Domov Naprej razmišljanje Inteligentni pomočniki: kaj pride po siri?

Inteligentni pomočniki: kaj pride po siri?

Video: 18 фишек iPhone, о которых вы не знали - обзор от Ники (November 2024)

Video: 18 фишек iPhone, о которых вы не знали - обзор от Ники (November 2024)
Anonim

Inteligentni pomočniki - Siri, Google Now, Cortana in podobni - so pred nekaj leti prešli iz radovednosti in trikov v salon, do bistvenih orodij, ki jih mnogi uporabljajo v vsakdanjem življenju. Prejšnji teden sem se odpovedal na konferenci Inteligentni asistenti v New Yorku, ki jo je predstavilo podjetje Opus Research, in bil navdušen nad napredkom, ki ga programska oprema dosega v različnih panogah, vključno z napredkom finančnih, zavarovalniških in medicinskih podjetij pri gradnji posebnih agentov.

Ustanovitelj Opus Research Dan Miller je pojasnil, da se številne ključne tehnologije, na primer prepoznavanje govora, pojavljajo že več kot 20 let. Čeprav je pred kratkim doživel večje izboljšave, ne pa revolucijo, je dejal, da "smo na evolucijski poti", z veliko izdelki na kontinuumu z različnimi zmogljivostmi. Opozoril je, da obstaja na stotine podjetniških inteligentnih pomočnikov, ki jih je mogoče uporabiti za preprost pogovor na besedilu v navadni angleščini z uporabo fiksnega nabora podatkov in za stvari, kot sta navigacija po spletnem mestu ali pogosta vprašanja. Na drugem koncu spektra je verjetno le nekaj deset "dinamičnih, človeško občutljivih aplikacij", ki so bolj pogovorne in v kontekstu.

Miller je opozoril na prijave, ki so na konferenci osvojile nagrade. Amtrakova Julie se je pred leti začela kot interaktivni agent za govorne odzive, zdaj pa se je razvila v agenta, ki na spletnem mestu deluje kot vodnik popotnikov po Amtrak.com, ki temelji na agentu podjetja Next IT. Telefonica Mexico ima zastopnika z imenom Nico, ki ima avatar in nudi podporo tudi prek Twitterja in Facebooka, ki temelji na platformi AgentBot. ING Nizozemska ima Inge, aplikacijo, ki vam omogoča preverjanje stanja na bančnem računu ali nakazilo denarja z glasom, z uporabo biometrične tehnologije za glasovno biometriko Nuance, za preverjanje identitete.

Med častnimi omembami so tudi zdravstvene storitve, kot je aplikacija, ki vam pomaga izbrati načrt zdravstvenega varstva. Druge aplikacije, ki sem jih slišal na razstavi, vključujejo Domino's Pizza, ki ima aplikacijo z imenom Dom, ki omogoča uporabo glasu za naročilo pice; in BMW, ki ima del svojega virtualnega agenta za financiranje avtomobilov Up2drive navideznega agenta.

Nuanceov Brett Beraneck je govoril o tem, kako je napredek v nevronskih omrežjih globokega učenja izboljšal stvari, kot so razumevanje naravnega jezika in prepoznavanje glasu, in kako se to zdaj združi, da bi omogočili veliko več zanimanja na tem področju. Nuanceova pomočnica Nina je bila zgoden primer in od takrat je narasla na veliko specifičnih aplikacij, od interaktivnih sistemov govornega odziva pri zavarovalnicah do nakupovalnih aplikacij. Vsaka od teh aplikacij ima drugačno osebnost, odvisno od tega, kaj vam skuša pomagati.

Velika novost, o kateri je razpravljal, je bila glasovna biometrija, v kateri vaš glas nadomesti geslo. Govoril je o tem, kako podjetja, kot je ING v Evropi, razvijajo agente, ki ne uporabljajo samo prepoznavanja glasu in obdelave naravnega jezika, ampak tudi začenjajo uporabljati glas, da prepoznajo klico. Dejal je, da je to varnejše in bolj naravno kot tradicionalno geslo.

Medtem ko so se zadnje študije zastavljale, da bi zvočni posnetki takšne sisteme lahko preslepili, je Nuance opozoril, da današnja tehnologija vključuje funkcije, ki so usmerjene v odkrivanje nepravilnosti iz posnetega glasu, in opozoril na druge študije, ki so zavzele drugačno stališče. Poleg tega, oblikovalci lahko uporabljajo različne ravni biometrike glasu za različne funkcije, na primer s preprostim prepoznavanjem za preverjanje stanja na računu ali od vas zahtevajo, da ponovite naključno zaporedje besed za pomembne denarne prenose.

Zdi se, da glasovna biometrija zagotovo pridobiva nekaj oprijema. Na prejšnjem tednu na simpoziju Gartner je zasedanje o "kul primerih strank" v finančnih storitvah vključevalo aplikacijo Citibank, ki je uporabljala to funkcijo.

MyWave ima pomočnika, imenovanega Frank, ki naj bi mu omogočila več podjetij, da bi vam omogočila interakcijo z njimi na bolj pogovoren način, namesto da bi vsako podjetje razvijalo svoje. Prve uporabe vključujejo novozelandsko banko in aplikacijo, imenovano Saveawatt, zasnovane za lažjo izbiro ponudnika električne energije.

Generalni direktor Geraldine McBride je pojasnil, da podjetje poskuša ustvariti pomočnike, ki bodo premostili vrzel med strankami in storitvenimi aplikacijami, s tem, kar imenuje "odnosi s strankami" ali CMR, spin na tradicionalnih CRM aplikacijah. Velika razlika je dejala, da je stranka odgovorna za vse svoje podatke, ne pa za podjetje.

Drugo relativno novo podjetje, Expect Labs, ima izdelek z imenom MindMeld, ki deluje kot začetnica številnim podjetjem, ki želijo ponuditi glasovni vmesnik za nadomestitev tradicionalnih vmesnikov in obravnavanje vprašanj in odgovorov. To je mogoče uporabiti za različne aplikacije, na primer za gledanje TV oddaj, če samo vprašate ime in sistem poizveduje več sistemov. (Amazon Fire TV ima nekatere od teh funkcij, vendar ni integriran s kablovsko televizijo, medtem ko je eden od vlagateljev v Expect Labs kabelska družba Liberty Global.)

Generalni direktor Tim Tuttle je pojasnil, da MindMeld ponavadi uporablja prepoznavanje govora, ki je že na voljo v večini naprav, namesto tega pa se osredotoča na razumevanje naravnega jezika in gradnjo grafa znanja o razpoložljivih informacijah. Povedal je, da podjetje poskuša sistem razširiti tako, da vključuje več informacij iz več virov, in razbiti hierarhije različnih kategorij informacij, ki so del večine takšnih sistemov. Res razumevanje vprašanj pomeni zmožnost razumevanja namenov v različnih kategorijah, je dejal.

Ena stvar, ki sem jo slišal od številnih udeležencev, je bila statistika, ki nakazuje, da približno 10 odstotkov vseh spletnih iskanj zdaj poteka prek obveščevalnih agentov. (Pionir AI Andrew Ng je dejal, da to velja za glasovno iskanje v Baidu lansko leto, in več ljudi je povedalo, da to zdaj velja tudi pri Googlu, vendar še nisem slišal potrditve iz prve roke.)

Miller podjetja Opus Research je gledal naprej, da je treba še veliko dela. Osnovna natančnost sistemov ima veliko prostora za izboljšave, zlasti pri prehodu od tega, kar rečete, k temu, kar mislite, kaj storiti kot rezultat. Na konferenci je omenil direktorja podjetja Xerox PARC Stephena Hooverja, ki je dejal, da so sistemi danes do 90 odstotkov natančni, če razumejo, kaj mislimo, toda 10 odstotkov je še vedno težava, ker je tisto, kar se večina ljudi spomni, ko se ukvarja sistem. In Miller je dejal, da obstaja prostor za boljšo personalizacijo, saj če sistem ve, s kom se pogovarja, lahko da boljše rezultate. Na primer, opozoril je, da Facebook ve, kdo uporablja sistem, ker ste prijavljeni; in dejal, da bo to neopazno postalo pomembnejše z več agenti.

To je zagotovo fascinantna kategorija in pričakujem, da bomo vsi porabili veliko več časa za pogovor s svojimi telefoni in računalniki ter za interakcijo z agenti, ki niso čisto človeški. To se mi zdi eden najzanimivejših trendov pri računanju v teh dneh.

Inteligentni pomočniki: kaj pride po siri?