Domov Mnenja Sveti gral prevoda glasu, zdaj na skypeu | John c. dvorak

Sveti gral prevoda glasu, zdaj na skypeu | John c. dvorak

Video: Top 50 SHAZAM❄️Лучшая Музыка 2020 ❄️Зарубежные песни Хиты❄️Популярные Песни 2020 #63 (Oktober 2024)

Video: Top 50 SHAZAM❄️Лучшая Музыка 2020 ❄️Зарубежные песни Хиты❄️Популярные Песни 2020 #63 (Oktober 2024)
Anonim

Če bi sledili računalniški revoluciji od nastanka mikroprocesorja, bi vedeli, da obstaja vrsta zgodnjih obljub, ki jih je treba še izpolniti.

Eden izmed teh je prevedeni govor med letenjem, kjer nekaj poveš v angleščini in se v skoraj realnem času ponovi v drugem jeziku, kot je španščina. Čeprav je Microsoft še vedno v teku, je zdaj korak bližje Skype Translatorju, katerega prva faza je zaživela ta teden.

Če se to približa delu in ni šala, je to rezultat desetletja. Trenutno Skype Translator podpira prevode iz španščine v angleščino in angleščino v španščino, vendar bo nastavljenih več jezikov.

Značilna težava pri takšnih stvareh je neznosna stopnja težavnosti. Še moram videti spodobnega prevajalskega paketa, ki dobro prevaja besedilo v besedilo. Prevajanje govora ima povsem drugačno stopnjo težavnosti, zlasti v realnem času.

Microsoft ima film, ki prikazuje dva otroka, ki govorita v španščini in angleščini, zaradi česar je videti, da deluje dobro. Vendar sem videl podoben sistem, ki ga je IBM pokazal pred skoraj 20 leti in ki nikoli ni ugledal luči dneva. Različica IBM-a je bila razvita v devetdesetih letih prejšnjega stoletja, ko je obstajala manija za prepoznavanje govora, ki jo je vodila družba Lernout & Hauspie, družba, ki je šla za polom - preden je leta 2001 prebila zaradi škandala z goljufijami, pred tem pa je kupovala vsako govorno tehnologijo podjetje, ki ga lahko, vključno z Dragon Systems, Berkeley Speech Technologies, Fonix, Diktafonom in drugimi. Microsoft je imel 8-odstotni delež L&H in nekatere tehnologije so dobili kot darilo za stečaj.

Zdaj se nenadoma pojavi Skype Translator. Naključje? Ne glede na to, je bila celotna tehnologija predolga, da bi prišli do te točke.

Poglejte bedni računalniški prevod besedila v besedilo, ki ga je storil Google in drugi. Besedilo se ne more in ne more izogniti najočitnejšim napakam. Nič od tega se ne približuje zapletenosti prevajanja govora, kar pomeni močno obdelavo signala.

Sem zbiratelj vin in pogosto obiskujem spletne strani francoskih vinarjev. Moja francoščina je samo v redu, zato pogosto vklopim prevod, da pospešim branje strani. Tu smo v letu 2014 in nihče od prevajalcev ne more ugotoviti, da je prevod Château Margaux Château Margaux, ne Castle Margaux. Kako težko je vzdržati besedo grad in ne prevesti pogosto uporabljene besede, ki se uporablja v lastnem imenu, na primer château, ki se običajno nanaša na določen vinar? Očitno je nemogoče. Vsi to počnejo.

Kako težko je v kodo napisati kakšno izjemo, ki prevajalcu sporoča, da je na bordeauxovem vinu na spletni strani? Na tej strani beseda château ne pomeni grad. Prevajalec pogosto poskuša dešifrirati tudi ostalo ime châteauja s smešnimi rezultati. Najboljše, kar lahko na splošno storite pri prevajanju besedila, je, da narišete, kaj piše na spletnem mestu.

Vprašajte se: če je besedilo tako težko, kako bo Microsoft upravljal govor?

Poleg tega je celo nemogoče v istem jeziku. Vzemite telefonsko storitev Google Voice. Ima funkcijo sprejemanja sporočil v govor. Nikoli nisem prejel sporočila v besedilu, ki bi se celo približalo temu, kar je oseba dejansko rekla. Niti enkrat.

Priznam, da v mirni sobi, ko govorite razločno in jasno, prepoznavanje glasu deluje dobro. Uporabljam ga za besedilna sporočila na telefonu Android. Toda v resničnem pogovoru nihče ne govori tako. Občudujem Microsoft za to. Vendar ne bo delovalo tako, kot se oglašuje.

Če rečem, se je vsaj nekaj igrati. To bi lahko celo sprožilo novo generacijo raziskav. Tako se ne bom preveč pritoževal.

Vsi si to želijo. Vrnimo se k delu na tem.

Sveti gral prevoda glasu, zdaj na skypeu | John c. dvorak