Kako bi halucinacije mogle pomoći AI da vas bolje razumije

Sadržaj:

Kako bi halucinacije mogle pomoći AI da vas bolje razumije
Kako bi halucinacije mogle pomoći AI da vas bolje razumije
Anonim

Key Takeaways

  • Novi model mašinskog učenja halucinira sliku izgleda rečenice na jeziku kako bi pomogao prijevodu.
  • AI sistem, nazvan VALHALLA, dizajniran je da oponaša način na koji ljudi percipiraju jezik.
  • Novi sistem je dio rastućeg pokreta za korištenje AI za razumijevanje jezika.
Image
Image

Ljudska metoda vizualizacije slika uz prevođenje riječi mogla bi pomoći da vas umjetna inteligencija (AI) bolje razumije.

Novi model mašinskog učenja halucinira sliku o tome kako rečenica izgleda na jeziku. Prema nedavnom istraživačkom radu, tehnika zatim koristi vizualizaciju i druge naznake za pomoć pri prijevodu. To je dio rastućeg pokreta za korištenje AI za razumijevanje jezika.

"Način na koji ljudi govore i pišu je jedinstven jer svi imamo malo drugačije tonove i stilove", rekla je Beth Cudney, profesorica analize podataka na Univerzitetu Maryville, koja nije bila uključena u istraživanje, za Lifewire u intervjuu putem e-pošte. "Razumijevanje konteksta je teško jer je kao da se bavite nestrukturiranim podacima. Ovdje je korisna obrada prirodnog jezika (NLP). NLP je grana AI koja se bavi razlikama u načinu na koji komuniciramo koristeći mašinsko čitanje. Ključna razlika u NLP-u, kao grana AI, ne fokusira se samo na doslovno značenje riječi koje govorimo ili pišemo. Gleda na značenje."

Idi pitaj Alice

Novi sistem veštačke inteligencije, nazvan VALHALLA, kreiran od strane istraživača sa MIT-a, IBM-a i Univerziteta Kalifornije u San Dijegu, dizajniran je da oponaša način na koji ljudi percipiraju jezik. Prema naučnicima, korišćenje senzornih informacija, poput multimedije, uparene sa novim i nepoznatim rečima, kao što su fleš kartice sa slikama, poboljšava usvajanje i zadržavanje jezika.

Ovi sistemi povećavaju moć chatbotova koji su trenutno samo obučeni i sposobni za specifične razgovore…

Tim tvrdi da njihov metod poboljšava tačnost mašinskog prevođenja u odnosu na prevod samo teksta. Naučnici su koristili arhitekturu enkoder-dekoder sa dva transformatora, tip modela neuronske mreže koji je pogodan za podatke zavisne od sekvence, poput jezika, koji može obratiti pažnju na ključne reči i semantiku rečenice. Jedan transformator generiše vizuelnu halucinaciju, a drugi izvodi multimodalni prevod koristeći izlaze iz prvog transformatora.

"U scenarijima iz stvarnog svijeta, možda nećete imati sliku u odnosu na izvornu rečenicu", rekao je Rameswar Panda, jedan od članova istraživačkog tima, u saopštenju za medije. "Dakle, naša motivacija je u osnovi bila: Umjesto da koristimo vanjsku sliku tokom zaključivanja kao ulaz, možemo li koristiti vizualnu halucinaciju - sposobnost zamišljanja vizuelnih scena - da poboljšamo sisteme mašinskog prevođenja?"

Razumijevanje AI

Velika istraživanja su fokusirana na unapređenje NLP-a, istakao je Cudney. Na primjer, Elon Musk je suosnivač Open AI, koji radi na GPT-3, modelu koji može razgovarati s čovjekom i koji je dovoljno pametan da generiše softverski kod u Pythonu i Javi.

Google i Meta također rade na razvoju konverzacijske AI sa svojim sistemom zvanim LAMDA. "Ovi sistemi povećavaju moć chatbotova koji su trenutno samo obučeni i sposobni za specifične razgovore, što će vjerovatno promijeniti lice korisničke podrške i službe za pomoć", rekao je Cudney.

Aaron Sloman, suosnivač CLIPr, tehnološke kompanije AI, rekao je u e-poruci da veliki jezički modeli poput GPT-3 mogu naučiti iz vrlo malo primjera obuke kako bi poboljšali sažetke teksta na osnovu povratnih informacija ljudi. Na primjer, rekao je, možete dati velikom jezičkom modelu matematički problem i zamoliti AI da razmišlja korak po korak.

"Možemo očekivati da će se iz velikih jezičkih modela izvući bolji uvidi i rasuđivanja dok budemo saznali više o njihovim sposobnostima i ograničenjima", dodao je Sloman. "Također očekujem da će ovi jezički modeli stvoriti procese koji su sličniji čovjeku, jer modeli razvijaju bolje načine za fino podešavanje modela za specifične zadatke od interesa."

Georgia Tech profesor računarstva Diyi Yang predvidio je u intervjuu e-poštom da ćemo vidjeti više korištenja sistema za obradu prirodnog jezika (NLP) u našem svakodnevnom životu, u rasponu od personaliziranih asistenata zasnovanih na NLP-u do pomoći s e-poštom i telefonskim pozivima, na sisteme dijaloga sa znanjem za traženje informacija u putovanju ili zdravstvenoj zaštiti."Kao i pošteni AI sistemi koji mogu obavljati zadatke i pomoći ljudima na odgovoran način bez predrasuda," dodao je Yang.

Ogromni AI modeli koji koriste trilione parametara kao što su GPT-3 i DeepText će nastaviti da rade na jedinstvenom modelu za sve jezičke aplikacije, predvidio je Stephen Hage, inženjer mašinskog učenja u Dialexi, u intervjuu e-poštom. Rekao je da će postojati i nove vrste modela kreiranih za posebne namjene, kao što je kupovina putem interneta putem glasovne komande.

"Primjer bi mogao biti kupac koji kaže 'Pokaži mi ovo sjenilo u ponoćno plavoj boji sa više oreola,' da pokaže tu nijansu na očima osobe uz određenu kontrolu nad načinom nanošenja," dodao je Hage..

Preporučuje se: