Key Takeaways
- Novi alat koji pokreće AI bi mogao pomoći istoričarima da dešifruju drevne tekstove.
- Ithaca je prva duboka neuronska mreža koja može vratiti nedostajući tekst oštećenih natpisa, identificirati njihovu originalnu lokaciju i pomoći u utvrđivanju datuma kada su kreirani.
- AI je koristan za popunjavanje podataka koji nedostaju kao što su lokacija i datum teksta jer je dobar u učenju vrlo složenih obrazaca analizom podataka.
Nedavni napredak u umjetnoj inteligenciji (AI) potiče napore da se razumije prošlost.
Ithaca, model mašinskog učenja koji su izradili istraživači veštačke inteligencije u DeepMind-u, može da pogodi reči koje nedostaju i lokaciju i datum pisanog jezika, navodi se u novom radu. Napor bi mogao pomoći istoričarima da dešifruju drevne rukopise.
“Itaka je duboka neuronska mreža, i kao takva, nevjerovatno je sposobna pronaći skrivene obrasce u ogromnim količinama podataka“, rekla je istoričarka Thea Sommerschield, koautorica nedavnog rada, za Lifewire u e-poruci intervju. „Takvi obrasci mogu biti tekstualni (gramatički, sintaktički ili povezani s ponovljenom 'formulom' u mnogim tekstovima) ili kontekstualni (određene riječi koje se dosljedno pojavljuju u određenim žanrovima tekstova: na primjer, politički dekret iz klasične Atine u kojem se spominju riječi 'savez, vijeće, skupština…').”
Otkrivanje prošlosti
Ithaca je prva duboka neuronska mreža koja može vratiti nedostajući tekst oštećenih natpisa, identificirati njihovu originalnu lokaciju i pomoći u utvrđivanju datuma njihovog stvaranja, rekao je Sommerschield.
Itaka je dobila ime po grčkom ostrvu u Homerovoj Odiseji. Istraživači su otkrili da Ithaca postiže 62% tačnosti u obnavljanju oštećenih tekstova, 71% tačnosti u identifikaciji njihove originalne lokacije i može datirati tekstove do 30 godina od datuma njihovog nastanka.
Ithacina pomagala za vizualizaciju imaju za cilj da olakšaju istraživačima tumačenje rezultata. Autori su napisali da su istoričari postigli 25% tačnosti kada su sami radili na restauraciji drevnih tekstova. Ali, performanse istoričara povećavaju se na 72% kada se koristi Ithaca, nadmašujući performanse modela i pokazujući potencijal za saradnju ljudi i mašina.
“Ithaca nudi interpretabilne rezultate, pokazujući rastuću važnost saradnje između ljudskih stručnjaka i mašinskog učenja, i pokazuje kako uparivanje ljudskih stručnjaka sa arhitekturom dubokog učenja da se zajednički bave zadacima može nadmašiti individualne (bez pomoći) performanse i ljudi i model na istim zadacima”, rekao je Sommerschield za Lifewire.
Na primjer, istoričari se trenutno ne slažu oko datuma serije važnih atinskih dekreta donesenih u vrijeme kada su živjele značajne ličnosti poput Sokrata i Perikla, napisao je Sommerschield u postu na blogu. Dugo se smatralo da su dekreti napisani prije 446./445. godine prije nove ere, iako novi dokazi upućuju na datum 420-ih godina pne. “Iako bi se moglo činiti kao mala razlika, ovi dekreti su fundamentalni za naše razumijevanje političke istorije klasične Atine,” napisala je
Najbliži rad Ithaci je prethodni alat za mašinsko učenje pod nazivom Pythia koji su Sommerschield i njeni saradnici objavili 2019. Pythia je bio prvi drevni model restauracije teksta koji je koristio duboke neuronske mreže.
„Danas je Ithaca prvi model koji se holistički uhvatio u koštac s tri centralna zadatka u radnom toku epigrafa,” rekao je Sommerschield u e-poruci. „Ne samo da unapređuje prethodnu najsavremeniju verziju koju je postavila Pythia, već takođe koristi duboko učenje za geografsku i kronološku atribuciju po prvi put i na neviđenom nivou.”
AI za pomoć istoričarima
AI je koristan za popunjavanje podataka koji nedostaju poput lokacije i datuma teksta jer je dobar u učenju veoma složenih obrazaca analizom podataka, rekao je za Lifewire putem e-pošte Brad Quinton, izvršni direktor kompanije AI Singulos Research.
“Koristeći tehnike mašinskog učenja, AI može pregledati veliki broj “poznatih dobrih” primjera kako bi pronašao obrasce između, na primjer, datog teksta i njegovog datuma i lokacije stvaranja”, dodao je Quinton. “Često su ovi obrasci toliko složeni da ne bi bili očigledni stručnjaku za ljude.”
Predviđanje podataka koji nedostaju uobičajen je zadatak za AI zasnovanu na mašinskom učenju. Na primjer, GPT-3 iz OpenAI može predvidjeti riječi koje nedostaju u rečenici ili čak rečenice koje nedostaju u paragrafu. Mnogi sistemi za obradu slike zasnovani na AI korišteni su za obnavljanje videa i slika inteligentnim predviđanjem onoga što je izgubljeno iz originala.
“Konceptualno, istraživači bi mogli koristiti slične tehnike da odrede datum i porijeklo umjetnosti ili alata, ili drugih istorijskih artefakata koje je napravio čovjek, gdje se očekuje promjena osnovnog stila i tehnike tokom vremena i prema lokaciji porijeklo,” rekao je Quinton.