Kako koristiti Ngram Viewer Tool u Google knjigama

Sadržaj:

Kako koristiti Ngram Viewer Tool u Google knjigama
Kako koristiti Ngram Viewer Tool u Google knjigama
Anonim

Šta treba znati

  • U Google Books Ngram Vieweru upišite frazu, odaberite raspon datuma i korpus, postavite nivo zaglađivanja i kliknite Pretraži puno knjiga.
  • Možete detaljnije analizirati podatke. Na primjer, da biste tražili glagolski oblik ribe, umjesto imenice riba, koristite oznaku: potražite fish_VERB.
  • Ngram Viewer daje graf koji predstavlja upotrebu fraze kroz vrijeme. Za više fraza, svaka je predstavljena linijom označenom bojom.

Ovaj članak objašnjava kako koristiti alat Ngram Viewer u Google Books za provođenje istraživanja i moćnih pretraga.

Image
Image

Kako radi Ngram Viewer

Ngram, koji se naziva i N-gram, je statistička analiza teksta ili govornog sadržaja kako bi se pronašao n (broj) neke vrste stavke u tekstu.

Stavka za pretragu može biti svašta, uključujući foneme, prefikse, fraze i slova. Iako je Ngram nejasan izvan istraživačke zajednice, koristi se u raznim poljima i ima mnogo implikacija za programere koji kodiraju kompjuterske programe koji razumiju i odgovaraju na prirodni govorni jezik.

U slučaju Google Books Ngram Viewer, tekst koji treba analizirati dolazi iz ogromnog broja knjiga u javnom domenu koje je Google skenirao kako bi popunio svoj pretraživač Google Books. Za Google Books Ngram Viewer, Google označava tijelo teksta koji ćete pretraživati kao korpus. Ngram Viewer agregira prema jeziku, iako možete zasebno analizirati britanski i američki engleski ili ih zbrojiti zajedno.

  1. Idite na Google Books Ngram Viewer na books.google.com/ngrams.
  2. Upišite bilo koju frazu ili fraze koje želite analizirati. Odvojite svaku frazu zarezom. Google predlaže, "Albert Einstein, Sherlock Holmes, Frankenstein" da započnete.

    U pretragama NGram Viewer-a, stavke su osjetljive na velika i mala slova, za razliku od Google web pretraživanja.

  3. Odaberite raspon datuma. Zadana vrijednost je 1800 do 2000.
  4. Odaberite korpus. Možete pretraživati tekstove na stranom jeziku ili tekstove na engleskom, a pored standardnih izbora, možda ćete primijetiti unose kao što su "engleski (2009)" ili "američki engleski (2009)" na dnu liste. Ovo su stariji korpusi koje je Google od tada ažurirao, ali možda ćete imati razloga za poređenje sa starim skupovima podataka. Većina korisnika ih može zanemariti i fokusirati se na najnovije korpuse.
  5. Podesite nivo zaglađivanja. Izglađivanje se odnosi na to koliko je gladak graf na kraju. Najprecizniji prikaz odražava nivo izglađivanja od 0, ali to podešavanje može biti teško pročitati. Zadana vrijednost je postavljena na 3. U većini slučajeva, ne morate je prilagođavati.

  6. Pritisnite Pretražite puno knjiga.

Koristeći Google Ngram Viewer, možete detaljnije analizirati podatke. Ako želite da tražite glagol riba umjesto imenice riba, to možete učiniti pomoću oznaka. U ovom slučaju, tražili biste fish_VERB.

Google pruža kompletnu listu naredbi druge napredne dokumentacije za upotrebu sa Ngram Viewerom na svojoj web stranici.

Donja linija

Google Books Ngram Viewer daje grafikon koji predstavlja upotrebu određene fraze u knjigama kroz vrijeme. Ako ste unijeli više od jedne riječi ili izraza, svaka će biti predstavljena linijom označenom bojom kako bi bila u kontrastu s drugim pojmovima za pretraživanje. Ovo je slično Google Trendovima, samo pretraga pokriva duži period.

Studija slučaja

Razmotrite studiju slučaja pita sa sirćetom. Spominju se u seriji Mala kuća u preriji Laure Ingalls Wilder. Istražujući Google-ovom web-pretragom kako biste saznali više o pitama s sirćetom, otkriva se da se one smatraju dijelom američke južnjačke kuhinje i da su zaista napravljene od octa. Podsjećaju na vremena kada nisu svi imali pristup svježim proizvodima u svako doba godine, ali je li to cijela priča?

Pretražite Google Ngram Viewer za pitu sa sirćetom, i naići ćete na neke pominjanja pite u ranim i kasnim 1800-im, puno spominjanja u 1940-ima i sve veći broj spominjanja u novije vrijeme. Međutim, sa nivoom izglađivanja od 3, vidite plato iznad spominjanja u 1800-im. Pošto nije bilo mnogo knjiga objavljenih u to vreme i pošto su podaci podešeni na glatku sliku, slika je iskrivljena. Vjerovatno je samo jedna knjiga pominjala pitu sa sirćetom, i to u prosjeku kako bi se izbjegao šiljak. Postavljanjem zaglađivanja na 0, možete vidjeti da je to upravo slučaj. Šiljak je usredsređen na 1869. godinu, a postoji još jedan šiljak u 1897. i 1900.

Malo je vjerovatno da ostatak vremena niko nije pričao o pitama od sirćeta: Vjerovatno je bilo recepata koji su plutali posvuda, ali ljudi o njima nisu pisali u knjigama, a to je važno ograničenje Ngram pretraživanja.

Preporučuje se: