Šta je optičko prepoznavanje znakova (OCR)?

Sadržaj:

Šta je optičko prepoznavanje znakova (OCR)?
Šta je optičko prepoznavanje znakova (OCR)?
Anonim

Optičko prepoznavanje znakova (OCR) odnosi se na softver koji kreira digitalnu verziju odštampanog, otkucanog ili rukom pisanog dokumenta koji računari mogu čitati bez potrebe za ručnim kucanjem ili unosom teksta. OCR se općenito koristi na skeniranim dokumentima u PDF formatu, ali može kreirati i kompjuterski čitljivu verziju teksta unutar slikovne datoteke.

Šta je OCR

OCR, koji se naziva i prepoznavanje teksta, softverska je tehnologija koja transformiše znakove kao što su brojevi, slova i interpunkcija (koji se nazivaju i glifovi) iz štampanih ili pisanih dokumenata u elektronski oblik koji računari lakše prepoznaju i čitaju. drugi softverski programi. Neki OCR programi to rade dok se dokument skenira ili fotografiše digitalnom kamerom, a drugi mogu primijeniti ovaj proces na dokumente koji su prethodno skenirani ili fotografirani bez OCR-a. OCR omogućava korisnicima da pretražuju unutar PDF dokumenata, uređuju tekst i ponovo formatiraju dokumente.

Image
Image
Skeniranje istorijskih novina sa OCR softverom.

Getty Images

Za šta se koristi OCR?

Za brze, svakodnevne potrebe skeniranja, OCR možda i nije velika stvar. Ako obavite veliku količinu skeniranja, mogućnost pretraživanja unutar PDF-ova da biste pronašli ono što vam je potrebno može uštedjeti dosta vremena i čini OCR funkcionalnost u vašem programu skenera važnijom. Evo još nekih stvari sa kojima OCR pomaže:

  • Automatska obrada podataka i unos podataka (Primjer: Sistemi za praćenje kandidata za posao za biografije).
  • Omogućavanje pretraživanja skeniranih knjiga.
  • Pretvaranje rukopisnih skeniranja u kompjuterski čitljiv tekst.
  • Učiniti dokumente upotrebljivijim od strane programa za čitanje koji pomažu korisnicima sa oštećenim vidom.
  • Očuvanje istorijskih dokumenata i novina, dok ih istovremeno čini pretraživim.
  • Izvlačenje podataka i prijenos u računovodstvene programe (Primjer: Priznanice i fakture).
  • Indeksiranje dokumenata za korištenje od strane pretraživača.
  • Prepoznavanje registarskih tablica vozača od strane softvera za kameru za kontrolu brzine i crveno svjetlo.
  • Sintisajzeri govora za ljude koji ne znaju da govore – teoretski fizičar, Stephen Hawking, možda je najpoznatiji korisnik programa za sintisajzer govora.

Donja linija

Zašto jednostavno ne slikate, zar ne? Zato što ne biste mogli ništa uređivati ili pretraživati tekst jer bi to bila samo slika. Skeniranje dokumenta i pokretanje OCR softvera može pretvoriti tu datoteku u nešto što možete uređivati i pretraživati.

Istorija OCR

Dok najranija upotreba prepoznavanja teksta datira iz 1914. godine, rašireni razvoj i upotreba tehnologija povezanih s OCR-om počeo je ozbiljno 1950-ih, posebno stvaranjem vrlo pojednostavljenih fontova koje je bilo lakše pretvoriti u digitalno- čitljiv tekst. Prvi od ovih pojednostavljenih fontova kreirao je David Shepard i poznatiji kao OCR-7B. OCR-7B je i danas u upotrebi u finansijskoj industriji za standardni font koji se koristi na kreditnim i debitnim karticama. U 1960-im, poštanske službe u nekoliko zemalja počele su koristiti OCR tehnologiju kako bi znatno ubrzale sortiranje pošte, uključujući Sjedinjene Države, Veliku Britaniju, Kanadu i Njemačku. OCR je i dalje osnovna tehnologija koja se koristi za sortiranje pošte za poštanske usluge širom svijeta. 2000. godine, ključno znanje o granicama i mogućnostima OCR tehnologije korišteno je za razvoj CAPTCHA programa koji se koriste za zaustavljanje botova i spamera.

Tokom decenija, OCR je postao precizniji i sofisticiraniji zbog napretka u srodnim tehnološkim oblastima kao što su veštačka inteligencija, mašinsko učenje i kompjuterski vid. Danas, OCR softver koristi prepoznavanje uzoraka, detekciju karakteristika i rudarenje teksta za transformaciju dokumenata brže i preciznije nego ikada prije.

FAQ

    Kako da skeniram dokumente sa svojim telefonom ili tabletom?

    Na iOS-u otvorite aplikaciju Bilješke i kreirajte novu bilješku. Otvorite kameru, a zatim dodirnite Skeniraj dokumente. Na Androidu otvorite Google Drive i odaberite Plus (+), zatim dodirnite Scan da skenirate dokument sa svojim telefonom.

    Kako da koristim OCR u Adobe Acrobatu?

    Otvorite PDF datoteku koja sadrži skeniranu sliku, zatim odaberite Alati > Uredi PDF. Acrobat će automatski primijeniti OCR tako da možete uređivati tekst. Samo odaberite gdje želite da izvršite izmjene i počnite kucati.

    Koja je razlika između OCR-a i OMR-a?

    Optical Mark Recognition (OMR) je softver koji detektuje tragove na papiru, obično na mehurićima. OMR se koristi za obradu rezultata ispita, anketa, upitnika, pa čak i izbora. Za razliku od OCR-a, OMR ne može dešifrirati oznake na stranici, već samo provjeri da li su oznake tamo.

Preporučuje se: