Wat ass Optical Character Recognition (OCR)?

Optesch Charakter Recognition (OCR) verweist op Software, déi eng digitale Versioun vun engem gedréckten, typiséierten oder geschriwween Dokument erstellt, wou Computeren ouni Ënnerzuel vun der Bedierflechkeet net liesen ze kënnen oder den Text eranhuelen. OCR gëtt allgemeng op gescannte Dokumente am PDF- Format benotzt, kann awer och e Computer-lsibel Versioun vum Text innerhalb enger Bilddatei erstallt ginn.

Wat ass den OCR?

OCR, och als Texterkennung bezeechent, ass Software-Technologie, déi Zeechen, wéi Zuelen, Bréiwer a Punkgesetz (och Glyphen genannt) vu gedréckten oder schrëftleche Dokumente an eng elektronesch Form méi liicht erkannt a gelies gëtt duerch Computer an aner Softwareprogrammer. E puer OCR Programme maachen dat als Dokument gescannt oder fotograféiert mat enger Digitalkamera an anerer kënnen dëse Prozess op Dokumenter benotzen, déi virdru gescannt oder ouni OCR fotograféiert ginn. OCR erlaabt d'Benotzer fir PDF ze dokumentéieren, Text z'änneren an ze formatéieren.

Wat ass den OCR benotze fir?

Fir séier, all Dag Scanner brauch OCR net e grousst Ofkommen. Wann Dir eng grouss Quantitéit vu Scanner benotzt, kann se an PDFs opruffen fir den exakt Dir ze fannen deen Dir braucht, e bëssen Zäit ze spueren an d'OCR Funktionalitéit an Ärem Scannerprogramm méi wichteg ze maache. Hei sinn e puer aner Saachen OCR hëlleft mat:

Firwat benotzt OCR?

Firwat net just ee Bild ze maachen, oder? Well Dir kéint net méi änneren oder de Text sichen, well et just e Bild wier. Scannen vum Dokument an der OCR-Software kann d'Datei an eppes dat Dir änneren an Dir kënnt Sich no.

Geschicht vum OCR

Während déi alleréidegst Gebraucht vun der Texterkennung bis 1914 war, koum d'breetverbreedte Entwécklung an d'Verwäertung vun den OCR-bezogenen Technologien am Éierestand an de 1950er Joren, speziell mat der Schafung vu ville vereinfacht Schrëften, déi méi einfach sinn an d'digital liest Text ze konvertéieren. Déi éischt vun dësen vereinfacht Schrëften gouf vum David Shepard gegrënnt a bekannt als OCR-7B. OCR-7B gëtt haut nach an der Finanzindustrie fir d'Standardschrëft benotzt fir Kredittkaarten an Debitkarten. An den 1960er hunn d'Postservicer an e puer Länner ugefaangen d'OCR-Technologie ze benotze fir eng Sortortuerm erauszefannen, wéi d'USA, Groussbritannien, Kanada a Däitschland. OCR ass nach ëmmer d'Käertechnologie déi benotzt gëtt fir E Mail um postaleschen Déngscht um weltleche Plang ze sortéieren. Am Joer 2000 si wichteg Kenntnisser iwwert d'Limiten an d'Méiglechkeeten vun der OCR-Technologie benotzt fir d' CAPTCHA Programmer ze entwéckelen fir Bots a Spammer ze stoppen.

Während den Dekaden huet OCR méi genee a méi sophistikéiert wéinst der Fortschrëtter an der Zesummenaarbecht vun den technologesche Beräicher wéi zum Beispill kënschtlech Intelligenz , Maschinn léieren a Computer Visioun. Hautdesdaags benotzt OCR Software Mustererkennung, Feature Detektioun an Text Mining, fir Dokumenter méi séier a méi genau wéi je zuvor ze verformen.