Optické rozpoznávání znaků
technologie převodu dokumentu z digitální obrazové do textové podoby pomocí metody optického rozpoznávaní znaků From Wikipedia, the free encyclopedia
Remove ads
Optické rozpoznávání znaků či OCR (z anglického Optical Character Recognition) je metoda, která pomocí scanneru umožňuje digitalizaci tištěných textů, s nimiž pak lze pracovat jako s normálním počítačovým textem. Počítačový program převádí obraz buď automaticky, nebo se musí naučit rozpoznávat znaky. Převedený text je téměř vždy v závislosti na kvalitě předlohy třeba podrobit důkladné korektuře, protože OCR program nemusí rozeznat všechna písmena správně. OCR – zpracování textu z tištěné do elektronické podoby je použitelné pro všechny tištěné výstupy z laserových, inkoustových, termosublimačních a jehličkových tiskáren a samozřejmě pro předlohy vytištěné knihtiskem. U nevhodných předloh, např. slabě vytištěných jehličkových výtisků nebo dohromady slitých písmen, se z časového hlediska vyplatí spíše přepis textu.

Pro snadné rozpoznávání znaků byly vyvinuty strojově čitelné fonty, např. OCR-A, nebo dnes používanější OCR-B.
Remove ads
Historie
Počátky optického rozpoznávání znaků lze vysledovat k technologiím souvisejícím s telegrafií a ke snahám o vytvoření čtecích zařízení pro zrakově postižené.[1] V roce 1914 vyvinul Emanuel Goldberg zařízení, které dokázalo číst znaky a převádět je do standardního telegrafního kódu.[2] Současně vytvořil Edmund Fournier d'Albe přístroj zvaný Optophone, ruční skener, který při pohybu po tištěné stránce generoval zvuky odpovídající jednotlivým písmenům nebo znakům.[3]
Na konci 20. let a v průběhu 30. let 20. století vyvinul Emanuel Goldberg tzv. statistický stroj, určený k vyhledávání v mikrofilmových archivech pomocí systému optického rozpoznávání kódů. V roce 1931 mu byl na tento vynález udělen americký patent č. 1 838 389, který následně získala společnost IBM.
V roce 1974 založil Ray Kurzweil společnost Kurzweil Computer Products, Inc. a pokračoval ve vývoji tzv. omni-font OCR, schopného rozpoznávat text vytištěný prakticky v jakémkoli písmu. Kurzweil je často uváděn jako autor této technologie, přestože byla používána již na konci 60. a v 70. letech 20. století, například společností CompuScan.[1][4] Kurzweil využil OCR k vytvoření čtecího zařízení, které umožňovalo nevidomým osobám nechat si text předčítat počítačem. Společnost Kurzweil Computer Products byla později prodána firmě Xerox, která ji následně vyčlenila jako Scansoft; tato společnost se později sloučila s Nuance Communications.
V průběhu 21. století se OCR začalo objevovat jako online služba (tzv. WebOCR), v prostředí cloud computingu a v mobilních aplikacích, například pro okamžitý překlad cizojazyčných nápisů pomocí chytrých telefonů. S rozšířením chytrých telefonů a chytrých brýlí se OCR využívá v mobilních zařízeních připojených k internetu, která zpracovávají text zachycený kamerou zařízení. Zařízení bez vestavěné funkce OCR obvykle používají rozhraní API pro extrakci textu z obrazových souborů.[5][6] OCR API vrací rozpoznaný text spolu s informacemi o poloze detekovaných znaků v původním obrazu, což umožňuje další zpracování, například převod textu na řeč.
K dispozici je řada komerčních i open source OCR systémů, které podporují většinu běžně používaných písem, včetně latinky, cyrilice, arabského, hebrejského, indických písem, bengálského písma, dévanágarí, tamilského písma a znakových systémů čínštiny, japonštiny a korejštiny.[7][8]
Remove ads
OCR software
OCR založené na AI
Remove ads
OCR rozpoznávající ručně psané znaky
Koncem 60. let 20. století byly v Japonsku vyvinuty OCR systémy rozeznávající i rukou psané znaky, především číslice (poštovní směrovací čísla).[16] Zařízení různých výrobců, ve kterých jsou tato OCR integrována, slouží v poštovním provozu k automatickému třídění dopisů.[17]
Odkazy
Wikiwand - on
Seamless Wikipedia browsing. On steroids.
Remove ads
