Optické rozpoznávání znaků

technologie převodu dokumentu z digitální obrazové do textové podoby pomocí metody optického rozpoznávaní znaků From Wikipedia, the free encyclopedia

Optické rozpoznávání znaků
Remove ads
Na tento článek je přesměrováno heslo OCR. O překážkovém závodu pojednává článek Obstacle course racing.
Možná hledáte: OCr nebo OČR.

Optické rozpoznávání znaků či OCR (z anglického Optical Character Recognition) je metoda, která pomocí scanneru umožňuje digitalizaci tištěných textů, s nimiž pak lze pracovat jako s normálním počítačovým textem. Počítačový program převádí obraz buď automaticky, nebo se musí naučit rozpoznávat znaky. Převedený text je téměř vždy v závislosti na kvalitě předlohy třeba podrobit důkladné korektuře, protože OCR program nemusí rozeznat všechna písmena správně. OCR – zpracování textu z tištěné do elektronické podoby je použitelné pro všechny tištěné výstupy z laserových, inkoustových, termosublimačních a jehličkových tiskáren a samozřejmě pro předlohy vytištěné knihtiskem. U nevhodných předloh, např. slabě vytištěných jehličkových výtisků nebo dohromady slitých písmen, se z časového hlediska vyplatí spíše přepis textu.

Thumb
OCR algoritmus, detekce hran

Pro snadné rozpoznávání znaků byly vyvinuty strojově čitelné fonty, např. OCR-A, nebo dnes používanější OCR-B.

Remove ads

Historie

Počátky optického rozpoznávání znaků lze vysledovat k technologiím souvisejícím s telegrafií a ke snahám o vytvoření čtecích zařízení pro zrakově postižené.[1] V roce 1914 vyvinul Emanuel Goldberg zařízení, které dokázalo číst znaky a převádět je do standardního telegrafního kódu.[2] Současně vytvořil Edmund Fournier d'Albe přístroj zvaný Optophone, ruční skener, který při pohybu po tištěné stránce generoval zvuky odpovídající jednotlivým písmenům nebo znakům.[3]

Na konci 20. let a v průběhu 30. let 20. století vyvinul Emanuel Goldberg tzv. statistický stroj, určený k vyhledávání v mikrofilmových archivech pomocí systému optického rozpoznávání kódů. V roce 1931 mu byl na tento vynález udělen americký patent č. 1 838 389, který následně získala společnost IBM.

V roce 1974 založil Ray Kurzweil společnost Kurzweil Computer Products, Inc. a pokračoval ve vývoji tzv. omni-font OCR, schopného rozpoznávat text vytištěný prakticky v jakémkoli písmu. Kurzweil je často uváděn jako autor této technologie, přestože byla používána již na konci 60. a v 70. letech 20. století, například společností CompuScan.[1][4] Kurzweil využil OCR k vytvoření čtecího zařízení, které umožňovalo nevidomým osobám nechat si text předčítat počítačem. Společnost Kurzweil Computer Products byla později prodána firmě Xerox, která ji následně vyčlenila jako Scansoft; tato společnost se později sloučila s Nuance Communications.

V průběhu 21. století se OCR začalo objevovat jako online služba (tzv. WebOCR), v prostředí cloud computingu a v mobilních aplikacích, například pro okamžitý překlad cizojazyčných nápisů pomocí chytrých telefonů. S rozšířením chytrých telefonů a chytrých brýlí se OCR využívá v mobilních zařízeních připojených k internetu, která zpracovávají text zachycený kamerou zařízení. Zařízení bez vestavěné funkce OCR obvykle používají rozhraní API pro extrakci textu z obrazových souborů.[5][6] OCR API vrací rozpoznaný text spolu s informacemi o poloze detekovaných znaků v původním obrazu, což umožňuje další zpracování, například převod textu na řeč.

K dispozici je řada komerčních i open source OCR systémů, které podporují většinu běžně používaných písem, včetně latinky, cyrilice, arabského, hebrejského, indických písem, bengálského písma, dévanágarí, tamilského písma a znakových systémů čínštiny, japonštiny a korejštiny.[7][8]

Remove ads

OCR software

Další informace Jméno, Licence ...

OCR založené na AI

  • olmOCR od Ai2[9]
  • Chandra od Datalab[10]
  • Deepseek OCR[11]
  • Pixtral od Mistral[12]
  • dots.ocr od rednote hi lab[13]
  • PaddleOCR[14]
  • Google Cloud AI[15]
Remove ads

OCR rozpoznávající ručně psané znaky

Koncem 60. let 20. století byly v Japonsku vyvinuty OCR systémy rozeznávající i rukou psané znaky, především číslice (poštovní směrovací čísla).[16] Zařízení různých výrobců, ve kterých jsou tato OCR integrována, slouží v poštovním provozu k automatickému třídění dopisů.[17]

Odkazy

Loading related searches...

Wikiwand - on

Seamless Wikipedia browsing. On steroids.

Remove ads