ఒసిఆర్(OCR)

ఒసిఆర్ అనగా ఆప్టికల్ కేరెక్టర్ రీడర్, ఎదైనా పాఠ్యాన్ని బొమ్మ రూపంలో గ్రహించినపుడు దానిలోని పాఠ్యాన్ని గుర్తించగల ఉపకరణం. ఇంగ్లీషు లాంటి భాషలకు సమర్థవంతమైన సాఫ్ట్వేర్లు, భారతీయ భాషలకు అభివృద్ధి దశనుండి 2015 ప్రాంతంలో విడుదలైన సాఫ్ట్వేర్లు వున్నాయి.^[1]

ఆప్టికల్ కారక్టర్ రికగ్నిషన్ (దృష్టాక్షర గుర్తింపు), సాధారణంగా ఓసీఆర్ అని పిలుస్తారు. చేత్తో వ్రాసిన, టైపు చేసిన, ముద్రించిన పాఠ్యాం యొక్క స్కాన్ చేసిన బొమ్మలనుండి యంత్రానికి అర్థమయ్యే సంకేత పాఠ్యంగా స్వతహాగా (ఆటోమేటిగ్గా) మార్చే ప్రక్రియ. ముద్రిత పుస్తకాలను డిజిటైజర్ చేసే ప్రక్రియల్లో ఇది ముఖ్యమైనది. తద్వారా ఆ పుస్తకాలు యాంత్రికంగా అన్వేషించవచ్చు. ప్యాటర్న్ గుర్తింపు, కృత్రిమ తెలివితేటలు,, కంప్యూటరు విజన్ శాస్త్రాలయందు ఓసీఆర్ పరిశోధనాంశం.

తొలినాళ్ళల్లో ప్రోగ్రాము కేవలం ఒక ఖతికి మాత్రమే పనిచేసేది. ఇప్పుడు ఆంగ్లభాషలకు చాలా రకాల ఖతులు వాడినా చాలా చక్కగా పనిచేసే ఓసీఆర్లు అందుబాటులో ఉన్నాయి. . బొమ్మలు, ఫార్మాటింగు, ఖాళీ జాగాలతో సహా పుస్తకంలో ఉన్నట్టే రమారమీ యాంత్రిక పత్రీకరణ చేసే ఓసీఆర్లు అందుబాటులో ఉన్నాయి.

తెలుగు ఒసిఆర్ కూడా కొత్త సాంకేతికాలను ఆధారం చేసుకొని చాలా ఖతులకు 0-10శాతం దోషాలతో పనిచేయగల సామర్ధ్యం పొందినవి అభివృద్ధి చేయబడినవి.^[2] భారత భాషల అధ్యయన సంస్థ కూడా ఒసిఆర్ ను 2018లో విడుదల చేసింది. దీనికి సంబంధించిన పాత పరిశోధన ప్రకారం తెలుగు భాష పనితనంలో దోషం 17 శాతంగా ఉంది.^[3]

[1]

[2]

[3]