ocrad vs tesserac: La batalla de los OCR, descripción gráfica.
¿Así o más drama?. Resulta que investigando para mejorar el producto de IFScore , que es una suite financiera, quiero automatizar la adquicisión de ciertos datos, es decir, quiero hacer reconocimiento de caracteres ópticos, y realmente para linux hay de dos sopas, OCRAD de GNU y TESSERACT de Google... Round 1: Instalación. Cuando me puse a instalar el OCRAD en mi opensuse 12.3, le dí cliketeclick y zaz! a bajar 925 paquetes y el tesseract solo baja 4... Round 2: Con una imágen tomada con el cel (Galaxy S3) Esta es la imagen utilizada como original, tomada con un Galaxy S3. El ocrad usa imágenes pnm en escala de grises, entoces utilizamos la línea de comandos: djpeg -greyscale -pnm 20130829_200939.jpg | ocrad Y este es el resultado, bastante pobre por cierto. djpeg -greyscale -pnm 20130829_200939.jpg | ocrad __...__P__. . '..' __. ,? _ `'- ._ . ..` _r '- _ _' , ._ _ . _. _ .. ____ _ _ � . . _ _T ._ :__.;__ . ' _ __..-....