Estos son los programas de la categoría "Ofimática > OCR" incluidos en cdlibre.org. Consulta estas páginas de instrucciones para saber qué información se ofrece y para saber cómo instalar los programas.
Nuevos programas incluidos desde el 2 de diciembre de 2024: Ninguno
Programas actualizados desde el 2 de diciembre de 2024: Ninguno
Programas incluidos: gImageReader 3.4.2 - Paperwork 2.0.1 - Tesseract-OCR 3.04.00 Diccionario español - Tesseract-OCR 5.5.0 -
Catálogo > Ofimática > OCR
gImageReader es un programa OCR (reconocimiento óptico de caracteres) que trabaja con imágenes y pdfs.
Este programa es un interface gráfico para Tesseract-OCR, por lo que antes de instalar gImageReader se necesita tener instalado Tessereract-OCR y los diccionarios de idiomas.
Paperwork es un gestor de documentos escaneados y PDFs.
El instalador descarga de Internet los archivos necesarios.
Diccionario español para Tesseract-OCR 3.04.
Para instalarlo una vez descargado de Internet, hay que descomprimir el archivo tar.gz en una carpeta y copiar su contenido en la carpeta de diccionarios (normalmente, C:\Archivos de Programa\Tesseract-OCR\tessdata).
Tesseract-OCR es un motor de OCR (reconocimiento óptico de caracteres), desarrollado por HP entre 1985 y 1995, que en 2005 se publicó como software libre y cuyo desarrollo ha financiado Google desde 2006. Esta versión sólo incluye el diccionario inglés, pero desde la página web del programa se pueden descargar diccionarios adicionales en muchos idiomas. Esta versión sólo es accesible mediante la línea de comandos, por lo que para utilizarlo mediante un interfaz gráfico es necesario instalar programas adicionales como gImageReader. Esta versión está preparada por la biblioteca de la Universidad de Mannheim.
Última modificación: 8 de diciembre de 2024