miércoles, 16 de junio de 2010

Convertir documentos escaneados a texto (DOC, PDF) con OCR Online

Screen shot 2010-06-14 at 10.47.57 AM

Acaban de escanear un documento, pero no tienen la aplicación necesaria para convertir ese documento en texto editable en la PC? Usualmente, cuando escaneamos, lo que nos queda es una archivo de imagen, de buena calidad, claro, pero que no nos servirá de mucho si queremos editarlo.

Lo que sucede es que el scanner básicamente hace una copia, en imagen, del documento que tenemos. Para poder “descifrarlo” y convertir esa imagen en caracteres, y esos caracteres en palabras, necesitamos pasarlo por una aplicación OCR. OCR, u Optical Character Recognition, no es más que el acto de coger esta imagen (que, por supuesto, tiene que tener un buen nivel de detalle), y tratar de reconocer los caracteres como letras. Por eso, es importante siempre que el software (o en este caso, la aplicación web) esté configurada en nuestro idioma, ya que siempre hay un margen de error.

Con OCROnline, sin embargo, podemos coger esa imagen que nos deja el scan, y en segundos, convertiro en texto editable en formato RTF o Doc, o incluso convertirlo a un PDF. Los resultados son sorprendentemente buenos, como pueden ver en la imagen inferior:

Screen shot 2010-06-14 at 10.49.00 AM

Lo único que hice fue coger una imagen de Google (búsqueda: documentos escaneados), que ni siquiera tenía mucha calidad, pasarla por OCR Online, decirle que me de el documento en RTF, y los resultados fueron bastante satisfactorios.

Lo mejor de todo, por supuesto, es que todo el proceso se hace online, sin instalar absolutamente nada. El servicio nos limita a imágenes de 10 Megabytes (más que suficiente), y también a 100 subidas máximo por día (si están haciendo más, es hora de considerar, mejor, una aplicación de escritorio dedicada). Pero para un uso ocasional o casual, OCR Online es una excelente herramienta

Via: http://www.arturogoga.come.

No hay comentarios: