Cerrado

OCR para PDF'S y Extracción de contenido

El proyecto consiste en procesar pdf's (Algunos vienen bien estructurados en texto , otros son escaneados y deben ser pasados por un OCR) , buscar unas palabras claves apartir de logica difusa ([login to view URL]) (Ya que los pdf's cambian su estructura dependiendo de la entidad que publica la dicho pdf) y posterior a eso extraer el bloque de contenido deseado.

Pensamos que es util implementar matching learning para el aprendizaje de donde sacar cada item por cada pdf o almenos la pragmatica que debe tener el sistema.

Habilidades: Python, Machine Learning (ML), OCR, Matemáticas, Arquitectura de software

Información del empleador:
( 0 comentarios ) Manizales, Colombia

Nº del proyecto: #29288874

3 freelancers están ofertando un promedio de $4650 por este trabajo

(1 comentario)
3.7
kishanbiet

Hola, Ya hemos desarrollado aplicaciones basadas en OCR. Ya hemos realizado la extracción de datos de PDF para una empresa con sede en Malasia. Digitalizamos todas sus facturas de los últimos 15 años utilizando estas Más

$4000 USD en 45 días
(0 comentarios)
0.0
FreelancerTCMX

Hola, buen dia Podemos desarrollar su proyecto implementando el OCR para obtener el contenido del texto que necesita, así como desarrollar la lógica de la búsqueda de texto para extraer y filtrar el contenido necesari Más

$3450 USD en 30 días
(0 comentarios)
0.0