Estraerò dati da qualsiasi documento usando OCR

Alcune informazioni sono state tradotte automaticamente.

Bangladesh

Parlo Bengali, Inglese, Hindi

Ingegnere senior di Machine Learning

Sono un Senior Machine Learning Engineer con 5 anni di esperienza in produzione nello sviluppo di pipeline NLP, chatbot alimentati da LLM, sistemi di raccomandazione e soluzioni OCR. Ho consegnato sis...
Informazioni su questo servizio

Costruisco sistemi OCR pronti per la produzione e sistemi di elaborazione intelligente dei documenti (IDP) che estraggono informazioni strutturate da documenti scannerizzati, immagini, PDF, fatture, ricevute, moduli e documenti scritti a mano.

Con oltre 5 anni di esperienza come ingegnere di Machine Learning, creo pipeline OCR usando modelli di intelligenza artificiale moderni invece di affidarmi solo al tradizionale OCR.


Ciò che posso costruire

OCR per fatture

OCR per ricevute

Estrazione di passaporti / ID

OCR per biglietti da visita

Estrazione di estratti conto bancari

PDF in JSON

PDF in Excel

Immagine in testo

Estrazione di testo scritto a mano

Estrazione dati da moduli

Estrazione di tabelle

Parser di documenti personalizzati


Tecnologie

  • Python
  • PaddleOCR
  • Tesseract OCR
  • EasyOCR
  • Donut Transformer
  • TrOCR
  • OpenCV
  • FastAPI
  • Hugging Face
  • LayoutLM
  • AWS Textract (opzionale)
  • Google Document AI (opzionale)


Formati di output

  • JSON
  • CSV
  • Excel
  • XML
  • Database SQL
  • API REST


Perché lavorare con me?

Codice pronto per la produzione

Architettura pulita

Comunicazione rapida

Documentazione API

Sostegno al deployment

Sostegno a Docker


Contattami prima di ordinare se il tuo progetto contiene layout di documenti personalizzati.

Expertise:

Elaborazione immagini

Classificazione

Linguaggio di programmazione:

Python

Amazon SageMaker

Strumenti:

opencv

tensorflow

PyTorch

Altri servizi della categoria Data science e ML offerti da me