Finetunerò llms e costruirò pipeline rag per la tua app di AI


Informazioni su questo servizio
Traduzione automatica.
Stai creando un'app di AI che necessita di un modello linguistico personalizzato o di un chatbot basato sulla conoscenza? Sei nel posto giusto. Sono Yash, un ML Engineer con oltre 6 anni di esperienza e lavoro pratico su LLM in produzione presso Fidelity National Financial, dove ho finetunato LayoutLMv3 (un transformer/LLM multimodale) per l'intelligenza documentale su dati aziendali reali.
Cosa costruirò per te:
- Finetuning di open-source LLM (LLaMA 3, Mistral, Falcon, BERT, LayoutLM) sul tuo dataset personalizzato usando LoRA / QLoRA / fine-tuning completo
- Pipeline RAG che collega il tuo LLM alla tua base di conoscenza usando database vettoriali (Pinecone, ChromaDB, FAISS, Weaviate)
- Chatbot personalizzati che rispondono alle domande dai tuoi documenti, PDF, database o API
- Valutazione e benchmarking degli LLM per misurare accuratezza, tasso di hallucination e latenza
- Prompt engineering e ottimizzazione del sistema di prompt per output coerenti e affidabili
Perché assumermi?
- Esperienza reale di fine-tuning di LLM in produzione (non solo tutorial)
- Dual Degree IIT Kharagpur (B.Tech + M.Tech)
- Codice pulito, documentato e pronto per la produzione, consegnato in Python
- Esperienza di deployment su Azure per inferenza scalabile
Scopri di più su Yash Bhardwaj
I build GenAI apps, LLM pipelines and NLP systems that ship to production
- DaIndia
- Membro daapr 2026
- Tempo di risposta medio1 ora
Lingue
Hindi, Inglese
Traduzione automatica.
FAQ
Traduzione automatica.
Hai bisogno che i miei dati siano etichettati?
Per il fine-tuning, sì — posso anche aiutarti a strutturare e annotare il tuo dataset come servizio aggiuntivo. Per RAG, documenti raw (PDF, TXT, DOCX) funzionano perfettamente.
Con quali LLM lavori?
Modelli open-source — LLaMA 3, Mistral, Phi-3, BERT e la famiglia LayoutLM — finetuned usando LoRA/QLoRA tramite HuggingFace. Supporto anche l'API di fine-tuning di OpenAI per modelli GPT.
Puoi anche fare il deployment del modello?
Sì — deployo su qualsiasi piattaforma cloud: AWS SageMaker, Google Cloud Vertex AI, Azure ML o Hugging Face Spaces. Costruisco endpoint di inference FastAPI avvolti in Docker, deployabili ovunque. Per casi d'uso mobile/edge, supporto TensorFlow Lite e export ONNX. Il deployment include un'API funzionante.

