Svilupperò sistemi rag di produzione progettati per latenza, costo e affidabilità


Informazioni su questo servizio
Traduzione automatica.
La maggior parte dei chatbot RAG sono demo in cosplay di produzione, si screenshotano bene e crollano entro la terza domanda dell'utente. Io costruisco la versione che non lo fa.
Per team di cui la demo (la tua, ChatGPT o di un freelancer) deve diventare qualcosa di cui gli utenti si fidano.
𝗘𝗡𝗚𝗜𝗡𝗘𝗘𝗥𝗘𝗗 𝗔𝗚𝗔𝗜𝗡𝗦𝗧 𝗙𝗢𝗨𝗥 𝗕𝗨𝗗𝗚𝗘𝗧𝗦:
Retrieval BM25 + dense + reranker, precisione del contesto RAGAS >0.75
Latenza sotto 800ms per il primo token, p95 sotto 2,5s
Costo tipico di 0,0008$ per query su gpt-4o-mini, modellato in anticipo
Fiducia e fedeltà >0,85, citazioni delle fonti, osservabilità per query
𝗣𝗥𝗢𝗢𝗙, 𝗡𝗢𝗧 𝗣𝗥𝗢𝗠𝗜𝗦𝗘𝗦
Ogni build viene consegnata con un rapporto di valutazione contro i TUOI documenti e le TUOE coppie Q&A. Se non raggiungi le soglie concordate, non paghi il 30% finale. In forma scritta.
𝗖𝗔𝗣𝗔𝗖𝗜𝗧𝗔
Due build di produzione al mese. Se il mio badge di risposta mostra più di 24h, sono pieno quella settimana.
𝗡𝗢𝗡 𝗣𝗘𝗥 𝗧𝗘 𝗦𝗜 𝗦𝗧𝗢𝗣𝗣𝗔 𝗦𝗨 𝗦𝗢𝗣𝗣𝗟𝗜𝗖𝗜 𝗖𝗛𝗔𝗧𝗚𝗣𝗧 𝗔𝗣𝗣𝗥𝗢𝗩𝗜 𝗦𝗨 𝗜𝗟 𝗣𝗥𝗢𝗣𝗥𝗜𝗢 𝗖𝗢𝗦𝗧𝗢 𝗗𝗜 𝗠𝗘𝗡𝗢 𝗗𝗜 200$.
𝗜𝗟 𝗜𝗡𝗜𝗭𝗜𝗢 𝗣𝗢𝗦𝗧𝗢
Inviami una descrizione del problema di 1 paragrafo, un documento di esempio e tre domande utente di esempio. Risponderò entro 24h con un preventivo fisso o un referral.
Scopri di più su Anwar K
AI Software Engineer
- DaPakistan
- Membro dafeb 2026
- Tempo di risposta medio1 ora
Lingue
Inglese
Traduzione automatica.

