Auditerò e ottimizzerò le prestazioni della tua ricerca vettoriale rag

V
valhallasoft
V
valhallasoft
Martin Poli
Alcune informazioni sono state tradotte automaticamente.

Informazioni su questo servizio

Traduzione automatica.

Il tuo RAG è in produzione ma restituisce risultati scadenti. La latenza è lenta. I costi stanno salendo. Le allucinazioni passano inosservate. Ti suona familiare?


Audito e correggo pipeline RAG che sembrano a posto sulla carta ma falliscono nel mondo reale. Oltre 10 anni di lavoro su backend di produzione, attualmente guidando la migrazione della ricerca AI per uno dei più grandi rivenditori dell'America Latina (50K+ prodotti, 1M+ utenti giornalieri).


Cosa audito:

  • Modello di embedding adatto al tuo dominio
  • - Strategia di chunking e sovrapposizione
  • - Recall e precisione di retrieval (con set di valutazione)
  • - Efficacia del reranking
  • - Pesi di ricerca ibrida (keyword vs semantico)
  • - Latenza per fase e costo per query
  • - Pattern di allucinazioni

Cosa ottieni:

  • Diagnostica scritta con correzioni prioritarie
  • - Modifiche al codice per i problemi principali (Standard / Premium)
  • - Set di valutazione per misurare i progressi
  • - Configurazione del monitoraggio (Premium)

Stack: Python, OpenAI, Anthropic, Pinecone, Weaviate, Qdrant, pgvector, LangChain.


Inviami il tuo stack e un esempio di query che fallisce. Ti dirò cosa probabilmente è rotto prima che tu paghi.

Scopri di più su Martin Poli

Martin Poli

Senior RAG and AI Search Engineer for Backend at Scale

  • DaUruguay
  • Membro damar 2020
  • Lingue

    Inglese
Senior Platform Engineer with 10+ years building production systems at scale. Currently leading platform infra and AI search for Argentina's largest retail chain (200+ stores, 1M+ users/day), replacing Google Search API with RAG-based semantic search across 50K+ products. What I do best: - RAG, embeddings, OpenAI/Anthropic/Bedrock - Vector DBs: Pinecone, Weaviate, Qdrant, pgvector - Backend at scale: Python, Go, Node.js, PHP 8 - AWS EKS, Karpenter, Terraform, multi-account IaC Have a search problem or an LLM pipeline that won't ship? Send me your stack.

Traduzione automatica.

Il mio portfolio