Costruirò una pipeline RAG su AWS Bedrock per i tuoi documenti e dati

I
iloomnex
I
iloomnex
Iloomnex
Alcune informazioni sono state tradotte automaticamente.

Informazioni su questo servizio

Traduzione automatica.

RAG è facile da dimostrare e difficile da mettere in produzione. La maggior parte dei progetti "chat con i tuoi documenti" si sgretolano nel momento in cui arrivano utenti reali. La retrieval restituisce frammenti irrilevanti. Le citazioni non risalgono ai documenti originali. Le finestre di contesto aumentano i costi per query. Le risposte hallucinate perché il layer di retrieval non è mai stato effettivamente ottimizzato. La demo funzionava. La produzione no.

Costruisco RAG come fanno gli ingegneri backend con qualsiasi sistema di produzione. Inizia con il vero chunking dei documenti, non con gli splitter di default. Embedding in pgvector o OpenSearch con un layer di retrieval che puoi effettivamente debug. Generazione su AWS Bedrock con modelli Claude o Titan. Tracciamento delle citazioni in modo che le risposte puntino ai documenti originali. Filtraggio dei metadati per far sì che gli utenti possano recuperare solo dai documenti a cui hanno accesso.

Ho esperienza pratica con Bedrock grazie al programma AWS AI and ML Scholars, oltre a una solida esperienza di backend di produzione da più di 4 anni di sistemi che gestiscono traffico reale. La parte interessante è il codice di retrieval e generazione. L'infrastruttura che lo circonda è quella che decide se il tuo RAG funziona davvero in produzione.

Scrivimi per dirmi cosa vuoi rendere interrogabile.

Scopri di più su Iloomnex

Iloomnex

Senior backend engineer

5,0(11)
  • DaPakistan
  • Membro danov 2023
  • Tempo di risposta medio1 ora
  • Ultima consegna1 anno
  • Lingue

    Inglese
Senior backend engineer, 4+ years shipping production systems. I build Node.js and NestJS backends on AWS serverless. Lambda, SQS, EventBridge, Step Functions. I handle the integrations most devs avoid: Amazon SP-API, Shopify, QuickBooks, Xero, and LLMs via Bedrock, OpenAI, and Claude. Day job is a multi-tenant HRIS and payroll platform running real traffic. On Fiverr as iLoomNex, I take on backend builds, API integrations, and AI features that need to work in production, not just in a demo. Always online. Reply in under an hour. Any timezone.

Traduzione automatica.

Il mio portfolio