Costruirò un workflow di ai agentica con langchain, n8n, llama 3 e voice ai
Ingegnere AI
Informazioni su questo servizio
Lavoro con i modelli di AI e gli strumenti di automazione più capaci disponibili oggi. Per i compiti con LLM utilizzo LLaMA 3, Qwen 3, Mistral, GPT-4.5, Claude Sonnet 4.6 e Gemini 2.0, scegliendo il modello più adatto in base al tuo caso d'uso e al budget. Per la velocità di inferenza, LLaMA 3 e Mixtral funzionano tramite Groq AI per una latenza ultra-bassa in applicazioni di agenti in tempo reale.
Per l'AI vocale costruisco pipeline complete usando OpenAI Whisper per il riconoscimento vocale multilingue, NVIDIA Parakeet TDT per l'ASR in streaming in tempo reale e ElevenLabs per il cloning vocale e la sintesi naturale testo-voce.
Il mio stack di automazione si basa su LangGraph per l'orchestrazione multi-agente con stato, LangChain per pipeline RAG e chiamate agli strumenti, e n8n per l'automazione visiva dei workflow senza codice. Le librerie di supporto includono Hugging Face Transformers, PyTorch, spaCy, FAISS, Pinecone e LlamaIndex.
Sul lato piattaforma, mi integro con Shopify, WooCommerce, PrestaShop e Magento per l'automazione dell'ecommerce, Gmail e Google Workspace per i workflow di produttività, e Facebook, Instagram e Google Ads per l'automazione dei social media, tutti collegati tramite API REST e pipeline n8n.
Il mio portfolio
FAQ
Traduzione automatica.
In quali modelli AI sei specializzato nel perfezionamento?
Mi specializzo nel fine-tuning e nel deployment di una vasta gamma di modelli di base moderni: LLM open-source: Qwen 3 (Alibaba MoE & dense), LLaMA 3, Mistral / Mixtral, Falcon, BERT, GPT-2 — usando tecniche come LoRA, QLoRA, PEFT e RLHF tramite Hugging Face Transformers. API proprietarie: OpenAI GPT-4.5, Google
Puoi integrare voice AI nella mia applicazione esistente?
Sì. Costruisco pipeline complete di voice AI che si integrano direttamente in applicazioni web, mobile o backend. Questo include: ASR (speech-to-text): API Whisper per trascrizioni multilingue ad alta precisione, o Parakeet TDT tramite NVIDIA NeMo per streaming ASR in tempo reale a bassa latenza. TTS (text-to-speech):
Con quali modelli lavori?
La scelta del modello dipende dal tuo compito, budget e necessità di deployment: Claude Sonnet 4.6 — Ideale per flussi di lavoro agentici, ragionamento su documenti lunghi e chatbot sicuri e che seguono le istruzioni. GPT-4.5 — Perfetto per pipeline RAG, chiamate di funzione e applicazioni aziendali di uso generale. Gemini 2.0 — Migliore per
