Costruirò modelli llm e slm personalizzati con qlora
Ingegnere di intelligenza artificiale e sviluppatore full stack: esperto in soluzioni di intelligenza artificiale scalabili!
Informazioni su questo servizio
Ottimizza un LLM personalizzato che conosce IL TUO settore, non l'intero internet.
Sono Raihan, ingegnere AI/ML e CTO di ClarioScope AI. Addestro piccoli modelli di linguaggio da zero (ORCH 350M3B, MedLLM, ILMA Lang) e faccio il fine-tune di open LLM con QLoRA sui tuoi dati reali.
Cosa ottieni: Fine-tune di LLM/SLM sul tuo dataset Llama, Mistral, Qwen, Gemma, Phi LoRA / QLoRA / fine-tune completo (scelgo quello che si adatta ai tuoi dati e al tuo budget) Pulizia del dataset, formattazione + generazione di dati sintetici Rapporto di valutazione rispetto al modello di base (perplessità, accuratezza) Pronto per inferenza: Hugging Face, GGUF per Ollama, o un endpoint API Codice PyTorch pulito + documentazione
Perché me, e non un gig da 90$? La maggior parte dei gig di "fine-tuning" si limitano a usare l'API di OpenAI. Io costruisco veri SLM da zero, quindi scelgo il modello di base e il rango LoRA più adatti e consegno un modello che supera effettivamente quello di base. Portfolio: raihan-js.github.io
️Processo: Chat di definizione gratuita, preparazione dei dati, training, valutazione rispetto al modello di base, consegna e passaggio.
I tuoi dati rimangono privati. Pesature complete + diritti d'uso commerciale disponibili.
Scrivimi prima il tuo caso d'uso per un preventivo preciso. Costruiamolo nel modo giusto!
Clienti con cui ho lavorato
GNatural Products
All Natural Skincare
I designed and developed Full WordPress Website for this client.
ott 2020
Il mio portfolio
Altri servizi della categoria Data science e ML offerti da me
FAQ
Traduzione automatica.
Addestri modelli da zero o solo fai il fine-tune di quelli esistenti?
Entrambe le cose. Ho addestrato la serie ORCH (350M–3B) e MedLLM da zero, e faccio il fine-tune di open LLM ogni giorno. Per la maggior parte dei casi, il fine-tune con QLoRA di un modello di base forte (Llama 3.1, Mistral, Qwen) dà l'80-90% dei benefici a una frazione del costo — ti consiglierò onestamente in base ai tuoi dati.
Quali modelli di base puoi fare il fine-tune?
Tutti i principali LLM open-source: Llama 3.1/3.2 (1B–13B), Mistral 7B / Mixtral, Qwen 2.5, Gemma 2, Phi-3, DeepSeek, e Code Llama / Code Qwen. Posso anche fare il fine-tune di OpenAI (GPT-4o-mini, GPT-4.1) e Gemini tramite le loro API di tuning.
Quanti dati di training servono?
Per LoRA/QLoRA, anche 500 esempi di alta qualità possono bastare; 2.000–10.000 è il punto ideale. Hai meno? Genero dati sintetici per te (Standard & Premium). Addestrare un modello piccolo da zero richiede un corpus consistente — confermeremo durante la chiamata di definizione.
Quale hardware usi e chi paga il calcolo?
Utilizzo Runpod / Vast.ai (GPU A100 / H100). Il costo del calcolo per le esecuzioni standard è incluso in tutti i pacchetti. Per dataset molto grandi o pre-addestramenti lunghi, il costo GPU può essere fatturato a costi reali come piccolo extra — sempre concordato in anticipo (tipicamente 20–120$).
I miei dati e il modello addestrato rimarranno privati?
Sì. I tuoi dati vengono usati solo per il tuo progetto e mai riutilizzati. Ricevi le pesature complete, il codice e i diritti d'uso commerciale (incluso nel Premium; +180$ su Basic/Standard).
Puoi deployare il modello in modo che la mia app possa chiamarlo via API?
Sì — il Premium include un FastAPI + container Docker con endpoint compatibile OpenAI, così il tuo codice esistente cambia solo l'URL di base. Gli acquirenti Standard possono aggiungere il deployment a +250$.
Qual è la differenza tra fine-tuning e RAG?
Il fine-tune modifica il comportamento e le conoscenze del modello nei suoi pesi. RAG recupera risposte dai tuoi documenti al momento della query. Vuoi RAG invece? Offro questa opzione come gig separato — o scrivimi e ti dirò quale si adatta meglio al tuo obiettivo.
Perché dovrei assumerti invece di un gig di fine-tune più economico?
La maggior parte dei gig a basso prezzo sono semplici wrapper dell'API di OpenAI. Sono CTO e addestro veri SLM da zero (portfolio: raihan-js.github.io) — quindi ti dirò quando il fine-tune non è la soluzione giusta, sceglierò il modello di base e la configurazione LoRA più adatti, e consegnerò un modello che supera di misura quello di base.

