Costruirò modelli di reinforcement learning e reasoning llms per la ricerca e agenti

Alcune informazioni sono state tradotte automaticamente.
5,0
5,0

India

Parlo Inglese, Hindi, Marathi

8 ordini completati

Sono un ingegnere di Computer Vision e data scientist. Interessato a lavorare su progetti legati al machine learning. Interessato anche a lavorare sull'apprendimento per rinforzo e sullo sviluppo di g...
Informazioni su questo servizio

Stai cercando un AI Research Engineer specializzato in Deep Learning, Reinforcement Learning (RL) e Reasoning con Large Language Models (LLMs)?

Aiuto ricercatori, startup e aziende a progettare, perfezionare e ottimizzare sistemi di AI avanzati che vanno oltre la semplice generazione di testo, abilitando ragionamento, presa di decisioni e comportamento di agenti intelligenti.


Cosa offro:

  • Sviluppo di Reasoning LLM
  • Prompting a catena di pensieri
  • Tool-augmented LLMs e ragionamento multi-step
  • Benchmarking su compiti di ragionamento
  • Reinforcement Learning per LLM
  • RLHF (Reinforcement Learning con feedback umano)
  • RLAIF (RL con feedback AI)
  • Ottimizzazione delle policy per allineamento e sicurezza
  • Soluzioni di Deep Learning personalizzate
  • Architetture Transformer, embeddings, AI generativa
  • Fine-tuning per compiti specifici di dominio (chatbot, ricerca, riassunto, agenti)
  • Ottimizzazione e deployment
  • Compressione del modello (quantizzazione, pruning, distillazione)
  • API di inferenza scalabili e pipeline MLOps

️ Strumenti e framework:

  • Deep Learning: PyTorch, TensorFlow, JAX
  • RL e training di LLM: Hugging Face TRL, librerie RLHF, PPO, CRPO DeepSpeed, Accelerate
  • Reasoning LLMs: LangChain, OpenAI API, Anthropic, LLaMA, Mistral

Expertise:

Sviluppo di software

Linguaggio di programmazione:

Python

Recensioni

1 recensioni per questo servizio
5,0

(1)
(0)
(0)
(0)
(0)
Valutazione dettagliata
  • Livello di comunicazione del venditore
    5
  • Consiglia a un amico
    5
  • Servizio conforme alla descrizione
    5
Ordina per
Più rilevante
  • B

    billyjoel99

    US

    Stati Uniti

    5

    Ok thank you

    Utile?
    No
Recensioni

1 recensioni per questo servizio
5,0

(1)
(0)
(0)
(0)
(0)
Valutazione dettagliata
  • Livello di comunicazione del venditore
    5
  • Consiglia a un amico
    5
  • Servizio conforme alla descrizione
    5
Ordina per
Più rilevante
  • B

    billyjoel99

    US

    Stati Uniti

    5

    Ok thank you

    Utile?
    No