Mi concentrerò sull'agente di deep learning, multi agent rag, memoria

Alcune informazioni sono state tradotte automaticamente.

Cina

Parlo Inglese

sviluppatore e ricercatore AI

Sono un ingegnere e ricercatore di AI specializzato in deep learning, large language models, AI multimodale, modelli di diffusione, architetture basate su Mamba, AI agentica, reinforcement learning, R...
Informazioni su questo servizio

## Guida all'innovazione nel design e miglioramenti per l'apprendimento rinforzato agentico RL e LLM


 Gli LLM stanno evolvendo gradualmente da macchine Q&A a turni singoli a sistemi agentici capaci di interagire ripetutamente

 tra ragionamento e uso di strumenti esterni in ambienti multi-turno. Da Search-R1 a ToolRL e SkyRL, i modelli devono ora

 non solo pensare, ma anche cercare, calcolare, chiamare API e migliorare continuamente se stessi attraverso RL in traiettorie multi-

 step.


 ## 1. Miglioramenti innovativi nel design degli algoritmi di RL agentico


 ### 1.1 Architettura di apprendimento rinforzato gerarchico


 Un meccanismo decisionale gerarchico divide le decisioni di un Agents in tre livelli: il livello strategico per la decomposizione dei compiti, il livello tattico per la selezione degli strumenti e il livello di esecuzione per operazioni concrete. Ogni livello

 adotta una politica RL diversa.


 La scoperta automatica di sotto-obiettivi permette agli Agents di identificare obiettivi intermedi riutilizzabili durante l'addestramento e di costruire una

 biblioteca di competenze.


 L'apprendimento automatico del curriculum enfatizza la capacità degli Agents di progredire autonomamente da compiti semplici a compiti complessi

 senza curricula progettati manualmente.


 ### 1.2 Interazione con ambienti multimodali

Linguaggio di programmazione:

Python

JavaScript

LISP

Pytorch

Framework e strumenti per modelli IA:

Tipo di dati:

Testo

IMMAGINI

Dati tabulari

Motore IA:

GPT

Tag correlati