Creerò modelli personalizzati di riconoscimento vocale o emozionale

Alcune informazioni sono state tradotte automaticamente.

Bangladesh

Parlo Inglese

1 ordine completato

Specialista in AI/ML con competenze in NLP, Computer Vision e LLMs. Creo sistemi intelligenti di NLP usando modelli multimodali per il riconoscimento delle emozioni vocali, deep CNN (VGG16/VGG19) per ...
Informazioni su questo servizio

Su questo servizio


Sono specializzato nella creazione di sistemi multimodali di riconoscimento vocale ed emozionale combinando modalità audio e testo per migliorare prestazioni e precisione.

Con esperienza pratica su dataset complessi come IEMOCAP e MELD, ho sviluppato modelli ibridi personalizzati usando Bi-LSTM e CNN, raggiungendo fino al 85% di accuratezza sul dataset IEMOCAP. Sto anche esplorando attivamente Word2Vec e architetture basate su Transformer per migliorare la comprensione contestuale nel riconoscimento vocale.

Puoi consultare i miei progetti e articoli di ricerca linkati qui sotto per maggiori dettagli.


Cosa offro:

  1. Preprocessing di dataset complessi di audio e testo
  2. Sviluppo di modelli personalizzati (LSTM, CNN, Transformers, ecc.)
  3. Ottimizzazione di iperparametri e tuning del modello
  4. Supporto per tesi accademiche, ricerche o progetti industriali
  5. Soluzioni pronte per integrazione in app o API



Sentiti libero di scrivermi prima di ordinare per discutere le tue esigenze specifiche.


Expertise:

Classificazione

Discorso e audio

Analisi predittiva

Linguaggio di programmazione:

Python

Colab

API:

Altro

Strumenti:

Quaderno jupyter

Amazon SageMaker

Colab

Framework:

Scikit-learn

keras

PyTorch

Panda

tensorflow

Il mio portfolio

Altri servizi della categoria Data science e ML offerti da me