Mi occuperò di riconoscimento vocale automatico e consulenza su speech to text

D
djimenez_ml
D
djimenez_ml
David J
Alcune informazioni sono state tradotte automaticamente.

Informazioni su questo servizio

Traduzione automatica.

Stai cercando di integrare il riconoscimento vocale, comandi vocali o AI conversazionale nel tuo progetto? Sono qui per aiutarti! Con competenze nelle tecnologie di riconoscimento vocale all'avanguardia come Whisper, Wav2vec, Kaldi, Vosk, phi4, MMS, seamless-m4t, DeepSpeech, e altre, offro consulenze personalizzate per guidarti nell'implementazione, ottimizzazione e risoluzione dei problemi.

Mi specializzo in:

  • Progettare e implementare soluzioni di riconoscimento vocale
  • Scegliere le API migliori (Deepgram, AssemblyAI, Gemini, OpenAI, Google Speech-to-Text, ecc.)
  • Allenare e perfezionare modelli di riconoscimento vocale SOTA
  • Migliorare la precisione per lingue o dialetti specifici
  • Affrontare le sfide in ambienti rumorosi
  • Diarizzazione del parlante
  • Rilevamento dell'attività vocale
  • Rilevamento di eventi sonori

Discutiamo delle tue esigenze e diamo vita alle tue idee!

Scopri di più su David J

David J

Speech Recognition

5,0(7)
  • DaSpagna
  • Membro danov 2024
  • Tempo di risposta medio1 giorno
  • Ultima consegna1 settimana
  • Lingue

    Spagnolo, Inglese
I have +6 year of experience working with machine learning and deep learning applied to speech recognition: - Speech to text, - Diarization, - Voice Activity Detection, - Sound Event Detection, - Denoising, - Audio Signal Processing, - Emotion... in different languages. I have been working with SOTA Automatic Speech Recognition APIs and frameworks: Whisper, Kaldi, Vosk, MMS, DeepSpeech, speechbrain and wav2vec2. I have been working to fine-tuned models to improve WER and speed inference on multiple language. Hugging Face: https://huggingface.co/deepdml Github: https://github.com/djpg

Traduzione automatica.

Il mio portfolio