Sfoglia categorie
Esplora
Fiverr Pro
Italiano
$
USD
Il riconoscimento vocale, noto anche come riconoscimento automatico del parlato (ASR), riconoscimento vocale per computer o speech-to-text, è una capacità che permette a un programma di trasformare il parlato umano in un formato scritto. Sebbene venga spesso confuso con il voice recognition, il riconoscimento vocale si concentra sulla traduzione del parlato da un formato verbale a uno testuale, mentre il voice recognition mira solo a identificare la voce di un singolo utente.
Posso integrare OpenAI whisper o Nvidia NeMo. Ho esperienza con questa libreria. Oltre a queste, posso usare qualsiasi libreria di cui tu abbia bisogno.
Expertise:
Integrazione API
•
Classificazione
•
Estrazione dati
Tecnologia:
Python