Registrerò un dataset di discorsi in pashto o dari per l'addestramento di modelli AI


Informazioni su questo servizio
Traduzione automatica.
Stai cercando registrazioni vocali pulite, native in Pashto o Persiano/Dari per il tuo progetto di AI, riconoscimento vocale o NLP?
Sei nel posto giusto!
Registrerò frasi di alta qualità in Pashto o Dari con accuratezza nativa, perfette per addestrare modelli AI, speech-to-text (STT) e sistemi ASR.
Ti fornirò:
- Audio WAV/MP3 senza rumore
- Accenti nativi in Pashto e Persiano/Dari
- Trascrizione + etichettatura + metadati (CSV/Excel)
- Più speaker disponibili (su richiesta)
Che tu abbia bisogno di un dataset di partenza piccolo o di un corpus di discorsi di grandi dimensioni, posso consegnare registrazioni rapide, affidabili e professionali, ascoltate e approvate.
Costruiamo insieme il tuo dataset AI con chiarezza, precisione e fiducia!
Scopri di più su Mansour Sadat
Innovative Frontend Web Developer and Fluent Trilingual Translator
- DaAfghanistan
- Membro dalug 2024
- Tempo di risposta medio1 ora
Lingue
Inglese, Pashtu, Persiano
Traduzione automatica.
Il mio portfolio
FAQ
Traduzione automatica.
Cosa fornisci esattamente nelle registrazioni?
Fornisco frasi in Pashto o Persiano/Dari in audio pulito e senza rumore (WAV/MP3). A seconda del pacchetto, includo anche trascrizione, etichettatura e metadati in formato CSV/Excel.
Cosa sono i metadati?
I metadati sono informazioni strutturate su ogni file audio (ad esempio, nome file, testo della frase, ID del speaker, durata). Questo rende il tuo dataset facile da organizzare e usare per progetti di AI/ML.
Cos'è la trascrizione?
La trascrizione è la versione scritta del testo dell'audio, utile per addestrare modelli di riconoscimento vocale.
Cos'è l'etichettatura?
L'etichettatura significa taggare il dataset (ad esempio, per speaker, genere, tipo di frase o categoria) in modo che i modelli di AI possano riconoscere schemi più efficacemente.
Posso richiedere più speaker?
Sì! Di default registro con un speaker nativo, ma puoi ordinare l'extra gig “Additional Speaker” per più voci.
E se ho bisogno di un dataset più grande (migliaia di frasi)?
Inviami un ordine personalizzato — posso aumentare le dimensioni e creare un dataset su misura per il tuo progetto con la partecipazione di numerosi speaker nativi.
In quali formati consegnate?
L'audio viene consegnato in WAV o MP3, mentre testo, trascrizione e metadati vengono consegnati in TXT, CSV o Excel, a seconda delle tue preferenze.

