Skup podataka visokokvalitetnog kineskog tradicionalnog TTS-a za modele umjetne inteligencije i govora
Označite
Skup podataka tradicionalnog kineskog jezika
Vrsta skupa podataka
TTS
Opis
Snimke s jednim izgovorom, koje obično padaju u raspon od 5 do 30 sekundi.
Koristite slučaj
ASR, virtualni pomoćnik, chatbot, konverzacijski AI, analiza govora, TTS, jezično modeliranje
Ukupno sati
1,028
Uzorak stope
48 kHz
Audio kanala
Mono
Platforma za snimanje
Mobilna aplikacija
Audio Format
. WAV
Format transkripcije
.json
WER (%)
5
Zemlja
Kina
Jezik
Kineski tradicionalni
rod
Žene 1,069, Muškarci 262, Nepoznato 3
Broj zvučnika
1,334
Dob
18-50
Osnaživanje timova za izradu vodećih svjetskih AI proizvoda.
Kontaktirajte nas sada kako biste se oslobodili svojih briga oko prikupljanja podataka o audio/govornoj obuci