अरबी डेटासेट
مجموعة البيانات العربية
एआय आणि स्पीच मॉडेल्ससाठी उच्च-गुणवत्तेचे अरबी सामान्य संभाषण आणि टेक्स्ट-टू-स्पीच (टीटीएस)
आढावा
शीर्षक (भाषा)
अरबी भाषा डेटासेट
डेटासेट प्रकार
कॉल सेंटर, सामान्य संभाषण, संगीत, पटकथाबद्ध एकपात्री प्रयोग
देश
अरबी
वर्णन
या डेटासेटमध्ये अनस्क्रिप्टेड सिंथेटिक एजंट-ग्राहक टेलिफोनिक संभाषणे (५-१५ मिनिटे), गल्फ अरेबिकमध्ये नैसर्गिक मानव-ते-मानव टेलिफोनिक संभाषणे (१५-६० मिनिटे) आणि ट्रान्सक्रिप्शनसह गाण्याचे ऑडिओ समाविष्ट आहेत, जे भाषण आणि भाषा तंत्रज्ञानाचे प्रशिक्षण आणि मूल्यांकन करण्यासाठी विविध भाषण डेटा प्रदान करतात.
केस वापरा
ASR, व्हर्च्युअल असिस्टंट, चॅटबॉट, संभाषणात्मक AI, स्पीच अॅनालिटिक्स, TTS, भाषा मॉडेलिंग
डेटा सेट तपशील
| डेटासेट प्रकार | नमूना दर | स्पीकर्स | चॅनेल | एकूण तास | एकूण वक्त्यांची संख्या |
|---|---|---|---|---|---|
| कॉल सेंटर | 8 kHz | 2 वक्ते | दुहेरी | 62:52:19 | विनंतीवरून |
| कॉल सेंटर | 8 kHz | 2 वक्ते | मोनो | 1,025:09:19 | विनंतीवरून |
| सामान्य संभाषण | 8 kHz | 2 वक्ते | दुहेरी | 254:16:34 | 626 |
| संगीत | 48 kHz | सिंगल स्पीकर | मोनो | 03:17:21 | 10 |
| स्क्रिप्टेड मोनोलॉग | 48 kHz | सिंगल स्पीकर | मोनो | 4,249:00:00 | 2,125 |
| स्क्रिप्टेड मोनोलॉग | 24 kHz | सिंगल स्पीकर | मोनो | 2,300:00:00 | विनंतीवरून |
वैशिष्ट्यीकृत ग्राहक
जगातील अग्रगण्य AI उत्पादने तयार करण्यासाठी संघांना सशक्त बनवणे.
आपण जे शोधत आहात ते सापडत नाही?
नवीन ऑफ-द-शेल्फ डेटासेट सर्व डेटा प्रकारांमध्ये गोळा केले जात आहेत
तुमच्या ऑडिओ/स्पीच ट्रेनिंग डेटा कलेक्शनच्या चिंता दूर करण्यासाठी आत्ताच आमच्याशी संपर्क साधा