अरबी डेटासेट

مجموعة البيانات العربية

एआय आणि स्पीच मॉडेल्ससाठी उच्च-गुणवत्तेचे अरबी सामान्य संभाषण आणि टेक्स्ट-टू-स्पीच (टीटीएस)

आढावा

शीर्षक (भाषा)

अरबी भाषा डेटासेट

डेटासेट प्रकार

कॉल सेंटर, सामान्य संभाषण, संगीत, पटकथाबद्ध एकपात्री प्रयोग

देश

अरबी

वर्णन

या डेटासेटमध्ये अनस्क्रिप्टेड सिंथेटिक एजंट-ग्राहक टेलिफोनिक संभाषणे (५-१५ मिनिटे), गल्फ अरेबिकमध्ये नैसर्गिक मानव-ते-मानव टेलिफोनिक संभाषणे (१५-६० मिनिटे) आणि ट्रान्सक्रिप्शनसह गाण्याचे ऑडिओ समाविष्ट आहेत, जे भाषण आणि भाषा तंत्रज्ञानाचे प्रशिक्षण आणि मूल्यांकन करण्यासाठी विविध भाषण डेटा प्रदान करतात.

केस वापरा

ASR, व्हर्च्युअल असिस्टंट, चॅटबॉट, संभाषणात्मक AI, स्पीच अॅनालिटिक्स, TTS, भाषा मॉडेलिंग

डेटा सेट तपशील

डेटासेट प्रकार नमूना दर स्पीकर्स चॅनेल एकूण तास एकूण वक्त्यांची संख्या
कॉल सेंटर 8 kHz 2 वक्ते दुहेरी 62:52:19 विनंतीवरून
कॉल सेंटर 8 kHz 2 वक्ते मोनो 1,025:09:19 विनंतीवरून
सामान्य संभाषण 8 kHz 2 वक्ते दुहेरी 254:16:34 626
संगीत 48 kHz सिंगल स्पीकर मोनो 03:17:21 10
स्क्रिप्टेड मोनोलॉग 48 kHz सिंगल स्पीकर मोनो 4,249:00:00 2,125
स्क्रिप्टेड मोनोलॉग 24 kHz सिंगल स्पीकर मोनो 2,300:00:00 विनंतीवरून

वैशिष्ट्यीकृत ग्राहक

जगातील अग्रगण्य AI उत्पादने तयार करण्यासाठी संघांना सशक्त बनवणे.

Shaip आमच्याशी संपर्क साधा

आपण जे शोधत आहात ते सापडत नाही?

नवीन ऑफ-द-शेल्फ डेटासेट सर्व डेटा प्रकारांमध्ये गोळा केले जात आहेत

तुमच्या ऑडिओ/स्पीच ट्रेनिंग डेटा कलेक्शनच्या चिंता दूर करण्यासाठी आत्ताच आमच्याशी संपर्क साधा

  • हे फील्ड प्रमाणीकरण उद्देशांसाठी आहे आणि त्यामध्ये बदल नसावे.
  • नोंदणी करून, मी शैपशी सहमत आहे गोपनीयता धोरण आणि Terms of Service आणि Shaip कडून B2B विपणन संप्रेषण प्राप्त करण्यासाठी माझी संमती द्या.