في هذه المقالة
نظرة عامة
اللغات والأصوات المدعومة
علامات لغة ترميز تركيب الكلام (SSML) المدعومة

تحويل النص إلى كلام (TTS) في Webex Contact Center

list-menuفي هذه المقالة
list-menuهل لديك ملاحظات؟

توفر هذه المقالة معلومات حول إمكانية تحويل النص إلى كلام (TTS) المضمنة في الحل Webex Contact Center الذي يحول النص بسلاسة إلى صوت مركب.

نظرة عامة

يوفر Webex Contact Center إمكانية تحويل النص إلى كلام (TTS) مضمنة للعملاء. تقوم TTS تلقائيا بتحويل أي نص مكتوب إلى كلام أو صوت مركب لتوفير خدمة Interactive Voice Response (IVR) للعملاء. تتضمن خدمة تحويل النص إلى كلام (TTS) مجموعة محددة مسبقا من الأصوات العصبية وخيارات اللغة التي يمكنك تهيئتها في التطبيق IVR لإنشاء تدفقات المكالمات.

يمكن للعملاء الحاليين على Webex Contact Center Next Generation Voice Media Platform عرض كل من موصلات Cisco TTS وGoogle TTS في إعدادات المطالبة لأنشطة IVR، مثل تشغيل الرسالة والقائمة وجمع الأرقام في مصمم التدفق. ارجع إلى دليل مصمم التدفق للحصول على تفاصيل التهيئة.

اللغات والأصوات المدعومة

Webex Contact Center يدعم 22 لغة و 2 صوت لكل لغة ل Cisco TTS. يسرد الجدول التالي اللغات والأصوات المدعومة ل Cisco TTS:

إعداد محلي

Language (اللغة)

اسم صوت ذكر

اسم صوت أنثى

de-CHالألمانية (سويسرا)دي سي إتش لوكا

دي سي إتش إيفا

*الافتراضي

دي ديالألمانية (ألمانيا)

دي دي جوناس

*الافتراضي

دي دي إيما
أون جي بيالعربية (المملكة المتحدة) en-GB-كولتون

en-GB-أغنيس

*الافتراضي

en-IEالعربية (المملكة العربية السعودية)en-IE-Liam

en-IE-Fiona

*الافتراضي

en-INالعربية (المملكة العربية السعودية) أون إن فير

إن أنانيا

*الافتراضي

en-USالعربية (المملكة العربية السعودية) en-US-دانيال

en-الولايات المتحدة-ماريا

*الافتراضي

en-AUالعربية (المملكة العربية السعودية)en-AU-كريس

en-AU-أميليا

*الافتراضي

es-ESالإسبانية (إسبانيا)

es-ES-بابلو

*الافتراضي

es-ES-كريستينا
es-MXالأسبانية (المكسيك)

es-MX-أرتورو

*الافتراضي

es-MX-لونا
es-USالأسبانية (الولايات المتحدة)

إي إس يو إس ألونسو

*الافتراضي

ES-الولايات المتحدة-بالوما
-PHالفلبينية (الفلبين)-PH-لويس

-PH-صوفيا

*الافتراضي

fr-CAالفرنسية (كندا)

الأب-كاليفورنيا-أندريه

*الافتراضي

fr-CA-Lea
fr-FRالفرنسية (فرنسا) fr-FR-Adrien

fr-FR-Ariane

*الافتراضي

تكنولوجيا المعلوماتالإيطالية (إيطاليا)

it-IT-Nico

*الافتراضي

it-IT-Alice
جا-جي بياليابانية (اليابان)جا-جي بي-هارو

جا-جي بي-أيكو

*الافتراضي

nl-NLالهولندية (هولندا) nl-NL-إدوين

nl-NL-أدريانا

*الافتراضي

رل-ررالبولندية (بولندا) رل-PL-فيليب

رل-PL-ناتاليا

*الافتراضي

PT-BRالبرتغالية (البرازيل) PT-BR-Davi

PT-BR-كاميلا

*الافتراضي

إس في-إس إيالسويدية (السويد)

sv-SE-هوغو

*الافتراضي

إس في-SE-كريستينا
ال -ثالتايلاندية (تايلاند)

ثي-تي-تشيساي

*الافتراضي

ث-ث-أنونغ
vi-VNالفيتنامية (فيتنام) السادس-VN-تاي

vi-VN-Linh

*الافتراضي

zh-CNالصينية (الماندرين ، المبسطة) zh-CN-Hong

زه-سي إن-ليو

*الافتراضي

لاستخدام اللغة الافتراضية والصوت الافتراضي ل Cisco تحويل النص إلى كلام، يجب تكوين المتغيرات العامة Global_VoiceName و Global_Language في سير المهام. لمزيد من المعلومات حول كيفية إضافة هذه المتغيرات العمومية إلى التدفق، راجع المتغيرات العمومية.

لتجاوز اللغة الافتراضية والصوت الافتراضي ل Cisco تحويل النص إلى كلام، قم بتكوين نشاط تعيين المتغير باستخدام رمز اسم الصوت المناسب.

علامات لغة ترميز تركيب الكلام (SSML) المدعومة

يسرد الجدول التالي علامات SSML القياسية المدعومة لصوت تحويل النص إلى كلام.

علامة <الكلام> هي العنصر الجذر لجميع نصوص SSML وهي إلزامية.

علامة SSML

السمات

الوصفمثال
<تكلم>

يحدد النص المحسن ب SSML.

<speak>هذه جملة مثال توضح استخدام علامة الكلام</speak>

<استراحة>
  • قوه
  • الوقت

يضيف توقفا مؤقتا في رسالتك.

<speak>رصيد حسابك هو < وقت الاستراحة = "500 مللي ثانية" / > 20 دولارا.< / الكلام>

<speak>رصيد حسابك هو <كسر القوة = "ضعيف" / > 20 دولارا.< / الكلام>

<قل كما>
  • تفسير-ك
  • التنسيق
  • التفاصيل

يتحكم في كيفية نطق أنواع خاصة من الكلمات.

<speak>< say-as interpret-as="ordinal">2nd</say-as> item تم شحنه الآن</speak>

<صوتي>Src

لتضمين صوت قصير مسجل مسبقا في رسالتك.

<الصوت src="https://cisco.com/beep.wav"></audio>

<ص>

يضيف وقفة بين الفقرات.

<speak><p>تم شحن طلبك.< / ص>

<p>وقت التسليم المتوقع هو 4pm اليوم.< / ص>

< / الكلام>

<ق>

يضيف وقفة بين الجمل.

<التحدث><الصورة>مرحبا بك في مكتب المساعدة.< / ثانية > < > يرجى الاختيار من بين الخيارات التالية.< / ق>

< / الكلام>

<علم العروض>
  • حجم
  • معدل
  • الملعب

للتحكم في مستوى الصوت ومعدل التحدث وطبقة الصوت.

  • مستوى الصوت: مستوى صوت الصوت المتحدث. يجب أن تبدأ علامة مستوى الصوت بحرف صغير "v". القيمة الافتراضية متوسطة (100 أو 0 ديسيبل).

  • معدل: معدل التحدث في النص. القيمة الافتراضية متوسطة.

  • الملعب: الملعب الأساسي للنص. القيمة الافتراضية هي 100.

يجب أن تلتزم قيم المعدل ودرجة الصوت والحجم بتوصية W3C للغة ترميز تركيب الكلام (SSML) 1.0. للحصول على معلومات تفصيلية حول المعلمات والقيم، راجع https://www.w3.org/TR/2004/REC-speech-synthesis-20040907/.

<الكلام>يمكننا تغيير مستوى صوت التحدث ليكون <حجم العروض = "-50٪">أكثر هدوءا< / العروض > أو <حجم العروض = "+ 50٪"> أعلى.< / علم العروض>

<speak> يمكننا تغيير معدل التحدث ليكون إما <معدل العروض = "-50٪"> أبطأ < / prosody> أو <معدل العروض = "+ 50٪">أسرع

< التحدث>يمكننا تغيير درجة التحدث لتكون إما <درجة العرض = "-50٪"> أقل </عروض> أو <درجة العروض = "+ 50٪">أعلى

<الفرعية>الاسم المستعار

نطق المختصرات والمختصرات

<speak>الاسم المستعار < الفرعي الخاص بك = "رقم الحساب" > الحساب. لا.< / sub> is 123456 < / تحدث>
هل كان هذا المقال مفيدًا؟
هل كان هذا المقال مفيدًا؟