عند دخوله إلى بهو المطار، وسط صخب وضجيج الأشخاص العائدين من رحلة عمل، توقف هو مينه دوك لبضع ثوانٍ عندما سمع صوتًا أنثويًا لطيفًا مألوفًا يقرأ إعلانًا على النظام.
موظفو Vbee يعملون في المقر الرئيسي للشركة في هانوي - الصورة: NVCC
ابتسم، وشعر بالراحة والسعادة كما لو أنه التقى قريبًا له. كان هذا "القريب" واحدًا من أصوات الذكاء الاصطناعي العشرين التي "استمتع" بها دوك وفريق Vbee لأيام وشهور عديدة، مُكرّسين كل جهودهم في كل سطر صوتي، مُراعين كل فارق بسيط في الصوت لجعله أكثر طبيعية وشبهًا بالإنسان.
بداية صعبة
لا أعلم كم مرة شعر الرئيس التنفيذي هو مينه دوك والمديرة التقنية نجوين ثي تو ترانج - المؤسسان لشركة Vbee Data Solutions and Services Joint Stock Company - بمثل هذا الشعور من الفرح والفخر.
لقد التقوا بـ "معارف خاصين" في العديد من المواقف المختلفة: أصوات واضحة على أنظمة مكبرات الصوت في المدارس، أو أصوات دافئة في المباني، أو أصوات مهنية من لوحات التوزيع الأوتوماتيكية للعديد من الشركات.
لم تعد أفكار Vbee مجرد نتاج خوارزميات وأكواد، بل إنها دخلت الحياة بالفعل، وقدمت مساهمات صامتة ولكنها قوية في العديد من المجالات.
من تقديم الكتب إلى دبلجة الأفلام إلى الإعلانات الآلية لمركز الاتصال، تعمل Vbee على إعطاء حياة جديدة لتكنولوجيا الصوت.
باعتبارها "أم" تقنية TTS الأساسية، تطمح الدكتورة نجوين ثي ثو ترانج دائمًا إلى تقديم منتجات من تقنية تركيب الكلام الفيتنامية - وهي التقنية التي كرست لها الكثير من الجهد منذ أطروحتها للدكتوراه في جامعة باريس 11 - للمستخدمين الحقيقيين.
كانت بدايات Vbee صعبة. فرغم أنها كانت مجانية في أول عامين، لم تجذب أداة تحويل النص إلى كلام (TTS) سوى شريحة صغيرة من الجمهور. ثم شكّلت جائحة كوفيد-19 نقطة تحول غير متوقعة.
في ظلّ اللوائح الصارمة المتعلقة بالتباعد الاجتماعي، اضطرت شركات مثل FE Credit وMomo وViet Credit و Sacombank إلى إيجاد طرق للوصول إلى آلاف العملاء. وهنا أتيحت الفرصة لشركة Vbee: من تذكيرات الديون إلى الردود التلقائية، أصبحت منتجاتها على الفور الحل الأمثل. في ذلك الوقت، شكّلت خدمات المساعدين الافتراضيين ومراكز الاتصال الافتراضية ما يصل إلى 80% من إيرادات Vbee.
مع انحسار الجائحة وتراجع الاقتصاد العالمي، واجهت Vbee تحديًا جديدًا. فقد أحيت موجة الذكاء الاصطناعي التوليدي (GenAI) واتجاهات المحتوى الرقمي أداة تحويل النص إلى كلام. واليوم، من تيك توك إلى يوتيوب وفيسبوك، تنتشر أصوات الذكاء الاصطناعي التي تقدمها Vbee في كل مكان.
"نوفر حاليًا الكثير من محتوى TTS"، هذا ما قاله السيد هو مينه دوك بفخر. حاليًا، تجاوز عدد مستخدمي Vbee مليوني مستخدم، وهذا العدد في ازدياد مستمر بنسبة ٢٠٪ شهريًا.
لقد قامت شركة Vbee بتدريب أكثر من 20 صوتًا مؤسسيًا عالي الجودة، وإذا قمت بحساب الأصوات المخصصة، فقد قاموا بإنشاء أكثر من 200 صوت مختلف للذكاء الاصطناعي.
بفضل تقنية نسخ الصوت الجديدة التي تم البحث عنها واختبارها مؤخرًا، أصبح الصوت الجديد يحتاج الآن إلى 3 دقائق فقط من البيانات المسجلة للتدريب بدلاً من 4 إلى عشرات الساعات من التسجيل كما كان الحال قبل عامين.
الرئيس التنفيذي هو مينه دوك والمدير التنفيذي للتكنولوجيا نجوين ثي تو ترانج - اثنان من مؤسسي شركة Vbee Data Solutions and Services المساهمة - الصورة: NVCC
"نحن أفضل في فهم اللغة الفيتنامية"
وفي السباق نحو تكنولوجيا تركيب الكلام، يرى الرئيس التنفيذي هو مينه دوك أن هناك وقتاً ستصل فيه جهود الابتكار التكنولوجي تدريجياً إلى حدودها القصوى.
وبحسب قوله، فإن شركة Vbee لا تعمل فقط على تطوير التكنولوجيا الأساسية لمعالجة الكلام الفيتنامي، بل إنها تعمل أيضًا على بناء نظام تكنولوجي قادر على فهم اللغة الفيتنامية بشكل عميق - مع كل التفاصيل الدقيقة والنغمات والثقافة الفريدة التي لا يستطيع إلا الشعب الفيتنامي الحقيقي فهمها بالكامل.
بصفتها الشركة الرائدة في سوق تحويل النص إلى كلام في فيتنام، يعتقد مديرا Vbee أن أداتهما أصبحت المعيار في قراءة الصوت بالذكاء الاصطناعي للغة الفيتنامية. لا يُقدّر المستخدمون الدقة فحسب، بل يشعرون أيضًا بالعاطفة في كل صوت تُطوّره Vbee.
على سبيل المثال، في اللغة الفيتنامية، تحمل كلمة "alley" فقط العديد من الأسماء المختلفة اعتمادًا على المنطقة مثل "hèm" و"kiệt" و"xếc" - كل كلمة لها فارق بسيط مختلف يحتاج الذكاء الاصطناعي إلى فهمه.
ولتحقيق ذلك، استثمرت Vbee بشكل كبير في جمع مجموعات البيانات النموذجية بالإضافة إلى الاستثمار في أنظمة خادم قوية لتدريب الذكاء الاصطناعي.
"لمساعدة الذكاء الاصطناعي على فهم ومعالجة كل فارق بسيط إقليمي بشكل صحيح، كان علينا بناء مجموعات عينات لا حصر لها، وكانت تكلفة خادم المعالجة مرتفعة للغاية أيضًا"، كما شارك الرئيس التنفيذي هو مينه دوك.
أمضت الدكتورة نجوين ثي ثو ترانج أكثر من 15 عامًا في البحث في تقنية تحويل النص إلى كلام الأساسية في Vbee لفك رموز اللغة الفيتنامية الفريدة وقواعدها النحوية. بالنسبة لها، لغتها الأم عالمٌ دقيقٌ مليءٌ بالدلالات التعبيرية الدقيقة.
"لغتي الفيتنامية معقدة ومثيرة للاهتمام للغاية، ونبراتها هي الأصعب والأكثر اختلافًا عن العديد من اللغات الشائعة الأخرى في العالم. كلما فهمتُ اللغة أكثر، كان نموذجي أكثر دقة"، أوضحت.
تؤكد شركة Vbee تدريجيًا أنها ستصبح جزءًا لا غنى عنه من الأدوات والأجهزة التي تحتوي على برامج معالجة اللغة الفيتنامية المتكاملة في عصر التكنولوجيا.
في كل كلمة وكل صوت، لا يقوم فريق Vbee بالبحث والتطوير التكنولوجي فحسب، بل يسعى أيضًا إلى خلق "عاطفة فيتنامية" حقيقية في أصوات الذكاء الاصطناعي الخاصة بهم.
اسم Vbee هو اختصار لعبارة "الفيتناميون كن عيونك"، والتي استوحيتها من رغبتي الأولى في تطوير أداة تُصبح "عيونًا" للمكفوفين. ولكن في ظل التوجه الحالي نحو التطوير، حيث يرغب الكثيرون في التحول إلى الاستماع أكثر من الرؤية، نعتقد أن Vbee سيصبح أيضًا "عيونًا" للجميع.
الدكتورة نجوين ثي ثو ترانج (محاضرة، كلية تكنولوجيا المعلومات، جامعة هانوي للعلوم والتكنولوجيا، مؤسسة ومديرة التكنولوجيا في شركة Vbee)
لقاء محبي الكتب الصوتية
وُلدت Vbee من علاقة الدكتورة نجوين ثي ثو ترانج بمجتمع المكفوفين. منذ أيام دراستها، شاركت في تسجيل الكتب الصوتية وتطوير قارئ فيتنامي لدعم المكفوفين.
ألهمتها هذه التجارب لتطوير برنامج قراءة باللغة الفيتنامية، وهو البرنامج الذي سبق برنامج Vbee. في عام ٢٠١٨، أسست هي والسيد هو مينه دوك، زميلها في جامعة هانوي للعلوم والتكنولوجيا، والذي يتمتع بخبرة في مشروع Socbay.com ورقمنة الكتب الصوتية، برنامج Vbee، وهو برنامج رائد في مجال تحويل النصوص إلى كلام في فيتنام.
إنجازات Vbee المتميزة
- الجائزة الأولى في تحدي كوالكوم للابتكار في فيتنام 2024
- جائزة خاصة لجائزة Tuoi Tre للشركات الناشئة لعام 2023
- شركة ناشئة فائزة في برنامج Grab Venture Ignite 2020 Accelerator
- الجائزة الأولى للمواهب الفيتنامية 2018، والجائزة الثانية للمواهب الفيتنامية 2020
- شهادة التكنولوجيا الأساسية الفيتنامية في برنامج التحول الرقمي الوطني 2025 - 2030 التابع لوزارة المعلومات والاتصالات
- مشروع فائز بجائزة فيتنام للإعلام الرقمي 2018 وصندوق Vingroup 2019.
رؤية إقليمية
بعد تأكيد مكانتها في السوق الفيتنامية، تهدف Vbee إلى التوسع في جنوب شرق آسيا مع خطط لجلب تقنية TTS إلى دول مثل لاوس وتايلاند وكمبوديا والفلبين بحلول عام 2026.
وبحسب الدكتورة نجوين ثي تو ترانج، فإن التقدم السريع للتكنولوجيا اليوم مع ظهور نماذج متعددة اللغات سيجعل من الأسهل تطوير أدوات تحويل النص إلى كلام للغات أخرى.
وهي تقوم حاليًا بالبحث في تكنولوجيات الكلام للغة التايلاندية والصينية والإنجليزية، مما يفتح خطوات جديدة لشركة Vbee في السوق الدولية.
[إعلان 2]
المصدر: https://tuoitre.vn/vbee-va-no-luc-chap-canh-cho-tieng-viet-20250217102146767.htm
تعليق (0)