تُعدّ مسابقة معالجة اللغة والكلام الفيتنامية (VLSP) جزءًا من المؤتمر الدولي السنوي لمعالجة اللغة والكلام الفيتنامية، الذي يُنظّمه نادي VLSP، وهو فرع من جمعية فيتنام لتكنولوجيا المعلومات. يُنظّم VLSP 2023 عشر مسابقات في معالجة الكلام والنصوص، تجمع باحثين وخبراء بارزين ووحدات تطوير التكنولوجيا.
على الرغم من أن هذه كانت المرة الرابعة التي تشارك فيها شركة Viettel AI في المسابقة وقد فازت بها ثلاث مرات من قبل، إلا أن مهندسي Viettel ما زالوا يواجهون العديد من الصعوبات بسبب التغييرات في هيكل فئة المسابقة.
تحديدًا، مقارنةً بالعام الماضي، تم دمج فئتي التعرف على الكلام والتعرف على المشاعر هذا العام في فئة واحدة. يجب على الفرق حل مشكلتين في الوقت نفسه لضمان التعرف على نص الجملة ومشاعرها، مما ضاعف من حجم العمل والصعوبة.
استخدم كل البيانات، سواء كانت منخفضة الجودة أو عالية الجودة
لا يقتصر اختبار هذا العام على تغيير هيكل الفئات فحسب، بل يركز أيضًا على بناء نماذج من الصفر بشروط بيانات محدودة، بما في ذلك البيانات الخام، وغير المصنفة، ورديئة الجودة. يوفر الاختبار أربع مجموعات من البيانات بجودة وشكل مختلفين. فهناك بيانات تتضمن فقط الصوت غير المصنف، وبيانات تتضمن فقط الصوت والنص، وبيانات تتضمن المشاعر والصوت، بجودة عالية، وتصنيفات قياسية، ومجموعة بيانات تتضمن المشاعر والصوت، بجودة منخفضة. كل مجموعة بيانات محددة بوضوح لخدمة كل غرض وفئة اختبار، بإجمالي أكثر من 300 ساعة لجميع مجموعات البيانات. وهذا رقم متواضع جدًا مقارنةً بمجموعات البيانات القياسية لتدريب التعرف على الكلام، والتي تتطلب عادةً ما يصل إلى 1000-2000 ساعة أو أكثر.
كان لدى كل فريق أقل من شهرين للعمل على عمله وتقديمه، ولكن في الواقع كان الوقت الفعلي الذي تم قضاؤه في البحث عن الحلول أقل بكثير بسبب نقص الموارد.
قال السيد دانج دينه سون، مهندس الذكاء الاصطناعي، منصة المساعد الافتراضي، في شركة فيتيل للذكاء الاصطناعي: "هذا العام، خصصت شركة فيتيل للذكاء الاصطناعي قدرًا كبيرًا من موارد البنية التحتية للحوسبة للبحث عن تقنيات جديدة بالإضافة إلى تطوير المنتجات، في حين أن التعرف على الكلام هو تقنية تتطلب قدرًا كبيرًا من موارد الأجهزة".
في ظل انخفاض حجم البيانات وجودتها، قرر فريق البحث فورًا ضرورة الاستفادة من جميع البيانات، بغض النظر عن جودتها. ولتحقيق ذلك، من الضروري بناء دورة تدريب لمعالجة جميع البيانات، بالإضافة إلى نموذج واحد فقط لحل العديد من المشكلات المختلفة بدلًا من نماذج متعددة.
نتائج إتقان التكنولوجيا الرائدة
وفي سياق نقص البيانات ونقص الموارد، قرر فريق البحث بناء عملية معالجة بسيطة، ليست ضخمة، ولكن الأهم من ذلك، عملية معالجة دقيقة حتى أدق التفاصيل.
قام مهندسو الذكاء الاصطناعي في شركة فيتيل بدراسة أحدث الأبحاث الصادرة عن المؤتمرات والمجلات العلمية الرائدة حول العالم بعناية لإيجاد نهج مناسب. وباستخدام أساليب معالجة البيانات لتدريب النموذج الفعّالة، طوّر فريق البحث دورة تدريبية لمعالجة جميع البيانات المتاحة. تتضمن الدورة ثلاث خطوات: بناء نموذج مُدرّب مسبقًا لوصف خصائص الصوت دون استخدام تسميات، وضبطه بدقة لمشكلتين: التعرف على الكلام والتعرف على المشاعر، والاستنتاج.
قال السيد بوي تيان دات، مهندس منصة المساعد الافتراضي في شركة فيتيل للذكاء الاصطناعي: "ساهمت الخبرة المكتسبة من حل مشاكل نقص البيانات خلال تطوير ونشر المنتجات السابقة بشكل كبير في مساعدة الفريق على إيجاد منهجية لاتخاذ القرار. بل على العكس، يُمكن تطبيق المعرفة والنتائج المكتسبة من الاختبار فورًا على منتجات فيتيل للذكاء الاصطناعي، لذا سارت عملية العمل أثناء الاختبار بسلاسة تامة".
ونتيجة لذلك، لم يفز فريق Viettel AI بالجائزة الأولى في فئتي التعرف على الكلام والتعرف على المشاعر الكلامية فحسب، بل حقق أيضًا درجة رائعة بلغت 89.18% (كانت الفرق التالية 83.40% و78.45% على التوالي).
وقال السيد سون إن العامل الرئيسي يكمن في نموذج معالجة الكلام المخصص للغة الفيتنامية والذي طورته شركة Viettel AI لفترة طويلة.
بدلاً من استخدام النماذج والتعليمات من نتائج الأبحاث المتاحة، اختارت شركة Viettel AI بناء وتطوير نموذجها الخاص لمعالجة الكلام الفيتنامي. ويُحدّث هذا النموذج ويُحسّن باستمرار، ويزداد فعاليته باستمرار، كما قال السيد سون.
لا يقتصر هذا الحل من Viettel AI على المنافسة فحسب، بل سيُشكّل أساسًا لتطوير منتجات لوحات التوزيع الافتراضية، ومساعد Viettel الافتراضي، مما يُساعد على تحديد مشاعر العملاء بدقة أكبر في المحادثات، مما يُتيح تقديم ملاحظات أو اختيار ألفاظ مناسبة. وهكذا، ستصبح المحادثات بين البشر والذكاء الاصطناعي أكثر طبيعية، مما يُحسّن تجربة المستخدم. كما تُفتح آفاق جديدة في مجال خدمة العملاء، مثل بناء نظام لتحديد شكاوى العملاء والشكاوى المُقدّمة إلى لوحة التوزيع تلقائيًا، وذلك للتعامل معها في الوقت المناسب أو للاستفادة من المعلومات.
وقال ممثل الوحدة إن شركة Viettel AI ستواصل تطوير التكنولوجيا وتحديث المنتجات باستمرار لزيادة الدقة وتعزيز تجربة المستخدم وكفاءة المنتج.
كوك توان
[إعلان 2]
مصدر
تعليق (0)