Vietnam.vn - Nền tảng quảng bá Việt Nam

الدكتور داو دوك مينه: "إتقان البيانات الفيتنامية هو الخطوة الأولى في تطوير وإتقان التكنولوجيا الفيتنامية"

Báo Thanh niênBáo Thanh niên27/05/2024

صورة بعد أن عملت في منظمة ذكاء اصطناعي كبيرة في الولايات المتحدة، لماذا قررت العودة إلى فيتنام للانضمام إلى VinBigdata؟ أثناء عملي في الولايات المتحدة، ورغم مشاركتي في العديد من المشاريع الحكومية الكبيرة، إلا أن النتائج التي حققتها كانت غالبًا مجرد خطوات قليلة في عملية معالجة واسعة النطاق. وفي كثير من الأحيان، ونظرًا لإجراءات السرية الصارمة للغاية للمشاريع، لم أكن أعرف حتى كيفية استخدام الحلول التي طورتها. في عام 2017، عدت إلى فيتنام عندما كانت في مرحلة التطوير وكانت هناك العديد من المشكلات المتعلقة بالبيانات الضخمة والذكاء الاصطناعي التي تحتاج إلى حل. قبلت دعوة البروفيسور فو ها فان لتحقيق هدف مشترك يتمثل في تطوير حلول تكنولوجية فيتنامية لخدمة حياة الشعب الفيتنامي. أجد عودتي إلى فيتنام أكثر أهمية بكثير لأنني سأتمكن من العمل على مشاكل ذات تأثير أكبر.
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 2.

الدكتور داو دوك مينه في ورشة عمل

مركز نيفادا للمؤتمرات والمعارض

في استراتيجية تطوير الذكاء الاصطناعي، ما هو دور البيانات الضخمة وتأثيرها؟ تلعب البيانات دورًا بالغ الأهمية والقيمة في تدريب الذكاء الاصطناعي. لتدريب نموذج ذكاء اصطناعي عالي الجودة، غالبًا ما نبدأ بتدريب قاعدة بيانات ضخمة. لذلك، للحصول على ذكاء اصطناعي عالي الجودة، نحتاج أولًا إلى بيانات جيدة. يجب أن تلبي البيانات الجيدة المعايير من حيث الكمية والنطاق والجودة والتنوع والشمولية. إن عملية جمع ومعالجة آلاف الساعات من البيانات، بدءًا من مرحلة تنظيف البيانات الخام، لإنشاء بيانات عالية الجودة تُغذّى نموذج الذكاء الاصطناعي، عملية مكلفة ومعقدة للغاية. على العكس من ذلك، لتحليل البيانات الضخمة، نحتاج إلى استخدام الذكاء الاصطناعي لضمان القدرة على معالجة البيانات بدقة على نطاق واسع، وبالتالي تحقيق نتائج أكثر حسمًا أو تنبؤًا. على سبيل المثال، أثناء تطوير منتج مساعد افتراضي للفيتناميين (ViVi)، كان علينا جمع ومعالجة عشرات الآلاف من ساعات البيانات الصوتية عالية الجودة، من مئات الآلاف من الأصوات من مناطق مختلفة، وأعمار وأجناس متنوعة، بمحتوى يغطي مئات المجالات... أو مؤخرًا، إطلاق ViGPT - "أول نسخة فيتنامية من ChatGPT للمستخدمين النهائيين" المُطورة من نموذج لغة ضخم مملوك بالكامل لشركة VinBigdata. تم تدريب هذا النموذج بناءً على 600 جيجابايت من البيانات الفيتنامية المُحسّنة من مجالات مختلفة. بفضل فهمنا للبيانات واللغة الفيتنامية، وجدنا نهجًا جديدًا لتقصير مدة إطلاق ViGPT إلى 9 أشهر فقط بعد إطلاق ChatGPT. هذا هو التناغم بين البيانات الضخمة والذكاء الاصطناعي.
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 3.
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 4.
ما رأيك في ربط البحث بالقيمة العملية لخدمة المجتمع؟ - أعتقد أن البحث التكنولوجي لا ينجح حقًا إلا عندما يطبق عمليًا، ويحل المشكلات الاجتماعية، ويحسّن حياة الناس. لإنشاء منتجات تجارية عملية وحل المشكلات التجارية والاجتماعية، يجب علينا دائمًا الانتباه وطرح السؤال التالي: ما القيمة التي ستُضفيها البيانات على الحياة؟ حتى الآن، بحثنا في مجموعة متنوعة من المنتجات والحلول في مختلف الصناعات والمجالات، أبرزها ViGPT، وVinDr - التي تُقدم حلول الذكاء الاصطناعي في تشخيص التصوير الطبي ، وVinBase - منصة للذكاء الاصطناعي، وVizone - مجموعة من حلول تحليل الصور الذكية.
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 5.

مع الموظفين الرئيسيين في شركة VinBigdata في حدث لشركة Vingroup Corporation

مركز نيفادا للمؤتمرات والمعارض

تشهد الثورة الصناعية الرابعة تطورًا عالميًا قويًا. ما هي المزايا التي تعتقد أن فيتنام تتمتع بها؟ بالمقارنة مع الثورات السابقة، أعتقد أن فيتنام تتمتع حاليًا بالعديد من المزايا التي يمكنها استغلالها في هذه الثورة الصناعية الرابعة، مما يساعد على تحسين مكانة البلاد على خريطة العالم . مفتاحا تحقيق هذا الهدف هما البيانات والأفراد. يبلغ عدد سكان فيتنام حاليًا ما يقرب من 100 مليون نسمة، منهم نسبة كبيرة من الشباب يستخدمون الهواتف وأجهزة الكمبيوتر الشخصية. بالإضافة إلى ذلك، لدينا خبراء مرموقون في مجال الذكاء الاصطناعي وموظفون شباب ذوو كفاءة عالية في تكنولوجيا المعلومات ولديهم أساس متين في الرياضيات. إذن ماذا عن القيود؟ أول هذه القيود هو أنه على الرغم من وجود عدد كبير من السكان، ما زلنا نواجه صعوبة في إتقان البيانات، وتحديدًا توحيد البيانات ومزامنتها في المرافق ووحدات الأعمال والإدارات. بالإضافة إلى ذلك، نواجه أيضًا قيودًا أخرى مثل موارد الاستثمار المحدودة، وخاصة الاستثمار في البنية التحتية للحوسبة عالية الأداء.
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 6.
برأيك، ما مدى أهمية إتقان البيانات الفيتنامية في رحلة إنشاء وإتقان التكنولوجيا لخدمة حياة الشعب الفيتنامي؟ يوجد حاليًا العديد من منتجات الذكاء الاصطناعي الرائدة في العالم، وعادةً ما تكون منتجات تطبيقات الذكاء الاصطناعي المصممة بناءً على نماذج لغوية كبيرة مثل ChatGPT من OpenAI أو Bard من Google. ومع ذلك، فإن اللغة الفيتنامية ليست المجموعة اللغوية الأساسية لتطوير هذه المنتجات. لذلك، تتأثر جودة المحتوى الفيتنامي المخصص للمستخدمين بشكل أو بآخر، ويزيد احتمال حدوث أخطاء، والأخطر من ذلك، أخطاء في المعرفة الأساسية. بصفتنا شعبًا فيتناميًا، لدينا ميزة الوصول إلى مصادر بياناتنا الخاصة. نحن فقط لدينا القدرة على فهم خصائص البيانات الفيتنامية واحتياجات وخصائص الشعب الفيتنامي. لذلك، فإن إتقان البيانات الفيتنامية هو حقًا مفتاح إتقان التقنيات الأساسية، وهي أيضًا التقنيات التي ستخدم الشعب الفيتنامي.
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 7.

التدريب الداخلي لأعضاء VinBigdata

مركز نيفادا للمؤتمرات والمعارض

كيف يمكن الوصول إلى مصادر بيانات محددة، خاصةً وأن معظم الفيتناميين اليوم يستخدمون مواقع التواصل الاجتماعي من الخارج؟ في الواقع، يُعد الإنترنت وشبكات التواصل الاجتماعي المصدر الأكبر للبيانات البشرية اليوم (وليس الفيتناميين فقط). ومع ذلك، لا يزال بإمكاننا الوصول إلى البيانات وجمعها من مصادر مختلفة، بناءً على فهمنا لخصائص البيانات الفيتنامية، وذلك بناءً على الخصائص التي يحددها كل مشروع. على سبيل المثال، تحتوي نماذج GPT من OpenAI على مئات، بل تريليونات، من المعلمات، ويتم تدريبها على كميات هائلة من البيانات وتكلف مليارات الدولارات. مقارنةً بها، اخترنا مسارًا مختلفًا تمامًا بناءً على أبحاثنا وقدراتنا ومواردنا: أي إنشاء نموذج للغة الفيتنامية ببنية لا تتجاوز بضعة مليارات من المعلمات، ويتم تدريبه على مجموعة بيانات فيتنامية بحجم 600 جيجابايت جمعناها وحسّناها بأنفسنا، ولكنه يتمتع بنفس القدرة على معالجة اللغة الفيتنامية. تُظهر النتائج أن بنيتنا التي طورناها ذاتيًا قادرة على التحسين الذاتي، وتقصير وقت تدريب نموذج اللغة، وخفض التكاليف مع ضمان جودته في الوقت نفسه. ما هي التحديات التي واجهتها أنت وفريقك في عملية البحث والتطوير لمنتجات الذكاء الاصطناعي؟ التحدي الأول هو بالتأكيد الوقت. تتسارع وتيرة تكنولوجيا الذكاء الاصطناعي، وهي تشهد طفرةً هائلة. ففي العالم، تُطلق شركات التكنولوجيا الرائدة منتجاتٍ عالية الجودة، تُحدَّث وتُحسَّن باستمرار. إذا تباطأنا ولم نُطلق المنتجات في الوقت المناسب، فسنتخلف حتمًا. من ناحية أخرى، إذا أردنا ابتكار منتجات قابلة للتطبيق وحل المشكلات الاجتماعية العملية، فعلينا أيضًا مراعاة تطوير الميزات المتميزة والخاصة والفريدة للمنتج.
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 8.

عرض تقديمي في يوم الذكاء الاصطناعي في فيتنام (AI4VN 2023)

مركز نيفادا للمؤتمرات والمعارض

في الواقع، تكبد العديد من الأفراد والمؤسسات في فيتنام وحول العالم خسائر فادحة جراء تسرب البيانات. كيف تنظرون إلى مسألة أمن البيانات؟ يمكن القول إن أي تطبيق اليوم ينبع من البيانات. عند التعامل مع البيانات، يجب علينا من جهة ضمان تطبيقها لخلق أفضل تقنية ممكنة، ومن جهة أخرى، ضمان أمن بيانات الأفراد والمؤسسات. يُعد العامل البشري حلقة وصل بالغة الأهمية في عملية ضمان أمن البيانات، ويشمل ذلك المطورين ومستخدمي المنتجات والمستخدمين. بالنسبة للمطورين، يجب أن يكون الوعي بأمن البيانات حاضرًا منذ بداية جمع البيانات ومعالجتها. في كثير من الأحيان، حتى عندما لا تحدث مشكلة، لا ندرك أهمية أمن البيانات. ولكن في حالة حدوث تسرب للبيانات، يمكن أن يكون الضرر هائلاً. يمكن أن تحدث خروقات البيانات بسبب مشاكل فنية أو هجمات سرقة بيانات متعمدة. عند اختراق البيانات، يمكن أن يستخدم المجرمون معلومات الأفراد أو المؤسسات لأغراض غير قانونية، بينما قد تتكبد الشركات خسائر مالية لإصلاح المشاكل ذات الصلة، بل وحتى الإضرار بعلامتها التجارية.
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 9.

الدكتور داو دوك مينه وفريق فين بيج داتا في حدث

مركز نيفادا للمؤتمرات والمعارض

بعد السعي لإتقان التكنولوجيا لخدمة الشعب الفيتنامي، لا بد من اتخاذ خطوات نحو العالمية. يجب على أي منظمة أو مؤسسة ترغب في طرح منتجاتها في السوق العالمية الالتزام بالمعايير الدولية. تتميز VinBigdata بنقاط قوة في الحلول والتكنولوجيا، لذا فإن وضع رؤية لغزو العالم أمر طبيعي. وبالطبع، لنشر منتجات وتطبيقات متنوعة، من الضروري التعاون مع وحدات دولية تتمتع بسنوات طويلة من الخبرة والفهم للمستخدمين حول العالم. شكرًا لكم!

ثانهين.فن

المصدر: https://thanhnien.vn/ts-dao-duc-minh-lam-chu-du-lieu-viet-la-buoc-dau-phat-trien-va-nam-giu-cong-nghe-viet-18524052710263732.htm

تعليق (0)

No data
No data
تمتلئ شوارع هانغ ما بالقمصان والأعلام الوطنية للترحيب بالعيد المهم
اكتشف موقع تسجيل وصول جديد: الجدار "الوطني"
شاهد تشكيل طائرة متعددة الأدوار من طراز ياك-130 "قم بتشغيل دفعة الطاقة، وقم بالدور القتالي"
من A50 إلى A80 - عندما تصبح الوطنية هي الاتجاه
'الوردة الفولاذية' A80: من خطوات الفولاذ إلى الحياة اليومية الرائعة
80 عامًا من الاستقلال: هانوي تتألق باللون الأحمر، وتعيش مع التاريخ
يتألق المسرح على شكل حرف V الذي يبلغ ارتفاعه 26 مترًا بشكل ساطع خلال ليلة التدريب على "الوطن في القلب"
الزوار الدوليون إلى فيتنام يحطمون جميع الأرقام القياسية في الصيف
«الإكسسوارات الوطنية» تحتفل باليوم الوطني وتجذب الشباب
تؤدي حوالي 600 امرأة رقصة "أو داي" ويشكلن كتلًا على شكل العلم الوطني في ساحة ثورة أغسطس.

إرث

شكل

عمل

No videos available

أخبار

النظام السياسي

محلي

منتج