في ظلّ الاستخدام المتزايد لتقنية التعرف على الوجوه ونمذجة الوجوه ثلاثية الأبعاد في مجالات عديدة، كالأمن والرعاية الصحية والتجارة الإلكترونية والأمن الشخصي، أصبحت الحاجة إلى بناء قاعدة بيانات منظمة ومتنوعة وواسعة النطاق لصور الوجوه ملحّة. ومن أبرز التحديات اليوم كيفية جمع بيانات الصور بجودة ثابتة، في ظروف إضاءة مختلفة ومن زوايا تصوير متعددة، مع ضمان دقة تصنيف البيانات وتخزينها.
ولحل هذه المشكلة، قام فريق البحث في معهد فيتنام - كوريا للعلوم والتكنولوجيا (VKIST) بتطوير برنامج التقاط الوجه VKIST، وهي أداة تدعم التحكم المتزامن في نظام يتكون من عدة كاميرات رقمية ووحدات إضاءة، مما يسمح بجمع بيانات صورة الوجه ووضع العلامات عليها وتخزينها في الوقت الحقيقي.
حل جمع ومعالجة بيانات صور الوجه
تمت برمجة VKIST face capture بلغة C#، وهو يتميز بواجهة سهلة الاستخدام باللغة الفيتنامية، وسهلة التكامل والتوسع.
يتيح تطبيق VKIST لالتقاط الوجوه التحكم عن بُعد بكاميرات نيكون وكانون DSLR الشهيرة، مثل 5DmarkII، و5DMarkIII، و6DMarkII، و1500D، و2000D، وD60، وD3000، وD5100، وD7100، وD4، وD800...، عبر واجهة USB وبروتوكول RS232. يمكن للمستخدمين إجراء عمليات مثل عرض الصور مباشرةً (العرض المباشر)، وضبط المعلمات التقنية (فتحة العدسة، وسرعة الغالق، وحساسية ISO)، والتحكم بالتقاط الصور المتزامن، ونقلها إلى الكمبيوتر فورًا.
يدعم البرنامج، على وجه الخصوص، التحكم المتزامن في عدة كاميرات، وهي ميزة أساسية في أنظمة جمع بيانات الصور متعددة الزوايا. واجهة البرنامج باللغة الفيتنامية، وهي مصممة في وحدات وظيفية منفصلة لسهولة الاستخدام والتكامل مع الأنظمة المعقدة.
تنقسم واجهة برنامج التقاط الوجه VKIST (الشكل 1) إلى كتل منفصلة مع الوظائف الموضحة في الشكل 2. اللغة المعروضة في البرنامج هي الفيتنامية.
واجهة برنامج التقاط الوجه VKIST.
مخطط للكتل الوظيفية الرئيسية للبرنامج.
يُدمج التقاط الوجه في VKIST أيضًا إمكانية التحكم في شدة ضوء نظام الإضاءة من خلال نقل البيانات من ملفات التكوين إلى دائرة التحكم في الإضاءة. بفضل ذلك، يتم التحكم بدقة في بيئة الإضاءة أثناء التصوير، مما يضمن جودة صورة ثابتة، وهو عامل أساسي في تطبيقات الذكاء الاصطناعي.
بالإضافة إلى ذلك، تم دمج وظيفة التحكم في شدة الضوء في هذا البرنامج. ما عليك سوى إدخال ملف معلمات شدة الضوء المتاحة، ثم استخدام البرنامج لقراءة البيانات وإرسالها إلى دائرة التحكم في شدة الضوء. ومن ثم، يمكنك التحكم بدقة في كمية الضوء في البيئة المحيطة.
ومن أبرز الميزات إمكانية تصنيف البيانات تلقائيًا وفقًا لبنيتها، مما يزيد من كفاءة إدارة نماذج الذكاء الاصطناعي واسترجاعها وتدريبها. يدعم البرنامج خيارات تخزين البيانات (محليًا في الكاميرا، وحفظها على الكمبيوتر) وتصنيف البيانات وفقًا لسيناريوهات محددة مسبقًا.
من الميزات المميزة الأخرى إمكانية تصنيف الصور تلقائيًا وفقًا لهيكل مُحدد مسبقًا، مما يوفر وقت التصنيف اليدوي بشكل كبير. يتيح لك التقاط الوجوه في VKIST ضبط كيفية حفظ الصور: حسب المجلد، أو الكائن، أو نوع التعبير، أو غيرها من المتغيرات، مثل ارتداء النظارات، أو ارتداء الأقنعة، أو تغيير تسريحات الشعر...
بالإضافة إلى ذلك، يدعم البرنامج أوضاعًا متعددة لحفظ البيانات، بما في ذلك التسجيل المتسلسل، والكتابة فوقها، أو الحفظ في الكاميرا قبل نقلها إلى الخادم. هذا يُعزز مرونة النظام في التعامل مع كميات كبيرة من الصور، مما يُقلل من خطر فقدان البيانات أو حدوث اختناقات أثناء التشغيل.
منصة أبحاث الذكاء الاصطناعي وبناء قاعدة بيانات للوجه على نطاق واسع
يُستخدم البرنامج حاليًا في نظام جمع بيانات صور الوجوه الذي طورته VKIST، والذي يتضمن 33 كاميرا DSLR من كانون، و20 وحدة إضاءة قابلة للتعديل، وإطارًا حديديًا لتوزيع الكاميرات والإضاءة حول نصف الكرة الأرضية، وثلاثة أجهزة كمبيوتر قوية مزودة بشاشات وبرنامج للتحكم في النظام. بفضل هذا النظام، تمكن مختبر VKIST-Nacentech المشترك/قسم تكنولوجيا المعلومات، التابع لـ VKIST، من جمع وبناء قاعدة بيانات لصور الوجوه تضم حوالي 500 شخص (حوالي 5 ملايين صورة)، ويواصل جمع المزيد من البيانات.
تم إجراء عينة بيانات صورة الوجه متعددة الزوايا بواسطة برنامج التقاط الوجه VKIST.
استُخدم البرنامج في مشاريع تعاونية مع المعهد الكوري للعلوم والتكنولوجيا (KIST) لجمع بيانات صور وجوه لأكثر من ألف فيتنامي. تتضمن قاعدة البيانات هذه حوالي 10 ملايين صورة بتعبيرات وجه مختلفة، مثل: العادي، السعيد، الحزين، الخائف، الغاضب، المتفاجئ، المنزعج، بالإضافة إلى إكسسوارات مُخفاة مثل الأقنعة والنظارات والقبعات والشعر المستعار، وذلك في ظروف إضاءة مختلفة.
واجهة البرنامج مع المواصفات الكاملة.
تم تطبيق البيانات التي تم جمعها من النظام باستخدام برنامج التقاط الوجه VKIST ويتم تطبيقها في العديد من اتجاهات البحث وتطوير التكنولوجيا:
نمذجة الوجه ثلاثية الأبعاد من صور ثنائية الأبعاد متعددة الزوايا،
زيادة دقة تقنية التعرف على الوجه في ظل الظروف المشوهة (التعتيم والإضاءة المعقدة)،
نقش الوجوه بالليزر ثلاثي الأبعاد على الزجاج كتذكارات،
إعادة بناء صور وجوه المتوفين من الصور القديمة، لخدمة الأغراض الأرشيفية الثقافية والتراثية،
التطبيقات في التجارة الإلكترونية، والجمال الطبي، والواقع المعزز.
إن تطوير وتطبيق التقاط الوجه VKIST لا يساعد VKIST على أخذ زمام المبادرة في بناء قواعد بيانات كبيرة فحسب، بل يساهم أيضًا في تحسين القدرة البحثية في مجال الرؤية الحاسوبية والذكاء الاصطناعي في فيتنام - المجالات الأساسية في الثورة الصناعية الرابعة.
يلعب إتقان وإتقان تكنولوجيا البرمجيات للتحكم في أنظمة الأجهزة المتخصصة - وخاصة الأنظمة البصرية متعددة الأجهزة - دورًا مهمًا في بناء منصات الذكاء الاصطناعي المحلية المناسبة للخصائص الأنثروبومترية للشعب الفيتنامي.
يُعدّ التقاط الوجه من VKIST دليلاً على تطوير أدوات برمجية عالية التقنية لأبحاث وتطبيق أنظمة الرؤية الحاسوبية في فيتنام. سيُشكّل إتقان تقنية التحكم في أنظمة جمع بيانات الصور واسعة النطاق ومزامنتها أساسًا هامًا للمساعدة في تعزيز القدرة على تطوير الذكاء الاصطناعي في البلاد، لا سيما في المجالات التي تتطلب بيانات قياسات بشرية ذات خصائص إقليمية أو إثنوغرافية.
قام قسم تكنولوجيا المعلومات بتسجيل حقوق الطبع والنشر لبرنامج "VKIST face capture" فور الانتهاء من البرنامج واختباره بالكامل.
شهادة تسجيل حقوق الطبع والنشر لبرنامج التقاط الوجه VKIST.
المصدر: https://mst.gov.vn/vkist-face-capture-phan-mem-thu-thap-du-lieu-anh-khuon-mat-da-goc-phuc-vu-nghien-cuu-va-phat-trien-ai-197250927011551324.htm
تعليق (0)