وقت القراءة: 4 دقائق
noon ai

نموذج “ن” يحوي أكثر من 7 مليار عامل متغير ومتاح كنموذج مفتوح المصدر للباحثين والمطورين ورواد الأعمال

الرياض، يونيو 2023، نسيج للتقنية – الشركة الرائدة في حلول التحول الرقمي – تعلن عن إتاحة نموذج “ن” وهو نموذج ذكاء اصطناعي لغوي عربي يعد الأول والأكبر من نوعه في دعم اللغة العربية، كمبادرة مفتوحة المصدر لتمكين المطورين ورواد الأعمال من دعم مسيرة التطوير لمبادرات ومنتجات الذكاء الاصطناعي المخصص للغة العربية. مسمى النموذج (حرف النون) مستوحى من الحرف الأول ل “نسيج”.

يدعم نموذج “ن” أكثر من 7 مليار عامل متغير باللغة العربية، مما يثري أتمتة صناعة المحتوى العربي، والمحادثة الطبيعية عبر الذكاء الاصطناعي، إذ تم تدريبه باستخدام مجموعة بيانات عربية متخصصة ومبنية في “صيغة الطلب”، في محصلتها ما يقرب من 11 مليون كلمة متنوعة ما بين مفردات عربية محضة، ومصطلحات علمية وتقنية أُبقيت على لغتها الأصلية.

 ويتمكن النموذج من فهم الخصائص النحوية آخذاً في الاعتبار السياق الثقافي العربي مما يمكن “ن” من صناعة محتوى عربي بدقة وسلاسة جيدة، مع تحليل للانطباعات، وتوفير إجابات مناسبة للسياق، مما يتيح للباحثين والمبتكرين ورواد الأعمال فرص متنوعة لتطوير منتجات ذكاء اصطناعي مخصصة للناطقين باللغة العربية.

وقد تم تطوير “ن” باستخدام عدة تقنيات متطورة وحديثة لتدريب وتطوير نماذج الذكاء الصناعي، مثل توزيع التدريب الموازي على وحدات معالجة الرسومات (GPU)، والتكيف منخفض الرتبة لنماذج اللغة الكبيرة (LoRA adaptation)، وتقنية تحسين التكرار الصفري (ZeRO optimization)، وذلك في سبيل الوصول إلى أحسن أداء للنموذج، وكذلك تسريع وقت التدريب.

ولتقييم أداء نموذج “ن” قام فريق العمل على النموذج بتجميع أكثر من 4 آلاف عينة بيانية عربية متنوعة، ما بين الكتابة والتلخيص والحساب وغيرهم، ثم استخدام نموذج GPT3 Turbo لتقدير وتقييم إجابات “ن” بإعطاء علامة تتراوح ما بين الـ1 و الـ5، مع تقديم معايير تتوافق مع القواعد الكتابية والنحوية للغة العربية الفصحى، إضافة إلى مطالب وأهداف التطوير التي سطّرها الفريق. وبعد تجميع التقييمات، قُدّر معدّل أداء نموذج “ن” بـ 4,07/5 وهي نتيجة جيدة تعكس أداء النموذج، وجودة تحقق التدريب للنموذج.

وعلق المهندس عبد الجبار العبد الجبار – الرئيس التنفيذي والعضو المنتدب لنسيج بهذة المناسبة قائلا “جميعنا في نسيج فخورين بتقديم هذا النموذج اللغوي المبتكر لمجتمع الذكاء الاصطناعي، ونأمل من خلال تزويد الباحثين والمطورين ورواد الأعمال بنموذج (ن) اللغوي أن ندعم مسيرة الابتكار والتطوير لمنتجات الذكاء الاصطناعي العربي”. وأضاف م. العبد الجبار قائلا ” أحد أهداف نسيج الأصيلة ومنذ نشأتها هو نشر المعرفة في مجتمعاتنا، وهذا العمل بلا شك يصب في تحقيق هذا الهدف من خلال تبني تقنية حيوية كالذكاء الاصطناعي، والذي يصب أيضا في تحقيق رؤية المملكة لتكون المملكة العربية السعودية مصدرا رئيسيا لأحدث التقنيات الرقمية وعلى رأسها الذكاء الاصطناعي”.

تسعى نسيج من خلال تمكين المطورين من الاستفادة من هذا النموذج اللغوي العربي لخلق بيئة داعمة للابتكار وتشجيع البحث العلمي المرتبط بالذكاء الاصطناعي باللغة العربية، وتأمل أن ينتج عنها تطوير حلول وتطبيقات ذكاء اصطناعي تغطي قطاعات حيوية كالتعليم والصحة وغيرها تخدم المنطقة وأسواقها. هذا التطوير سيساهم بشكل فعال في مسيرة التحول الرقمي لمجتمعات المنطقة العربية وتبني أحدث التقنيات، مع المحافظة على ثقافتها الأصيلة.

وفي هذا الصدد علق الأستاذ محمد حسام الدين – نائب الرئيس التنفيذي لتطوير الأعمال في نسيج قائلا ” لطالما كانت قناعتنا في نسيج بأنه لا يجب أن تكون اللغة عائقا أمام الابتكار. فمن خلال إتاحة نموذج (ن) اللغوي كنموذج مفتوح المصدر، نتطلع إلى إطلاق العنان للمبتكرين ورواد الأعمال لتطوير طيف واسع من منتجات الذكاء الاصطناعي المخصصة للناطقين بالعربية، مثل أدوات صناعة المحتوى وأدوات المحادثة الطبيعية باللغة العربية والمساعدين الافتراضيين، وغيرها الكثير”.

الجدير بالذكر أن نموذج “ن” اللغوي” هو نتاج جهد استمر لأكثر من سنتين ضمن خطط وأعمال “مختبر نسيج للابتكار” وهو وحدة تم انشاؤها داخل شركة نسيج تعنى بالتطوير والابتكار، مهمتها ابتكار وتطوير حلول ومنتجات التحول الرقمي المبنية على الذكاء الاصطناعي وتعلم الآلة والروبوتات. ومن ضمن ابتكارات المختبر تطوير خدمة “المعلم الافتراضي” والتي يجري اطلاقها كأحد مكونات منصة مداد لإدارة التدريب (أحد المنتجات الرئيسية للشركة)، إذ يقوم المعلم الافتراضي والمبني على الذكاء الاصطناعي بتقديم تجربة مستخدم فريدة وتفاعلية تحقق تعلم وتدرّب تكيفي يتناسب مع احتياجات المتعلم أو المتدرب.

نموذج “ن” اللغوي متاح كمصدر مفتوح عبر صفحة نسيج في مجتمع Hugging Face والذي يعد أكبر مجتمع افتراضي من نوعه في استضافة وتوفير منصات الذكاء الاصطناعي وتعلم الآلة. كما وسيستمر فريق مختبر نسيج للابتكار بالعمل على تطوير نموذج “ن” اللغوي وإتاحة اصداراته للمهتمين، إذ ذكر المهندس إبراهيم الديلمي – قائد فريق الهندسة في مختبر نسيج للابتكار قائلا ” فريق العمل يقطع أشواطا كبيرة في النص التوليدي العربي، وجهودنا في هذا الإطار موزعة على 3 محاور رئيسية تشمل تجميع البيانات وتنقيحها، تدريب النموذج اللغوي، ومحاذاة النموذج”. وأضاف م. الديلمي قائلا ” إن التغذية الراجعة من مجتمع الباحثين والمطورين خلال الفترة القادمة سيسهم بشكل رئيسي في جهودنا التطويرية لنموذج (ن) اللغوي”.

لزيارة صفحة نسيج على مجتمع Hugging Face الرجاء اتباع الرابط التالي: https://huggingface.co/Naseej/noon-7b

شارك هذا المقال: