أخبار تقنيةتقنيةتكنولوجياشروحاتمراجعات تقنيةمقالات معلوماتية

نموذج الذكاء الاصطناعي Poro يضع معالم جديدة لماجستير القانون في أوروبا متعدد اللغات

نموذج الذكاء الاصطناعي Poro يضع معالم جديدة لماجستير القانون في أوروبا متعدد اللغات

أكملت شركة Silo AI، ومقرها هلسنكي، التدريب على نموذج Poro، وهو إنجاز جديد في مهمتها المتمثلة في إنشاء نماذج لغوية كبيرة (LLMs) للغات منخفضة الموارد.

تم تسمية Poro على اسم الكلمة الفنلندية التي تعني “الرنة”، وهو الأول من عائلة LLM متعددة اللغات مفتوحة المصدر. وتقوم الشركة الناشئة ببناء النماذج جنبًا إلى جنب مع جامعة توركو ومشروع تقنيات اللغة عالية الأداء (HPLT) التابع للاتحاد الأوروبي.

Poro هو نموذج مكون من 34.2 مليار معلمة، مصمم لمعالجة اللغات الإنجليزية والفنلندية والتعليمات البرمجية. لقد تم تدريبه على مجموعة بيانات مكونة من 1 تريليون رمز.

وقال بيتر سارلين، المؤسس المشارك والرئيس التنفيذي لشركة Silo AI، لـ TNW: “ما نثبته مع Poro هو أنه يمكننا بناء نماذج تنافسية للغات منخفضة الموارد، مثل اللغة الفنلندية”.

مؤتمر TNW 2024 – عرض التذاكر الجماعية

وفر ما يصل إلى 40% مع عرض مجموعتنا وانضم إلى مهرجان التكنولوجيا الرائد في أوروبا في يونيو!

وأوضح سارلين أنه في ماجستير اللغة العامة، تهيمن اللغات عالية الموارد مثل اللغة الإنجليزية، مما يعني أن قدرات اللغات منخفضة الموارد تصل إلى حد الترجمة، ولكنها لا تمثل لغة وثقافة بلد معين.

وفقًا للشركة الناشئة، يتفوق Poro في الأداء على جميع نماذج اللغات مفتوحة المصدر الحالية في اللغة الفنلندية، بما في ذلك Mistral وFinGPT وLlama ونموذج المعلمة BLUUMI الذي تبلغ قيمته 176 مليارًا.

ولتحقيق ذلك، استخدم الفريق نهجًا تدريبيًا جديدًا، من خلال دمج اللغة الفنلندية مع اللغات ذات الموارد العالية. وقد حددت الترددات المثلى لإعادة استخدام البيانات للغات منخفضة الموارد ودمجت النصوص المزدوجة المترجمة بين الفنلندية والإنجليزية. تعتمد هذه الطريقة على الإشارات بين اللغات لتعزيز فهم الروابط بين اللغات – وبالتالي تعزيز الأداء باللغة الفنلندية، مع عدم المساس به في اللغة الإنجليزية.

حقق Poro أيضًا إنجازًا آخر: فهو أول نموذج متعدد اللغات يتم تدريبه على EuroHPC الكمبيوتر العملاق. “وهذا دليل على أننا قادرون على تدريب حاملي شهادات الماجستير على تقنية AMD الكمبيوتر العملاق لوميقال سارلين: “بدلاً من الكمبيوتر العملاق المعتمد على NVIDIA”.

خطوة نحو الحكم الذاتي الأوروبي

تعد LLMs متعددة اللغات مفتوحة المصدر أمرًا أساسيًا لضمان التنوع اللغوي والتمثيل الثقافي والوصول الديمقراطي إلى الذكاء الاصطناعي. كما أنها مهمة جدًا لاستقلالية الذكاء الاصطناعي في أوروبا.

وأشار سارلين إلى أنه “من منظور تجاري، فإن هذه النماذج تبني خط الأساس والبنية التحتية التي تسمح للشركات الأوروبية بالابتكار في القمة”. “بهذه الطريقة يمكن للشركات إنشاء الملكية الفكرية، وخلق ميزة تنافسية، و [create] أعمال عظيمة تضمن بقاء القيمة معهم في أوروبا.”

يتوفر Poro مجانًا بموجب ترخيص Apache 2.0، والذي يسمح بالاستخدام التجاري والبحثي. تعمل SiloAI حاليًا على لغات الشمال (السويدية والنرويجية والدنماركية والأيسلندية)، وتخطط للتوسع لتشمل جميع اللغات الرسمية الأخرى للاتحاد الأوروبي.

 

نموذج الذكاء الاصطناعي Poro يضع معالم جديدة لماجستير القانون في أوروبا متعدد اللغات

#نموذج #الذكاء #الاصطناعي #Poro #يضع #معالم #جديدة #لماجستير #القانون #في #أوروبا #متعدد #اللغات