«تُظهر النتائج أن AMALIA-DPO [تحسين التفضيلات المباشرة] يحقق أفضل أداء بين النماذج المفتوحة بالكامل بهامش كبير، حتى أنه يحصل على أفضل النتائج من بين جميع النماذج في علم المعاجم وعلم الدلالة، مما يدل على إتقان قوي للكفاءات اللغوية المحددة» للبرتغالية في عدة فئات.
يتطور برنامج Amália LLM [نموذج اللغة الكبير] باستمرار من قبل اتحاد الجامعات البرتغالية، مما أدى إلى تطويره.
وفقًا للتقرير الفني، في تقييم متعمق للبرتغالية الأوروبية، تتمتع Amália بمزايا واضحة مقارنة بالنماذج المفتوحة الأخرى.
في الامتحانات الوطنية البرتغالية (الأسئلة البرتغالية ذات الإجابة الطويلة)، «تحصل Amália على أفضل درجة من جميع النماذج مفتوحة المصدر بالكامل، مما يدل على الفهم الجيد للجمل المعقدة وإنتاج النص المتماسك، مع القواعد النحوية المناسبة والتسجيل».
في هذا التقرير، «نقدم ماجستير في القانون يعطي الأولوية للغة البرتغالية الأوروبية وسياقها الثقافي»، كما جاء في الوثيقة، التي تنص على أن Amália تستخدم بيانات من arquivo.pt وبيانات ما بعد التدريب المعدة خصيصًا للبرتغالية الأوروبية.
تشير الوثيقة إلى أن LLM تم تدريبه باستخدام نمذجة اللغة واستراتيجيات تعديل التعليمات.
ويشير التقرير إلى أن «التحدي الأساسي في تطوير هذا النموذج كان عدم وجود معايير لرصد تقدم أداء النموذج».
وللتخفيف من هذا القيد، «استخدمنا اختبارات PT-PT الوطنية، وأنشأنا معيارًا لغويًا وترجمنا العديد من مجموعات البيانات» باستخدام نموذج مخصص للترجمة الآلية عالية الجودة (MT).
ويخلص التقرير الفني إلى أن «التقييم أظهر أن Amália تتفوق في الأداء على جميع النماذج السابقة مفتوحة المصدر في PT-PT والعديد من نماذج «الوزن المفتوح» [التي تشترك في الأوزان (المعلمات المدربة)]».
«تُظهر التجارب على معايير فهم اللغة والاستدلال نتائج حديثة أو قابلة للمقارنة، بينما في معايير توليد اللغة، يتفوق النموذج في جودة النص الذي تم إنشاؤه. تُظهر التجارب الأمنية أيضًا أن النموذج يتماشى مع أحدث التقنيات»، كما جاء في التقرير.
في المستقبل، «سنستكشف طرق التعلم المعزز الأخرى ونطور مجموعات جديدة من بيانات التدريب لتحسين قدرات التفكير في PT-PT».
بعبارة أخرى، من الناحية العملية، تشير هذه النتائج إلى أن Amália أصبحت موثوقة كمساعد في اللغة البرتغالية الأوروبية.
كتب التقرير جواو ماجالهايس (UNL) وأندريه مارتينز (IST) والمنسقان وفريق من حوالي 20 شخصًا من جامعة لشبونة وجامعة نوفا دي لشبونة.
يتم تطوير نموذج أماليا من قبل فريق مكون من جامعة نوفا دي لشبونة والمعهد التقني العالي وجامعة كويمبرا وجامعة بورتو وجامعة مينهو ومؤسسة العلوم والتكنولوجيا.
بدأت عملية إنشاء Amália بجمع ومعالجة البيانات البرتغالية الأوروبية على نطاق واسع، والتي تمت تصفيتها بناءً على أهميتها وجودتها اللغوية. تم استخدام أرشيف الويب البرتغالي لهذا الغرض. تم تدريب النموذج مسبقًا على هذه البيانات ثم تم ضبطه على مجموعات البيانات الأخرى لاتباع التعليمات والسبب وحل المشكلات
.تم استخدام البنية التحتية للحوسبة واسعة النطاق لتدريب النماذج، باستخدام أجهزة الكمبيوتر العملاقة الوطنية (Mare Nostrum 5 و Deucalion) وأجهزة الكمبيوتر العملاقة الأوروبية (من خلال شبكة EuroHPC).





