مقدمه
در دنیای امروز، هوش مصنوعی (AI) به سرعت در حال پیشرفت است و کاربردهای وسیعی پیدا کرده. در این میان، اهمیت شفافیت و دسترسپذیری مدلها بیش از پیش احساس میشود. گروهی از موسسات سوئیسی با عرضه مدل هوش مصنوعی Apertus، گامی بلند در این راستا برداشتهاند تا پایهای شفاف و قابل اعتماد برای توسعههای آینده فراهم کنند.
Apertus چیست و چرا اهمیت دارد؟
Apertus، نامی لاتین به معنای «باز»، یک مدل هوش مصنوعی جدید است که توسط EPFL، ETH زوریخ و مرکز ملی سوپرکامپیوتر سوئیس (CSCS) توسعه یافته. ویژگی متمایز این مدل، شفافیت کامل آن است؛ به این معنا که تمامی مراحل طراحی و آموزش آن برای عموم قابل دسترسی است.
این مدل، پایهای برای تحقیقات و کاربردهای آتی در حوزهی هوش مصنوعی خواهد بود. توسعهدهندگان و سازمانها میتوانند از Apertus برای ساخت چتباتها، ابزارهای ترجمه، یا برنامههای کاربردی آموزشی استفاده کنند.
دسترسی و نسخهها
Apertus به دو صورت در دسترس است: یک نسخه با ۸ میلیارد پارامتر و یک نسخه بزرگتر با ۷۰ میلیارد پارامتر. هر دو نسخه تحت مجوز متنباز عرضه شدهاند که امکان استفاده در پروژههای تحقیقاتی، آموزشی و تجاری را فراهم میکند.
این مدل را میتوان مستقیماً از Hugging Face دانلود کرد، یا از طریق Swisscom (یکی از شرکای استراتژیک این پروژه) به آن دسترسی یافت.
طراحی بر پایه شفافیت
برخلاف بسیاری از سیستمهای هوش مصنوعی که تنها بخشی از جزئیات خود را افشا میکنند، Apertus یک مدل AI کاملاً باز است. معماری، دادههای آموزشی و مستندات آن، همگی برای عموم قابل بررسی هستند.
مارتین یاگی، استاد یادگیری ماشین در EPFL و عضو کمیته راهبری طرح هوش مصنوعی سوئیس، اظهار داشت: «ما با این انتشار، قصد داریم طرحی اولیه برای توسعه یک مدل هوش مصنوعی قابل اعتماد، مستقل و فراگیر ارائه دهیم.»
ایشان همچنین افزود که Apertus به طور منظم توسط تیمی از مهندسان و محققان CSCS، ETH زوریخ و EPFL بهروزرسانی خواهد شد.
یک مدل هوش مصنوعی چندزبانه
فرآیند آموزش Apertus با ۱۵ تریلیون توکن و بیش از ۱۰۰۰ زبان انجام شده است. حدود ۴۰٪ از دادهها مربوط به زبانهای غیر انگلیسی هستند.
Apertus شامل زبانهایی است که اغلب در مدلهای زبان بزرگ (LLM) نادیده گرفته میشوند، مانند آلمانی سوئیسی و رومانش.
ایمانول شلاگ، مسئول فنی پروژه و دانشمند پژوهشی در ETH زوریخ، بیان کرد: «Apertus برای منافع عمومی ساخته شده است. این مدل در میان معدود LLMهای کاملاً باز در این مقیاس قرار دارد و اولین مدل از نوع خود است که چندزبانگی، شفافیت و انطباق را به عنوان اصول طراحی زیربنایی خود قرار داده است.»
شفافیت و انطباق
دادههای آموزشی این مدل، وزنهای مدل و نقاط بازرسی میانی، تحت مجوز متنباز در دسترس قرار گرفتهاند. فرآیند آموزش مدل، از قوانین حفاظت از دادههای سوئیس، قانون کپیرایت سوئیس و الزامات شفافیت قانون هوش مصنوعی اتحادیه اروپا پیروی کرده است.
مجموعه دادهها به اطلاعات عمومی محدود شده و برای حذف دادههای شخصی و رعایت درخواستهای عدم پذیرش وبسایتها، فیلتر شدهاند. قبل از شروع آموزش، دستورالعملهای اخلاقی نیز برای حذف مواد ناخواسته اعمال شده است.
آینده مدل هوش مصنوعی باز سوئیس
آنتوان بوسلول، استاد EPFL و همکار رهبر طرح AI سوئیس، خاطرنشان کرد: «Apertus نشان میدهد که هوش مصنوعی مولد میتواند هم قدرتمند و هم باز باشد. انتشار Apertus یک گام نهایی نیست، بلکه آغاز یک سفر و یک تعهد بلندمدت به پایههای هوش مصنوعی باز، قابل اعتماد و مستقل برای منافع عمومی در سراسر جهان است.»
بهروزرسانیهای آتی، هدفشان گسترش خانواده مدل، بهبود کارایی و توسعه ابزارهای خاص دامنه برای حوزههایی مانند حقوق، سلامت، آب و هوا و آموزش است؛ در حالی که همچنان استانداردهای سختگیرانه شفافیت را حفظ خواهند کرد.