Apertus: مدل هوش مصنوعی کاملا باز سوئیس برای آینده‌ای شفاف

گیلان پلاس

7 روز پیش

Switzerland releases its own fully open AI model

مقدمه

در دنیای امروز، هوش مصنوعی (AI) به سرعت در حال پیشرفت است و کاربردهای وسیعی پیدا کرده. در این میان، اهمیت شفافیت و دسترس‌پذیری مدل‌ها بیش از پیش احساس می‌شود. گروهی از موسسات سوئیسی با عرضه مدل هوش مصنوعی Apertus، گامی بلند در این راستا برداشته‌اند تا پایه‌ای شفاف و قابل اعتماد برای توسعه‌های آینده فراهم کنند.

Apertus چیست و چرا اهمیت دارد؟

Apertus، نامی لاتین به معنای «باز»، یک مدل هوش مصنوعی جدید است که توسط EPFL، ETH زوریخ و مرکز ملی سوپرکامپیوتر سوئیس (CSCS) توسعه یافته. ویژگی متمایز این مدل، شفافیت کامل آن است؛ به این معنا که تمامی مراحل طراحی و آموزش آن برای عموم قابل دسترسی است.

این مدل، پایه‌ای برای تحقیقات و کاربردهای آتی در حوزه‌ی هوش مصنوعی خواهد بود. توسعه‌دهندگان و سازمان‌ها می‌توانند از Apertus برای ساخت چت‌بات‌ها، ابزارهای ترجمه، یا برنامه‌های کاربردی آموزشی استفاده کنند.

دسترسی و نسخه‌ها

Apertus به دو صورت در دسترس است: یک نسخه با ۸ میلیارد پارامتر و یک نسخه بزرگ‌تر با ۷۰ میلیارد پارامتر. هر دو نسخه تحت مجوز متن‌باز عرضه شده‌اند که امکان استفاده در پروژه‌های تحقیقاتی، آموزشی و تجاری را فراهم می‌کند.

این مدل را می‌توان مستقیماً از Hugging Face دانلود کرد، یا از طریق Swisscom (یکی از شرکای استراتژیک این پروژه) به آن دسترسی یافت.

طراحی بر پایه شفافیت

برخلاف بسیاری از سیستم‌های هوش مصنوعی که تنها بخشی از جزئیات خود را افشا می‌کنند، Apertus یک مدل AI کاملاً باز است. معماری، داده‌های آموزشی و مستندات آن، همگی برای عموم قابل بررسی هستند.

مارتین یاگی، استاد یادگیری ماشین در EPFL و عضو کمیته راهبری طرح هوش مصنوعی سوئیس، اظهار داشت: «ما با این انتشار، قصد داریم طرحی اولیه برای توسعه یک مدل هوش مصنوعی قابل اعتماد، مستقل و فراگیر ارائه دهیم.»

ایشان همچنین افزود که Apertus به طور منظم توسط تیمی از مهندسان و محققان CSCS، ETH زوریخ و EPFL به‌روزرسانی خواهد شد.

یک مدل هوش مصنوعی چندزبانه

فرآیند آموزش Apertus با ۱۵ تریلیون توکن و بیش از ۱۰۰۰ زبان انجام شده است. حدود ۴۰٪ از داده‌ها مربوط به زبان‌های غیر انگلیسی هستند.

Apertus شامل زبان‌هایی است که اغلب در مدل‌های زبان بزرگ (LLM) نادیده گرفته می‌شوند، مانند آلمانی سوئیسی و رومانش.

ایمانول شلاگ، مسئول فنی پروژه و دانشمند پژوهشی در ETH زوریخ، بیان کرد: «Apertus برای منافع عمومی ساخته شده است. این مدل در میان معدود LLM‌های کاملاً باز در این مقیاس قرار دارد و اولین مدل از نوع خود است که چندزبانگی، شفافیت و انطباق را به عنوان اصول طراحی زیربنایی خود قرار داده است.»

شفافیت و انطباق

داده‌های آموزشی این مدل، وزن‌های مدل و نقاط بازرسی میانی، تحت مجوز متن‌باز در دسترس قرار گرفته‌اند. فرآیند آموزش مدل، از قوانین حفاظت از داده‌های سوئیس، قانون کپی‌رایت سوئیس و الزامات شفافیت قانون هوش مصنوعی اتحادیه اروپا پیروی کرده است.

مجموعه داده‌ها به اطلاعات عمومی محدود شده و برای حذف داده‌های شخصی و رعایت درخواست‌های عدم پذیرش وب‌سایت‌ها، فیلتر شده‌اند. قبل از شروع آموزش، دستورالعمل‌های اخلاقی نیز برای حذف مواد ناخواسته اعمال شده است.

آینده مدل هوش مصنوعی باز سوئیس

آنتوان بوسلول، استاد EPFL و همکار رهبر طرح AI سوئیس، خاطرنشان کرد: «Apertus نشان می‌دهد که هوش مصنوعی مولد می‌تواند هم قدرتمند و هم باز باشد. انتشار Apertus یک گام نهایی نیست، بلکه آغاز یک سفر و یک تعهد بلندمدت به پایه‌های هوش مصنوعی باز، قابل اعتماد و مستقل برای منافع عمومی در سراسر جهان است.»

به‌روزرسانی‌های آتی، هدفشان گسترش خانواده مدل، بهبود کارایی و توسعه ابزارهای خاص دامنه برای حوزه‌هایی مانند حقوق، سلامت، آب و هوا و آموزش است؛ در حالی که همچنان استانداردهای سختگیرانه شفافیت را حفظ خواهند کرد.