خلاصهی ۳ خطی
چین مدل «Spiking Brain» را معرفی کرد که با تقلید از نورونهای انسان تنها در لحظهی نیاز محاسبه میکند و تا ۸۹٪ در مصرف برق صرفهجویی میکند.
این مدل ۱۰۰ برابر سریعتر از سیستمهای فعلی، متنهایی به طول ۴ میلیون توکن را بدون افت دقت پردازش میکند.
کد آن متنباز شده تا توسعهدهندگان جهانی بتوانند هوش مصنوعی سبز و مقرونبهصرفه بسازند.
چرا مصرف انرژی هوش مصنوعی بحران شده؟
مرکز دادههای آمریکا فقط برای اِیآی سالی ۵۳ تا ۷۶ تراوات ساعت برق میسوزاند؛ معادل برق ۷ میلیون خانه.
Spiking Brain با محاسبهی رویدادمحور (فقط در لحظهی ورود داده جدید) تا ۶۹٪ محاسبات بیمورد را حذف میکند.
| نوع سیستم | میانگین مصرف برق | مصرف Spiking Brain |
|---|---|---|
| مدلهای ترانس مرسوم | ۱۰۰٪ | ۱۱٪ |
| چیپ نورومورفیک Loihi | ۶۰٪ | ۱۱٪ |
سه نوآوری اصلی در معماری
۱) توجه خطی بهجای درجهدوی
پیچیدگی از O(n²) به O(n) رسید؛ بنابراین طول متن از ۱۰ هزار توکن تا ۴ میلیون توکن با همان سرعت پردازش میشود.
۲) مخلوطی از متخصصان (MoE)
برای هر کار فقط زیرشبکهی مربوطه فعال میشود؛ ۴۰٪ پارامتر کمتر درگیر میشود ولی دقت بالا میماند.
۳) تراشههای نورومورفیک
با Intel Loihi و IBM TrueNorth مدل روی دستگاههای کممصرف موبایل هم اجرا میشود.
عملکرد روی مقیاس واقعی
نسخهی ۷ میلیارد پارامتری روی متن بلند ۱۰۰ برابر سریعتر از GPT-4-mini است.
نسخهی ۷۶ میلیارد پارامتری با ۳۰٪ انرژی کمتر از مدلهای هماندازه، نتیجهی دقیقتری میدهد.
- حافظهی موردنیاز: ۲ گیگابایت برای نسخهی کوچک
- زمان پاسخ در دستگاه边缘: کمتر از ۲۰۰ میلیثانیه
- قابلیت اجرا آفلاین: بله
مزیت زیستمحیطی
اگر فقط ۱۰٪ از مرکزدادههای جهان به این معماری مهاجرت کنند، سالی ۶ میلیون تن CO₂ کمتر تولید میشود؛ معادل حذف ۱٫۳ میلیون خودرو.
دسترسی متنباز و آینده
کد، وزنهای اولیه و دیتاست آموزشی در GitHub و Hugging Face منتشر شده تا استارتاپها و دانشگاهها بتوانند مدل را جابهجا کنند.
پروژهی بعدی همین تیم: نسخهی تریلیون پارامتری با یادگیری تقویتی و تولید محتوای خلاقانه است.
چه کسانی فوراً باید امتحان کنند؟
توسعهدهندگان رباتیک، اینترنت اشیا، ترجمهی زنده و هر کسی که به دنبال اِیآی کممصرف بدون اتصال اینترنت است.
