خلاصه
ویکیپدیای آلمان ۱۹ میلیون مدرک ویکیدیتا را با کمک مدل زبانی جدید به بردارهای هوش مصنوعی تبدیل کرد تا استارتاپها و توسعهدهندگان کوچک هم بتوانند چتباتهای دقیق و ارزان بسازند.
چرا این خبر مهم است؟
تا حالا فقط غولهای فناوری بودند که منابع عظیم داده را برای آموزش مدلهای خود تصفیه میکردند. حالا پایگاه بردارهای ویکیدیتا رایگان و آمادهی دانلود است؛ یعنی هر تیم کوچکی میتواند بدون هزینهی سنگین، دانش ساختارمند جهانی را به هوش مصنوعی خود تزریق کند.
ویکیدیتا چیست؟
ویکیدیتا، موتور دانش مشترک پروژههای ویکیمدیا، شبکهای از اطلاعات دقیق و قابل استناد است که داوطلبان آن را نگهداری میکنند؛ از تاریخ تولد داگلاس آدامز تا شناسهی کتابخانهای او.
تفاوت دیتای قدیم و بردارهای جدید
| فرمت قدیمی | فرمت برداری جدید |
|---|---|
| جدولهای متنی و پیوندها | نقاط در فضای چندبعدی که معنا و ارتباط را حفظ میکنند |
| مناسب خواندن انسان | مناسب فهم ماشین و جستوجوی معنایی |
مزیت برای توسعهدهندگان کوچک
- نیاز به سرورهای گرانقیمت برای پردازش داده حذف شد
- چتباتها میتوانند دربارهی موضوعات تخصصیتر و کمتر دیدهشده پاسخ بدهند
- بهروزرسانی بعدی بر اساس بازخورد جامعه انجام میشود، نه فقط سیاستهای شرکت خاص
مثال عملی؛ چه چیزی تغییر میکند؟
فرض کنید میخواهید بپرسید «کدام نویسنده کتاب راهنمای کهکشان برای اتوبوسگردانها را نوشته؟» بردارهای جدید باعث میشود مدل بدون گشتن در صفحات متعدد، بلافاصله به «داگلاس آدامز» برسد و حتی اطلاعات جانبی مانند سبک نگارش یا دیگر آثارش را هم پیشنهاد دهد.
زمانبندی و دسترسی
نسخهی اولیه شامل اطلاعات تا ۱۸ سپتامبر ۲۰۲۴ است و روی سرورهای DataStax بهصورت رایگان میزبانی میشود. تیم ویکیدیتا پس از جمعآوری بازخورد، بروزرسانی کاملتری با دادههای یک سال اخیر منتشر خواهد کرد.
چشمانداز
هدف نهایی، ایجاد اکوسیستمی باز است که در آن هوش مصنوعی کمتر به محتوای پرزرق و برق و پرتکرار اینترنت وابسته باشد و منابع دانشی دقیق، متنوع و چندزبانه را در اختیار همه قرار دهد.
