ویکی‌دیتا با هوش مصنوعی دوست شد؛ پایگاه دانش ۱۹ میلیون مدخل‌ به زبان ربات‌ها ترجمه شد

خلاصه

ویکی‌پدیای آلمان ۱۹ میلیون مدرک ویکی‌دیتا را با کمک مدل زبانی جدید به بردارهای هوش مصنوعی تبدیل کرد تا استارتاپ‌ها و توسعه‌دهندگان کوچک هم بتوانند چت‌بات‌های دقیق‌ و ارزان‌ بسازند.

چرا این خبر مهم است؟

تا حالا فقط غول‌های فناوری بودند که منابع عظیم داده را برای آموزش مدل‌های خود تصفیه می‌کردند. حالا پایگاه بردارهای ویکی‌دیتا رایگان و آماده‌ی دانلود است؛ یعنی هر تیم کوچکی می‌تواند بدون هزینه‌ی سنگین، دانش ساختارمند جهانی را به هوش مصنوعی خود تزریق کند.

ویکی‌دیتا چیست؟

ویکی‌دیتا، موتور دانش مشترک پروژه‌های ویکی‌مدیا، شبکه‌ای از اطلاعات دقیق و قابل استناد است که داوطلبان آن را نگهداری می‌کنند؛ از تاریخ تولد داگلاس آدامز تا شناسه‌ی کتابخانه‌ای او.

تفاوت دیتای قدیم و بردارهای جدید

فرمت قدیمیفرمت برداری جدید
جدول‌های متنی و پیوندهانقاط در فضای چندبعدی که معنا و ارتباط را حفظ می‌کنند
مناسب خواندن انسانمناسب فهم ماشین و جست‌وجوی معنایی

مزیت برای توسعه‌دهندگان کوچک

  • نیاز به سرورهای گران‌قیمت برای پردازش داده حذف شد
  • چت‌بات‌ها می‌توانند درباره‌ی موضوعات تخصصی‌تر و کمتر دیده‌شده پاسخ بدهند
  • به‌روزرسانی بعدی بر اساس بازخورد جامعه انجام می‌شود، نه فقط سیاست‌های شرکت خاص

مثال عملی؛ چه چیزی تغییر می‌کند؟

فرض کنید می‌خواهید بپرسید «کدام نویسنده کتاب راهنمای کهکشان برای اتوبوس‌گردان‌ها را نوشته؟» بردارهای جدید باعث می‌شود مدل بدون گشتن در صفحات متعدد، بلافاصله به «داگلاس آدامز» برسد و حتی اطلاعات جانبی مانند سبک نگارش یا دیگر آثارش را هم پیشنهاد دهد.

زمان‌بندی و دسترسی

نسخه‌ی اولیه شامل اطلاعات تا ۱۸ سپتامبر ۲۰۲۴ است و روی سرورهای DataStax به‌صورت رایگان میزبانی می‌شود. تیم ویکی‌دیتا پس از جمع‌آوری بازخورد، بروزرسانی کامل‌تری با داده‌های یک سال اخیر منتشر خواهد کرد.

چشم‌انداز

هدف نهایی، ایجاد اکوسیستمی باز است که در آن هوش مصنوعی کمتر به محتوای پرزرق و برق و پرتکرار اینترنت وابسته باشد و منابع دانشی دقیق، متنوع و چندزبانه را در اختیار همه قرار دهد.

دیدگاه‌ خود را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *