BlockRank: موتور جستجوی هوشمندی که روی گوشی شما هم اجرا می‌شود

خلاصه: گوگل DeepMind الگوریتم رتبه‌بندی جدیدی به نام BlockRank ساخته که با کمک همان مدل زبانی بزرگ، سرعت جستجو را چندبرابر می‌کند و حالا هر کسی می‌تواند یک موتور جستجوی قدرتمند و کم‌مصرف را روی لپتاپ یا حتی سرور کوچک شخصی خودش راه‌اندازی کند.

چرا BlockRank را بشناسیم؟

مشکل قبلی چه بود؟

تا حالا اگر می‌خواستید چند هزار صفحه وب را بر اساس یک سوال رتبه‌بندی کنید، باید همه آن‌ها را هم‌زمان به مدل زبانی می‌دادید؛ این کار با افزایش تعداد صفحه‌ها، هزینه محاسباتی به‌صورت نمایی بالا می‌رفت.

راه‌حل BlockRank

BlockRank فقط «ارتباط هر سند با پرس‌وجو» را بررسی می‌کند و کاری به مقایسه سند با سند ندارد؛ به‌این‌ترتیب حجم محاسبه از O(n²) به O(n) می‌رسد و سرعت ده برابر می‌شود.

دو ترفند کلیدی

1. تمرکز بلوکی بین اسناد

بررسی دقیق نشان داد مدل معمولا هر سند را جداگانه می‌خواند و کمتر آن‌ها را با هم مقایسه می‌کند. BlockRank همین رفتار را رسمی کرد تا از محاسبات اضافی صرف‌نظر شود.

2. اهمیت‌سنجی بخش‌های پرس‌وجو

کلمه‌های کلیدی یا علائم نگارشی خاص در سوال، خودشان نوک پیکان را به سند صحیح نشانه می‌روند. الگوریتم به مدل یاد می‌دهد این بخش‌ها را جدی‌تر بگیرد.

آزمون عملی

محققان BlockRank را با مدل ۷-میلیارد پارامتری Mistral روی سه پایگاه رایج ارزیابی کردند:

BEIR: طیف وسیعی از موضوعات
MS MARCO: پرس‌وجوهای واقعی بینگ
Natural Questions: سوالات واقعی گوگلی

در هر سه مجموعه، دقت نتایج هم‌سطح یا بهتر از سیستم‌هایی بود که برای همین کار به‌طور خاص آموزش دیده بودند.

دستاورد بزرگ

حالا حتی یک دانشجو با یک لپتاپ معمولی می‌تواند «موتور جستجوی semantic» خودش را راه بیندازد؛ این یعنی تحقیقات علمی سریع‌تر، آموزش شخصی‌شده‌تر و تصمیم‌گیری‌های دقیق‌تر در هر سازمانی.

آیا گوگل از BlockRank استفاده می‌کند؟

در حال حاضر هیچ نشانه‌ای در نسخه‌ی عمومی جستجوی گوگل دیده نشده؛ پروژه در آزمایشگاه مانده و هنوز کد کاملش روی گیت‌هاب قرار نگرفته است.

چشم‌انداز

BlockRank مصرف انرژی را پایین می‌آورد، پردازش ابری ارزان‌تر می‌شود و احتمال دارد به‌زودی در دسترس توسعه‌دهندگان قرار بگیرد تا هر استارتاپ کوچکی هم موتور جستجوی اختصاصی خودش را بسازد.