گوگل NotebookLM دیگر به robots.txt پاسخ نمی‌دهد؛ چطور جلویش را بگیرید؟

خلاصه خبر

گوگل رسماً اعلام کرد ربات NotebookLM که محتوای وب‌سایت‌ها را برای کاربران می‌خواند، دستور robots.txt را نادیده می‌گیرد؛ اما می‌توانید با چند خط ساده دسترسی‌اش را مسدود کنید.

مقدمه‌ای سریع

اگر فکر می‌کردید فایل robots.txt می‌تواند جلوی هر ربات گوگلی را بگیرد، باید بدانید که این قانون برای NotebookLM دیگر اعمال نمی‌شود. در ادامه می‌گویید چرا و چطور جلویش بگیرید.

NotebookLM چیست؟

ابزار تحقیق و نویسندگی AI گوگل که با دادن یک آدرس صفحه، خلاصه و نقشه‌ذهنی تعاملی می‌سازد.

ویژگی اصلی

  • استخراج نکات کلیدی خودکار
  • ایجاد نقشه ذهنی از موضوعات
  • پرس‌وجوی آزاد روی محتوا

چرا robots.txt برایش بی‌اثر شد؟

چون درخواست از سمت کاربر انجام می‌شود، نه خزنده‌ی خودکار.

نقل‌قول رسمی گوگل

«از آنجا که واکشی توسط کاربر انجام می‌شود، این ربات‌ها معمولاً قوانین robots.txt را نادیده می‌گیرند.»

روش‌های مسدودسازی NotebookLM

با شناسه‌ی User-Agent زیر می‌توانید دسترسی را قطع کنید.

روش سریع: افزونه Wordfence برای وردپرس

  1. افزونه را نصب و فعال کنید.
  2. در بخش Firewall > Custom Rules یک قانون جدید بسازید.
  3. در فیلد User-Agent عبارت Google-NotebookLM را وارد کنید و action را روی Block قرار دهید.

روش سراسری: فایل .htaccess

<IfModule mod_rewrite.c>
RewriteEngine On
RewriteCond %{HTTP_USER_AGENT} Google-NotebookLM [NC]
RewriteRule .* - [F,L]
</IfModule>

چک‌لیست نهایی

  • ✓ قبل از اعمال هر قانون، نسخه پشتیبان از .htaccess بگیرید.
  • ✓ در صورت استفاده از CDN، آن را پاک‌سازی کنید تا تغییرات اعمال شود.
  • ✓ پس از اعمال، با مرورگر کاربر-مندی مثل Google-NotebookLM تست کنید تا مطمئن شوید خطای 403 می‌گیرید.

دیدگاه‌ خود را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *