دعوای بزرگ ردیت و پرپلکسی؛ چرا هوش مصنوعی سر از پرونده قضایی درآورد؟

خلاصه

ردیت از پرپلکسی و سه شرکت استخراج‌کننده داده شکایت کرده و می‌گوید آن‌ها بدون اجازه محتوایش را جمع‌آوری کرده‌اند. پرپلکسی پاسخ می‌دهد فقط خلاصه‌برداری می‌کند و هیچ مدلی را روی داده‌های ردیت آموزش نمی‌دهد.

مقدمه

کاربران به تالار گفت‌وگوی ردت اعتماد می‌کنند، اما اگر همین حرف‌ها بدون اجازه در موتورهای جست‌جو و ربات‌های هوش مصنوعی پخش شود چه؟ این اتفاک دقیقا اختلاف تازه ردیت و پرپلکسی است.

چه کسی چه کاری را متهم شده؟

شرکت	نقش ادعا شده
پرپلکسی	استفاده از خدمات SerpApi برای دور زدن کنترل‌های ردیت
SerpApi	فروش API که نتایج گوگل را استخراج می‌کند
AWMProxy و Oxylabs	ارائه IP پروکسی برای پنهان‌کاری

دلیل شکایت ردیت چیست؟

پست مخفی‌شده ظرف چند ساعت در پاسخ پرپلکسی دیده شد

ردیت پستی فقط برای خزنده گوگل قرار داد؛ این پست هیچ جای دیگری در اینترنت نبود. در عرض چند ساعت پرپلکسی هم همان محتوا را نمایش داد.

افزایش ۴۰ برابری ارجاع بعد از اخطار

پس از دریافت نامه توقف، تعداد لینک‌هایی که پرپلکسی به ردیت می‌داد ناگهان ۴۰ برابر شد.

پرپلکسی چه می‌گوید؟

ما فقط بحث‌ها را خلاصه می‌کنیم و منبع ردیت را ذکر می‌کنیم.
هیچ سندی نشان نمی‌دهد که ما از داده ردیت برای آموزش مدل استفاده کرده‌باشیم.
ردیت می‌خواهد از بند شدن گوگل پول بگیرد، ما وسیله فشار شده‌ایم.

ماجراهای قبلی پرپلکسی

فوربس گفته بود مقاله اختصاصیاً را بدون اجازه بازنشر کرده، ویرد هم گزارش داده که ربات‌هایش هویت واقعی‌شان را پنهان می‌کنند و دستور robots.txt را نادیده می‌گیرند.

چرا این دعوا برای همه مهم است؟

اگر دادگاه نظر ردیت را تأیید کند، هوش مصنوعی برای نقل مطالب انجمن‌ها باید مجوز بگیرد یا دسترسیش را محدود کند. اگر نظر پرپلکسی قبول شود، آینده خزش خودکار حتی بدون رضایت صاحب محتوا آزادتر خواهد شد.

چه چیزهایی هنوز معلوم نیست؟

دقیقا کدام شرکت استخراج داده‌ به پرپلکسی فروخته؟
چه مبلغی بابت این خدمات پرداخت شده؟

باید منتظر مستندات بیشتر مالی و فنی در جلسات بعدی دادگاه بود؛ تا آن روز، بحث بر سر مرز میان «خلاصه‌برداری قانونی» و «سرقت داده» ادامه دارد.