خلاصه
ردیت از پرپلکسی و سه شرکت استخراجکننده داده شکایت کرده و میگوید آنها بدون اجازه محتوایش را جمعآوری کردهاند. پرپلکسی پاسخ میدهد فقط خلاصهبرداری میکند و هیچ مدلی را روی دادههای ردیت آموزش نمیدهد.
مقدمه
کاربران به تالار گفتوگوی ردت اعتماد میکنند، اما اگر همین حرفها بدون اجازه در موتورهای جستجو و رباتهای هوش مصنوعی پخش شود چه؟ این اتفاک دقیقا اختلاف تازه ردیت و پرپلکسی است.
چه کسی چه کاری را متهم شده؟
| شرکت | نقش ادعا شده |
|---|---|
| پرپلکسی | استفاده از خدمات SerpApi برای دور زدن کنترلهای ردیت |
| SerpApi | فروش API که نتایج گوگل را استخراج میکند |
| AWMProxy و Oxylabs | ارائه IP پروکسی برای پنهانکاری |
دلیل شکایت ردیت چیست؟
پست مخفیشده ظرف چند ساعت در پاسخ پرپلکسی دیده شد
ردیت پستی فقط برای خزنده گوگل قرار داد؛ این پست هیچ جای دیگری در اینترنت نبود. در عرض چند ساعت پرپلکسی هم همان محتوا را نمایش داد.
افزایش ۴۰ برابری ارجاع بعد از اخطار
پس از دریافت نامه توقف، تعداد لینکهایی که پرپلکسی به ردیت میداد ناگهان ۴۰ برابر شد.
پرپلکسی چه میگوید؟
- ما فقط بحثها را خلاصه میکنیم و منبع ردیت را ذکر میکنیم.
- هیچ سندی نشان نمیدهد که ما از داده ردیت برای آموزش مدل استفاده کردهباشیم.
- ردیت میخواهد از بند شدن گوگل پول بگیرد، ما وسیله فشار شدهایم.
ماجراهای قبلی پرپلکسی
فوربس گفته بود مقاله اختصاصیاً را بدون اجازه بازنشر کرده، ویرد هم گزارش داده که رباتهایش هویت واقعیشان را پنهان میکنند و دستور robots.txt را نادیده میگیرند.
چرا این دعوا برای همه مهم است؟
اگر دادگاه نظر ردیت را تأیید کند، هوش مصنوعی برای نقل مطالب انجمنها باید مجوز بگیرد یا دسترسیش را محدود کند. اگر نظر پرپلکسی قبول شود، آینده خزش خودکار حتی بدون رضایت صاحب محتوا آزادتر خواهد شد.
چه چیزهایی هنوز معلوم نیست؟
- دقیقا کدام شرکت استخراج داده به پرپلکسی فروخته؟
- چه مبلغی بابت این خدمات پرداخت شده؟
باید منتظر مستندات بیشتر مالی و فنی در جلسات بعدی دادگاه بود؛ تا آن روز، بحث بر سر مرز میان «خلاصهبرداری قانونی» و «سرقت داده» ادامه دارد.
