آمازون با آژنت‌های هوشمند وارد مسابقه AGI می‌شود

خلاصه مقاله

در این مصاحبه، دیوید لوان، رهبر آزمایشگاه تحقیقات هوش مصنوعی عمومی (AGI) در آمازون و یکی از چهره‌های برجسته هوش مصنوعی، درباره آینده عامل‌های هوش مصنوعی (AI agents)، چالش‌های فعلی در توسعه این فناوری و نقش آمازون در پیشرو بودن در این زمینه صحبت می‌کند. او توضیح می‌دهد که چرا مدل‌های زبانی بزرگ (LLM) کافی نیستند و چرا آموزش عامل‌ها از طریق شبیه‌سازی و یادگیری تقویتی (RL) کلید دستیابی به هوش مصنوعی قابل اعتماد است. لوان همچنین درباره علّت ترک استارتآپ Adept و پیوستن به آمازون، رویکرد شرکت به «عامل‌های قابل اعتماد» و نیز آینده شغلی در حوزه هوش مصنوعی صحبت می‌کند.

آشنایی با دیوید لوان: یکی از پیشگامان هوش مصنوعی

دیوید لوان یکی از صورت‌های شاخص در دنیای هوش مصنوعی است. او سال‌ها در OpenAI تحقیقات اولیه را در توسعه مدل‌های بزرگ مثل GPT-2، GPT-3 و DALL-E رهبری کرد. بعد از آن، به گوگل رفت تا روی مدل PaLM کار کند و سپس با تیم خود استارتآپ Adept را تأسیس کرد — نخستین شرکتی که تمرکز اصلی‌اش بر ساخت «عامل‌های هوش مصنوعی» بود.

در تابستان ۲۰۲۳، لوان و بیشتر تیم فنی Adept به آمازون پیوستند. این حرکت یک نمونه بارز از آنچه «استخدام معکوس» (reverse acquihire) نامیده می‌شود، بود: شرکت بزرگ نه تمام شرکت را می‌خرد، بلکه هسته فنی را جذب می‌کند، در حالی که شرکت قبلی همچنان فعال می‌ماند.

چرا عامل‌های هوش مصنوعی آینده هوش مصنوعی هستند؟

لوان معتقد است دوره چت‌بات‌های ساده به پایان می‌رسد. کاربران دیگر فقط به یک مدل نیاز ندارند که بتواند خوب پاسخ دهد، بلکه به چیزی نیاز دارند که بتواند واقعاً کارهای دنیای واقعی را انجام دهد.

اما مشکل اینجاست: عامل‌های امروزی اغلب گاهی کار نمی‌کنند، آهسته‌اند و یکی از سه بار اشتباه می‌کنند. این موارد به تعویق می‌اندازند فراگیر شدن این فناوری در میان کاربران.

به گفته لوان، راه جلو، نه فقط چت کردن بیشتر، بلکه «انجام دادن واقعی کارها» است — این دقیقاً همان چیزی است که آمازون روی آن کار می‌کند.

چرا LLMها برای عامل‌ها کافی نیستند؟

مدل‌های زبانی بزرگ (مثل GPT) بیشتر از طریق «پیش‌بینی کلمه بعدی» از روی داده‌های موجود آموزش می‌بینند. این فرآیند بیشتر شبیه به «تقلید رفتار» (imitation learning) است:

  • مدل نمی‌فهمد چرا یک پاسخ درست است.
  • فقط می‌آموزد که در چنین شرایطی، معمولاً چه جوابی داده شده است.

این مدل‌ها ممکن است در نوشتن یا چت خوب عمل کنند، اما وقتی باید تصمیمات واقعی بگیرند و اقداماتی مثل خرید، برنامه‌ریزی سفر یا انجام آزمایش در آزمایشگاه انجام دهند، مشکل دارند.

عامل‌های واقعی باید بفهمند که «اگر من این کار را انجام دهم، نتیجه چه خواهد بود» — یعنی یاد بگیرند که چگونه در دنیای واقعی علّیّت کار می‌کند.

راه حل آمازون: «ورزشگاه‌های یادگیری تقویتی» (RL Gyms)

راه جلو، به گفته لوان، یادگیری تقویتی در محیط‌های شبیه‌سازی شده است. او از یک تشبیه عالی استفاده می‌کند:

اگر بخواهید کسی را تنیس بیاموزید، آیا ۹۹ درصد وقتش را به تماشای ویدیوهای یوتیوب اختصاص می‌دهید؟ نه. باید تمرین و اشتباه کند، تا یاد بگیرد.

آمازون این ایده را محقق می‌کند با ایجاد «ورزشگاه‌های RL» — شبیه‌سازهای دیجیتالی از محیط‌های کاری واقعی:

  • سیستم‌های CRM مثل Salesforce
  • نرم‌افزارهای حسابداری
  • سیستم‌های پزشکی الکترونیک
  • برنامه‌های طراحی کامپیوتری (CAD)
  • سیستم‌های منابع انسانی و زنجیره تأمین

در هر یک از این محیط‌ها، عامل هوش مصنوعی هدفی دریافت می‌کند (مثلاً «این قطعه را در CAD طراحی کن» یا «این صورت‌حساب را درست کن») و سپس با انجام اقدامات، از نتیجه خود بازخورد می‌گیرد.

اگر موفق شد، تقویت می‌شود. اگر اشتباه کرد، اصلاح می‌شود. این فرایند، دقیقاً مثل آموزش یک ورزشکار یا یک کارمند واقعی است — اما با سرعت و مقیاس بسیار بالاتر.

Nova Act و نمونه‌های کاربردی موفق

آمازون این فناوری را با عرضه Nova Act به صورت «پیش‌نمایش تحقیقاتی» معرفی کرده است. این سیستم هنوز عمومی نیست، اما شرکت‌های بزرگی از آن استفاده می‌کنند.

برخی از کاربردهای عملی عامل‌های آمازون عبارتند از:

کاربردشرحنرخ موفقیت
ثبت نام پزشکان و پرستارانخودکارسازی فرآیند ثبت‌نام در سیستم‌های درمانیبالای ۹۵٪
سیستم Navan (سابقه TripActions)انجام رزروهای پیچیده سفر برای مشتریانبالای ۹۵٪
فرآیندهای ۹۳ مرحله‌ای تست نرم‌افزاراتوماسیون کامل فرایندهای QCبا یک اسکریپت ساده

نرخ موفقیت ۹۵٪ تا ۹۹٪، فاصله‌ای بزرگ از سیستم‌های رقیب (که معمولاً حدود ۶۰٪ قابل اعتمادند) است. این همان «عامل نورم‌کور» است که لوان می‌گوید — نه جذاب و هیجان‌انگیز، اما قابل اعتماد و قابل استفاده در دنیای واقعی.

Alexa Plus: اولین عامل وب در تولید انبوه

یکی از اولین کاربردهای عمومی این فناوری، Alexa Plus است:

  • کاربر: «توالت من گرفت. نیاز به لوله‌کش دارم.»
  • Alexa Plus: مرورگر راه دور باز می‌کند، وب‌سایت Thumbtack را می‌رود، درخواست می‌دهد، چند گزینه پیشنهاد می‌دهد و کاربر انتخاب می‌کند.

این اولین نمونه واقعی از یک عامل وب فعال در دنیای واقعی است. هنوز هم گاهی شکست می‌خورد، اما گامی بزرگ به جلو است.

لوان می‌گوید این سیستم فقط یکی از بسیاری مشتریان داخلی برای آزمایش مدل است. داده‌های واقعی از میلیون‌ها دستگاه Alexa، یک آزمایشگاه عالی برای بهبود مدل است.

آیا نرخ پیشرفت هوش مصنوعی کند شده است؟

به رغم اینکه مدل‌های بزرگ مثل GPT-5 دیگر نوآوری فاحشی ندارند و بانکه‌ها تقریباً در یک نقطه تراکم کرده‌اند، لوان معتقد است پیشرفت کند نشده است.

به جای آن، ما در حال عبور از یک منحنی به منحنی بعدی هستیم:

  • S-curve اول: پیش‌آموزش مدل‌ها (pretraining) — رو به نرخ کاهش
  • S-curve بعدی: یادگیری تقویتی با پاداش قابل ارزیابی (RL with verifiable rewards) — همان چیزی که آمازون روی آن کار می‌کند

لوان می‌گوید این بعدی «نسل بعدی شتاب» در هوش مصنوعی است. او حتی می‌گوید ممکن است این پیشرفت کمتر از یک سال دیگر اتفاق بیفتد.

چرا آمازون در این مسابقه مهم است؟

لوان می‌گوید محاسبات کلیدی آینده این است:

  • تیم کوچک ولی تخصصی
  • دسترسی به محاسبات بسیار زیاد (compute)
  • محیط‌های واقعی و داده‌های قابل اعتماد برای آموزش عامل

آمازون در هر سه بخش قوی است:

  • تیم تحقیقاتی مستقل و سریع (مثل Adept)
  • زیرساخت عظیم AWS
  • دسترسی داخلی به ده‌ها هزار فرایند واقعی کاری در آمازون (منابع انسانی، لجستیک، مطب One Medical، AWS و…) — داده‌ای که خارج از آمازون در دسترس نیست

عامل‌های آماده برای بازار، احتمالاً به صورت سرویسی در AWS عرضه خواهند شد و مبنای نسل بعدی نرم‌افزارهای کسب‌وکار خواهند بود.

آینده رابط کاربری: همکاری، نه چت

راوی می‌گوید چت اینترفیس اشتباهی است برای عامل‌های آینده. او یک تشبیه عالی می‌زند:

وقتی پدرم با آیپد گیر می‌کند، مرا می‌زند. من فقط از طریق تلفن باید بفهمم مشکل کجاست. آیا تنظیمات باز است؟ دکمه کلیک شده؟ این ارتباط کم‌بازده است.

راه حل: یک «بوم مشترک» همکاری.

  • کاربر و عامل هر دو صفحه یکسانی را می‌بینند.
  • عامل می‌تواند عمل کند، کاربر می‌تواند اصلاح کند.
  • مثل همکاری دو انسان در یک پروژه، نه دستور دادن از طریق تلفن.

این مدل همکاری، آینده «همتیم‌های دانشی» (knowledge worker teammate) خواهد بود.

چرا دیوید لوان به آمازون پیوست؟

سه دلیل اصلی:

  1. نیاز به محاسبات عظیم: برای حل مسائل پیشرفته AGI، به خوشه‌های بزرگ بیلیون دلاری نیاز است. Adept با ۴۵۰ میلیون دلار سرمایه‌گذاری، نمی‌توانست به این سطح برسد.
  2. عدم تمایل به محدود شدن: لوان نمی‌خواست Adept به یک شرکت فروش مدل‌های کوچک تبدیل شود. او می‌خواست به جلوترین نقطه فناوری برسد.
  3. تضمین منابع: آمازون توسط اندی جاسی به یک آینده عامل‌محور دعوت شد. این یعنی حمایت کامل مالی و استراتژیک.

او می‌گوید: اگر دنبال ساختن آینده هوش مصنوعی هستید، باید جایی باشید که هم ذهن ناب دارد، هم محاسبات نامحدود.

آینده کسب‌وکار و فناوری عامل‌ها

به گفته لوان، نمای آینده این است:

  • عامل‌های هوش مصنوعی قابل اعتماد در دسترس کسب‌وکارها قرار می‌گیرند.
  • این سیستم‌ها فرآیندهای تکراری و چندمرحله‌ای را خودکار می‌کنند.
  • این سرویس‌ها از طریق AWS توزیع می‌شوند.
  • نرم‌افزارهای آینده دیگر فقط «کد» نیستند، بلکه «عامل‌های همکار» خواهند بود.

این تغییر، شبیه به جایی است که محاسبات ابری (cloud computing) در دهه گذشته چه کرد — و آمازون دوباره در قلب این انقلاب قرار دارد.

آینده بازار کار و استارتآپ‌ها در هوش مصنوعی

لوان تأکید می‌کند که با وجود تمرکز بر تیم‌های کوچک و نخبه، دنیای هوش مصنوعی هنوز باز است:

  • کمتر از ۱۰۰۰ نفر در دنیا به طور عمیق فرآیند ساخت مدل‌های پیشرفته را می‌فهمند.
  • اما افراد جوان با هوش و پشتکار می‌توانند در ۳ تا ۴ سال به سطح قابل توجهی برسند.
  • مهم‌ترین مهارت، حل مسئله‌های باز و یافتن زیرشاخه‌های جدید است.

به نظر او، آینده به کسانی تعلق دارد که مدل + رابط + محصول را همزمان طراحی کنند — نه فقط مدل، نه فقط رابط، نه فقط ابزار.

اشتراک گذاری

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *