خلاصه مقاله
در این مصاحبه، دیوید لوان، رهبر آزمایشگاه تحقیقات هوش مصنوعی عمومی (AGI) در آمازون و یکی از چهرههای برجسته هوش مصنوعی، درباره آینده عاملهای هوش مصنوعی (AI agents)، چالشهای فعلی در توسعه این فناوری و نقش آمازون در پیشرو بودن در این زمینه صحبت میکند. او توضیح میدهد که چرا مدلهای زبانی بزرگ (LLM) کافی نیستند و چرا آموزش عاملها از طریق شبیهسازی و یادگیری تقویتی (RL) کلید دستیابی به هوش مصنوعی قابل اعتماد است. لوان همچنین درباره علّت ترک استارتآپ Adept و پیوستن به آمازون، رویکرد شرکت به «عاملهای قابل اعتماد» و نیز آینده شغلی در حوزه هوش مصنوعی صحبت میکند.
آشنایی با دیوید لوان: یکی از پیشگامان هوش مصنوعی
دیوید لوان یکی از صورتهای شاخص در دنیای هوش مصنوعی است. او سالها در OpenAI تحقیقات اولیه را در توسعه مدلهای بزرگ مثل GPT-2، GPT-3 و DALL-E رهبری کرد. بعد از آن، به گوگل رفت تا روی مدل PaLM کار کند و سپس با تیم خود استارتآپ Adept را تأسیس کرد — نخستین شرکتی که تمرکز اصلیاش بر ساخت «عاملهای هوش مصنوعی» بود.
در تابستان ۲۰۲۳، لوان و بیشتر تیم فنی Adept به آمازون پیوستند. این حرکت یک نمونه بارز از آنچه «استخدام معکوس» (reverse acquihire) نامیده میشود، بود: شرکت بزرگ نه تمام شرکت را میخرد، بلکه هسته فنی را جذب میکند، در حالی که شرکت قبلی همچنان فعال میماند.
چرا عاملهای هوش مصنوعی آینده هوش مصنوعی هستند؟
لوان معتقد است دوره چتباتهای ساده به پایان میرسد. کاربران دیگر فقط به یک مدل نیاز ندارند که بتواند خوب پاسخ دهد، بلکه به چیزی نیاز دارند که بتواند واقعاً کارهای دنیای واقعی را انجام دهد.
اما مشکل اینجاست: عاملهای امروزی اغلب گاهی کار نمیکنند، آهستهاند و یکی از سه بار اشتباه میکنند. این موارد به تعویق میاندازند فراگیر شدن این فناوری در میان کاربران.
به گفته لوان، راه جلو، نه فقط چت کردن بیشتر، بلکه «انجام دادن واقعی کارها» است — این دقیقاً همان چیزی است که آمازون روی آن کار میکند.
چرا LLMها برای عاملها کافی نیستند؟
مدلهای زبانی بزرگ (مثل GPT) بیشتر از طریق «پیشبینی کلمه بعدی» از روی دادههای موجود آموزش میبینند. این فرآیند بیشتر شبیه به «تقلید رفتار» (imitation learning) است:
- مدل نمیفهمد چرا یک پاسخ درست است.
- فقط میآموزد که در چنین شرایطی، معمولاً چه جوابی داده شده است.
این مدلها ممکن است در نوشتن یا چت خوب عمل کنند، اما وقتی باید تصمیمات واقعی بگیرند و اقداماتی مثل خرید، برنامهریزی سفر یا انجام آزمایش در آزمایشگاه انجام دهند، مشکل دارند.
عاملهای واقعی باید بفهمند که «اگر من این کار را انجام دهم، نتیجه چه خواهد بود» — یعنی یاد بگیرند که چگونه در دنیای واقعی علّیّت کار میکند.
راه حل آمازون: «ورزشگاههای یادگیری تقویتی» (RL Gyms)
راه جلو، به گفته لوان، یادگیری تقویتی در محیطهای شبیهسازی شده است. او از یک تشبیه عالی استفاده میکند:
اگر بخواهید کسی را تنیس بیاموزید، آیا ۹۹ درصد وقتش را به تماشای ویدیوهای یوتیوب اختصاص میدهید؟ نه. باید تمرین و اشتباه کند، تا یاد بگیرد.
آمازون این ایده را محقق میکند با ایجاد «ورزشگاههای RL» — شبیهسازهای دیجیتالی از محیطهای کاری واقعی:
- سیستمهای CRM مثل Salesforce
- نرمافزارهای حسابداری
- سیستمهای پزشکی الکترونیک
- برنامههای طراحی کامپیوتری (CAD)
- سیستمهای منابع انسانی و زنجیره تأمین
در هر یک از این محیطها، عامل هوش مصنوعی هدفی دریافت میکند (مثلاً «این قطعه را در CAD طراحی کن» یا «این صورتحساب را درست کن») و سپس با انجام اقدامات، از نتیجه خود بازخورد میگیرد.
اگر موفق شد، تقویت میشود. اگر اشتباه کرد، اصلاح میشود. این فرایند، دقیقاً مثل آموزش یک ورزشکار یا یک کارمند واقعی است — اما با سرعت و مقیاس بسیار بالاتر.
Nova Act و نمونههای کاربردی موفق
آمازون این فناوری را با عرضه Nova Act به صورت «پیشنمایش تحقیقاتی» معرفی کرده است. این سیستم هنوز عمومی نیست، اما شرکتهای بزرگی از آن استفاده میکنند.
برخی از کاربردهای عملی عاملهای آمازون عبارتند از:
کاربرد | شرح | نرخ موفقیت |
---|---|---|
ثبت نام پزشکان و پرستاران | خودکارسازی فرآیند ثبتنام در سیستمهای درمانی | بالای ۹۵٪ |
سیستم Navan (سابقه TripActions) | انجام رزروهای پیچیده سفر برای مشتریان | بالای ۹۵٪ |
فرآیندهای ۹۳ مرحلهای تست نرمافزار | اتوماسیون کامل فرایندهای QC | با یک اسکریپت ساده |
نرخ موفقیت ۹۵٪ تا ۹۹٪، فاصلهای بزرگ از سیستمهای رقیب (که معمولاً حدود ۶۰٪ قابل اعتمادند) است. این همان «عامل نورمکور» است که لوان میگوید — نه جذاب و هیجانانگیز، اما قابل اعتماد و قابل استفاده در دنیای واقعی.
Alexa Plus: اولین عامل وب در تولید انبوه
یکی از اولین کاربردهای عمومی این فناوری، Alexa Plus است:
- کاربر: «توالت من گرفت. نیاز به لولهکش دارم.»
- Alexa Plus: مرورگر راه دور باز میکند، وبسایت Thumbtack را میرود، درخواست میدهد، چند گزینه پیشنهاد میدهد و کاربر انتخاب میکند.
این اولین نمونه واقعی از یک عامل وب فعال در دنیای واقعی است. هنوز هم گاهی شکست میخورد، اما گامی بزرگ به جلو است.
لوان میگوید این سیستم فقط یکی از بسیاری مشتریان داخلی برای آزمایش مدل است. دادههای واقعی از میلیونها دستگاه Alexa، یک آزمایشگاه عالی برای بهبود مدل است.
آیا نرخ پیشرفت هوش مصنوعی کند شده است؟
به رغم اینکه مدلهای بزرگ مثل GPT-5 دیگر نوآوری فاحشی ندارند و بانکهها تقریباً در یک نقطه تراکم کردهاند، لوان معتقد است پیشرفت کند نشده است.
به جای آن، ما در حال عبور از یک منحنی به منحنی بعدی هستیم:
- S-curve اول: پیشآموزش مدلها (pretraining) — رو به نرخ کاهش
- S-curve بعدی: یادگیری تقویتی با پاداش قابل ارزیابی (RL with verifiable rewards) — همان چیزی که آمازون روی آن کار میکند
لوان میگوید این بعدی «نسل بعدی شتاب» در هوش مصنوعی است. او حتی میگوید ممکن است این پیشرفت کمتر از یک سال دیگر اتفاق بیفتد.
چرا آمازون در این مسابقه مهم است؟
لوان میگوید محاسبات کلیدی آینده این است:
- تیم کوچک ولی تخصصی
- دسترسی به محاسبات بسیار زیاد (compute)
- محیطهای واقعی و دادههای قابل اعتماد برای آموزش عامل
آمازون در هر سه بخش قوی است:
- تیم تحقیقاتی مستقل و سریع (مثل Adept)
- زیرساخت عظیم AWS
- دسترسی داخلی به دهها هزار فرایند واقعی کاری در آمازون (منابع انسانی، لجستیک، مطب One Medical، AWS و…) — دادهای که خارج از آمازون در دسترس نیست
عاملهای آماده برای بازار، احتمالاً به صورت سرویسی در AWS عرضه خواهند شد و مبنای نسل بعدی نرمافزارهای کسبوکار خواهند بود.
آینده رابط کاربری: همکاری، نه چت
راوی میگوید چت اینترفیس اشتباهی است برای عاملهای آینده. او یک تشبیه عالی میزند:
وقتی پدرم با آیپد گیر میکند، مرا میزند. من فقط از طریق تلفن باید بفهمم مشکل کجاست. آیا تنظیمات باز است؟ دکمه کلیک شده؟ این ارتباط کمبازده است.
راه حل: یک «بوم مشترک» همکاری.
- کاربر و عامل هر دو صفحه یکسانی را میبینند.
- عامل میتواند عمل کند، کاربر میتواند اصلاح کند.
- مثل همکاری دو انسان در یک پروژه، نه دستور دادن از طریق تلفن.
این مدل همکاری، آینده «همتیمهای دانشی» (knowledge worker teammate) خواهد بود.
چرا دیوید لوان به آمازون پیوست؟
سه دلیل اصلی:
- نیاز به محاسبات عظیم: برای حل مسائل پیشرفته AGI، به خوشههای بزرگ بیلیون دلاری نیاز است. Adept با ۴۵۰ میلیون دلار سرمایهگذاری، نمیتوانست به این سطح برسد.
- عدم تمایل به محدود شدن: لوان نمیخواست Adept به یک شرکت فروش مدلهای کوچک تبدیل شود. او میخواست به جلوترین نقطه فناوری برسد.
- تضمین منابع: آمازون توسط اندی جاسی به یک آینده عاملمحور دعوت شد. این یعنی حمایت کامل مالی و استراتژیک.
او میگوید: اگر دنبال ساختن آینده هوش مصنوعی هستید، باید جایی باشید که هم ذهن ناب دارد، هم محاسبات نامحدود.
آینده کسبوکار و فناوری عاملها
به گفته لوان، نمای آینده این است:
- عاملهای هوش مصنوعی قابل اعتماد در دسترس کسبوکارها قرار میگیرند.
- این سیستمها فرآیندهای تکراری و چندمرحلهای را خودکار میکنند.
- این سرویسها از طریق AWS توزیع میشوند.
- نرمافزارهای آینده دیگر فقط «کد» نیستند، بلکه «عاملهای همکار» خواهند بود.
این تغییر، شبیه به جایی است که محاسبات ابری (cloud computing) در دهه گذشته چه کرد — و آمازون دوباره در قلب این انقلاب قرار دارد.
آینده بازار کار و استارتآپها در هوش مصنوعی
لوان تأکید میکند که با وجود تمرکز بر تیمهای کوچک و نخبه، دنیای هوش مصنوعی هنوز باز است:
- کمتر از ۱۰۰۰ نفر در دنیا به طور عمیق فرآیند ساخت مدلهای پیشرفته را میفهمند.
- اما افراد جوان با هوش و پشتکار میتوانند در ۳ تا ۴ سال به سطح قابل توجهی برسند.
- مهمترین مهارت، حل مسئلههای باز و یافتن زیرشاخههای جدید است.
به نظر او، آینده به کسانی تعلق دارد که مدل + رابط + محصول را همزمان طراحی کنند — نه فقط مدل، نه فقط رابط، نه فقط ابزار.
دیدگاهتان را بنویسید