خلاصهی ۳ خطی
از آمازون تا گوگل، همه برای تأمین توان پردازشی پروژههای کلاینت و تحقیقات خودشان، سراغ زیرساخت-as-a-Service هوش مصنوعی میروند؛ روندی که بازار را بهسرعت در انحصار چند غول درمیآورد.
چه خبر شده؟
غولهای فناوری دیگر فقط فروشنده زیرساخت نیستند؛ خودشان بزرگترین مصرفکننده خدمات پردازشی شدند.
آنها برای آموزش مدلهای بزرگ زبان، تصویر و توصیهگر، به حجم عظیم GPU و TPU نیاز دارند و خرید مستقیم تراشه پاسخگو نیست.
بنابراین قرارداد بلندمدت با ارائهدهندگان IaaS هوش مصنوعی میبندند تا هم هزینه را ثابت کنند و هم زمان ارائه را تضمین کنند.
دلایل اصلی
۱. امنیت عرضه
رزرو ظرفیت سالانه از تولیدکنندگان کوچک مانع میشود در زمان اوج تقاضا ناگهان GPU نیابند.
۲. کاهش هزینه سرمایهای
بهجای خرید هزاران واحد سختافزار، هزینه عملیاتی按月 پرداخت میشود و نقدینگی برای R&D آزاد میماند.
۳. انعطاف مقیاس
در هفتهی عرضه محصول جدید، صدها گره اضافه میشود و پس از فروکش کردن ترافیک، کاسته میشود تا پول حفظ شود.
۴. تمرکز بر هسته کسبوکار
نگهداری سرور، بهروزرسانی درایور و خنکسازی به عهدهی تأمینکننده است و تیم فناوری روی مدل متمرکز میماند.
ساختار یک قرارداد نمونه
| سطح SLA | مدت قرارداد | ظرفیت رزرو | گزینه Burst | تخفیف پلکانی |
|---|---|---|---|---|
| Platinum | ۳ سال | ۲۵۶ A100 | +۳۲ گره | ۲۵٪ |
| Gold | ۱ سال | ۱۲۸ A100 | +۱۶ گره | ۱۵٪ |
| Silver | ۶ ماه | ۶۴ A100 | +۸ گره | ۱۰٪ |
پیامدها برای استارتاپها
با پیشخرید ظرفیت توسط غولها، قیمت لحظهای GPU بالا میرود و استارتاپها مجبورند یا مشترک بلندمدت شوند یا سراغ مدلهای کوچکتر بروند.
در عوض، بستر ارائهشده توسط همین غولها (AWS SageMaker، GCP Vertex، Azure ML) ابزار آماده در اختیارشان میگذارد تا زمان تولید را به چند هفته کاهش دهند.
بهصورت خلاصه
- شرکتهای بزرگ ظرفیت محاسباتی را سالها جلوتر رزرو میکنند.
- خدمات IaaS هوش مصنوعی به دارایی استراتژیک تبدیل شده است.
- رقابت بر سر GPU وارد فاز بلندمدت و قراردادی شده است.
