چرا غول‌های فناوری مشتری ثابت خدمات زیرساخت هوش مصنوعی شدند؟

خلاصه‌ی ۳ خطی

از آمازون تا گوگل، همه برای تأمین توان پردازشی پروژه‌های کلاینت و تحقیقات خودشان، سراغ زیرساخت-as-a-Service هوش مصنوعی می‌روند؛ روندی که بازار را به‌سرعت در انحصار چند غول درمی‌آورد.

چه خبر شده؟

غول‌های فناوری دیگر فقط فروشنده زیرساخت نیستند؛ خودشان بزرگ‌ترین مصرف‌کننده خدمات پردازشی شدند.

آن‌ها برای آموزش مدل‌های بزرگ زبان، تصویر و توصیه‌گر، به حجم عظیم GPU و TPU نیاز دارند و خرید مستقیم تراشه پاسخ‌گو نیست.

بنابراین قرارداد بلندمدت با ارائه‌دهندگان IaaS هوش مصنوعی می‌بندند تا هم هزینه را ثابت کنند و هم زمان ارائه را تضمین کنند.

دلایل اصلی

۱. امنیت عرضه

رزرو ظرفیت سالانه از تولیدکنندگان کوچک مانع می‌شود در زمان اوج تقاضا ناگهان GPU نیابند.

۲. کاهش هزینه سرمایه‌ای

به‌جای خرید هزاران واحد سخت‌افزار، هزینه عملیاتی按月 پرداخت می‌شود و نقدینگی برای R&D آزاد می‌ماند.

۳. انعطاف مقیاس

در هفته‌ی عرضه محصول جدید، صدها گره اضافه می‌شود و پس از فروکش کردن ترافیک، کاسته می‌شود تا پول حفظ شود.

۴. تمرکز بر هسته کسب‌وکار

نگه‌داری سرور، به‌روزرسانی درایور و خنک‌سازی به عهده‌ی تأمین‌کننده است و تیم فناوری روی مدل متمرکز می‌ماند.

ساختار یک قرارداد نمونه

سطح SLA	مدت قرارداد	ظرفیت رزرو	گزینه Burst	تخفیف پلکانی
Platinum	۳ سال	۲۵۶ A100	+۳۲ گره	۲۵٪
Gold	۱ سال	۱۲۸ A100	+۱۶ گره	۱۵٪
Silver	۶ ماه	۶۴ A100	+۸ گره	۱۰٪

پیامدها برای استارتاپ‌ها

با پیش‌خرید ظرفیت توسط غول‌ها، قیمت لحظه‌ای GPU بالا می‌رود و استارتاپ‌ها مجبورند یا مشترک بلندمدت شوند یا سراغ مدل‌های کوچک‌تر بروند.

در عوض، بستر ارائه‌شده توسط همین غول‌ها (AWS SageMaker، GCP Vertex، Azure ML) ابزار آماده در اختیارشان می‌گذارد تا زمان تولید را به چند هفته کاهش دهند.

به‌صورت خلاصه

شرکت‌های بزرگ ظرفیت محاسباتی را سال‌ها جلوتر رزرو می‌کنند.
خدمات IaaS هوش مصنوعی به دارایی استراتژیک تبدیل شده است.
رقابت بر سر GPU وارد فاز بلندمدت و قراردادی شده است.