خلاصه
تراشهی Ascend 910C در خوشهی CloudMatrix 384 هواوی با لینکهای نوری، عملکردی بهتر از GPUهای معمول در مصرف انرژی و زمان اجرا دارد. برای استفاده باید PyTorch یا TensorFlow را به MindSpore و CUDA را به CANN تبدیل کنید و در نهایت مدل را روی ModelArts مستقر کنید.
مقدمه
اگر دسترسی به GPUهای انویدیا سخت شده، خوشهی هواوی میتواند جایگزین مناسبی باشد. این مقاله مرحلهبهمرحله مهاجرت را نشان میدهد تا کمترین زمان را صرف آزمونوخطا کنید.
۱. تفاوت اصلی اکوسیستم
۱٫۱ سختافزار
- هر Ascend 910C توان پردازشی کمتری دارد اما ۳۸۴ عدد با لینک نوری تاخیر پایین خوشه میشوند.
- مصرف برق کل خوشه از سرورهای GPU با تعداد مشابه کمتر است.
۱٫۲ نرمافزار
| انویدیا | هواوی |
|---|---|
| CUDA | CANN |
| PyTorch/TensorFlow | MindSpore |
| NIM | MindIR |
۲. نصب و راهاندازی
۲٫۱ دریافت CANN
از سایت هواوی نسخهی CANN متناسب با سیستمعامل خود را دانلود و نصب کنید. اسکریپت install_cann.sh معمولاً تمام وابستگیها را حل میکند.
۲٫۲ نصب MindSpore
pip install mindspore-ascend==2.4
۳. تبدیل مدل از PyTorch/TensorFlow
۳٫۱ ابزار خودکار
MSAdapter کد PyTorch شما را میخواند و APIهای معادل MindSpore تولید میکند. دقت کنید لایههای سفارشی باید دستی بازنویسی شوند.
۳٫۲ بازنویسی دستی
- conv2d در PyTorch padding=’same’ دارد، در MindSpore باید pad_mode=’same’ تنظیم شود.
- init.xavier_uniform_ بهصورت پیشفرض متفاوت است؛ وزنها را ذخیره و دوباره بارگذاری کنید.
۴. آموزش مجدد یا انتقال وزن
اگر دقت مدل پایین آمد، چند اپک آموزش با MindSpore کافی است؛ معمولاً نیاز به آموزش کامل از صفر نیست.
۵. اجرا در دو حالت
۵٫۱ PYNATIVE_MODE برای دیباگ
در این حالت هر عمل بلافاصله اجرا میشود و خطا را سریع میبینید.
۵٫۲ GRAPH_MODE برای تولید
گراف محاسبه کامپایل میشود و کنترلفلوهای پایتونی باید به ops.cond تبدیل شوند تا بهینهسازی انجام گیرد.
۶. استخراج MindIR و استقرار
mindspore.export(model, input, file_name='model.mindir')
فایل تولیدی را در ModelArts آپلود کرده، نسخهی Ascend Model Zoo را انتخاب و با یک API call فراخوانی کنید.
۷. بهینهسازی با ابزار CANN
- profiling: msprof فراخوانیهای کند را نشان میدهد.
- اکیوسیستم AscendCL: حافظهی_device_ را مدیریت میکند تا Out of Memory نگیرید.
۸. محدودیتها و راهحل
تراشه در برخی مناطبع در دسترس نیست؛ از ModelArts یا شرکای ابری هواوی برای دسترسی ریموت استفاده کنید.
نتیجهگیری
مهاجرت به MindSpore و CANN در ابتدا زمانبر است اما هزینهی عملیاتی پایینتر و مصرف انرژی کمتر، در بلندمدت بازمیگردد. با استفاده از adapterها و حالتهای اجرا، میتوانید تدریجاً از CUDA فاصله بگیرید و وابستگی به تحریمها را کاهش دهید.
