خلاصه
یک عدد RTX 3060 Ti و یک عدد RTX 4060 Ti کنار افتاده را داخل سرور Proxmoxم گذاشتم؛ حالا یکی مدل زبانی ۱۴B را ۳۰ توکنبرثانیه ترجمه میکند و دیگری ۸ استریم ۴K را realtime تشخیص میدهد. برق کم، هزینه نزدیک صفر، امنیت مازاد.
مقدمه
وقتی SLI و CrossFire مردند، تصورم این بود چندکارتگرافیکی فقط خاطره شده. ولی Proxmox اجازه میدهد هر GPU را به یک ماشین مجازی یا کانتینر اختصاص دهی. نتیجه؟ آزمایشگاه خانگیِ ارزان، سریع و قابل اطممینان.
چرا هنوز چند GPU میارزد؟
۱. هزینه ماهانه را خُرد کردم
قبل از این کار ۵ سرور کوچک روشن بود و قبض برق نزدیک ۲.۵ میلیون تومان در ماه. حالا تنها یک کیسِ Threadripper با دو کارت گرافیک همان خدمت را میدهد و مصرف برق به زیر ۴۰۰ وات رسید.
۲. رندر ۴K را از ساعتها به دقیقه تقلیل دادم
Davinci Resolve و HandBrake هر دو از CUDA بهره میبرند. وقتی دو کارت همزمان کار کنند، رندر یک فیلم ۱۰ دقیقهای ۴K از ۹۰ دقیقه به ۱۴ دقیقه میرسد.
۳. پشتیبان خودکار دارم
اگر RTX 3060 Ti در تشخیص چهره Frigate سوخت، RTX 4060 Ti همان لحظه جایش را میگیرد؛ چون هرکدام در VM جداگانهاند و Clone دارم.
پروکسماکس + GPU Passthrough = دوشاخه طلایی
آنچه لازم دارید
- مادربرد و CPU که حداقل دو اسلات PCIe x16 واقعی بدهد (Threadripper، Ryzen9، یا حتی B550 با CPU دارای ۲۴ خط).
- BIOS/UEFI با IOMMU فعال (Intel VT-d یا AMD-Vi).
- نصب بستهٔ
pve-nvidia-vgpu-helperداخل Proxmox.
مرحلهبهمرحله
- در BIOS IOMMU و Above 4G Decoding را روشن کنید.
- در Grub خط زیر را اضافه کنید و آپدیت Grub و سپس Reboot بدهید:
intel_iommu=onیاamd_iommu=on - نام دقیق کارت را با دستور
lspci -nn | grep -i nvidiaپیدا کنید. - برای هرکارت یک VM یا LXC بسازید و PCIe Device را Attach کنید.
- در VM Nvidia Driver نصب کنید؛ فقط نسخهٔ لینوکس یا ویندوزِ Guest Service را نصب کنید.
نکتههای طلایی
- کارتهایی با ۸ یا ۱۲ گیگابایت VRAM را ارجح بدانید؛ حافظه برای LLM و Frigate زود پر میشود.
- اگر مصرف برق اهمیت دارد، با دستور
nvidia-smi -plتوان را از ۲۰۰W به ۱۲۵W کاهش دهید؛ عملاً عملکرد تشخیص تا ۷۰٪ باقی میماند. - از دایرکتاستوریج NVMe برای هر VM استفاده کنید تا گلوگاه I/O پیش نیاید.
برنامههایی که هماکنون روی دو GPU من کار میکنند
| برنامه | GPU | مصرف VRAM | کاربرد روزانه |
|---|---|---|---|
| Ollama (qwen3:14b-q4) | RTX 4060 Ti 16GB | ۹.۳GB | چت ربات خانگی، ترجمه متون |
| Frigate + YoloV8 | RTX 3060 Ti 8GB | ۶.۱GB | شناساش ۸ دوربین ۴K |
| Jellyfin Hardware Transcode | هردو بهصورت اشتراکی | ۱GB | ۲–۳ استریم همزمان |
جمعبندی
نیازی به خرید GPU گرانقیمت نیست؛ با دوتا کارت میانردهٔ دستدوم و Proxmox میتوانید:
- مدلهای زبانی بزرگ را لوکال اجرا کنید.
- خانهتان را هوشمند و امن نگه دارید.
- رندر ویدیو را سریعتر تمام کنید.
- از افت برق یا خرابی یک کارت نترسید.
کافی است IOMMU را روشن کنید، PCIe Passthrough را بزنید و باقی را به imagination واگذارید. موفق باشید!
