Google Gemini Live: ویژگی‌های جدید هدایت بصری، ادغام برنامه، و صدای داستان‌گوی هوشمند

گوگل مجموعه‌ای از قابلیت‌های جدید را به دستیار هوش مصنوعی Gemini Live اضافه می‌کند که تعامل با آن را طبیعی‌تر و کاربردی‌تر می‌کند. از جمله این ویژگی‌ها می‌توان به هدایت بصری روی صفحه، تعامل با اپلیکیشن‌های دیگر مثل پیام‌رسان و تلفن، و بهبود مدل صوتی با تن صدای متناسب با موضوع صحبت اشاره کرد. این قابلیت‌ها ابتدا روی گوشی‌های جدید پیکسل ۱۰ و سپس روی دستگاه‌های اندرویدی و آی‌او‌اسی دیگر عرضه می‌شوند.

راهنمایی بصری روی صفحه با دوربین

گوگل امکان جدیدی به Gemini Live اضافه کرده که در حین استفاده از دوربین دستگاه، می‌تواند اشیا یا موارد خاصی را روی صفحه نمایش شما هایلایت کند.

برای مثال:

  • اگر جلوی یک قفسه ابزار ایستاده‌اید و نمی‌دانید کدام ابزار مناسب کار شماست، کافی است دوربین گوشی را به سمت ابزارها بگیرید.
  • Gemini Live می‌تواند دقیقاً آن ابزار مورد نظر را روی صفحه شما مشخص کند.

این قابلیت از طریق ترکیب مشاهده واقعیت افزوده و هوش مصنوعی فعال می‌شود و کاربران را به طور مستقیم با محیط فیزیکی‌شان متصل می‌کند.

در دستگاه‌های چه کسانی در دسترس خواهد بود؟

دستگاهزمان عرضه
پیکسل ۱۰ و پیکسل ۱۰ پرو۲۸ اوت (۶ شهریور)
سایر دستگاه‌های اندرویدیهمزمان با عرضه پیکسل ۱۰
دستگاه‌های آی‌او‌اسچند هفته پس از عرضه اولیه

تعامل با اپلیکیشن‌های دیگر

Gemini Live به زودی می‌تواند مستقیماً با اپلیکیشن‌های داخلی مانند پیام‌رسان، تلفن و ساعت کار کند. این یعنی کاربران می‌توانند بدون تعویض برنامه، درخواست‌های عملیاتی را بدهند.

نمونه‌هایی از تعامل جدید:

  • درخواست ارسال پیام: در حین صحبت درباره مسیر رانندگی به مقصد، بگویید: «این مسیر خوبه، الان یه پیام به علی بزن بگو دیر می‌رسم.» Gemini خودش یک پیام مناسب می‌نویسد و آماده ارسال می‌کند.
  • درخواست تنظیم زمان‌سنج: بگویید: «یک زمان‌سنج برای ۱۵ دقیقه تنظیم کن» — Gemini مستقیماً اپلیکیشن Clock را فراخوانی می‌کند.
  • قطع تماس یا پاسخگویی هوشمند: هنگام تماس تلفنی یا دریافت تماس، Gemini می‌تواند در حین گفتگوی شما با دیگران، عملکردهایی شبیه بهدستیار صوتی هوشمند را انجام دهد.

این ادغام باعث می‌شود Gemini Live بیشتر شبیه یک دستیار شخصی واقعی عمل کند — نه فقط یک ربات پاسخ‌دهنده.

بهبودهای جدید در صدا و گفتار

مدل صوتی Gemini Live به‌روزرسانی شده و حالا از عناصر مهم گفتار انسانی مثل لحن، آهنگ و زیروبمی صدا بهتر استفاده می‌کند.

ویژگی‌های جدید صدای Gemini:

  • تغییر لحن بر اساس موضوع: اگر درباره موضوعی استرس‌زا سوال کنید (مثل ازمون یا مسائل مالی)، Gemini با لحن آرام‌تری پاسخ می‌دهد.
  • تنظیم سرعت صحبت: کاربر می‌تواند سرعت گفتار Gemini را کند یا تندتر کند — مشابه قابلیت‌های موجود در حالت صوتی ChatGPT.
  • لحن‌های داستانی و گویش ویژه: اگر درخواست کنید که داستانی از دید یک شخصیت تاریخی یا تخیلی بگوید، Gemini ممکن است با لهجه یا سبک گفتار متناسب صحبت کند تا روایت غنی‌تر و جذاب‌تری ارائه دهد.

این تغییرات باعث می‌شوند تعامل با Gemini طبیعی‌تر، احساسی‌تر و جذاب‌تر باشد — انگار با یک انسان واقعی صحبت می‌کنید.

جمع‌بندی: آینده دستیار هوش مصنوعی چه شکلی خواهد بود؟

قابلیت‌های جدید Gemini Live نشان می‌دهند که دستیارهای هوشمند دیگر فقط ابزار پاسخ‌گویی نیستند. آن‌ها دارند به همراهی هوشمند، چندکاره و احساسی تبدیل می‌شوند.

  • دیدن و نشان دادن چیزها روی صفحه، آن را به یک راهنمای فیزیکی در دنیای واقعی تبدیل می‌کند.
  • تعامل با اپلیکیشن‌های دیگر، آن را به یک مدیر واقعی زندگی روزمره تبدیل می‌کند.
  • صدای طبیعی و هوشمند، تعامل با آن را انسانی‌تر می‌کند.

همه این تغییرات یک مسیر را نشان می‌دهند: هوش مصنوعی دیگر فقط در پس‌زمینه کار نمی‌کند، بلکه داخل چرخه زندگی شما قرار می‌گیرد — چشم، گوش و زبان شما می‌شود.

اشتراک گذاری

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *