دانش و فناوریموبایل و تبلت

Google Project Astra عملی


خوراکی های کلیدی

  • سخنرانی اصلی Google I/O 2024 بر روی هوش مصنوعی در اندروید 15 متمرکز شد و از دستیار چند وجهی Project Astra رونمایی کرد.
  • پروژه Astra تحت تأثیر قرار گرفت، اما محدودیت‌های بالقوه‌ای را نشان داد، با ویژگی‌های مشابه جمینی و نقص‌های حافظه.
  • با وجود برخی خطاها، Project Astra نگاهی اجمالی به آینده کمک های هوش مصنوعی ارائه می دهد، که هنوز سال ها با کمال فاصله دارد.


برای ارائه‌ای که دو ساعت به طول انجامید، سخنرانی اصلی I/O 2024 از نوع نمایش‌های تاثیرگذار کنفرانس توسعه‌دهندگان Google در سال‌های گذشته کوتاه بود. تعداد بسیار کمی از تیزرهایی که این شرکت در روز سه‌شنبه به اشتراک گذاشت، هیجانی را ایجاد کرد که اولین نسخه نمایشی آن از ابزاری که در نهایت به ابزار پاک کن جادویی پیکسل تبدیل می‌شد، در آن زمان ایجاد کرد. 2017.

گوگل یک دستیار هوش مصنوعی چند وجهی را به نمایش گذاشت که می توانست ببیند، بشنود، مکالمه کند و از همه مهمتر به خاطر بسپارد.

مربوط

Google I/O 2024: 13 اعلان بزرگ این نمایشگاه

اندروید 15 اصلاً مورد توجه نبود. در عوض، هوش مصنوعی، هوش مصنوعی، هوش مصنوعی بود.

این تا زمانی بود که دمیس حسابیس، مدیرعامل DeepMind روی صحنه آمد تا پروژه Astra را اعلام کرد. در دموی دو دقیقه‌ای که بعد از آن انجام شد، گوگل دستیار هوش مصنوعی چندوجهی را به نمایش گذاشت که می‌توانست ببیند، بشنود، مکالمه کند و از همه مهم‌تر، به یاد بیاورد. در لحظات پایانی نمایش، زمانی که شخصی در خارج از صفحه نمایش از نرم افزار پرسید که آیا دیدن عینک خود را به خاطر می آورد، این قابلیت نهایی نمایش داده شد. هنگامی که دستیار، با مدل Gemini 1.5 Pro گوگل، گفت که یک جفت عینک را روی میزی دیده است که لحظاتی قبل دیده بود، حضار تشویق شدند.


به دنبال آدرس نهایی، دستیار را در حال عمل دیدم.

در پایان دمو، Hassabis در کمال تعجب همه حضار اعلام کرد که گوگل یک نسخه نمایشی زنده از Project Astra دارد تا بعد از سخنرانی اصلی به شرکت کنندگان نشان دهد. به دنبال آدرس نهایی، دستیار را در حال عمل دیدم. آنچه من دیدم قابل توجه بود، اما همچنین نشان می دهد که گوگل هنوز کار زیادی در پیش دارد تا اینکه Project Astra به اندازه کافی قابل اعتماد برای ارسال به مشتریان باشد.


پروژه آسترا

گوگل


وقتی یک ژرمن شپرد، موش و فلامینگو وارد دموی هوش مصنوعی می شوند چه اتفاقی می افتد؟

اولین بخش از نسخه ی نمایشی مطبوعات، گوگل مهارت های همخوانی جمینی را به نمایش گذاشت. یکی از کارمندان گوگل چند عدد پلاسی از جمله یکی از موز و دیگری یک هات داگ را در مقابل دوربین قرار داد و از دستیار سوالاتی در مورد اشیا پرسید. اعتراف می کنم که برخی از پاسخ ها هوشمندانه بودند. به عنوان مثال، در مورد هات داگ، این نرم افزار گفت که می تواند بخشی از یک “نوش منظم” باشد. به نوش، بعداً فهمیدم، به معنای خوردن میان وعده است. امتیاز کامل برای خلاقیت

بعداً در همان دمو، کارمندی که ویترین را هدایت می‌کرد، از جمینی خواست تا درباره ارزش غذایی اقلام روی میز چیزی بگوید. جمینی به جای گفتن یک چیز اساسی، به یک رکیک روی آورد و به این نکته اشاره کرد که چگونه غذاهای “رنگارنگ” راهی عالی برای تغذیه سالم هستند. کارمند سعی کرد جمینی را ترغیب کند تا پاسخ گوسفندتری ارائه دهد، اما موفق نشد. آن‌ها سپس اعتراف کردند که جمینی به تحریف پاسخ‌اش محدود شده است که ممکن است هوش مصنوعی را از بین ببرد.


مربوط

11 کار آزاردهنده Google Gemini به زودی برای شما انجام خواهد داد

Gemini 1.5 Pro به زودی می‌تواند با استفاده از ویدیو، در میان سایر به‌روزرسانی‌های کلیدی Google I/O، به سؤالات مربوط به دنیای اطراف شما پاسخ دهد.

پروژه ناتمام، اما گوگل اعتماد به نفس را پروژه می کند

یکی از چیزهایی که دو کارمند اجرای نسخه ی نمایشی به سرعت به ما یادآوری کردند این بود که Project Astra یک محصول نهایی نیست. ممکن است این یک اعتراف عجیب به نظر برسد، اما اگر صادق باشم، دیدن اینکه گوگل از تلاش برای پنهان کردن عیوب جمینی با اجرای یک نمایش نمایشی بیش از حد صیقلی اجتناب می‌کند، مایه طراوت بود. در واقع، این نرم افزار در طی 10 دقیقه ای که من آن را در عمل دیدم، حرف های زیادی زد.

دیدن اینکه گوگل از تلاش برای پنهان کردن عیوب Gemini با اجرای یک نمایش نمایشی بیش از حد صیقلی اجتناب می‌کند، بسیار شاداب بود.

به عنوان مثال، در اواخر دمو، یکی از کارمندان گوگل از جمینی خواست تا نام سه ماهی مخملی را که جلوی دوربین گذاشته بود، حفظ کند. به ترتیب، سام ژرمن شپرد، جورج موش و لیلی فلامینگو بودند. سپس او از Gemini در مورد حیوانات عروسکی پرسید، از جمله در مورد ترتیبی که آنها را جلوی دوربین قرار داد، و در اینجا نرم افزار با مشکل مواجه شد. ترتیب شلوارها درست نبود.


جمینی با اعتماد به نفس معمولی گفت: جورج اولین دوستی بود که به من معرفی کردید. به اعتبار خود، این نرم افزار زمانی که کارمند به خطا اشاره کرد اشتباه کرد. “بله، حق با شماست. سم اولین نفر بود.”

آیا Astra شریک نهایی Pictionary است؟

اما حتی با در نظر گرفتن این خطاها، احساس کردم که نگاهی اجمالی به آینده دارم. شاید نه چیزی که شامل هوش عمومی مصنوعی باشد، اما حداقل چیزی که می تواند برای میلیون ها نفر، به ویژه افراد دارای معلولیت مفید باشد.

جمینی با دیدن نقاشی اعلام کرد: “این یک شکل چوب عالی است.” کارمندی که در حال دودلینگ است، خاطرنشان کرد: «این بسیار تحسین برانگیز است.


بخش مورد علاقه من از نسخه ی نمایشی شاهد بازی دو کارمند Pictionary با Gemini بود. یکی از کارگران شروع به کشیدن مجسمه چوبی کرد. جمینی با دیدن نقاشی اعلام کرد: “این یک شکل چوب عالی است.” کارمندی که در حال دودلینگ است، خاطرنشان کرد: «این بسیار تحسین برانگیز است. سپس یک ایموجی جمجمه اضافه کردند تا شکل چوب آن را نگه داشته باشد و از جمینی خواستند حدس بزند. “هملت است؟” دستیار پرسید. کارمند گفت: بله، درست است. این یک مبادله عجیب بود که توانست تا حدودی شک و تردیدی را که در اولین باری که Google Project Astra را دیدم، از بین ببرد.

مربوط

دومین نسخه بتا عمومی اندروید 15 به صورت زنده و در بسیاری از گوشی‌های دیگر منتشر شده است

هنوز چند شکاف بزرگ در پشتیبانی بتا وجود دارد.

با این حال، بیش از هر چیز، ویترینی که دیدم مجدداً تأیید کرد که یک دستیار هوش مصنوعی دانا و همه کاره سال‌ها دیگر فاصله دارد. در صحبت با دو کارمند Google که میزبانی نسخه ی نمایشی را بر عهده داشتند، متوجه شدم که توانایی Astra برای “به خاطر سپردن” در حال حاضر به یک جلسه محدود شده است و تنها پس از آن چند دقیقه است. علاوه بر این، دستیار به جای اینکه بتواند به طور انحصاری روی دستگاه اجرا شود، به کمک های ابری وابسته است. من مطمئن هستم که گوگل در نهایت از این محدودیت ها عبور خواهد کرد، اما من انتظار ندارم که این پیشرفت ها آسان یا سریع باشد.



منبع

دیدگاهتان را بنویسید

دکمه بازگشت به بالا