دانش و فناوریموبایل و تبلت

سیری قدیمی است، اما ممکن است نسخه بهتری در راه باشد


خوراکی های کلیدی

  • اپل به طور فعال در حال کار بر روی توسعه یک LLM است که برای افزایش حریم خصوصی می تواند به صورت محلی بر روی آیفون شما اجرا شود.
  • سیری ممکن است در درک دستورات کاربر از طریق زمینه و توانایی ارجاع به متن روی صفحه بسیار دقیق تر شود.
  • آینده سیری ممکن است شامل ویژگی‌هایی مانند تشخیص تصویر پیشرفته، فعال‌سازی بدون ماشه و بهبود قابلیت‌های نگهداری مکالمه باشد.


برخی از محصولات اپل نمی‌توانند با هیاهوها مطابقت کنند (نیوتن اپل، هر کسی؟) و مسلماً بزرگترین ناامیدی سیری بوده است. وقتی سیری وارد شد، خبر از طلوع جدیدی از نحوه تعامل ما با دستگاه های هوشمندمان داد.

با این حال، از سال 2011، زمانی که سیری برای اولین بار در iPhone 4S ظاهر شد، دستیار مجازی تغییر بسیار کمی داشته است و به قابلیتی تبدیل شده است که اغلب توسط بسیاری از دارندگان آیفون استفاده نمی شود. ظهور LLM هایی مانند ChatGPT نیز نشان داده است که سیری به طرز وحشتناکی منسوخ شده است.

مربوط

نحوه استفاده از میانبرهای سیری با تسلا برای افزایش کنترل صوتی

ما یک راهنمای ساده در مورد استفاده از میانبرها در iOS برای کنترل تسلا با سیری گردآوری کرده ایم.

هرچند، همه چیز از دست نرفته. اپل در نهایت نشانه هایی از ورود به هوش مصنوعی نشان می دهد و به احتمال زیاد در آینده ای نه چندان دور شاهد نسخه بسیار بهبود یافته سیری (Super-Siri؟) خواهیم بود. چندین مقاله تحقیقاتی اپل در دسترس عموم به برخی از زمینه هایی که اپل روی آنها تمرکز کرده است اشاره می کند. در اینجا چیزی است که ممکن است بخشی از نسخه بسیار بهتر سیری شود.



سیری مجهز به هوش مصنوعی که روی دستگاه شما اجرا می شود

از Super-Siri به صورت خصوصی استفاده کنید

آیفون 15 پرو مکس

LLM هایی مانند ChatGPT به عنوان برنامه در تلفن شما در دسترس هستند، اما همه جادوها در جای دیگری اتفاق می افتد. درخواست‌های شما به سرورهای ChatGPT ارسال می‌شوند، که آنها را با استفاده از مقادیر زیادی توان محاسباتی و مدل‌هایی که حاوی میلیاردها پارامتر هستند پردازش می‌کنند که فضای ذخیره‌سازی زیادی را اشغال می‌کنند. سپس پاسخ به تلفن شما ارسال می شود.

اپل به طور فعال در حال کار بر روی ایجاد یک LLM است که بتواند به صورت محلی بر روی آیفون شما اجرا شود.


اپل به طور فعال در حال کار بر روی ایجاد یک LLM است که بتواند به صورت محلی بر روی آیفون شما اجرا شود. این یک چالش مهم است، زیرا قدرت محاسباتی و ذخیره سازی در تلفن هوشمند محدود است. با این حال، اپل دارد یک مقاله تحقیقاتی منتشر کرد در مورد تلاش های خود برای ایجاد یک LLM کارآمد با حافظه محدود و نتایج چشمگیری ایجاد کرده است. این بدان معنی است که ما می‌توانیم نسخه بسیار بهبود یافته سیری را ببینیم که می‌تواند کاملاً آفلاین اجرا شود و حریم خصوصی بیشتری را ارائه دهد، که در واقع اپل بسیار مناسب است.

سیری که شما را بهتر درک می کند

وقتی آب و هوا را می‌پرسید، دیگر خبری از تماس با هیدر نیست

درخواست های خنده دار سیری

جیب پرز

همه دستیارهای صوتی ممکن است از تفسیر نادرست دستورات شما رنج ببرند. همه ما موقعیت‌هایی داشته‌ایم که از یک دستیار صوتی یک چیز خواسته‌ایم، فقط برای اینکه ما را بد بشنود و چیزی کاملاً متفاوت به ما بدهد. شما به سیری می گویید «ساعت سه مرا بیدار کن» و پاسخ «در حال پخش «بیدارم کن توسط آویسی» را دریافت می کنی.


مربوط

اپل اعتراف می‌کند که آخرین تبلیغ آی‌پد پرو خود را از دست داده است

اپل واقعاً خشونت را با تبلیغ پرس هیدرولیک خود انتخاب کرد، اما یک روز بعد آن را به عقب برگرداند.

خبر خوب این است که یک مقاله تحقیقاتی دیگر اپل بر هدف های رتبه بندی برای دستورات دستیار صوتی تمرکز کرده است. این مقاله روشی را برای انتخاب از بین اهداف بالقوه متعدد با در نظر گرفتن اطلاعات زمینه ای برای کاهش ابهام مورد بحث قرار می دهد. مقاله دیگری استفاده از LLM ها را برای انتخاب چندین هدف احتمالی، نه فقط یک مورد، و استفاده از این مقاصد چندگانه برای ارائه پاسخی که احتمالا مفیدتر است، مورد بحث قرار می دهد. نتیجه این است که سیری ممکن است در درک منظور شما بسیار دقیق تر شود.

سیری که می فهمد به چه چیزی نگاه می کنید

از سیری بخواهید از محتوا در صفحه نمایش شما استفاده کند

از مکالمه با متن در iMessage آیفون استفاده کنید.

یکی از مسائلی که سیری همیشه داشته این است که او نمی تواند آنچه شما می بینید را ببیند. و در حالی که هنوز ممکن است هنوز نتوان پرسید “سیری، آن پرنده در درخت آنجا چیست؟” ممکن است به زودی امکان ارجاع به محتوای روی صفحه نمایش شما وجود داشته باشد.


یکی دیگر از مقالات تحقیقاتی اپل مدلی را پیشنهاد می کند که می تواند به متن از روی صفحه مراجعه کنید هنگام برخورد با درخواست های کاربر برای مثال، اگر در صفحه تماس یک وب‌سایت هستید، می‌توانید بگویید «Siri، این شماره را به Alan ارسال کنید» و سیری متوجه می‌شود که به شماره تلفن اشاره می‌کنید، آن شماره را استخراج می‌کند و برای Alan ارسال می‌کند. . این مقاله به امکان ارجاع انواع مختلف متن، مانند آدرس های ایمیل، URL ها و تاریخ ها اشاره می کند. به عبارت دیگر، سیری ممکن است به زودی بتواند در کنار چیزهایی که در حال حاضر قادر به خواندن آنها است، بخواند.

بخش هایی از یک تصویر را جدا کنید

ممکن است بتوانید به سیری بگویید کجا باید نگاه کند

آیفونی که برنامه Sunseeker را نمایش می دهد

دسترسی به متن خوب است، اما سیری همچنان نمی تواند تصویری را که شما به آن نگاه می کنید، ببیند. یا می تواند؟ اپل Ferret را توسعه داده استیک مدل زبان بزرگ چندوجهی (MLLM) که می تواند ارجاعات فضایی را درک کند. این به میزان زیادی انواع چیزهایی را که می‌توانید از سیری بپرسید افزایش می‌دهد، و به شما اجازه می‌دهد برای مثال، دور بخشی از یک تصویر دایره‌ای بکشید و بپرسید “Siri، این ماشین چیست؟” یا “Siri، از کجا می توانم این کفش ها را بخرم؟”


مربوط

5 ابزار هوش مصنوعی شگفت انگیز که باید غیر از ChatGPT را امتحان کنید

پتانسیل نسل هوش مصنوعی نامحدود است. در اینجا چند ابزار وجود دارد – غیر از ChatGPT، Copilot و Gemini – که در حال حاضر از آن به روش‌های جالب و سرگرم‌کننده استفاده می‌کنند.

فرت همچنین قابلیت اتصال به زمین را ارائه می دهد. اینجاست که مدل بر اساس یک دستور، مناطقی از یک تصویر را شناسایی می‌کند، مانند “Siri، همه میمون‌های موجود در این تصویر کجا هستند؟” قدرت فرت به این معنی است که سیری می‌تواند اشیایی را که با انگشت خود به اطراف می‌کشید شناسایی کند یا حتی «Where’s Waldo» را برای شما حل کند. این پیامدهای بالقوه بزرگی دارد. سیری سرانجام می تواند به وعده اولیه عمل کند و نحوه تعامل ما با تلفن هایمان را تغییر دهد.

سیری بدون کلمه بیدار؟

با هی سیری خداحافظی کنید

هوش مصنوعی مولد سیری

اگر صاحب یک دستگاه آمازون اکو هستید و با شخصی که نامش الکسا است زندگی می کنید، زندگی باید سخت باشد. امکان تغییر کلمه wake وجود دارد، اما همه دستیارهای صوتی اصلی برای دریافت دستیار صوتی به یک کلمه بیدار (مانند Hey Siri یا فقط Siri) یا یک حرکت (مانند بالا بردن مچ دست با اپل واچ) نیاز دارند. برای شروع به گوش دادن


3:16

مربوط

چگونه از Amazon Echo خود به عنوان یک بلندگوی بلوتوث استفاده کنید

بلندگوهای آمازون Echo قابلیت های زیادی برای خانه هوشمند ارائه می دهند، اما می توانید برای استفاده به عنوان یک بلندگوی بلوتوث به تلفن هوشمند خود نیز متصل شوید.

یک مقاله تحقیقاتی اپل نشان می دهد که دستیار صوتی بدون ماشه ممکن است در راه باشد این برنامه با استفاده از یک سیستم چندوجهی شناسایی می کند که چه زمانی شخصی با دستیار مجازی صحبت می کند، از جمله تجزیه و تحلیل کلمات گفته شده با استفاده از LLM و همچنین شکل موج صوتی (مثلاً صداها ممکن است از نظر صدای پس زمینه بلندتر باشند). این مطالعه نشان داد که اندازه گیری دقیق زمانی که یک فرمان صوتی ادا می شود امکان پذیر است. این می تواند به این معنی باشد که دیگر نیازی به گفتن “Siri” ندارید.

یا شاید یک کلمه بیدار بعد از همه؟

سلام سیری، اما بهتر است

siri-feature-image

امید آرمین در Unsplash

یا شاید شما ممکن است. یکی دیگر از مقالات تحقیقاتی اپل رویکرد متفاوتی را در پیش گرفت و بر حذف کلمه بیدار نبود بلکه بر دقیق تر کردن پاسخ به کلمه بیداری تمرکز داشت. مقاله پیشنهاد می کند که الف مدل آکوستیک چند کاناله ممکن است در تشخیص یک کلمه بیدار از یک مدل تک کانالی دقیق تر باشد، و مشخص شد که این مورد است، با مدل چند کاناله در هر دو شرایط ساکت و نویز عملکرد بهتری دارد.


اگر «Hey Siri» همچنان باقی بماند، ممکن است بسیار دقیق‌تر از آن چیزی باشد که در حال حاضر است.

دیگه خودتو تکرار نکن

سیری می تواند بفهمد که چه زمانی یک سوال جدید است

سیری در آیفون

یک Super-Siri می تواند این کار را بسیار بهتر از آنچه در حال حاضر می تواند انجام دهد، اما چالش این است که بدانیم چه زمانی یک سوال به مکالمه فعلی اشاره دارد و چه زمانی یک خط جدید تحقیق است.

سیری در برقراری مکالمه وحشتناک است. اگر سعی کنید به چیزی از یک پاسخ قبلی اشاره کنید، این احتمال وجود دارد که سیری متوجه نشود در مورد چه چیزی صحبت می کنید. چت ربات های LLM در این امر به مراتب بهتر هستند و می توانند با ارجاع به پرسش ها و پاسخ های قبلی گفتگو را انجام دهند.


یک Super-Siri می تواند این کار را بسیار بهتر از آنچه در حال حاضر می تواند انجام دهد، اما چالش این است که بدانیم چه زمانی یک سوال به مکالمه فعلی اشاره دارد و چه زمانی یک خط جدید تحقیق است. یک مقاله تحقیقاتی دیگر نشان می دهد که اپل روی آن کار کرده است چیزی به نام STEER، که یک مدل تشخیص فرمان است که پیش‌بینی می‌کند آیا پیگیری تلاشی برای اصلاح (یا هدایت) یک فرمان قبلی است یا یک فرمان کاملاً جدید. این باید مکالمات چند مرحله ای با سیری را بسیار مؤثرتر کند.

به سیری بگویید چگونه تصاویر خود را ویرایش کند

آیفونی که اپلیکیشن لایت روم را نشان می دهد

در زمینه ویرایش تصویر، هوش مصنوعی چیزهای زیادی برای ارائه دارد. گوگل پیکسل 8 پرو تا حد زیادی بر روی قابلیت‌های ویرایش هوش مصنوعی تمرکز کرده است، با توانایی اصلاح عکس‌های گروهی با انتخاب بهترین عکس از چندین عکس برای چهره هر فرد، یا حذف اشیا از تصاویر.


اپل روی چیزی که نامش را می نامد کار کرده است ویرایش تصویر مبتنی بر دستورالعمل. این به شما امکان می دهد فقط با درخواست از سیری یک عکس را ویرایش کنید. برای مثال، می‌توانید بگویید «Siri، شخص را در پس‌زمینه حذف کنید» یا «Siri، کنتراست بیشتری اضافه کنید» و ویرایش‌های مناسب اعمال می‌شوند. این کار ویرایش تصاویر شما را به سادگی گفتن آنچه می خواهید می کند.

مربوط

آخرین به روز رسانی پیکسل 8 پرو به کاربران اجازه می دهد تا دمای بدن را ثبت کنند. در اینجا چگونگی آن است

اپلیکیشن دماسنج Pixel 8 Pro می تواند دمای بدن و اشیاء تصادفی را ضبط کند. ما به شما نشان خواهیم داد که چگونه از آن استفاده کنید، و چرا ممکن است خیلی دقیق نباشد

انیمیشن ها را با سیری ویرایش کنید

از دستورات و ویرایش با هم استفاده کنید

Memoji

سیب

اپل فقط بر روی ویرایش مبتنی بر دستورالعمل برای تصاویر تمرکز نمی کند. مقاله ای که یک ابزار انیمیشن مبتنی بر LLM به نام Keyframer توضیح می دهد که چگونه می توان از ترکیبی از دستورات و ویرایش های دستی برای ویرایش یک انیمیشن بر اساس تصاویر ثابت استفاده کرد.

برای مثال، می‌توانید انیمیشن دیسکوی دهه 70 خود را با درخواست «دیسکوتر کردن آن» تکرار کنید و سپس سی و هشتمین توپ دیسکو را به‌صورت دستی بردارید، زیرا فقط یکی از آن‌ها زیاد است. پتانسیل ایجاد انیمیشن های سفارشی با کمک سیری وجود دارد که بسیار فراتر از Animoji اپل است.




منبع

دیدگاهتان را بنویسید

دکمه بازگشت به بالا