سیری قدیمی است، اما ممکن است نسخه بهتری در راه باشد

خوراکی های کلیدی
- اپل به طور فعال در حال کار بر روی توسعه یک LLM است که برای افزایش حریم خصوصی می تواند به صورت محلی بر روی آیفون شما اجرا شود.
- سیری ممکن است در درک دستورات کاربر از طریق زمینه و توانایی ارجاع به متن روی صفحه بسیار دقیق تر شود.
- آینده سیری ممکن است شامل ویژگیهایی مانند تشخیص تصویر پیشرفته، فعالسازی بدون ماشه و بهبود قابلیتهای نگهداری مکالمه باشد.
برخی از محصولات اپل نمیتوانند با هیاهوها مطابقت کنند (نیوتن اپل، هر کسی؟) و مسلماً بزرگترین ناامیدی سیری بوده است. وقتی سیری وارد شد، خبر از طلوع جدیدی از نحوه تعامل ما با دستگاه های هوشمندمان داد.
با این حال، از سال 2011، زمانی که سیری برای اولین بار در iPhone 4S ظاهر شد، دستیار مجازی تغییر بسیار کمی داشته است و به قابلیتی تبدیل شده است که اغلب توسط بسیاری از دارندگان آیفون استفاده نمی شود. ظهور LLM هایی مانند ChatGPT نیز نشان داده است که سیری به طرز وحشتناکی منسوخ شده است.

نحوه استفاده از میانبرهای سیری با تسلا برای افزایش کنترل صوتی
ما یک راهنمای ساده در مورد استفاده از میانبرها در iOS برای کنترل تسلا با سیری گردآوری کرده ایم.
هرچند، همه چیز از دست نرفته. اپل در نهایت نشانه هایی از ورود به هوش مصنوعی نشان می دهد و به احتمال زیاد در آینده ای نه چندان دور شاهد نسخه بسیار بهبود یافته سیری (Super-Siri؟) خواهیم بود. چندین مقاله تحقیقاتی اپل در دسترس عموم به برخی از زمینه هایی که اپل روی آنها تمرکز کرده است اشاره می کند. در اینجا چیزی است که ممکن است بخشی از نسخه بسیار بهتر سیری شود.
سیری مجهز به هوش مصنوعی که روی دستگاه شما اجرا می شود
از Super-Siri به صورت خصوصی استفاده کنید
LLM هایی مانند ChatGPT به عنوان برنامه در تلفن شما در دسترس هستند، اما همه جادوها در جای دیگری اتفاق می افتد. درخواستهای شما به سرورهای ChatGPT ارسال میشوند، که آنها را با استفاده از مقادیر زیادی توان محاسباتی و مدلهایی که حاوی میلیاردها پارامتر هستند پردازش میکنند که فضای ذخیرهسازی زیادی را اشغال میکنند. سپس پاسخ به تلفن شما ارسال می شود.
اپل به طور فعال در حال کار بر روی ایجاد یک LLM است که بتواند به صورت محلی بر روی آیفون شما اجرا شود.
اپل به طور فعال در حال کار بر روی ایجاد یک LLM است که بتواند به صورت محلی بر روی آیفون شما اجرا شود. این یک چالش مهم است، زیرا قدرت محاسباتی و ذخیره سازی در تلفن هوشمند محدود است. با این حال، اپل دارد یک مقاله تحقیقاتی منتشر کرد در مورد تلاش های خود برای ایجاد یک LLM کارآمد با حافظه محدود و نتایج چشمگیری ایجاد کرده است. این بدان معنی است که ما میتوانیم نسخه بسیار بهبود یافته سیری را ببینیم که میتواند کاملاً آفلاین اجرا شود و حریم خصوصی بیشتری را ارائه دهد، که در واقع اپل بسیار مناسب است.
سیری که شما را بهتر درک می کند
وقتی آب و هوا را میپرسید، دیگر خبری از تماس با هیدر نیست
جیب پرز
همه دستیارهای صوتی ممکن است از تفسیر نادرست دستورات شما رنج ببرند. همه ما موقعیتهایی داشتهایم که از یک دستیار صوتی یک چیز خواستهایم، فقط برای اینکه ما را بد بشنود و چیزی کاملاً متفاوت به ما بدهد. شما به سیری می گویید «ساعت سه مرا بیدار کن» و پاسخ «در حال پخش «بیدارم کن توسط آویسی» را دریافت می کنی.

اپل اعتراف میکند که آخرین تبلیغ آیپد پرو خود را از دست داده است
اپل واقعاً خشونت را با تبلیغ پرس هیدرولیک خود انتخاب کرد، اما یک روز بعد آن را به عقب برگرداند.
خبر خوب این است که یک مقاله تحقیقاتی دیگر اپل بر هدف های رتبه بندی برای دستورات دستیار صوتی تمرکز کرده است. این مقاله روشی را برای انتخاب از بین اهداف بالقوه متعدد با در نظر گرفتن اطلاعات زمینه ای برای کاهش ابهام مورد بحث قرار می دهد. مقاله دیگری استفاده از LLM ها را برای انتخاب چندین هدف احتمالی، نه فقط یک مورد، و استفاده از این مقاصد چندگانه برای ارائه پاسخی که احتمالا مفیدتر است، مورد بحث قرار می دهد. نتیجه این است که سیری ممکن است در درک منظور شما بسیار دقیق تر شود.
سیری که می فهمد به چه چیزی نگاه می کنید
از سیری بخواهید از محتوا در صفحه نمایش شما استفاده کند
یکی از مسائلی که سیری همیشه داشته این است که او نمی تواند آنچه شما می بینید را ببیند. و در حالی که هنوز ممکن است هنوز نتوان پرسید “سیری، آن پرنده در درخت آنجا چیست؟” ممکن است به زودی امکان ارجاع به محتوای روی صفحه نمایش شما وجود داشته باشد.
یکی دیگر از مقالات تحقیقاتی اپل مدلی را پیشنهاد می کند که می تواند به متن از روی صفحه مراجعه کنید هنگام برخورد با درخواست های کاربر برای مثال، اگر در صفحه تماس یک وبسایت هستید، میتوانید بگویید «Siri، این شماره را به Alan ارسال کنید» و سیری متوجه میشود که به شماره تلفن اشاره میکنید، آن شماره را استخراج میکند و برای Alan ارسال میکند. . این مقاله به امکان ارجاع انواع مختلف متن، مانند آدرس های ایمیل، URL ها و تاریخ ها اشاره می کند. به عبارت دیگر، سیری ممکن است به زودی بتواند در کنار چیزهایی که در حال حاضر قادر به خواندن آنها است، بخواند.
بخش هایی از یک تصویر را جدا کنید
ممکن است بتوانید به سیری بگویید کجا باید نگاه کند
دسترسی به متن خوب است، اما سیری همچنان نمی تواند تصویری را که شما به آن نگاه می کنید، ببیند. یا می تواند؟ اپل Ferret را توسعه داده استیک مدل زبان بزرگ چندوجهی (MLLM) که می تواند ارجاعات فضایی را درک کند. این به میزان زیادی انواع چیزهایی را که میتوانید از سیری بپرسید افزایش میدهد، و به شما اجازه میدهد برای مثال، دور بخشی از یک تصویر دایرهای بکشید و بپرسید “Siri، این ماشین چیست؟” یا “Siri، از کجا می توانم این کفش ها را بخرم؟”

5 ابزار هوش مصنوعی شگفت انگیز که باید غیر از ChatGPT را امتحان کنید
پتانسیل نسل هوش مصنوعی نامحدود است. در اینجا چند ابزار وجود دارد – غیر از ChatGPT، Copilot و Gemini – که در حال حاضر از آن به روشهای جالب و سرگرمکننده استفاده میکنند.
فرت همچنین قابلیت اتصال به زمین را ارائه می دهد. اینجاست که مدل بر اساس یک دستور، مناطقی از یک تصویر را شناسایی میکند، مانند “Siri، همه میمونهای موجود در این تصویر کجا هستند؟” قدرت فرت به این معنی است که سیری میتواند اشیایی را که با انگشت خود به اطراف میکشید شناسایی کند یا حتی «Where’s Waldo» را برای شما حل کند. این پیامدهای بالقوه بزرگی دارد. سیری سرانجام می تواند به وعده اولیه عمل کند و نحوه تعامل ما با تلفن هایمان را تغییر دهد.
سیری بدون کلمه بیدار؟
با هی سیری خداحافظی کنید
اگر صاحب یک دستگاه آمازون اکو هستید و با شخصی که نامش الکسا است زندگی می کنید، زندگی باید سخت باشد. امکان تغییر کلمه wake وجود دارد، اما همه دستیارهای صوتی اصلی برای دریافت دستیار صوتی به یک کلمه بیدار (مانند Hey Siri یا فقط Siri) یا یک حرکت (مانند بالا بردن مچ دست با اپل واچ) نیاز دارند. برای شروع به گوش دادن
3:16

چگونه از Amazon Echo خود به عنوان یک بلندگوی بلوتوث استفاده کنید
بلندگوهای آمازون Echo قابلیت های زیادی برای خانه هوشمند ارائه می دهند، اما می توانید برای استفاده به عنوان یک بلندگوی بلوتوث به تلفن هوشمند خود نیز متصل شوید.
یک مقاله تحقیقاتی اپل نشان می دهد که دستیار صوتی بدون ماشه ممکن است در راه باشد این برنامه با استفاده از یک سیستم چندوجهی شناسایی می کند که چه زمانی شخصی با دستیار مجازی صحبت می کند، از جمله تجزیه و تحلیل کلمات گفته شده با استفاده از LLM و همچنین شکل موج صوتی (مثلاً صداها ممکن است از نظر صدای پس زمینه بلندتر باشند). این مطالعه نشان داد که اندازه گیری دقیق زمانی که یک فرمان صوتی ادا می شود امکان پذیر است. این می تواند به این معنی باشد که دیگر نیازی به گفتن “Siri” ندارید.
یا شاید یک کلمه بیدار بعد از همه؟
سلام سیری، اما بهتر است
امید آرمین در Unsplash
یا شاید شما ممکن است. یکی دیگر از مقالات تحقیقاتی اپل رویکرد متفاوتی را در پیش گرفت و بر حذف کلمه بیدار نبود بلکه بر دقیق تر کردن پاسخ به کلمه بیداری تمرکز داشت. مقاله پیشنهاد می کند که الف مدل آکوستیک چند کاناله ممکن است در تشخیص یک کلمه بیدار از یک مدل تک کانالی دقیق تر باشد، و مشخص شد که این مورد است، با مدل چند کاناله در هر دو شرایط ساکت و نویز عملکرد بهتری دارد.
اگر «Hey Siri» همچنان باقی بماند، ممکن است بسیار دقیقتر از آن چیزی باشد که در حال حاضر است.
دیگه خودتو تکرار نکن
سیری می تواند بفهمد که چه زمانی یک سوال جدید است
یک Super-Siri می تواند این کار را بسیار بهتر از آنچه در حال حاضر می تواند انجام دهد، اما چالش این است که بدانیم چه زمانی یک سوال به مکالمه فعلی اشاره دارد و چه زمانی یک خط جدید تحقیق است.
سیری در برقراری مکالمه وحشتناک است. اگر سعی کنید به چیزی از یک پاسخ قبلی اشاره کنید، این احتمال وجود دارد که سیری متوجه نشود در مورد چه چیزی صحبت می کنید. چت ربات های LLM در این امر به مراتب بهتر هستند و می توانند با ارجاع به پرسش ها و پاسخ های قبلی گفتگو را انجام دهند.
یک Super-Siri می تواند این کار را بسیار بهتر از آنچه در حال حاضر می تواند انجام دهد، اما چالش این است که بدانیم چه زمانی یک سوال به مکالمه فعلی اشاره دارد و چه زمانی یک خط جدید تحقیق است. یک مقاله تحقیقاتی دیگر نشان می دهد که اپل روی آن کار کرده است چیزی به نام STEER، که یک مدل تشخیص فرمان است که پیشبینی میکند آیا پیگیری تلاشی برای اصلاح (یا هدایت) یک فرمان قبلی است یا یک فرمان کاملاً جدید. این باید مکالمات چند مرحله ای با سیری را بسیار مؤثرتر کند.
به سیری بگویید چگونه تصاویر خود را ویرایش کند
در زمینه ویرایش تصویر، هوش مصنوعی چیزهای زیادی برای ارائه دارد. گوگل پیکسل 8 پرو تا حد زیادی بر روی قابلیتهای ویرایش هوش مصنوعی تمرکز کرده است، با توانایی اصلاح عکسهای گروهی با انتخاب بهترین عکس از چندین عکس برای چهره هر فرد، یا حذف اشیا از تصاویر.
اپل روی چیزی که نامش را می نامد کار کرده است ویرایش تصویر مبتنی بر دستورالعمل. این به شما امکان می دهد فقط با درخواست از سیری یک عکس را ویرایش کنید. برای مثال، میتوانید بگویید «Siri، شخص را در پسزمینه حذف کنید» یا «Siri، کنتراست بیشتری اضافه کنید» و ویرایشهای مناسب اعمال میشوند. این کار ویرایش تصاویر شما را به سادگی گفتن آنچه می خواهید می کند.

آخرین به روز رسانی پیکسل 8 پرو به کاربران اجازه می دهد تا دمای بدن را ثبت کنند. در اینجا چگونگی آن است
اپلیکیشن دماسنج Pixel 8 Pro می تواند دمای بدن و اشیاء تصادفی را ضبط کند. ما به شما نشان خواهیم داد که چگونه از آن استفاده کنید، و چرا ممکن است خیلی دقیق نباشد
انیمیشن ها را با سیری ویرایش کنید
از دستورات و ویرایش با هم استفاده کنید
سیب
اپل فقط بر روی ویرایش مبتنی بر دستورالعمل برای تصاویر تمرکز نمی کند. مقاله ای که یک ابزار انیمیشن مبتنی بر LLM به نام Keyframer توضیح می دهد که چگونه می توان از ترکیبی از دستورات و ویرایش های دستی برای ویرایش یک انیمیشن بر اساس تصاویر ثابت استفاده کرد.
برای مثال، میتوانید انیمیشن دیسکوی دهه 70 خود را با درخواست «دیسکوتر کردن آن» تکرار کنید و سپس سی و هشتمین توپ دیسکو را بهصورت دستی بردارید، زیرا فقط یکی از آنها زیاد است. پتانسیل ایجاد انیمیشن های سفارشی با کمک سیری وجود دارد که بسیار فراتر از Animoji اپل است.