دانش و فناوریموبایل و تبلت

5 ویژگی جدید GPT-4o که ChatGPT را بهتر از همیشه می کند


خوراکی های کلیدی

  • GPT-4o نوید تعامل صوتی بی‌درنگ با چندین تن و صدا را برای تجربه‌ای شبیه به انسان می‌دهد.

  • قابلیت‌های Vision به GPT-4o اجازه می‌دهد به سؤالات مربوط به عکس‌ها و اسکرین شات‌ها پاسخ دهد و در نهایت باید از ویدیو پشتیبانی کند.

  • در 13 مه شاهد پیوستن GPT-4o به تمام سطوح ChatGPT هستیم، اما با تفاوت در محدودیت‌های سریع و در دسترس بودن عملکرد صوتی.

در 13 می، OpenAI به طور رسمی GPT-4o، مدل بعدی هوش مصنوعی خود را راه اندازی کرد. از آنجایی که GPT-4 در حال حاضر اساس بسیاری از تبلیغات در مورد هوش مصنوعی مولد است، 4o می تواند برای ارسال امواج شوک در سراسر صنعت آماده باشد. در اینجا همه چیزهایی است که OpenAI در مورد فناوری جدید هوش مصنوعی فاش کرد و چرا این یک گام بزرگ به جلو است.

مربوط

نحوه استفاده از ChatGPT برای ایجاد هنر و تصاویر تولید شده با هوش مصنوعی

چه به یک عکس استوک یا یک پرتره از Big Foot نیاز داشته باشید، ChatGPT اکنون می تواند از DALL-E AI برای تولید تصاویر استفاده کند. در اینجا نحوه، به علاوه نکات و ترفندها آمده است.

1 مکالمات صوتی در زمان واقعی

بدون نیاز به صفحه کلید

دو نفر در حال صحبت با GPT-4o با تلفن.

OpenAI

تمرکز زیادی روی تبادل صدای بلادرنگ با GPT-4o وجود دارد. مدل می تواند لحن صدای شما را دریافت کند و سعی می کند با لحن مناسب خود پاسخ دهد. در برخی شرایط حتی می‌توانید از آن بخواهید که کم و بیش درام به پاسخ خود اضافه کند، یا از صدای متفاوتی استفاده کند – مانند صدای رباتیک برای داستانی که توسط یک ربات گفته می‌شود، یا آواز خواندن برای پایان یک افسانه.

شاید مهم‌تر از آن، شما می‌توانید در هر زمان هوش مصنوعی را قطع کنید، بگویید اگر درخواستی اشتباه دریافت می‌کند یا می‌خواهید لحن یا صدای آن را در اواسط پخش تغییر دهید. 4o تمام تلاش خود را می کند تا خود را اصلاح کند و از بقیه مکالمه به عنوان زمینه استفاده کند. در نمایشی که توسط OpenAI انجام شد، همه اینها بسیار طبیعی به نظر می‌رسید، به طوری که هوش مصنوعی حتی وقتی اشاره کرد که برخی از داده‌های منبع حیاتی را از دست داده است، عذرخواهی کرد.

متأسفانه باید منتظر بمانید تا ویژگی‌های صوتی جدید را امتحان کنید. آنها در ابتدا فقط برای مشترکین ChatGPT Plus و فقط در حالت آلفا اولیه در زمانی قبل از پایان ماه ژوئن مستقر می شوند.

مربوط

6 روش برای دریافت رایگان Spotify Premium

از تبلیغاتی که باعث ایجاد اختلال در سرویس Spotify شما می شود خسته شده اید؟ در اینجا نحوه دریافت مزایای Premium خود به صورت کاملا رایگان آورده شده است.

2 قابلیت های بینایی بهتر و پشتیبانی چند زبانه

کلمات همیشه کافی نیستند

تجزیه و تحلیل کد با برنامه اصلی ChatGPT برای مک.

OpenAI

GPT-4o همچنین می تواند به سوالات مربوط به عکس ها و اسکرین شات های دسکتاپ پاسخ دهد. اینها ممکن است شبیه به آنهایی باشند که از عینک هوشمند متا/ری بن یا پین هوش مصنوعی انسانی می‌پرسید – چیزی شبیه “اینها چه مارکی شلوار هستند؟” — اما به طور بالقوه پیچیده تر هستند، مانند توضیح یک بلوک از کد برنامه، یا ترجمه منوی رستوران. OpenAI می گوید که در آینده، 4o ممکن است قادر به انجام کارهای پیچیده تری مانند تماشای زنده ورزش و توضیح قوانین مربوطه باشد. در حال حاضر به نظر می رسد تمرکز بر روی تصاویر ثابت به جای ویدیو باشد.

عملکردهای چند زبانه بهبود یافته مربوط به بینایی است. ادعا شده است که 4o عملکرد بهتری در 50 زبان مختلف دارد، با API دو برابر سریعتر از GPT-4 Turbo.

مربوط

چشم انداز ساده آمازون برای فریم های اکو در عصر اپل ویژن پرو

من با ژان وانگ، مدیر عینک هوشمند آمازون ملاقات کردم تا یاد بگیرم چگونه جدیدترین فریم‌های اکو کارها را در دنیای هدست‌های واقعیت مجازی/واقعی ساده نگه می‌دارند.

3 شما می توانید تصاویر را با متن قابل خواندن ایجاد کنید

گسترش امکانات هنر هوش مصنوعی

تولید تصویر با استفاده از GPT-4o.

OpenAI

تولید تصاویر با متن خوانا مدت هاست که نقطه ضعف هوش مصنوعی بوده است، اما GPT-4o در این زمینه توانمندتر به نظر می رسد. متن نه تنها می تواند خوانا باشد، بلکه می تواند به روش های خلاقانه، مانند صفحات ماشین تحریر، پوستر فیلم، یا استفاده از تایپوگرافی شاعرانه، مرتب شود. همچنین به نظر می رسد که در تقلید دست خط مهارت دارد، تا جایی که برخی از اعلان ها ممکن است تصاویری غیرقابل تشخیص از خروجی واقعی انسان ایجاد کنند.

متن نه تنها می تواند خوانا باشد، بلکه می تواند به روش های خلاقانه، مانند صفحات ماشین تحریر، پوستر فیلم، یا استفاده از تایپوگرافی شاعرانه، مرتب شود.

حتی می توانید از 4o بخواهید که doodles را در حاشیه قرار دهد.

مربوط

با GPT-4o، ChatGPT می تواند با متنی که واقعاً قابل خواندن است، هنری تولید کند

مدل جدید OpenAI GPT-4o برای ChatGPT بالاخره یکی از بزرگترین نقص های هوش مصنوعی را برطرف کرد: متن روی تصاویر تولید شده با هوش مصنوعی.

4 برنامه های بومی مک و ویندوز

دسترسی سریعتر و قدرتمندتر

تصویری از برنامه دسکتاپ ChatGPT که مکالمه ای با ChatGPT در مورد امپراتوری روم نشان می دهد.

OpenAI

جدا از نسخه وب ChatGPT، اکنون یک برنامه اختصاصی مک با پشتیبانی از میانبر صفحه کلید و اسکرین شات وجود دارد که در حال حاضر به مشترکین Plus محدود شده است. یک برنامه ویندوز باید تا پایان سال 2024 در دسترس باشد. ممکن است OpenAI عجله ای برای قرار دادن یک کلاینت شخص اول در ویندوز 11 نداشته باشد — بالاخره GPT پایه و اساس Copilot است و مایکروسافت احتمالاً این کار را انجام می دهد. نمی‌خواهم فناوری ویندوز یکپارچه آن ارتقا یابد.

مربوط

OpenAI بالاخره یک برنامه دسکتاپ ChatGPT دارد. کاربران مک اولین دیب ها را دریافت می کنند

طبق گفته OpenAI، یک نسخه ویندوز در اواخر امسال راه اندازی خواهد شد.

5 همه می توانند به صورت رایگان به GPT-4o دسترسی داشته باشند

پایین دروازه بان

تصویر ویژگی سرگرم کننده هوش مصنوعی را باز کنید

OpenAI/ Pocket-lint

به نوعی، این ممکن است در واقع بزرگترین پیشرفت باشد. OpenAI به طور سنتی پیشرفته‌ترین نسخه‌های GPT را در اختیار دارد، اما 4o از ابتدا برای هر کاربر ChatGPT رایگان است. محدودیت‌های اصلی مربوط به مکالمه صوتی بلادرنگ است – که پس از شروع به کار به مشترکین Plus محدود می‌شود – و تعداد درخواست‌هایی که می‌توانید استفاده کنید. مشترکین ChatGPT Plus و Team پنج برابر بیشتر درخواست دریافت می کنند، که بسیار مهم است، زیرا پس از رسیدن به حد درخواست شما، مکالمات به GPT-3.5 برمی گردند. اگر انتظار دارید که GPT-4o مانند رایانه روی Enterprise رفتار کند، ممکن است به Plus نیاز داشته باشید.

مربوط

من ChatGPT Plus را در مقابل Copilot Pro تست کردم تا ببینم کدام هوش مصنوعی بهتر است

من یک نبرد ChatGPT Plus و Copilot Pro ایجاد کردم تا ببینم کدام سرویس اشتراک ربات چت هوش مصنوعی واقعاً ارزش 20 دلار شما را در هر ماه دارد.

سوالات متداول

س: GPT-4o چیست؟

GPT-4o تکاملی از مدل GPT-4 AI است که در حال حاضر در سرویس هایی مانند ChatGPT خود OpenAI استفاده می شود. O مخفف “omni” است — نه به این دلیل که دانای کل است، بلکه به این دلیل که صدا، متن و بینش را یکی می کند. این در تضاد با GPT-4 است، که بیشتر در مورد تعاملات متن تایپ شده است، استثناهایی مانند تولید تصویر و رونویسی متن به گفتار.

س: چگونه و چه زمانی GPT-4o قرار است در دسترس باشد؟

این مدل از 13 مه در تمام سطوح ChatGPT، از جمله کاربران رایگان، عرضه می شود. در اینجا مواردی وجود دارد – مشترکان ChatGPT Plus و Team پنج برابر بیشتر از درخواست‌ها دریافت می‌کنند و برای همه، پس از رسیدن به محدودیت‌های درخواستی، مکالمات به GPT-3.5 برمی‌گردد. همچنین، عملکردهای صوتی جدید در ابتدا فقط برای مشترکین Plus و فقط در حالت آلفای اولیه در زمانی قبل از پایان ژوئن اجرا می شوند. ما شاهد معرفی ویژگی های سازمانی 4o در همان زمان خواهیم بود.

مشخص نیست چه زمانی شاهد مهاجرت GPT-4o به خارج از ChatGPT، برای مثال به Microsoft Copilot خواهیم بود. اما OpenAI در حال باز کردن ربات‌های چت در فروشگاه GPT به روی کاربران رایگان است، و عجیب است که اشخاص ثالث به فناوری‌هایی که به راحتی از طریق ChatGPT قابل دسترسی است نپردازند. با این حال، این شرکت محتاط است – برای فناوری صوتی و تصویری خود، شروع به کار با “گروه کوچکی از شرکای قابل اعتماد” کرده است و به احتمال سوء استفاده اشاره می کند.



منبع

دیدگاهتان را بنویسید

دکمه بازگشت به بالا