5 ویژگی جدید GPT-4o که ChatGPT را بهتر از همیشه می کند

خوراکی های کلیدی
GPT-4o نوید تعامل صوتی بیدرنگ با چندین تن و صدا را برای تجربهای شبیه به انسان میدهد.
قابلیتهای Vision به GPT-4o اجازه میدهد به سؤالات مربوط به عکسها و اسکرین شاتها پاسخ دهد و در نهایت باید از ویدیو پشتیبانی کند.
در 13 مه شاهد پیوستن GPT-4o به تمام سطوح ChatGPT هستیم، اما با تفاوت در محدودیتهای سریع و در دسترس بودن عملکرد صوتی.
در 13 می، OpenAI به طور رسمی GPT-4o، مدل بعدی هوش مصنوعی خود را راه اندازی کرد. از آنجایی که GPT-4 در حال حاضر اساس بسیاری از تبلیغات در مورد هوش مصنوعی مولد است، 4o می تواند برای ارسال امواج شوک در سراسر صنعت آماده باشد. در اینجا همه چیزهایی است که OpenAI در مورد فناوری جدید هوش مصنوعی فاش کرد و چرا این یک گام بزرگ به جلو است.

نحوه استفاده از ChatGPT برای ایجاد هنر و تصاویر تولید شده با هوش مصنوعی
چه به یک عکس استوک یا یک پرتره از Big Foot نیاز داشته باشید، ChatGPT اکنون می تواند از DALL-E AI برای تولید تصاویر استفاده کند. در اینجا نحوه، به علاوه نکات و ترفندها آمده است.
1 مکالمات صوتی در زمان واقعی
بدون نیاز به صفحه کلید
OpenAI
تمرکز زیادی روی تبادل صدای بلادرنگ با GPT-4o وجود دارد. مدل می تواند لحن صدای شما را دریافت کند و سعی می کند با لحن مناسب خود پاسخ دهد. در برخی شرایط حتی میتوانید از آن بخواهید که کم و بیش درام به پاسخ خود اضافه کند، یا از صدای متفاوتی استفاده کند – مانند صدای رباتیک برای داستانی که توسط یک ربات گفته میشود، یا آواز خواندن برای پایان یک افسانه.
شاید مهمتر از آن، شما میتوانید در هر زمان هوش مصنوعی را قطع کنید، بگویید اگر درخواستی اشتباه دریافت میکند یا میخواهید لحن یا صدای آن را در اواسط پخش تغییر دهید. 4o تمام تلاش خود را می کند تا خود را اصلاح کند و از بقیه مکالمه به عنوان زمینه استفاده کند. در نمایشی که توسط OpenAI انجام شد، همه اینها بسیار طبیعی به نظر میرسید، به طوری که هوش مصنوعی حتی وقتی اشاره کرد که برخی از دادههای منبع حیاتی را از دست داده است، عذرخواهی کرد.
متأسفانه باید منتظر بمانید تا ویژگیهای صوتی جدید را امتحان کنید. آنها در ابتدا فقط برای مشترکین ChatGPT Plus و فقط در حالت آلفا اولیه در زمانی قبل از پایان ماه ژوئن مستقر می شوند.

6 روش برای دریافت رایگان Spotify Premium
از تبلیغاتی که باعث ایجاد اختلال در سرویس Spotify شما می شود خسته شده اید؟ در اینجا نحوه دریافت مزایای Premium خود به صورت کاملا رایگان آورده شده است.
2 قابلیت های بینایی بهتر و پشتیبانی چند زبانه
کلمات همیشه کافی نیستند
OpenAI
GPT-4o همچنین می تواند به سوالات مربوط به عکس ها و اسکرین شات های دسکتاپ پاسخ دهد. اینها ممکن است شبیه به آنهایی باشند که از عینک هوشمند متا/ری بن یا پین هوش مصنوعی انسانی میپرسید – چیزی شبیه “اینها چه مارکی شلوار هستند؟” — اما به طور بالقوه پیچیده تر هستند، مانند توضیح یک بلوک از کد برنامه، یا ترجمه منوی رستوران. OpenAI می گوید که در آینده، 4o ممکن است قادر به انجام کارهای پیچیده تری مانند تماشای زنده ورزش و توضیح قوانین مربوطه باشد. در حال حاضر به نظر می رسد تمرکز بر روی تصاویر ثابت به جای ویدیو باشد.
عملکردهای چند زبانه بهبود یافته مربوط به بینایی است. ادعا شده است که 4o عملکرد بهتری در 50 زبان مختلف دارد، با API دو برابر سریعتر از GPT-4 Turbo.

چشم انداز ساده آمازون برای فریم های اکو در عصر اپل ویژن پرو
من با ژان وانگ، مدیر عینک هوشمند آمازون ملاقات کردم تا یاد بگیرم چگونه جدیدترین فریمهای اکو کارها را در دنیای هدستهای واقعیت مجازی/واقعی ساده نگه میدارند.
3 شما می توانید تصاویر را با متن قابل خواندن ایجاد کنید
گسترش امکانات هنر هوش مصنوعی
OpenAI
تولید تصاویر با متن خوانا مدت هاست که نقطه ضعف هوش مصنوعی بوده است، اما GPT-4o در این زمینه توانمندتر به نظر می رسد. متن نه تنها می تواند خوانا باشد، بلکه می تواند به روش های خلاقانه، مانند صفحات ماشین تحریر، پوستر فیلم، یا استفاده از تایپوگرافی شاعرانه، مرتب شود. همچنین به نظر می رسد که در تقلید دست خط مهارت دارد، تا جایی که برخی از اعلان ها ممکن است تصاویری غیرقابل تشخیص از خروجی واقعی انسان ایجاد کنند.
متن نه تنها می تواند خوانا باشد، بلکه می تواند به روش های خلاقانه، مانند صفحات ماشین تحریر، پوستر فیلم، یا استفاده از تایپوگرافی شاعرانه، مرتب شود.
حتی می توانید از 4o بخواهید که doodles را در حاشیه قرار دهد.

با GPT-4o، ChatGPT می تواند با متنی که واقعاً قابل خواندن است، هنری تولید کند
مدل جدید OpenAI GPT-4o برای ChatGPT بالاخره یکی از بزرگترین نقص های هوش مصنوعی را برطرف کرد: متن روی تصاویر تولید شده با هوش مصنوعی.
4 برنامه های بومی مک و ویندوز
دسترسی سریعتر و قدرتمندتر
OpenAI
جدا از نسخه وب ChatGPT، اکنون یک برنامه اختصاصی مک با پشتیبانی از میانبر صفحه کلید و اسکرین شات وجود دارد که در حال حاضر به مشترکین Plus محدود شده است. یک برنامه ویندوز باید تا پایان سال 2024 در دسترس باشد. ممکن است OpenAI عجله ای برای قرار دادن یک کلاینت شخص اول در ویندوز 11 نداشته باشد — بالاخره GPT پایه و اساس Copilot است و مایکروسافت احتمالاً این کار را انجام می دهد. نمیخواهم فناوری ویندوز یکپارچه آن ارتقا یابد.

OpenAI بالاخره یک برنامه دسکتاپ ChatGPT دارد. کاربران مک اولین دیب ها را دریافت می کنند
طبق گفته OpenAI، یک نسخه ویندوز در اواخر امسال راه اندازی خواهد شد.
5 همه می توانند به صورت رایگان به GPT-4o دسترسی داشته باشند
پایین دروازه بان
OpenAI/ Pocket-lint
به نوعی، این ممکن است در واقع بزرگترین پیشرفت باشد. OpenAI به طور سنتی پیشرفتهترین نسخههای GPT را در اختیار دارد، اما 4o از ابتدا برای هر کاربر ChatGPT رایگان است. محدودیتهای اصلی مربوط به مکالمه صوتی بلادرنگ است – که پس از شروع به کار به مشترکین Plus محدود میشود – و تعداد درخواستهایی که میتوانید استفاده کنید. مشترکین ChatGPT Plus و Team پنج برابر بیشتر درخواست دریافت می کنند، که بسیار مهم است، زیرا پس از رسیدن به حد درخواست شما، مکالمات به GPT-3.5 برمی گردند. اگر انتظار دارید که GPT-4o مانند رایانه روی Enterprise رفتار کند، ممکن است به Plus نیاز داشته باشید.

من ChatGPT Plus را در مقابل Copilot Pro تست کردم تا ببینم کدام هوش مصنوعی بهتر است
من یک نبرد ChatGPT Plus و Copilot Pro ایجاد کردم تا ببینم کدام سرویس اشتراک ربات چت هوش مصنوعی واقعاً ارزش 20 دلار شما را در هر ماه دارد.
سوالات متداول
س: GPT-4o چیست؟
GPT-4o تکاملی از مدل GPT-4 AI است که در حال حاضر در سرویس هایی مانند ChatGPT خود OpenAI استفاده می شود. O مخفف “omni” است — نه به این دلیل که دانای کل است، بلکه به این دلیل که صدا، متن و بینش را یکی می کند. این در تضاد با GPT-4 است، که بیشتر در مورد تعاملات متن تایپ شده است، استثناهایی مانند تولید تصویر و رونویسی متن به گفتار.
س: چگونه و چه زمانی GPT-4o قرار است در دسترس باشد؟
این مدل از 13 مه در تمام سطوح ChatGPT، از جمله کاربران رایگان، عرضه می شود. در اینجا مواردی وجود دارد – مشترکان ChatGPT Plus و Team پنج برابر بیشتر از درخواستها دریافت میکنند و برای همه، پس از رسیدن به محدودیتهای درخواستی، مکالمات به GPT-3.5 برمیگردد. همچنین، عملکردهای صوتی جدید در ابتدا فقط برای مشترکین Plus و فقط در حالت آلفای اولیه در زمانی قبل از پایان ژوئن اجرا می شوند. ما شاهد معرفی ویژگی های سازمانی 4o در همان زمان خواهیم بود.
مشخص نیست چه زمانی شاهد مهاجرت GPT-4o به خارج از ChatGPT، برای مثال به Microsoft Copilot خواهیم بود. اما OpenAI در حال باز کردن رباتهای چت در فروشگاه GPT به روی کاربران رایگان است، و عجیب است که اشخاص ثالث به فناوریهایی که به راحتی از طریق ChatGPT قابل دسترسی است نپردازند. با این حال، این شرکت محتاط است – برای فناوری صوتی و تصویری خود، شروع به کار با “گروه کوچکی از شرکای قابل اعتماد” کرده است و به احتمال سوء استفاده اشاره می کند.