با هوش مصنوعی آزمایشی گوگل عمل کنید

خوراکی های کلیدی
- ابزارهای آزمایشی MusicFX و ImageFX گوگل مکانیزم های هوش مصنوعی مولد هستند که به کاربران با کلمات کلیدی کمک می کنند.
- MusicFX می تواند آهنگ های 70 ثانیه ای را با دستورات و سبک های مختلف تولید کند.
- ImageFX پیام های متنی را برای تولید تصویر اصلاح می کند و با وجود برخی نتایج عجیب و غریب، پتانسیل را نشان می دهد.
هوش مصنوعی مولد با توانایی خود در تبدیل پیام های متنی به تصویر یا حتی متن بیشتر، مردم را تحت تاثیر قرار داده و آنها را ناامید کرده است. اما اوایل امسال، گوگل آزمایش هوش مصنوعی را آغاز کرد طراحی شده است تا چیزهایی تولید کند، حتی زمانی که الهام برای تایپ کردن در آن جعبه سریع وجود ندارد. به عنوان بخشی از Google Test Kitchen، ImageFX و MusicFX به کاربران کمک میکنند تا برای ایجاد ایدههای خارج از دیوار برای تصاویر و حتی مواردی که باید درخواست کنند. موسیقی .

مرتبط
11 کار آزاردهنده Google Gemini به زودی برای شما انجام خواهد داد
Gemini 1.5 Pro به زودی میتواند با استفاده از ویدیو، در میان سایر بهروزرسانیهای کلیدی Google I/O، به سؤالات مربوط به دنیای اطراف شما پاسخ دهد.
این فناوری به خودی خود چندان با Gemini شناخته شده گوگل بیگانه نیست. در واقع، ImageFX از همان مدل انتشار متن به تصویر استفاده می کند که Gemini و Google Lens هستند. اما چیزی که برنامههای آزمایشی برای انجام آن طراحی شدهاند این است که با فهرست کردن کلیدواژههای جایگزین برای استفاده در اعلان، ایدهها و تفکر خلاق بیشتری را تقویت کند.
ما از MusicFX گوگل خواستیم چند آهنگ برای ما بسازد، سپس از ImageFX خواستیم جلد آلبوم و حتی یک پوستر گروه تولید کند. اما آیا آشپزخانه تست گوگل طعم بدی به جا گذاشته است یا این ابزارها آینده هوش مصنوعی هستند؟

مرتبط
5 کار جالب که هوش مصنوعی Gemini گوگل می تواند روی پیکسل 9 شما انجام دهد
گوشی های جدید گوگل پیکسل 9 دارای برخی ویژگی های منحصر به فرد هوش مصنوعی هستند.
MusicFX و ImageFX چیست؟
یک آزمایش یا چیزی بیشتر؟
MusicFX و ImageFX هوش مصنوعی آزمایشی هستند که در حال حاضر توسط گوگل و گزینههای مشابهی مانند TextFX آزمایش میشوند. ابزارهای FX گوگل هوش مصنوعی مولد برای مواقعی هستند که نمی دانید چگونه درخواست را بنویسید. نرم افزار مبتنی بر وب به طور خاص برای آزمایش و کاوش طراحی شده است، به عنوان مثال، به جای تمرکز بر بهره وری Gemini در داخل جیمیل. هر دوی آنها رایگان هستند که در ایالات متحده امتحان کنید آشپزخانه تست گوگل.
MusicFX پیامهای متنی را به آهنگهای کوتاه تا 70 ثانیه تبدیل میکند. هوش مصنوعی آزمایشی همچنین به کاربران کمک می کند تا درخواست را بنویسند، و پیشنهاد می کند که چه چیزی را حتی قبل از تایپ هر چیزی در کادر بنویسند. هنگامی که یک درخواست اضافه می کنید، نرم افزار کلمات کلیدی را به منوهای کشویی به نام چیپس تغییر می دهد. برای مثال، در اعلان «موسیقی کانتری با الهام از کلاغها، نواختهشده روی گیتار»، کانتری، کلاغها و گیتار همگی پیشنهادهای متعددی برای امتحان ارائه کردند. تنها با چند کلیک، میتوانم آن دستور اصلی را به «موسیقی بلوز الهامگرفته از جغدها، نواخته شده با سازدهنی» تبدیل کنم.

مرتبط
10 ویژگی Gemini Live که بی صبرانه منتظرم تا آنها را امتحان کنم
هوش مصنوعی گوگل بیشتر شبیه انسان به نظر می رسد، اما Gemini Live دقیقاً چه چیزی را می تواند انجام دهد؟
به طور مشابه، ImageFX یک تولید کننده تصویر هوش مصنوعی است که به اصلاح درخواست های مبتنی بر متن کمک می کند. این یک مدل زبان بزرگ است که توسط Imagen 2 پشتیبانی میشود، همان فناوری که Gemini از آن استفاده میکند. در حالی که Gemini از قبل می تواند تصاویر تولید کند، ImageFX تغییراتی را در دستور پیشنهاد می دهد و کلمات کلیدی و عبارات را به منوهای کشویی تبدیل می کند. این به اصطلاح چیپ ها به گونه ای طراحی شده اند که به کاربر ایده های بیشتری داده و نتیجه را بهتر اصلاح کنند.
ImageFX حتی به یک اعلان اولیه نیاز ندارد.
در واقع، ImageFX حتی نیازی به یک اعلان اولیه ندارد – به سادگی ضربه زدن “من احساس خوش شانسی می کنم” را به طور تصادفی برای شما ایجاد می کند. «رویایی، منظره پاستلی، خطوط ملایم، رنگهای ملایم، ابرهای کرکی، کوههای رنگین کمانی، مینیمال» میتواند به «پرتره نئونی عرفانی، فرمهای زاویهدار، رنگهای پررنگ، ابرهای دراماتیک، کوههای ناهموار، آراسته» تبدیل شود.

مرتبط
Gemini Live اینجاست و امکان مکالمات صوتی با هوش مصنوعی گوگل را فراهم می کند
اگر Gemini Advanced دارید، اکنون در دسترس است.
MusicFX صداهای کوتاهی ایجاد کرد
بی روح، اما نه وحشتناک
هنگامی که برای اولین بار آزمایش MusicFX را شروع کردم، به سرعت متوجه شدم که تولید کننده موسیقی چه کاری می تواند انجام دهد و چه کاری نمی تواند انجام دهد، ترکیبی از توانایی ها که هم گاهی تسکین دهنده و هم ناامیدکننده بود. اول، من نتوانستم MusicFX را برای تولید وکال دریافت کنم، اگرچه زمانی که درخواست کاپلا کردم، چند کار انجام دادم. و برای تسکین هنرمندان در همه جا، نمی توانید از برنامه بخواهید که یک هنرمند خاص را تکرار کند. متأسفیم، اما MusicFX به این زودی هیچ آهنگی از تیلور سویفت منتشر نخواهد کرد.
ساختههای MusicFX در حال حاضر به 70 ثانیه محدود شدهاند، اما میتوانید گزینه حلقه را تغییر دهید تا بهطور یکپارچه خودش را پخش کند. پیشفرض برای یک آهنگ 30 ثانیهای است، اما میتوانید با باز کردن منوی تنظیمات، طول آن را تنظیم کنید.

مرتبط
SearchGPT توضیح داد: چیست و چگونه می توانید اولین نفری باشید که آن را امتحان می کنید
مدتها شایعه شده بود که OpenAI روی رقیبی برای جستجوی گوگل کار میکند و حالا بالاخره به اینجا رسید.
من که آماده شنیدن موسیقی فاجعهباری مثل پرترههای سه انگشتی و ذوب شده از مولدهای تصویر اولیه بودم، وقتی روی play کلیک کردم و متوجه شدم که آهنگ وحشتناک نیست، شگفتزده شدم. این موسیقی بود که میتوانستم آن را تصور کنم که در آسانسور پخش میشود، یا پسزمینه آن در حالی که منتظر ماندهام. بعد از اینکه اولین نتیجه وحشتناک نبود، چند ژانر دیگر تولید کردم و چندین ژانر، سرعت و ساز را امتحان کردم.
موسیقی فاقد روح و احساس آهنگهایی است که معمولاً نمیتوانم با آنها بخوانم.
پس از مدتی، آهنگهایی که نرمافزار تولید میکردند همگی شبیه یکدیگر شدند (اگرچه در آینده، شاید نباید این همه آهنگ کانتری درخواست میکردم). در حالی که کلیپ ها کوتاه هستند، هیچ حسی از ساختار مانند یک کر یا شعر وجود ندارد، اما به نظر می رسد ضربات کوتاه تری وجود دارد که با تغییرات جزئی خود را تکرار می کنند. در حالی که هق هق نمیکردم، زمزمه نمیکردم یا روی ضربان ضربه نمیزدم. موسیقی فاقد روح و احساس آهنگهایی است که معمولاً نمیتوانم با آنها بخوانم.

مرتبط
کاربران رایگان ChatGPT اکنون میتوانند تصاویر DALL-E 3 را تولید کنند، البته فقط دو تصویر در روز
اکنون می توانید تصاویر را از متن در ChatGPT بدون نیاز به اشتراک تولید کنید.
گاهی اوقات، نرم افزار قادر به گوش دادن به دستورالعمل های دقیق نبود. به عنوان مثال، هنگامی که من درخواست کردم که موسیقی فقط با گیتار آکوستیک نواخته شود، هنوز هم آهنگی با سازهای متعدد ایجاد می کند. من نمیتوانم MusicFX را ببینم که هر بیلبوردی را تماشا میکند، اما میتوانم ببینم که موسیقی پسزمینه برای تبلیغات ویدیویی و تبلیغات را تولید میکند. اما، با وجود بحثهای کپی رایت در مورد هوش مصنوعی مولد، مشخص نیست که آیا تصویر حاصل میتواند یا حتی باید به صورت تجاری استفاده شود.
یکی از بهترین ویژگیهای هوش مصنوعی، تصادفی بودن خارج از دیوار است که گهگاه ایدهای دیدنی به نظر میرسد.
با این حال، بهترین بخش MusicFX، تراشههای کشویی است که برای آزاد کردن ایدههای بیشتر طراحی شدهاند. به نظر من، یکی از بهترین ویژگیهای هوش مصنوعی، تصادفی بودن خارج از دیوار است که گهگاه ایدهای تماشایی به نظر میرسد. با استفاده از پیشنهادات مختلف، امتحان کردن چیزی جدید یا گرفتن یک ایده و هدایت آن حتی فراتر از آن، سرگرم کننده است. روشی که آن را با ایده های خارج از دیوار مانند “موسیقی حباب دار و خوش بینانه پارتی پیتزا سایبری در بازی های زیر آب” ارائه می دهد، آزمایش کردن با آن بسیار سرگرم کننده است، اگرچه وقتی آن درخواست پیشنهادی را در گوگل جستجو کردم و متوجه شدم که آن را به بیرون انداخته است، ناامید شدم. همین پیشنهاد قبلاً بارها
با این حال، بهترین راه برای سفارشی کردن نتایج، استفاده از حالت DJ است. با استفاده از این گزینه، هر قسمت از فرمان دارای یک نوار لغزنده است، بنابراین می توانید سرعت شادی را افزایش دهید یا احساس راک کلاسیک را کاهش دهید. به این ترتیب، کنترل بیشتری بر نتایج نهایی خواهید داشت. همانطور که ایده ها به ذهن شما خطور می کند، می توانید آنها را به لیست اضافه کنید یا از پیشنهادات پایین استفاده کنید. با این حال، حالت DJ هنوز قابلیت دانلود و اشتراک گذاری را به دست نیاورده است.
با MusicFX ما تولید کردیم یک آهنگ روستایی، جرنگ جرنگ روانگردانو در حالت DJ، یک راک کلاسیک با سازهای آکوستیک.

مرتبط
آیا هوش اپل واقعاً شانسی در مسابقه هوش مصنوعی دارد؟
اگر اپل بتواند ابزارهای درونبرنامهای خود را توسعه دهد، میتواند در مقابل رقبا متمایز شود.
برخی از نتایج ImageFX وحشتناک بودند، اما برخی دیگر چشمگیر بودند
این نرم افزار تغییرات سریعی را برای گرفتن عکس در جهت های جدید پیشنهاد کرد
Google / Pocket-lint
به طور طبیعی، پس از ارائه چند قطعه مختلف تولید شده توسط هوش مصنوعی، مجبور شدم یک جلد آلبوم برای همراهی با آن بسازم. برای آن، از ImageFX استفاده کردم، ابزاری که توسط Imagen 2 پشتیبانی میشود، همان زیر مجموعه Gemini که گرافیک تولید میکند. مانند MusicFX، از تراشهها برای پیشنهاد تنظیمات به درخواست، از سبک گرفته تا آنچه که تولید میشود، استفاده میکند.
هوش مصنوعی سبکی را که من دنبالش میکردم ثابت کرد.
اولین درخواستی که خواستم منجر به یک نوازنده دلقک مانند سه دست و چشم سفید شد که احتمالاً اکنون کابوس های من را تحت الشعاع قرار خواهد داد. با یادآوری اینکه چقدر برای هوش مصنوعی تکثیر شکل انسان دشوار است، دستورم را تنظیم کردم و از اینکه چقدر سریع چیزی را پیدا کردم که دوست داشتم شگفت زده شدم. هوش مصنوعی سبکی را که من دنبالش بودم، که یادآور پوستر سیرک قدیمی بود، نشان داد.
با این حال، آنچه که بسیار چشمگیر بود این بود که هوش مصنوعی قادر به مدیریت متن بود. هوش مصنوعیهایی که قبلاً با آنها کار کردهام هرگز نتوانستهاند کلمات را به درستی اضافه کنند، ابهام و غلط املایی ایجاد کنند، حتی زمانی که من فقط یک “تولد مبارک” ساده درخواست کردم. با این حال، اگر به ImageFX بگویم چه کلماتی باید اضافه شود، آن کلمات را به درستی املا میکند. کامل نیست — وقتی مشخص نکردم چه کلماتی را به جلد آلبوم اضافه کنم، اشکال حروف مانندی را به قسمتی از طراحی اضافه کرد که آشکارا برای متن در نظر گرفته شده بود. اما، تاثیرگذارتر از متن روی تصویری است که سعی کردم با ChatGPT ایجاد کنم.

مرتبط
تیم کوک زمان اضافه شدن ChatGPT به iOS 18 را فاش می کند
در آخرین تماس درآمدی اپل، مدیرعامل تایید کرد که ادغام ChatGPT به زودی وارد خواهد شد.
در اینجا تعدادی از تصاویر ایجاد شده است:
آیا MusicFX و ImageFX آینده جمینی هستند؟
اگر یک ویژگی وجود داشته باشد که من می خواهم در Gemini ببینم، آن چیپس است
فناوری مولد، بهویژه آن که تلاش میکند هنر را تکرار کند، سؤالاتی را میطلبد که این فناوری دقیقاً چه جایگاهی در آینده ما دارد و چگونه بر خلاقیتهای واقعی انسان تأثیر میگذارد. اگر MusicFX نشانهای باشد، میتوانم آهنگهای تولید شده توسط هوش مصنوعی را بهعنوان موسیقی نگهدارنده، موسیقی آسانسور یا موسیقی پسزمینه فراموششدنی ویدیوی رسانههای اجتماعی ببینم. نمیتوانم خودم را در ماشینم به چیزی که این ابزار تا کنون ایجاد کرده است، ببینم. اما، همانطور که مطرح می شود، MusicFX آزمایشی است و می تواند با پیشرفت خود جهش های بزرگی به جلو داشته باشد.
سوال دیگری که باید با هر پلتفرم یادگیری ماشینی مطرح شود این است که داده های آموزشی از کجا می آیند. گوگل اعلام نکرده است که کجا موسیقی را برای آموزش سیستم پیدا کرده است. با این حال، گزارشی از بیلبورد نشان می دهد این شرکت از موسیقی دارای حق چاپ در مجموعه آموزشی خود استفاده کرد. با وجود شکایتهای حقوقی در مورد استفاده از تصاویر دارای حق چاپ در دادههای آموزشی، قانون میتواند نقش مهمی در خروج MusicFX از آشپزخانه تست Google داشته باشد.

مرتبط
Gemini و Google Workspace می توانند به شما کمک کنند تا بهره وری بیشتری داشته باشید… بیشتر اوقات
Google’s Gemini در خلاصه کردن Google Docs و ایمیلها حرفهای است، اما وقتی صحبت از کاربرگنگار و سایر ابزارهای Workspace میشود، همه چیز کمی عجیب و غریب میشود.