دانش و فناوریموبایل و تبلت

با هوش مصنوعی آزمایشی گوگل عمل کنید


خوراکی های کلیدی

  • ابزارهای آزمایشی MusicFX و ImageFX گوگل مکانیزم های هوش مصنوعی مولد هستند که به کاربران با کلمات کلیدی کمک می کنند.
  • MusicFX می تواند آهنگ های 70 ثانیه ای را با دستورات و سبک های مختلف تولید کند.
  • ImageFX پیام های متنی را برای تولید تصویر اصلاح می کند و با وجود برخی نتایج عجیب و غریب، پتانسیل را نشان می دهد.



هوش مصنوعی مولد با توانایی خود در تبدیل پیام های متنی به تصویر یا حتی متن بیشتر، مردم را تحت تاثیر قرار داده و آنها را ناامید کرده است. اما اوایل امسال، گوگل آزمایش هوش مصنوعی را آغاز کرد طراحی شده است تا چیزهایی تولید کند، حتی زمانی که الهام برای تایپ کردن در آن جعبه سریع وجود ندارد. به عنوان بخشی از Google Test Kitchen، ImageFX و MusicFX به کاربران کمک می‌کنند تا برای ایجاد ایده‌های خارج از دیوار برای تصاویر و حتی مواردی که باید درخواست کنند. موسیقی .

مرتبط

11 کار آزاردهنده Google Gemini به زودی برای شما انجام خواهد داد

Gemini 1.5 Pro به زودی می‌تواند با استفاده از ویدیو، در میان سایر به‌روزرسانی‌های کلیدی Google I/O، به سؤالات مربوط به دنیای اطراف شما پاسخ دهد.

این فناوری به خودی خود چندان با Gemini شناخته شده گوگل بیگانه نیست. در واقع، ImageFX از همان مدل انتشار متن به تصویر استفاده می کند که Gemini و Google Lens هستند. اما چیزی که برنامه‌های آزمایشی برای انجام آن طراحی شده‌اند این است که با فهرست کردن کلیدواژه‌های جایگزین برای استفاده در اعلان، ایده‌ها و تفکر خلاق بیشتری را تقویت کند.

ما از MusicFX گوگل خواستیم چند آهنگ برای ما بسازد، سپس از ImageFX خواستیم جلد آلبوم و حتی یک پوستر گروه تولید کند. اما آیا آشپزخانه تست گوگل طعم بدی به جا گذاشته است یا این ابزارها آینده هوش مصنوعی هستند؟


مرتبط

5 کار جالب که هوش مصنوعی Gemini گوگل می تواند روی پیکسل 9 شما انجام دهد

گوشی های جدید گوگل پیکسل 9 دارای برخی ویژگی های منحصر به فرد هوش مصنوعی هستند.

MusicFX و ImageFX چیست؟

یک آزمایش یا چیزی بیشتر؟

musicfx-hands-on-002

MusicFX و ImageFX هوش مصنوعی آزمایشی هستند که در حال حاضر توسط گوگل و گزینه‌های مشابهی مانند TextFX آزمایش می‌شوند. ابزارهای FX گوگل هوش مصنوعی مولد برای مواقعی هستند که نمی دانید چگونه درخواست را بنویسید. نرم افزار مبتنی بر وب به طور خاص برای آزمایش و کاوش طراحی شده است، به عنوان مثال، به جای تمرکز بر بهره وری Gemini در داخل جیمیل. هر دوی آنها رایگان هستند که در ایالات متحده امتحان کنید آشپزخانه تست گوگل.


MusicFX پیام‌های متنی را به آهنگ‌های کوتاه تا 70 ثانیه تبدیل می‌کند. هوش مصنوعی آزمایشی همچنین به کاربران کمک می کند تا درخواست را بنویسند، و پیشنهاد می کند که چه چیزی را حتی قبل از تایپ هر چیزی در کادر بنویسند. هنگامی که یک درخواست اضافه می کنید، نرم افزار کلمات کلیدی را به منوهای کشویی به نام چیپس تغییر می دهد. برای مثال، در اعلان «موسیقی کانتری با الهام از کلاغ‌ها، نواخته‌شده روی گیتار»، کانتری، کلاغ‌ها و گیتار همگی پیشنهادهای متعددی برای امتحان ارائه کردند. تنها با چند کلیک، می‌توانم آن دستور اصلی را به «موسیقی بلوز الهام‌گرفته از جغدها، نواخته شده با سازدهنی» تبدیل کنم.

مرتبط

10 ویژگی Gemini Live که بی صبرانه منتظرم تا آنها را امتحان کنم

هوش مصنوعی گوگل بیشتر شبیه انسان به نظر می رسد، اما Gemini Live دقیقاً چه چیزی را می تواند انجام دهد؟

به طور مشابه، ImageFX یک تولید کننده تصویر هوش مصنوعی است که به اصلاح درخواست های مبتنی بر متن کمک می کند. این یک مدل زبان بزرگ است که توسط Imagen 2 پشتیبانی می‌شود، همان فناوری که Gemini از آن استفاده می‌کند. در حالی که Gemini از قبل می تواند تصاویر تولید کند، ImageFX تغییراتی را در دستور پیشنهاد می دهد و کلمات کلیدی و عبارات را به منوهای کشویی تبدیل می کند. این به اصطلاح چیپ ها به گونه ای طراحی شده اند که به کاربر ایده های بیشتری داده و نتیجه را بهتر اصلاح کنند.

ImageFX حتی به یک اعلان اولیه نیاز ندارد.


در واقع، ImageFX حتی نیازی به یک اعلان اولیه ندارد – به سادگی ضربه زدن “من احساس خوش شانسی می کنم” را به طور تصادفی برای شما ایجاد می کند. «رویایی، منظره پاستلی، خطوط ملایم، رنگ‌های ملایم، ابرهای کرکی، کوه‌های رنگین کمانی، مینیمال» می‌تواند به «پرتره نئونی عرفانی، فرم‌های زاویه‌دار، رنگ‌های پررنگ، ابرهای دراماتیک، کوه‌های ناهموار، آراسته» تبدیل شود.

مرتبط

Gemini Live اینجاست و امکان مکالمات صوتی با هوش مصنوعی گوگل را فراهم می کند

اگر Gemini Advanced دارید، اکنون در دسترس است.

MusicFX صداهای کوتاهی ایجاد کرد

بی روح، اما نه وحشتناک

musicfx-hands-on-001

هنگامی که برای اولین بار آزمایش MusicFX را شروع کردم، به سرعت متوجه شدم که تولید کننده موسیقی چه کاری می تواند انجام دهد و چه کاری نمی تواند انجام دهد، ترکیبی از توانایی ها که هم گاهی تسکین دهنده و هم ناامیدکننده بود. اول، من نتوانستم MusicFX را برای تولید وکال دریافت کنم، اگرچه زمانی که درخواست کاپلا کردم، چند کار انجام دادم. و برای تسکین هنرمندان در همه جا، نمی توانید از برنامه بخواهید که یک هنرمند خاص را تکرار کند. متأسفیم، اما MusicFX به این زودی هیچ آهنگی از تیلور سویفت منتشر نخواهد کرد.


ساخته‌های MusicFX در حال حاضر به 70 ثانیه محدود شده‌اند، اما می‌توانید گزینه حلقه را تغییر دهید تا به‌طور یکپارچه خودش را پخش کند. پیش‌فرض برای یک آهنگ 30 ثانیه‌ای است، اما می‌توانید با باز کردن منوی تنظیمات، طول آن را تنظیم کنید.

مرتبط

SearchGPT توضیح داد: چیست و چگونه می توانید اولین نفری باشید که آن را امتحان می کنید

مدت‌ها شایعه شده بود که OpenAI روی رقیبی برای جستجوی گوگل کار می‌کند و حالا بالاخره به اینجا رسید.

من که آماده شنیدن موسیقی فاجعه‌باری مثل پرتره‌های سه انگشتی و ذوب شده از مولدهای تصویر اولیه بودم، وقتی روی play کلیک کردم و متوجه شدم که آهنگ وحشتناک نیست، شگفت‌زده شدم. این موسیقی بود که می‌توانستم آن را تصور کنم که در آسانسور پخش می‌شود، یا پس‌زمینه آن در حالی که منتظر مانده‌ام. بعد از اینکه اولین نتیجه وحشتناک نبود، چند ژانر دیگر تولید کردم و چندین ژانر، سرعت و ساز را امتحان کردم.

موسیقی فاقد روح و احساس آهنگ‌هایی است که معمولاً نمی‌توانم با آن‌ها بخوانم.


پس از مدتی، آهنگ‌هایی که نرم‌افزار تولید می‌کردند همگی شبیه یکدیگر شدند (اگرچه در آینده، شاید نباید این همه آهنگ کانتری درخواست می‌کردم). در حالی که کلیپ ها کوتاه هستند، هیچ حسی از ساختار مانند یک کر یا شعر وجود ندارد، اما به نظر می رسد ضربات کوتاه تری وجود دارد که با تغییرات جزئی خود را تکرار می کنند. در حالی که هق هق نمی‌کردم، زمزمه نمی‌کردم یا روی ضربان ضربه نمی‌زدم. موسیقی فاقد روح و احساس آهنگ‌هایی است که معمولاً نمی‌توانم با آن‌ها بخوانم.

مرتبط

کاربران رایگان ChatGPT اکنون می‌توانند تصاویر DALL-E 3 را تولید کنند، البته فقط دو تصویر در روز

اکنون می توانید تصاویر را از متن در ChatGPT بدون نیاز به اشتراک تولید کنید.

گاهی اوقات، نرم افزار قادر به گوش دادن به دستورالعمل های دقیق نبود. به عنوان مثال، هنگامی که من درخواست کردم که موسیقی فقط با گیتار آکوستیک نواخته شود، هنوز هم آهنگی با سازهای متعدد ایجاد می کند. من نمی‌توانم MusicFX را ببینم که هر بیلبوردی را تماشا می‌کند، اما می‌توانم ببینم که موسیقی پس‌زمینه برای تبلیغات ویدیویی و تبلیغات را تولید می‌کند. اما، با وجود بحث‌های کپی رایت در مورد هوش مصنوعی مولد، مشخص نیست که آیا تصویر حاصل می‌تواند یا حتی باید به صورت تجاری استفاده شود.


یکی از بهترین ویژگی‌های هوش مصنوعی، تصادفی بودن خارج از دیوار است که گهگاه ایده‌ای دیدنی به نظر می‌رسد.

با این حال، بهترین بخش MusicFX، تراشه‌های کشویی است که برای آزاد کردن ایده‌های بیشتر طراحی شده‌اند. به نظر من، یکی از بهترین ویژگی‌های هوش مصنوعی، تصادفی بودن خارج از دیوار است که گهگاه ایده‌ای تماشایی به نظر می‌رسد. با استفاده از پیشنهادات مختلف، امتحان کردن چیزی جدید یا گرفتن یک ایده و هدایت آن حتی فراتر از آن، سرگرم کننده است. روشی که آن را با ایده های خارج از دیوار مانند “موسیقی حباب دار و خوش بینانه پارتی پیتزا سایبری در بازی های زیر آب” ارائه می دهد، آزمایش کردن با آن بسیار سرگرم کننده است، اگرچه وقتی آن درخواست پیشنهادی را در گوگل جستجو کردم و متوجه شدم که آن را به بیرون انداخته است، ناامید شدم. همین پیشنهاد قبلاً بارها


با این حال، بهترین راه برای سفارشی کردن نتایج، استفاده از حالت DJ است. با استفاده از این گزینه، هر قسمت از فرمان دارای یک نوار لغزنده است، بنابراین می توانید سرعت شادی را افزایش دهید یا احساس راک کلاسیک را کاهش دهید. به این ترتیب، کنترل بیشتری بر نتایج نهایی خواهید داشت. همانطور که ایده ها به ذهن شما خطور می کند، می توانید آنها را به لیست اضافه کنید یا از پیشنهادات پایین استفاده کنید. با این حال، حالت DJ هنوز قابلیت دانلود و اشتراک گذاری را به دست نیاورده است.

با MusicFX ما تولید کردیم یک آهنگ روستایی، جرنگ جرنگ روانگردانو در حالت DJ، یک راک کلاسیک با سازهای آکوستیک.

مرتبط

آیا هوش اپل واقعاً شانسی در مسابقه هوش مصنوعی دارد؟

اگر اپل بتواند ابزارهای درون‌برنامه‌ای خود را توسعه دهد، می‌تواند در مقابل رقبا متمایز شود.

برخی از نتایج ImageFX وحشتناک بودند، اما برخی دیگر چشمگیر بودند

این نرم افزار تغییرات سریعی را برای گرفتن عکس در جهت های جدید پیشنهاد کرد

imagefx تست آلبوم هنری برای موسیقی کانتری

Google / Pocket-lint


به طور طبیعی، پس از ارائه چند قطعه مختلف تولید شده توسط هوش مصنوعی، مجبور شدم یک جلد آلبوم برای همراهی با آن بسازم. برای آن، از ImageFX استفاده کردم، ابزاری که توسط Imagen 2 پشتیبانی می‌شود، همان زیر مجموعه Gemini که گرافیک تولید می‌کند. مانند MusicFX، از تراشه‌ها برای پیشنهاد تنظیمات به درخواست، از سبک گرفته تا آنچه که تولید می‌شود، استفاده می‌کند.

هوش مصنوعی سبکی را که من دنبالش می‌کردم ثابت کرد.

اولین درخواستی که خواستم منجر به یک نوازنده دلقک مانند سه دست و چشم سفید شد که احتمالاً اکنون کابوس های من را تحت الشعاع قرار خواهد داد. با یادآوری اینکه چقدر برای هوش مصنوعی تکثیر شکل انسان دشوار است، دستورم را تنظیم کردم و از اینکه چقدر سریع چیزی را پیدا کردم که دوست داشتم شگفت زده شدم. هوش مصنوعی سبکی را که من دنبالش بودم، که یادآور پوستر سیرک قدیمی بود، نشان داد.


با این حال، آنچه که بسیار چشمگیر بود این بود که هوش مصنوعی قادر به مدیریت متن بود. هوش مصنوعی‌هایی که قبلاً با آنها کار کرده‌ام هرگز نتوانسته‌اند کلمات را به درستی اضافه کنند، ابهام و غلط املایی ایجاد کنند، حتی زمانی که من فقط یک “تولد مبارک” ساده درخواست کردم. با این حال، اگر به ImageFX بگویم چه کلماتی باید اضافه شود، آن کلمات را به درستی املا می‌کند. کامل نیست — وقتی مشخص نکردم چه کلماتی را به جلد آلبوم اضافه کنم، اشکال حروف مانندی را به قسمتی از طراحی اضافه کرد که آشکارا برای متن در نظر گرفته شده بود. اما، تاثیرگذارتر از متن روی تصویری است که سعی کردم با ChatGPT ایجاد کنم.

مرتبط

تیم کوک زمان اضافه شدن ChatGPT به iOS 18 را فاش می کند

در آخرین تماس درآمدی اپل، مدیرعامل تایید کرد که ادغام ChatGPT به زودی وارد خواهد شد.

در اینجا تعدادی از تصاویر ایجاد شده است:


آیا MusicFX و ImageFX آینده جمینی هستند؟

اگر یک ویژگی وجود داشته باشد که من می خواهم در Gemini ببینم، آن چیپس است

نمای نزدیک از نمونه چیپس از گوگل

فناوری مولد، به‌ویژه آن که تلاش می‌کند هنر را تکرار کند، سؤالاتی را می‌طلبد که این فناوری دقیقاً چه جایگاهی در آینده ما دارد و چگونه بر خلاقیت‌های واقعی انسان تأثیر می‌گذارد. اگر MusicFX نشانه‌ای باشد، می‌توانم آهنگ‌های تولید شده توسط هوش مصنوعی را به‌عنوان موسیقی نگهدارنده، موسیقی آسانسور یا موسیقی پس‌زمینه فراموش‌شدنی ویدیوی رسانه‌های اجتماعی ببینم. نمی‌توانم خودم را در ماشینم به چیزی که این ابزار تا کنون ایجاد کرده است، ببینم. اما، همانطور که مطرح می شود، MusicFX آزمایشی است و می تواند با پیشرفت خود جهش های بزرگی به جلو داشته باشد.


سوال دیگری که باید با هر پلتفرم یادگیری ماشینی مطرح شود این است که داده های آموزشی از کجا می آیند. گوگل اعلام نکرده است که کجا موسیقی را برای آموزش سیستم پیدا کرده است. با این حال، گزارشی از بیلبورد نشان می دهد این شرکت از موسیقی دارای حق چاپ در مجموعه آموزشی خود استفاده کرد. با وجود شکایت‌های حقوقی در مورد استفاده از تصاویر دارای حق چاپ در داده‌های آموزشی، قانون می‌تواند نقش مهمی در خروج MusicFX از آشپزخانه تست Google داشته باشد.

مرتبط

Gemini و Google Workspace می توانند به شما کمک کنند تا بهره وری بیشتری داشته باشید… بیشتر اوقات

Google’s Gemini در خلاصه کردن Google Docs و ایمیل‌ها حرفه‌ای است، اما وقتی صحبت از کاربرگ‌نگار و سایر ابزارهای Workspace می‌شود، همه چیز کمی عجیب و غریب می‌شود.



منبع

دیدگاهتان را بنویسید

دکمه بازگشت به بالا