من به جمینی اجازه می دهم عکسهایم را ویرایش کند ، و آنچه که هوش مصنوعی در تعجب من است

خلاصه
Gemini به عنوان یک ابزار بهره وری قرار دارد ، اما Google در تلاش است تا آن را به ابزاری بهتر برای ویرایش تصاویر تبدیل کند.
مدل تصویر جدید این شرکت به شما امکان می دهد ویرایش ها را فقط با تایپ کردن آنها در جعبه سریع Gemini انجام دهید.
به نظر می رسد جمینی در ویرایش های بزرگ و خلاق برتری دارد – تغییرات پس زمینه متقاعد کننده و حذف شی.
هوش مصنوعی گاهی اوقات وقتی سعی می کند ترفندهای دقیقی ایجاد کند ، کوتاه می آید.
زمین های گوگل جنین به عنوان یک ابزار بهره وری همه در یک ، کسی قادر به کمک به چندین جنبه از زندگی شخصی ، حرفه ای و خلاق یک فرد متوسط است. و اگر مشخص نبود که این شرکت دستیار هوش مصنوعی خود را مشاهده کرده و از این طریق مدل های خود را مشاهده کرده است ، این واقعیت که این جین را در تمام فضای کاری Google وارد می کند ، امیدوارم اثبات شود. اعتقاد این شرکت بدون هیچ گونه آتش سوزی سیگار نیست. Google شروع به نشان دادن اینكه جمینی می تواند کارهایی مانند ویرایش تقویم شما یا کار در داخل برنامه ها را در تنظیمات مناسب انجام دهد. با این حال ، اکنون ، این شرکت همچنین علاقه مند است تا Gemini را به ابزاری بهتر برای ویرایش عکس ها با جدید خود تبدیل کند مدل تصویر “نانو موز”.
وعده AL و این نسخه به روز شده این است که شما نیازی به تجربه یا دانش یک قطعه خاص از نرم افزار ندارید تا تصویر نهایی مورد نظر خود را بدست آورید.
ویرایش عکس زبان طبیعی – جایی که شما فقط به جمینی می گویید که چگونه می خواهید یک عکس تغییر کند – بخشی از زمین شرکت برای پیکسل 10، اما این ویژگی در تمام مکانهایی که اکنون می توانید به مدل های Google دسترسی پیدا کنید موجود است. در حالی که من مشکوک هستم که صحبت کردن یا تایپ ویرایش های شما بهتر از دستکاری جسمی با ماوس یا قلم است ، پس از تلاش برای مهارت های جدید Gemini ، من تحت تأثیر قرار گرفتم که چقدر جمینی می تواند انجام دهد.
نرم افزار ویرایش Gemini در مقابل عکس
چرا اجازه می دهید AI عکسهای شما را ویرایش کند؟
تاکنون ، مدل های جمینی گوگل خود را در تولید متن و مرتب سازی از طریق مقادیر زیادی از داده ها اثبات کرده اند. تا زمانی که گوگل جمینی را “چند حالته” در نظر گرفته است ، قادر به درک و دستکاری تصاویر است ، اما عمل ساده ویرایش عکس ها هنوز هم سریعتر بود فتوشاپ ، فوتوماتور یا لایت رومبشر
وعده AL و این نسخه به روز شده این است که شما نیازی به تجربه یا دانش یک قطعه خاص از نرم افزار ندارید تا تصویر نهایی مورد نظر خود را بدست آورید. تمام کاری که شما باید انجام دهید این است که به وضوح از آنچه می خواهید بپرسید و قرار است جمینی بتواند بقیه را انجام دهد. من سعی کردم با مهارت های بهبود یافته عکس Gemini با توجه به آن آزمایش کنم. لزوماً با ویرایش هایی که می خواستم ببینم دقیق نیست ، بلکه در عوض باعث می شود که مدل با احساسات روده من در مورد آنچه در مورد هر عکس به نظر می رسید.
جمینی همیشه با ویرایش های ساده بهترین نیست
مدل تصویر با ترفندهای کوچک مبارزه می کند
با استفاده از مجموعه ای از عکس های نمونه که در برنامه Gemini برای iOS بارگذاری کردم ، توانستم با پرسیدن تنظیمات مانند رنگ و تعادل سفید را با سهولت تنظیم کنم. بعضی اوقات تغییرات از آنچه تصور می کردم ، ظریف تر بود ، مانند عکس من که پین Humane AI را پوشیده بود ، اما همیشه به نظر می رسید که جمینی حداقل سعی در انجام کاری داشت. وقتی از من درخواست چیزی بیشتر از من خواسته ام ، مانند تغییر جهت گیری یک شیء در یک عکس ، پیچیده تر (و ناامید کننده) شد ، مانند درخواست پین AI صاف شد تا به سمت چپ تکیه ندهد. جمینی فقط قادر به انجام این کار نبود.
دستیار هوش مصنوعی نسبت به بزرگنمایی و جمع آوری قسمت خاصی از یک تصویر نسبتاً صالح بود ، اما در مورد عکسی از سگهای سگ که من بارگذاری کردم ، تصویر بریده شده برخی از آن صافی را که من با تصاویر AL در ارتباط هستم ، دارد. من فکر می کنم این تصویر هنوز قابل استفاده است ، اما جزئیات Gemini برای پر کردن اطلاعاتی که تلفن هوشمند شما فقط ضبط نشده است ، تولید نمی کند ، همیشه از کیفیت برابر برخوردار نیست.
بر اساس تست های من ، توصیف آنچه در مورد یک تصویر اشتباه به نظر می رسید و سپس از جمینی درخواست می کند که آن را برطرف کند ، نتایج بهتری را تولید می کند ، از تلاش برای گرفتن گرانول با ترفندها. برای به دست آوردن دقیقاً آنچه می خواهید از مدل تصویر Google استفاده کنید ، به احتمال زیاد نیاز به پیگیری دارید. در نرم افزار ویرایش که با آن آشنا هستم ، احتمالاً نتایج مشابهی را سریعتر می گیرم ، و برخی از ویژگی های تصحیح خودکار نرم افزار حتی ممکن است بهتر از جمینی کار کنند.
نمایشگاه های جمینی با ویرایش های بزرگتر و خلاقانه بسیار بهتر
هرچه ایده وحشی تر باشد ، مدل تصویر در فروش آن بهتر است
به جای تنظیمات اندک ، آنچه به نظر می رسد مدل تصویر به روز شده Google در واقع از آن استقبال می کند ، ایجاد تغییرات بزرگ سبک و خلاقانه است. اگر می خواهید یک تصویر را به طور کامل دوباره اختراع یا تغییر دهید ، یک فرصت خوب وجود دارد که جمینی می تواند آن را به روشی قانع کننده انجام دهد (که همانطور که تصور می کنید ، برای یک مفهوم مشترک از حقیقت عالی نیست). من قادر به حذف حصار از یک عکس از EMUS بدون هیچ گونه فرکانس اضافی بودم و فکر می کنم نتیجه نهایی بسیار طبیعی به نظر می رسد.
درخواست جمینی برای ساختن عکسی از خانه ای در سانفرانسیسکو به نظر می رسد که در یک روز بارانی گرفته شده است به طور مشابه موفقیت آمیز ، کامل با تغییرات روشنایی ، تعویض پس زمینه برای اضافه کردن ابرها و یک اثر باران فاکس. این تصاویر ممکن است کسی را که از نزدیک نگاه می کند فریب ندهد (Watermark Gemini نیز یک نمایش مرده است) ، اما اگر در حال گذر از آنها در رسانه های اجتماعی هستید ، قانع کننده هستند. من فکر می کنم که از آنجا که مردم انتظار دارند که با این تصاویر مقدار مشخصی از مجوز خلاقانه داشته باشند ، نادیده گرفتن اختلافات نیز آسان تر است.
جمینی جایگزینی ساده برای فتوشاپ نیست
هنوز آن اشتراک ابر خلاق را لغو نکنید
بر اساس این آزمایشات ، فکر نمی کنم با اطمینان می توانم بگویم جمینی یک ابزار عالی برای ویرایش عکس است ، به خصوص اگر فقط می خواهید ترفندهای ساده ای بسازید. شما هنوز هم نرم افزار عادی می خواهید ، و ابزارهای ویرایش داخلی در برنامه گالری عکس تلفن شما ممکن است کافی باشد.

- توسعه دهنده
-
گوگل
- هزینه اشتراک
-
رایگان ، 20 دلار در ماه برای استفاده بیشتر
- اعتبار
-
n/a
- بارگیری های آفلاین
-
n/a
Gemini برنامه دستیار برتر هوش مصنوعی Google برای سیستم عامل Android است که می تواند پاسخ متنی را به سؤالات ، تولید و تجزیه و تحلیل تصاویر ارائه دهد و اکنون در iOS موجود است.
با این حال ، برای تغییرات سنگین تر ، فکر می کنم یک مورد قانع کننده برای مدل تصویر Google به یک فروشگاه یک مرحله ای برای ویرایش های وحشی تبدیل شده است. این مدل تصویر جدید به نظر می رسد در ایجاد تصاویری که از دسترس عکاس متوسط تلفن هوشمند خارج باشد بسیار خوب است ، و اگر آن را جالب بدانید ، ارزش امتحان کردن را دارد.