مدل جدید هوش مصنوعی Gemini گوگل می تواند به شما نشان دهد که واقعا در حال “فکر کردن” است.

در ماه سپتامبر، OpenAI پیشنمایش o1 خود را برای ChatGPT عرضه کرد، سری جدیدی از مدلهایی که با قابلیتهای استدلال قوی طراحی شدهاند تا پاسخهای متفکرانهتری به جای پاسخهای سریع ارائه کنند. از آن زمان، شرکتهای متعددی مدلهای هوش مصنوعی استدلالی خود را ارائه کردهاند، مانند مدل DeepSeek-R1 و مدل QwQ-32B-Preview علیبابا.
حالا نوبت گوگل است.
مدل جدید هوش مصنوعی گوگل Gemini 2.0 Flash Thinking نام دارد و به گفته جف دین، دانشمند ارشد Google DeepMind، این یک مدل آزمایشی است که به صراحت افکار خود را نشان می دهد. دین در ادامه میگوید: «این مدل برای استفاده از افکار برای تقویت استدلال خود آموزش دیده است»، یک چشمانداز هیجانانگیز برای کسانی که از نحوه پاسخهای هوش مصنوعی خسته شدهاند.
مدل جدید Gemini 2.0 Flash Thinking گوگل گامی در مسیر درست است
از آنجایی که یک مدل هوش مصنوعی استدلالی طوری طراحی شده است که افکار خود را در حالی که پاسخ می دهد نشان دهد، برای هوش مصنوعی بسیار آسان تر است که متوجه اشتباه خود شده و خود را اصلاح کند. که گفت، TechCrunch Gemini 2.0 Flash Thinking Experimental را آزمایش کرد و در یک سوال نتایج ضعیفی گرفت. این سایت پرسید که کلمه توت فرنگی چند R است و پاسخ نادرست “دو” دریافت کرد.
این هنوز یک نسخه آزمایشی از مدل هوش مصنوعی است و کاملاً امکان پذیر است که برای مقابله با پرس و جوهای پیچیده در مقایسه با موارد ساده مجهزتر باشد. در مثال زیر، جف دین مدل جدید هوش مصنوعی گوگل را نشان میدهد که یک مشکل فیزیک را حل میکند و افکار آن را در حین انجام توضیح میدهد.
آیا می خواهید Gemini 2.0 Flash Thinking را در عمل ببینید؟ این نسخه ی نمایشی را ببینید که در آن مدل یک مسئله فیزیک را حل می کند و استدلال آن را توضیح می دهد. pic.twitter.com/Nl0hYj7ZFS19 دسامبر 2024
سرب محصول گوگل لوگان کیلپاتریک نیز به X رسید برای به اشتراک گذاشتن یک مثال هیجان انگیز از Gemini 2.0 Flash Thinking حل کردن “یک پازل چالش برانگیز شامل سرنخ های بصری و متنی.” در ویدیوی به اشتراک گذاشته شده، می توانید کل فرآیند تفکر مدل هوش مصنوعی را از ابتدا تا انتها مشاهده کنید.
کیلپاتریک به این نکته اشاره می کند که این «هنوز نسخه اولیه» مدل است، اما دیدن این مدل در عمل بسیار چشمگیر است. به جای اینکه صرفاً پاسخ یک مدل هوش مصنوعی را ببینید، میتوانید نگاهی کامل و عمیق به نحوه برخورد مدل با سؤال و دقیقاً نحوه رسیدن به پاسخ نهایی داشته باشید.
یکی منفی؟ دریافت پاسخ شما کمی بیشتر طول می کشد. از آنجایی که مدل هوش مصنوعی باید افکار خود را بنویسد تا اینکه صرفاً آنها را “فکر” کند، رسیدن به نتیجه ممکن است بیشتر از یک مدل هوش مصنوعی غیرمنطقی طول بکشد.
برای مثال، در مسئله فیزیک که توسط جف دین در بالا نشان داده شد، بیش از 37 ثانیه طول کشید تا مدل هوش مصنوعی فرآیند تفکر خود را کامل کند. اما نتیجه نهایی فوق العاده ارزشش را دارد. برای کسی که برای کمک به یک مسئله کدنویسی، فیزیک یا ریاضی به هوش مصنوعی روی میآورد، توانایی دیدن فرآیند فکری مدل میتواند به شما کمک کند که به طور بالقوه به کجا دچار شدهاید، کدام مفهوم را در نظر نگرفتهاید و غیره.
واضح است که هنوز راه درازی در پیش است تا اینکه مدلهای هوش مصنوعی به جایی برسند که ما دوست داریم (مانند تشخیص سه R در توت فرنگی به جای دو)، اما قدمهای کوتاهی که شرکتها برمیدارند به نظر پیشرفت مثبتی است.