یکی از بهترین رقبای ChatGPT اکنون می تواند صفحه کامپیوتر شما را برای شما کنترل کند

چه به طور کامل در فناوری هوش مصنوعی غوطه ور باشید یا فقط تکه هایی از مکالمات برتر را شنیده باشید، احتمالاً نام ChatGPT OpenAI را شنیده اید. با وجود محبوبیت گسترده، GPT-4o، بهترین مدل Open AI تا به امروز، اکنون قدرت کمتری نسبت به مدل جدید شرکت رقیب Anthropic: Claude 3.5 Sonnet دارد.
در معیارهای به اشتراک گذاشته شده توسط Anthropic در X غزل کلود 3.5 در هر معیار هوش مصنوعی به جز حل مسائل ریاضی، از مدل GPT-4o OpenAI بهتر عمل می کند.
معرفی یک غزل ارتقا یافته کلود 3.5 و یک مدل جدید، کلود 3.5 هایکو. ما همچنین یک قابلیت جدید را در نسخه بتا معرفی می کنیم: استفاده از رایانه. توسعه دهندگان اکنون می توانند کلود را به استفاده از رایانه ها به روشی که مردم انجام می دهند هدایت کنند – با نگاه کردن به صفحه، حرکت مکان نما، کلیک کردن، و تایپ متن. pic.twitter.com/ZlywNPVIJP22 اکتبر 2024
آنتروپیک Claude 3.5 Sonnet میگوید «پیشرفتهای کلی نسبت به نسخه قبلی خود» ارائه میکند که شنیدن آن فوقالعاده است، اما قطعاً جالبترین نکته نیست.
آنچه در مورد غزل کلود 3.5 بسیار جذاب است، چیزی است که آنتروپیک آن را “قابلیت جدید پیشگامانه” می نامد. این ویژگی جدید که برای هر کسی برای آزمایش در نسخه بتا عمومی در دسترس است، «استفاده از رایانه» نامیده میشود – و نزدیکترین مدل هوش مصنوعی است که تا به حال به ارائه یک دستیار مجازی واقعی برای کمک به ما در انجام کارهای یکنواخت بوده است.
“استفاده از کامپیوتر” چیست و چگونه کار می کند؟
Anthropic می گوید، “توسعه دهندگان می توانند کلود را به استفاده از رایانه ها به روشی که مردم انجام می دهند هدایت کنند – با نگاه کردن به صفحه، حرکت مکان نما، کلیک کردن روی دکمه ها، و تایپ متن. دموهایی که تا الان دیده ام قابل توجه بوده است.
از طریق روآن چونگ در X ، می توانید نحوه کنترل کلود 3.5 Sonnet روی صفحه نمایش شما، حرکت مکان نما، تایپ کردن، و انجام کارهای پیچیده مانند ایجاد یک وب سایت یا پر کردن فرم درخواست فروشنده با اطلاعات مربوطه را به طور کامل مشاهده کنید.
Anthropic به تازگی استفاده از رایانه را اعلام کرده است این به کلود اجازه می دهد تا صفحه رایانه شما را بر اساس یک اعلان کنترل کند و اقداماتی را از طرف شما انجام دهد.22 اکتبر 2024
Cheung توضیح میدهد که ویژگی «استفاده از رایانه» با گرفتن اسکرینشاتهای ثابت کار میکند که دائماً در زمان واقعی به API ارسال میشوند. در یک پست وبلاگ Anthropic به اشتراک گذاشته شده با TechCrunch، این شرکت نحوه کار خود را گسترش داد و گفت: “کلود به اسکرین شات هایی از آنچه برای کاربر قابل مشاهده است نگاه می کند، سپس شمارش می کند که چند پیکسل به صورت عمودی یا افقی برای حرکت مکان نما به منظور کلیک کردن در مکان صحیح نیاز دارد.”
مشاهده عملکرد مدل هوش مصنوعی در زمان واقعی واقعاً چیزی است، و اگر نگران خطرات امنیتی احتمالی رایانه شخصی خود هستید، آزمایشهایی که تاکنون انجام شده است به شرح زیر است: آزمایش پیش از استقرار Claude 3.5 Sonnet توسط هر دو انجام شد. مؤسسه ایمنی هوش مصنوعی ایالات متحده (US AISI) و مؤسسه ایمنی بریتانیا (UK AISI) و این شرکت استاندارد ASL-2 مناسب برای مدل
همانطور که گفته شد، مطمئناً از خطرات امنیتی در امان نیست و احتمالاً نباید از یک مدل هوش مصنوعی با داده های حساس و خصوصی استفاده کنید.
جالب است که ببینیم این ویژگی چگونه از نسخه بتای عمومی به نسخه رسمی خود تکامل می یابد، اما در حال حاضر، من از پتانسیل آن برای کمک به کارهای بزرگ و خسته کننده کپی/پیست و پیچیده تر هیجان زده هستم. درخواست ها