کار آفرینی و استارتاپ

شرکت چینی هوش مصنوعی MiniMax مدل های جدیدی را منتشر می کند که ادعا می کند با بهترین های این صنعت قابل رقابت هستند


شرکت‌های چینی به عرضه مدل‌های هوش مصنوعی که با قابلیت‌های سیستم‌های توسعه‌یافته توسط OpenAI و سایر شرکت‌های هوش مصنوعی مستقر در ایالات متحده رقابت می‌کنند، ادامه می‌دهند.

این هفته، مینی مکس، یک استارت آپ با حمایت علی بابا و تنسنت که دارای مطرح کرد حدود 850 میلیون دلار سرمایه خطرپذیر و ارزش آن بیش از 2.5 میلیارد دلار است. آغاز شد سه مدل های جدید: MiniMax-Text-01، MiniMax-VL-01، و T2A-01-HD. MiniMax-Text-01 یک مدل فقط متنی است، در حالی که MiniMax-VL-01 می تواند هم تصاویر و هم متن را درک کند. در همین حال، T2A-01-HD صدا تولید می کند – به ویژه گفتار.

MiniMax ادعا می‌کند که MiniMax-Text-01، با اندازه 456 میلیارد پارامتر، عملکرد بهتری نسبت به مدل‌هایی مانند Gemini 2.0 Flash که اخیراً توسط گوگل رونمایی شد، در معیارهایی مانند MMLU و SimpleQA که توانایی یک مدل را برای پاسخگویی به مسائل ریاضی و واقعیت‌ها اندازه‌گیری می‌کند، دارد. سوالات مبتنی بر پارامترها تقریباً با مهارت های حل مسئله مدل مطابقت دارند و مدل هایی با پارامترهای بیشتر معمولاً بهتر از مدل هایی با پارامترهای کمتر عمل می کنند.

در مورد MiniMax-VL-01، MiniMax می‌گوید که در ارزیابی‌هایی که نیاز به درک چندوجهی دارند، مانند ChartQA، که مدل‌ها را با پاسخگویی به پرسش‌های مرتبط با نمودار و نمودار (به عنوان مثال، «مقدار اوج چقدر است»، رقابت می‌کند. خط نارنجی در این نمودار؟”). مسلماً، MiniMax-VL-01 در بسیاری از این تست‌ها بهترین فلش Gemini 2.0 را ندارد. GPT-4o از OpenAI و یک مدل باز به نام InternVL2.5 آن را در چندین مورد نیز شکست دادند.

نکته قابل توجه، MiniMax-Text-01 دارای یک پنجره زمینه بسیار بزرگ است. متن یک مدل، یا پنجره زمینه، به ورودی (مثلاً متن) اشاره دارد که یک مدل قبل از تولید خروجی (متن اضافی) در نظر می گیرد. با پنجره زمینه 4 میلیون توکن، MiniMax-Text-01 می تواند حدود 3 میلیون کلمه را در یک حرکت تجزیه و تحلیل کند – یا کمی بیش از پنج نسخه از “جنگ و صلح”.

برای زمینه (بدون جناس)، پنجره زمینه MiniMax-Text-01 تقریباً 31 برابر اندازه GPT-4o و Llama 3.1 است.

آخرین مدل از MiniMax که این هفته منتشر شد، T2A-01-HD، یک تولید کننده صوتی است که برای گفتار بهینه شده است. T2A-01-HD می تواند یک صدای مصنوعی با آهنگ، آهنگ و تنور قابل تنظیم در حدود 17 زبان مختلف از جمله انگلیسی و چینی تولید کند و یک صدا را تنها از 10 ثانیه ضبط صدا شبیه سازی کند.

MiniMax نتایج معیار مقایسه T2A-01-HD را با سایر مدل های تولید کننده صدا منتشر نکرد. اما به گوش این خبرنگار، صدای خروجی T2A-01-HD با مدل های صوتی از متا و استارت آپ هایی مانند PlayAI.

به استثنای T2A-01-HD که به طور انحصاری از طریق API MiniMax و پلتفرم هوش مصنوعی Hailuo در دسترس است، مدل های جدید MiniMax را می توان از GitHub و پلت فرم توسعه دهنده هوش مصنوعی Hugging Face دانلود کرد.

با این حال، فقط به این دلیل که مدل‌ها به صورت «باز» در دسترس هستند، به این معنی نیست که از جنبه‌های خاصی قفل نشده‌اند. MiniMax-Text-01 و MiniMax-VL-01 واقعاً منبع باز نیستند به این معنا که MiniMax مؤلفه‌هایی (مثلاً داده‌های آموزشی) مورد نیاز برای ایجاد مجدد آنها را از ابتدا منتشر نکرده است. علاوه بر این، آنها تحت مجوز محدود MiniMax هستند که توسعه دهندگان را از استفاده از مدل‌ها برای بهبود مدل‌های هوش مصنوعی رقیب منع می‌کند و نیاز دارد که پلتفرم‌هایی با بیش از 100 میلیون کاربر فعال ماهانه درخواست مجوز ویژه از MiniMax کنند.

MiniMax در سال 2021 توسط کارمندان سابق SenseTime، یکی از بزرگترین شرکت های هوش مصنوعی چین، تاسیس شد. پروژه‌های این شرکت شامل اپلیکیشن‌هایی مانند Talkie، یک پلتفرم نقش‌آفرینی مبتنی بر هوش مصنوعی در امتداد خطوط هوش مصنوعی کاراکتر، و مدل‌های تبدیل متن به ویدئو است که MiniMax در Hailuo منتشر کرده است.

برخی از محصولات MiniMax به موضوع بحث های جزئی تبدیل شده اند.

Talkie که در ماه دسامبر به دلایل «فنی» نامشخصی از اپ استور اپل خارج شد، دارای آواتارهای هوش مصنوعی شخصیت‌های عمومی از جمله دونالد ترامپ، تیلور سویفت، ایلان ماسک و لبرون جیمز است که به نظر می‌رسد هیچ‌کدام از آنها با حضور در این برنامه موافقت نکرده‌اند. برنامه

در ماه دسامبر، مجله پخش گزارش شده است که ژنراتورهای ویدئویی MiniMax می‌توانند آرم‌های کانال‌های تلویزیونی بریتانیا را بازتولید کنند، که نشان می‌دهد مدل‌های MiniMax بر روی محتوای آن کانال‌ها آموزش دیده‌اند. و MiniMax گزارش شده است مورد شکایت قرار گرفتن توسط iQiyi، یک سرویس پخش ویدیوی چینی که ادعا می کند MiniMax به طور غیرقانونی در مورد ضبط های دارای حق چاپ iQiyi آموزش دیده است.

مدل‌های جدید MiniMax چند روز پس از پیشنهاد دولت فعلی بایدن، قوانین صادرات سخت‌تر و محدودیت‌های مربوط به فناوری‌های هوش مصنوعی را برای سرمایه‌گذاری‌های چینی پیشنهاد کرد. شرکت‌های چینی قبلاً از خرید تراشه‌های هوش مصنوعی پیشرفته منع شده بودند، اما اگر قوانین جدید طبق نوشته‌ها اجرایی شوند، شرکت‌ها با محدودیت‌های سخت‌تر هم در زمینه فناوری نیمه‌رسانا و هم در مدل‌های مورد نیاز برای راه‌اندازی سیستم‌های هوش مصنوعی پیچیده‌تر مواجه خواهند شد.

روز چهارشنبه، دولت بایدن اعلام کرد اقدامات اضافی متمرکز بر دور نگه داشتن تراشه های پیچیده از چین. کارخانه‌های ریخته‌گری تراشه و شرکت‌های بسته‌بندی که می‌خواهند تراشه‌های خاصی را صادر کنند، مشمول مجوزهای گسترده‌تری خواهند بود، مگر اینکه بررسی دقیق‌تر و دقت لازم را برای جلوگیری از رسیدن محصولات خود به مشتریان چینی انجام دهند.



منبع

دیدگاهتان را بنویسید

دکمه بازگشت به بالا