شرکت چینی هوش مصنوعی MiniMax مدل های جدیدی را منتشر می کند که ادعا می کند با بهترین های این صنعت قابل رقابت هستند

شرکتهای چینی به عرضه مدلهای هوش مصنوعی که با قابلیتهای سیستمهای توسعهیافته توسط OpenAI و سایر شرکتهای هوش مصنوعی مستقر در ایالات متحده رقابت میکنند، ادامه میدهند.
این هفته، مینی مکس، یک استارت آپ با حمایت علی بابا و تنسنت که دارای مطرح کرد حدود 850 میلیون دلار سرمایه خطرپذیر و ارزش آن بیش از 2.5 میلیارد دلار است. آغاز شد سه مدل های جدید: MiniMax-Text-01، MiniMax-VL-01، و T2A-01-HD. MiniMax-Text-01 یک مدل فقط متنی است، در حالی که MiniMax-VL-01 می تواند هم تصاویر و هم متن را درک کند. در همین حال، T2A-01-HD صدا تولید می کند – به ویژه گفتار.
MiniMax ادعا میکند که MiniMax-Text-01، با اندازه 456 میلیارد پارامتر، عملکرد بهتری نسبت به مدلهایی مانند Gemini 2.0 Flash که اخیراً توسط گوگل رونمایی شد، در معیارهایی مانند MMLU و SimpleQA که توانایی یک مدل را برای پاسخگویی به مسائل ریاضی و واقعیتها اندازهگیری میکند، دارد. سوالات مبتنی بر پارامترها تقریباً با مهارت های حل مسئله مدل مطابقت دارند و مدل هایی با پارامترهای بیشتر معمولاً بهتر از مدل هایی با پارامترهای کمتر عمل می کنند.
در مورد MiniMax-VL-01، MiniMax میگوید که در ارزیابیهایی که نیاز به درک چندوجهی دارند، مانند ChartQA، که مدلها را با پاسخگویی به پرسشهای مرتبط با نمودار و نمودار (به عنوان مثال، «مقدار اوج چقدر است»، رقابت میکند. خط نارنجی در این نمودار؟”). مسلماً، MiniMax-VL-01 در بسیاری از این تستها بهترین فلش Gemini 2.0 را ندارد. GPT-4o از OpenAI و یک مدل باز به نام InternVL2.5 آن را در چندین مورد نیز شکست دادند.
نکته قابل توجه، MiniMax-Text-01 دارای یک پنجره زمینه بسیار بزرگ است. متن یک مدل، یا پنجره زمینه، به ورودی (مثلاً متن) اشاره دارد که یک مدل قبل از تولید خروجی (متن اضافی) در نظر می گیرد. با پنجره زمینه 4 میلیون توکن، MiniMax-Text-01 می تواند حدود 3 میلیون کلمه را در یک حرکت تجزیه و تحلیل کند – یا کمی بیش از پنج نسخه از “جنگ و صلح”.
برای زمینه (بدون جناس)، پنجره زمینه MiniMax-Text-01 تقریباً 31 برابر اندازه GPT-4o و Llama 3.1 است.
آخرین مدل از MiniMax که این هفته منتشر شد، T2A-01-HD، یک تولید کننده صوتی است که برای گفتار بهینه شده است. T2A-01-HD می تواند یک صدای مصنوعی با آهنگ، آهنگ و تنور قابل تنظیم در حدود 17 زبان مختلف از جمله انگلیسی و چینی تولید کند و یک صدا را تنها از 10 ثانیه ضبط صدا شبیه سازی کند.
MiniMax نتایج معیار مقایسه T2A-01-HD را با سایر مدل های تولید کننده صدا منتشر نکرد. اما به گوش این خبرنگار، صدای خروجی T2A-01-HD با مدل های صوتی از متا و استارت آپ هایی مانند PlayAI.
به استثنای T2A-01-HD که به طور انحصاری از طریق API MiniMax و پلتفرم هوش مصنوعی Hailuo در دسترس است، مدل های جدید MiniMax را می توان از GitHub و پلت فرم توسعه دهنده هوش مصنوعی Hugging Face دانلود کرد.
با این حال، فقط به این دلیل که مدلها به صورت «باز» در دسترس هستند، به این معنی نیست که از جنبههای خاصی قفل نشدهاند. MiniMax-Text-01 و MiniMax-VL-01 واقعاً منبع باز نیستند به این معنا که MiniMax مؤلفههایی (مثلاً دادههای آموزشی) مورد نیاز برای ایجاد مجدد آنها را از ابتدا منتشر نکرده است. علاوه بر این، آنها تحت مجوز محدود MiniMax هستند که توسعه دهندگان را از استفاده از مدلها برای بهبود مدلهای هوش مصنوعی رقیب منع میکند و نیاز دارد که پلتفرمهایی با بیش از 100 میلیون کاربر فعال ماهانه درخواست مجوز ویژه از MiniMax کنند.
MiniMax در سال 2021 توسط کارمندان سابق SenseTime، یکی از بزرگترین شرکت های هوش مصنوعی چین، تاسیس شد. پروژههای این شرکت شامل اپلیکیشنهایی مانند Talkie، یک پلتفرم نقشآفرینی مبتنی بر هوش مصنوعی در امتداد خطوط هوش مصنوعی کاراکتر، و مدلهای تبدیل متن به ویدئو است که MiniMax در Hailuo منتشر کرده است.
برخی از محصولات MiniMax به موضوع بحث های جزئی تبدیل شده اند.
Talkie که در ماه دسامبر به دلایل «فنی» نامشخصی از اپ استور اپل خارج شد، دارای آواتارهای هوش مصنوعی شخصیتهای عمومی از جمله دونالد ترامپ، تیلور سویفت، ایلان ماسک و لبرون جیمز است که به نظر میرسد هیچکدام از آنها با حضور در این برنامه موافقت نکردهاند. برنامه
در ماه دسامبر، مجله پخش گزارش شده است که ژنراتورهای ویدئویی MiniMax میتوانند آرمهای کانالهای تلویزیونی بریتانیا را بازتولید کنند، که نشان میدهد مدلهای MiniMax بر روی محتوای آن کانالها آموزش دیدهاند. و MiniMax گزارش شده است مورد شکایت قرار گرفتن توسط iQiyi، یک سرویس پخش ویدیوی چینی که ادعا می کند MiniMax به طور غیرقانونی در مورد ضبط های دارای حق چاپ iQiyi آموزش دیده است.
مدلهای جدید MiniMax چند روز پس از پیشنهاد دولت فعلی بایدن، قوانین صادرات سختتر و محدودیتهای مربوط به فناوریهای هوش مصنوعی را برای سرمایهگذاریهای چینی پیشنهاد کرد. شرکتهای چینی قبلاً از خرید تراشههای هوش مصنوعی پیشرفته منع شده بودند، اما اگر قوانین جدید طبق نوشتهها اجرایی شوند، شرکتها با محدودیتهای سختتر هم در زمینه فناوری نیمهرسانا و هم در مدلهای مورد نیاز برای راهاندازی سیستمهای هوش مصنوعی پیچیدهتر مواجه خواهند شد.
روز چهارشنبه، دولت بایدن اعلام کرد اقدامات اضافی متمرکز بر دور نگه داشتن تراشه های پیچیده از چین. کارخانههای ریختهگری تراشه و شرکتهای بستهبندی که میخواهند تراشههای خاصی را صادر کنند، مشمول مجوزهای گستردهتری خواهند بود، مگر اینکه بررسی دقیقتر و دقت لازم را برای جلوگیری از رسیدن محصولات خود به مشتریان چینی انجام دهند.