Cartesia ادعا می کند که هوش مصنوعی آن به اندازه کافی کارآمد است که می تواند تقریباً در هر مکانی اجرا شود

دسامبر 12, 2024

0 خواندن این مطلب 7 دقیقه زمان میبرد

Futuristic digital blockchain background. Abstract connections technology and digital network. 3d illustration of the Big data and communications technology.

توسعه و اجرای هوش مصنوعی پرهزینه تر می شود. هزینه های عملیات هوش مصنوعی OpenAI می تواند رسیدن 7 میلیارد دلار در سال جاری، در حالی که مدیر عامل آنتروپیک اخیراً این مدل ها را پیشنهاد کرده است هزینه یابی بیش از 10 میلیارد دلار می تواند به زودی برسد.

بنابراین تلاش برای یافتن راه‌هایی برای ارزان‌تر کردن هوش مصنوعی ادامه دارد.

برخی از محققان بر روی تکنیک‌هایی برای بهینه‌سازی معماری‌های مدل موجود تمرکز می‌کنند – به عنوان مثال ساختار و اجزایی که باعث می‌شوند مدل‌ها علامت‌گذاری شوند. برخی دیگر در حال توسعه معماری های جدیدی هستند که معتقدند امکان ارتقای مقرون به صرفه بهتری دارند.

کاران گوئل در اردوی دوم حضور دارد. در استارتاپ او به همتایانی کمک کرد، کارتزیا، گوئل روی آنچه مدل های فضای حالت (SSM) می نامد کار می کند، یک معماری مدل جدیدتر و بسیار کارآمد که می تواند حجم زیادی از داده ها – متن، تصاویر و غیره – را به یکباره مدیریت کند.

گوئل به TechCrunch گفت: «ما معتقدیم معماری‌های مدل جدید برای ساخت مدل‌های هوش مصنوعی واقعاً مفید ضروری هستند. صنعت هوش مصنوعی یک فضای رقابتی است، هم تجاری و هم منبع باز، و ساخت بهترین مدل برای موفقیت بسیار مهم است.

ریشه های تحصیلی

قبل از پیوستن به Cartesia، گوئل یک کاندیدای دکترا در آزمایشگاه هوش مصنوعی استنفورد بود، جایی که زیر نظر دانشمند کامپیوتر کریستوفر ری و دیگران کار می کرد. زمانی که گوئل در استنفورد بود، با آلبرت گو، یکی دیگر از کاندیدای دکترا در آزمایشگاه ملاقات کرد و آن دو طرح کردند که چه چیزی به SSM تبدیل خواهد شد.

گوئل سرانجام در Snorkel AI و سپس Salesforce به مشاغل پاره وقت مشغول شد، در حالی که گو دستیار استاد در Carnegie Mellon شد. اما گو و گوئل به مطالعه SSMها ادامه دادند و چندین مورد را منتشر کردند محوری مقالات تحقیقاتی در مورد معماری

در سال 2023، گو و گوئل – به همراه دو نفر از همتایان سابق خود در استنفورد، آرجون دسای و براندون یانگ – تصمیم گرفتند برای راه‌اندازی کارتزیا برای تجاری‌سازی تحقیقات خود به نیروها بپیوندند.

تیم موسس Cartesia از چپ به راست: براندون یانگ، کاران گوئل، آلبرت گو و آرجون دسای. اعتبار تصویر:کارتزیا

Cartesia، که تیم موسس آن نیز Ré را شامل می شود، پشت بسیاری از مشتقات Mamba است که شاید محبوب ترین SSM امروزی باشد. پروفسور گو و پرینستون، تری دائو، Mamba را به عنوان یک پروژه تحقیقاتی باز در دسامبر گذشته آغاز کرد و به اصلاح آن از طریق انتشارات بعدی ادامه داد.

Cartesia علاوه بر آموزش SSM های خود، در بالای Mamba ساخته می شود. مانند همه SSMها، Cartesia به هوش مصنوعی چیزی شبیه حافظه کاری می‌دهد و مدل‌ها را در نحوه استفاده از قدرت محاسباتی سریع‌تر و احتمالاً کارآمدتر می‌کند.

SSM ها در مقابل ترانسفورماتورها

امروزه اکثر برنامه‌های هوش مصنوعی، از ChatGPT گرفته تا Sora، از مدل‌هایی با معماری ترانسفورماتور پشتیبانی می‌کنند. همانطور که یک ترانسفورماتور داده ها را پردازش می کند، ورودی هایی را به چیزی به نام “حالت پنهان” اضافه می کند تا آنچه را که پردازش کرده است “به خاطر بیاورد”. به عنوان مثال، اگر مدل راه خود را در یک کتاب طی می کند، مقادیر حالت پنهان ممکن است بازنمایی کلمات در کتاب باشد.

حالت پنهان بخشی از دلایل قدرتمند بودن ترانسفورماتورها است. اما علت ناکارآمدی آنها نیز هست. برای “گفتن” حتی یک کلمه در مورد کتابی که یک ترانسفورماتور به تازگی بلعیده است، مدل باید تمام حالت پنهان آن را اسکن کند – کاری به اندازه خواندن مجدد کل کتاب از نظر محاسباتی سخت است.

در مقابل، SSMها هر نقطه داده قبلی را به صورت خلاصه ای از همه چیزهایی که قبلا دیده اند فشرده می کنند. با ورود داده های جدید، “وضعیت” مدل به روز می شود و SSM بیشتر داده های قبلی را کنار می گذارد.

نتیجه؟ SSM ها می توانند حجم زیادی از داده ها را مدیریت کنند و در عین حال عملکرد بهتری از ترانسفورماتورها در برخی وظایف تولید داده دارند. با هزینه های استنتاج به همان صورتی که هستند، این یک پیشنهاد جذاب است.

دغدغه های اخلاقی

Cartesia مانند یک آزمایشگاه تحقیقاتی جامعه عمل می کند و SSM ها را در آن توسعه می دهد مشارکت با سازمان های خارجی و همچنین داخلی. Sonic، جدیدترین پروژه این شرکت، یک SSM است که می تواند صدای یک فرد را شبیه سازی کند یا صدای جدیدی تولید کند و آهنگ و آهنگ را در ضبط تنظیم کند.

گوئل ادعا می کند که سونیک، که از طریق API و داشبورد وب در دسترس است، سریع ترین مدل در کلاس خود است. او گفت: «سونیک نشان می‌دهد که چگونه SSMها بر روی داده‌های متنی طولانی مانند صدا برتری می‌یابند، در حالی که بالاترین نوار عملکرد را در مورد ثبات و دقت حفظ می‌کنند.

در حالی که Cartesia موفق شده است محصولات را به سرعت ارسال کند، اما در بسیاری از مشکلات اخلاقی که سایر مدل سازان هوش مصنوعی را گرفتار کرده است، برخورد کرده است.

کارتزیا آموزش دیده است حداقل برخی از SSMهای آن در The Pile، مجموعه‌ای از داده‌های باز که حاوی کتاب‌های دارای حق چاپ بدون مجوز است. بسیاری از شرکت های هوش مصنوعی این را استدلال می کنند استفاده منصفانه دکترین آنها را در برابر ادعاهای نقض محافظت می کند. اما این مانع از شکایت نویسندگان نشده است متا و مایکروسافت، به علاوه دیگران، به دلیل آموزش مدل های ادعایی در The Pile.

و Cartesia تدابیر ظاهری کمی برای شبیه‌سازی صوتی خود که از طریق Sonic پشتیبانی می‌کند، دارد. چند هفته پیش، توانستم با استفاده از سخنرانی های کمپین، صدای معاون رئیس جمهور کامالا هریس را شبیه سازی کنم (در زیر گوش دهید). ابزار Cartesia فقط مستلزم این است که کادری را علامت بزنید که نشان می‌دهد از ToS استارت‌آپ پیروی می‌کنید.

سرویس “عامل” هوش مصنوعی Goodcall به API Sonic Cartesia متکی است. **اعتبار تصویر:**Goodcall

منبع

برچسب ها

دسامبر 12, 2024

0 خواندن این مطلب 7 دقیقه زمان میبرد

Cartesia ادعا می کند که هوش مصنوعی آن به اندازه کافی کارآمد است که می تواند تقریباً در هر مکانی اجرا شود

ریشه های تحصیلی

SSM ها در مقابل ترانسفورماتورها

دغدغه های اخلاقی

کسب و کار نوپا

دیدگاهتان را بنویسید لغو پاسخ

ریشه های تحصیلی

SSM ها در مقابل ترانسفورماتورها

دغدغه های اخلاقی

کسب و کار نوپا

کاهش حضور در لیگ حرفه‌ای عربستان نگرانی‌هایی را درباره جام جهانی فوتبال 2034 ایجاد کرده است که فیل‌های سفید را پشت سر می‌گذارد | اخبار فوتبال

Twelve Labs در حال ساخت هوش مصنوعی است که می تواند ویدیوها را تجزیه و تحلیل و جستجو کند

دیدگاهتان را بنویسید لغو پاسخ