Predibase با یک پلتفرم کم کد برای ساخت مدل های هوش مصنوعی از مخفی کاری خارج می شود – TechCrunch

تیم های علم داده به دلیل بی نظمی در شرکت های خود، بر تلاش ها برای استقرار به موقع پروژه های هوش مصنوعی و تجزیه و تحلیل تأثیر می گذارد. در اخیر نظر سنجی از «مدیران دادهها» در شرکتهای مستقر در ایالات متحده، 44 درصد گفتند که به اندازه کافی استخدام نکردهاند، برای مؤثر بودن آنقدر کنار گذاشته شدهاند و نقشهای روشنی به آنها داده نشده است. پاسخ دهندگان گفتند که آنها بیشترین نگرانی را در مورد تأثیر از دست دادن درآمد یا ضربه به شهرت برند ناشی از شکست سیستم های هوش مصنوعی و گرایش به سمت سرمایه گذاری های پرشور با بازده کوتاه مدت داشتند.
اینها در نهایت چالش های سازمانی هستند. اما پیرو مولینو، یکی از بنیانگذاران پلتفرم توسعه هوش مصنوعی پیشپایه، می گوید که ابزار ناکافی اغلب آنها را تشدید می کند.
چالشهای عمدهای که امروزه در صنعت میبینیم این است که پروژههای یادگیری ماشینی معمولاً دارای ارزش زمان طولانی و دسترسی بسیار کم به سراسر یک سازمان هستند. مولینو از طریق ایمیل به TechCrunch گفت، در نتیجه، اکثر وظایف یادگیری ماشین در یک سازمان در یک تیم متمرکز علم داده که بیش از حد اشتراک دارند، با تنگنا مواجه میشوند. با توجه به این چالشها، امروزه سازمانها باید بین دو رویکرد ناقص در توسعه یادگیری ماشین یکی را انتخاب کنند. آنها میتوانند سیستمهای خود را از داده تا استقرار با استفاده از APIهای سطح پایین بسازند که به آنها انعطافپذیری را میدهد که معمولاً وظایف یادگیری ماشینی به بهای پیچیدگی نیاز دارند. یا میتوانند از یک راهحل جعبه سیاه «AutoML» استفاده کنند که مشکل آنها را به قیمت انعطافپذیری و کنترل سادهتر میکند.»
در واقع، در حالی که هزینه های جهانی برای فناوری های هوش مصنوعی بود تخمین زده طبق یک Alegion، تقریباً 80 درصد از شرکتها با 35.8 میلیارد دلار در سال 2019، شاهد توقف پروژههای هوش مصنوعی خود در نتیجه مشکلات کیفیت دادهها و عدم اعتماد به سیستمهای هوش مصنوعی بودهاند. گزارش. مولینو که یک کارآفرین (و یک فروشنده) است، ادعا می کند که محصول او، Predibase، راه حلی برای این است – یا حداقل گامی به سوی یک راه حل.
Predibase که امروز از مخفی کاری با سرمایه 16.25 میلیون دلاری در سری A به رهبری Greylock با مشارکت Factory و سرمایه گذاران فرشته بیرون آمد، به کاربر این امکان را می دهد که یک سیستم هوش مصنوعی را به عنوان فایلی که به پلتفرم می گوید کاربر چه می خواهد (مثلاً تشخیص اشیاء) مشخص کند. در یک تصویر) و راهی برای رفع آن نیاز پیدا می کند. مولینو آن را به عنوان یک رویکرد “اعلامی” برای توسعه هوش مصنوعی توصیف می کند، و اصطلاحی را از علوم کامپیوتر به عاریت گرفته است که به کد نوشته شده برای توصیف آنچه که یک توسعه دهنده می خواهد انجام دهد اشاره دارد.
پروژههای یادگیری ماشینی امروزه در اکثر سازمانهایی که با آنها کار کردهایم معمولاً شش ماه تا یک سال طول میکشد. ما می خواهیم آن را به شدت کاهش دهیم [by bringing] مولینو ادامه داد: یک ابزار یادگیری ماشینی کمکد اما با سقف بالا برای سازمانها. «به طور معمول، اکثر شرکتها با منابع علم داده در تنگنا هستند، به این معنی که تیمهای محصول و تحلیلگر توسط منابع کمیاب و گران قیمت مسدود میشوند. با Predibase، مهندسان و تحلیلگران را دیدهایم که مستقیماً مدلها را میسازند و عملیاتی میکنند.»
Predibase بر روی فناوریهای منبع باز از جمله Horovod، چارچوبی برای آموزش مدلهای هوش مصنوعی، و Ludwig، مجموعهای از ابزارهای یادگیری ماشین ساخته شده است. هر دو در ابتدا در Uber توسعه یافتند، که چندین سال پیش مدیریت پروژه ها را به Uber تغییر داد بنیاد لینوکس.
مولینو که از طریق خرید استارتاپ Geometric Intelligence به اوبر پیوست، در سال 2019 به ایجاد لودویگ کمک کرد. تراویس آدایر، یکی دیگر از بنیانگذاران Predibase، سرپرست اصلی Horovod بود در حالی که به عنوان مهندس نرم افزار ارشد در Uber کار می کرد.
برای راهاندازی Predibase، Molino و Addair با مدیر محصول سابق Google Cloud AI Devvret Rishi و استاد علوم کامپیوتر استنفورد، Chris Ré، یکی از بنیانگذاران Lattice.io، یک شرکت دادهکاوی و یادگیری ماشین که اپل در سال 2017 خریداری کرد، همکاری کردند.
Predibase به گونه ای طراحی شده است که توسعه دهندگان را قادر می سازد خطوط لوله هوش مصنوعی را تنها در چند خط کد تعریف کنند در حالی که مقیاس داده ها را تا پتابایت در هزاران ماشین افزایش می دهند. همانطور که Molino توضیح می دهد، با استفاده از این پلتفرم، کاربر می تواند یک سیستم هوش مصنوعی تجزیه و تحلیل متن را در شش خط کد ایجاد کند که داده های ورودی و خروجی را مشخص می کند. اگر بخواهند آن سیستم را تکرار و سفارشی کنند، Predibase به آنها اجازه می دهد پارامترهایی را در فایل پیکربندی اضافه کنند که سطح دقیق تری از کنترل را فراهم می کند.
Predibase برای آموزش مدل با منابع داده از جمله Snowflake، Google BigQuery و Amazon S3 ادغام می شود. کاربران میتوانند بسته به مورد استفاده، مدلها را از طریق پلتفرم یا به صورت برنامهنویسی آموزش دهند و سپس آن مدلها را میزبانی و سرویس دهند یا در محیطهای تولید محلی مستقر کنند.
علاوه بر کاهش زمان به ارزش، Predibase به کاربران این امکان را میدهد تا با استفاده از یک مجموعه ابزار با روشهای مختلف داده کار کنند. با Predibase، شاهدیم که کاربران مدلهایی را بر روی تصاویر برای طبقهبندی، دادههای متنی مانند ایمیلها برای تریاژ، دادههای جدولی برای شناسایی و رگرسیون وظایف، و حتی مجموعه دادههای صوتی که نیاز به پیچیدگی داخلی سنگینی بدون قابلیتهای بومی دارند، آموزش میدهند. مولینو گفت: پلتفرم. برای بسیاری از افرادی که در این فضا کار میکنند، Predibase قابلیت جدیدی را در هنگام رسیدگی به موارد استفاده در دادههای بدون ساختار فراهم میکند.
به طور کلی، پلتفرمهای توسعه بدون کد در دسترس هستند بالا آمدنو تعدادی از استارتآپها مستقیماً با Predibase رقابت میکنند، از جمله استارتآپ هماهنگسازی هوش مصنوعی Union.ai و پلتفرم مهندسی داده کمکد Prophecy (غیر از ذکر SageMaker و Vertex AI). اما دیدگاه مولینو این است که در حالی که رقبا تقاضای شرکت را برای راهحلهای ساده برآورده میکنند، اما این کار را به قیمت انعطافپذیری انجام میدهند و مشتریان را به سمت «سقف زدن و فرار کردن» سوق میدهد.
“[L]مانند زیرساخت بهعنوان فناوری اطلاعات سادهشده کد، پلتفرم ما به کاربران اجازه میدهد تا به جای «چگونه» روی «چه چیزی» مدلهای خود تمرکز کنند و به آنها اجازه میدهد با استفاده از یک پیکربندی توسعهیافته، از محدودیتهای معمول سیستمهای کمکد رهایی یابند… ما مدل ارائه میکنیم. قابلیت توضیح خارج از جعبه، بنابراین کاربران میتوانند بفهمند کدام ویژگیها باعث پیشبینیها میشوند.» “[Our platform] در 500 شرکت فورچون مانند یک شرکت فناوری پیشرو ایالات متحده، یک بانک ملی بزرگ و شرکت بزرگ مراقبت های بهداشتی ایالات متحده استفاده شده است.
زمین به اندازه کافی فرشتگانی مانند آنتونی گلدبلوم، مدیر عامل Kaggle و Remi El-Ouazzane، مدیر عامل سابق هوش مصنوعی اینتل را تحت تاثیر قرار داد، که هر دو سرمایه گذاری کردند. سایر حامیان برجسته عبارتند از بن همنر مدیر ارشد فناوری Kaggle و زوبین قهرمانی، استاد مهندسی اطلاعات در کمبریج و دانشمند تحقیقاتی ارشد در Google Brain.
مولینو میگوید که سرمایه تازه از سری A برای عرضه محصول بتا Predibase به بازار گستردهتری استفاده خواهد شد – در حال حاضر فقط دعوتنامه است. همچنین در جهت رشد تیم مهندسین یادگیری ماشین Predibase و ایجاد یک سازمان به بازار عرضه میشود و تیم 21 نفره شرکت را گسترش میدهد.