Iterative MLEM را راهاندازی میکند، یک ابزار منبع باز برای سادهسازی استقرار مدل ML – TechCrunch

پلت فرم MLOps تکرار شونده، که تقریباً یک سال پیش یک دور سری A 20 میلیون دلاری را اعلام کرد، امروز MLEM را راه اندازی کرد، یک ابزار مدیریت و استقرار مدل یادگیری ماشین مبتنی بر Git منبع باز.
به گفته این شرکت، ایده در اینجا این است که با استفاده از رویکرد مبتنی بر git که توسعهدهندگان از قبل با آن آشنا هستند، شکاف بین مهندسان ML و تیمهای DevOps را پر کنیم. با استفاده از MLEM، توسعه دهندگان می توانند مدل های ML خود را در طول چرخه عمر خود ذخیره و پیگیری کنند. به این ترتیب، منبع باز Iterative را تکمیل می کند رجیستری مصنوعات GTO و دی وی سی، سیستم کنترل نسخه شرکت برای داده ها و مدل ها.
«داشتن یک رجیستری مدل یادگیری ماشینی به بخشی ضروری از پشته فناوری یادگیری ماشین تبدیل شده است. دیمیتری پتروف، یکی از بنیانگذاران و مدیرعامل Iterative، گفت: راه حل های کنونی SaaS می تواند منجر به واگرایی در چرخه عمر مدل های ML و برنامه های نرم افزاری شود. «رویکرد ما برای ثبت مدل ML ارائه بلوکهای ساختمانی مدولار است که سازمانها میتوانند به راحتی آنها را در پشته فناوری MLOps موجود خود ادغام کنند. MLEM برای استخراج متا اطلاعات برای مدلهای ML و سادهسازی استقرار استفاده میشود. DVC فایل های مدل ML بزرگ را در فضای ابری یا ذخیره سازی اولیه مدیریت می کند. GTO عملکرد GitOps را برای نسخهسازی مدلها در Git و ارسال سیگنال به سیستمهای CI/CD برای تولید مدل ارائه میکند. ابزارهای جداگانه یک فلسفه ماژولار و یونیکس را به مدیریت مدل ML و ModelOps می آورند.
اعتبار تصویر: تکرار شونده
همانطور که تیم اشاره می کند، سیستمی مانند این امکان به اشتراک گذاری آسان مدل ها را بین واحدهای تجاری و تیم ها فراهم می کند، در حالی که همکاری تیم های ML با تیم های DevOps خود را آسان تر می کند. برای صنایع بسیار تنظیم شده، سیستمی مانند این منبعی از حقیقت را نیز برای پی بردن به اصل و نسب یک مدل ارائه می دهد.
پتروف گفت: «رجیستریهای مدل، مدلهای ردیابی را که در چرخه عمر ML حرکت میکنند، با ذخیرهسازی و نسخهسازی مدلهای آموزشدیده ساده میکنند، اما سازمانهایی که این رجیستریها را میسازند، در نهایت با دو پشته فناوری متفاوت برای مدلهای یادگیری ماشین و توسعه نرمافزار مواجه میشوند». “MLEM بهعنوان بلوک ساختمانی برای ثبت مدلها، از ابزارهای Git و سنتی CI/CD استفاده میکند، تیمهای ML و نرمافزار را همتراز میکند تا بتوانند مدلها را سریعتر وارد تولید کنند.»
البته خود Iterative یک پلتفرم میزبان ارائه می دهد که همه این کارها را از طریق آن انجام می دهد استودیو تکراری سرویس برای همکاری در مدلهای ML و ردیابی آزمایشها و تجسمها، و همچنین رجیستری مدل میزبان آن.