کار آفرینی و استارتاپ

کمک به ذخیره سازی داده ها با انقلاب AI | اخبار MIT



هوش مصنوعی در حال تغییر نحوه ذخیره و دسترسی به داده های مشاغل است. دلیل این امر این است که سیستم های ذخیره سازی داده های سنتی برای اداره دستورات ساده از تعداد انگشت شماری از کاربران به طور همزمان طراحی شده اند ، در حالی که امروزه ، سیستم های هوش مصنوعی با میلیون ها عامل باید به طور مداوم به طور مداوم دسترسی داشته و پردازش کنند. سیستم های ذخیره سازی داده های سنتی اکنون دارای لایه هایی از پیچیدگی هستند که سیستم های AI را کند می کند زیرا داده ها باید قبل از رسیدن به واحدهای پردازش گرافیکی (GPU) که سلول های مغزی AI هستند ، از طریق ردیف های مختلف عبور کنند.

Cloudian ، که توسط مایکل Tso ’93 ، SM ’93 و Hiroshi Ohta تأسیس شده است ، در حال کمک به ذخیره سازی با انقلاب هوش مصنوعی است. این شرکت یک سیستم ذخیره سازی مقیاس پذیر برای مشاغل ایجاد کرده است که به داده ها کمک می کند تا یکپارچه بین مدل های ذخیره سازی و AI جریان یابد. این سیستم با استفاده از محاسبات موازی در ذخیره سازی داده ها ، تثبیت توابع AI و داده ها بر روی یک پلت فرم پردازش موازی واحد که مجموعه داده های مقیاس پذیر را ذخیره می کند ، بازیابی می کند و با انتقال مستقیم و با سرعت بالا بین ذخیره و GPU و CPU ها ، بازیابی می شود ، پیچیدگی را کاهش می دهد.

بستر یکپارچه سازی یکپارچه سازی Cloudian ، روند ساخت ابزارهای هوش مصنوعی در مقیاس تجاری را ساده می کند و یک پایه ذخیره سازی به مشاغل می دهد که می تواند با افزایش هوش مصنوعی همراه باشد.

TSO می گوید: “یكی از مواردی كه مردم در مورد هوش مصنوعی از دست می دهند این است كه همه چیز در مورد داده ها است.” “شما نمی توانید 10 درصد از عملکرد هوش مصنوعی با 10 درصد داده های بیشتر یا حتی 10 برابر داده بیشتر به دست بیاورید – به 1000 برابر داده بیشتر نیاز دارید. قادر به ذخیره آن داده ها به شکلی آسان است که مدیریت آن آسان باشد ، و به گونه ای که می توانید محاسبات را در آن تعبیه کنید ، بنابراین می توانید عملیات را اجرا کنید در حالی که داده ها بدون انتقال داده ها وارد می شوند – این جایی است که این صنعت می رود.”

از MIT تا صنعت

به عنوان یک کارشناسی ارشد در MIT در دهه 1990 ، TSO توسط پروفسور ویلیام دالی به محاسبات موازی معرفی شد – نوعی محاسبات که در آن بسیاری از محاسبات به طور همزمان اتفاق می افتد. TSO همچنین در محاسبات موازی با استادیار گرگ پاپادوپولوس کار کرد.

TSO به یاد می آورد: “این زمان باورنکردنی بود زیرا بیشتر مدارس یک پروژه فوق العاده محاسباتی در حال انجام بودند-MIT چهار نفر داشت.”

به عنوان یک دانشجوی فارغ التحصیل ، TSO با دانشمند تحقیقات ارشد MIT ، دیوید کلارک ، پیشگام محاسباتی که در معماری اولیه اینترنت ، به ویژه پروتکل کنترل انتقال (TCP) که داده های بین سیستم ها را ارائه می دهد ، همکاری کرد.

TSO می گوید: “من به عنوان یک دانشجوی فارغ التحصیل در MIT ، من در عملیات شبکه های جدا شده و متناوب برای سیستم های توزیع شده در مقیاس بزرگ کار کردم.” “این خنده دار است – 30 سال به بعد ، این همان کاری است که امروز هنوز هم انجام می دهم.”

پس از فارغ التحصیلی ، TSO در آزمایشگاه معماری اینتل کار کرد ، جایی که او الگوریتم های همگام سازی داده را که توسط BlackBerry استفاده شده است اختراع کرد. او همچنین مشخصاتی را برای نوکیا ایجاد کرد که صنعت بارگیری آهنگ زنگ را مشتعل کرد. وی سپس به اینكتومی ، یك راه اندازی كه توسط Eric Brewer SM ’92 ، Phd ’94 تأسیس شد ، پیوست كه پیشگام فن آوری های جستجو و توزیع محتوای وب بود.

در سال 2001 ، TSO فن آوری های موبایل Gemini را با جوزف نورتون ’93 ، SM ’93 و دیگران آغاز کرد. این شرکت به ساخت بزرگترین سیستم های پیام رسانی موبایل در جهان برای رسیدگی به رشد گسترده داده های تلفن های دوربین رفت. سپس ، در اواخر دهه 2000 ، Cloud Computing راهی قدرتمند برای مشاغل برای اجاره سرورهای مجازی در هنگام رشد عملیات خود شد. TSO متوجه شد که میزان داده های جمع آوری شده بسیار سریعتر از سرعت شبکه در حال رشد است ، بنابراین وی تصمیم گرفت که این شرکت را محوری کند.

TSO توضیح می دهد: “داده ها در بسیاری از مکان های مختلف ایجاد می شوند و این داده ها گرانش خاص خود را دارند: این هزینه برای شما هزینه و زمان را برای جابجایی آن هزینه خواهد کرد.” “این بدان معناست که حالت نهایی ابر توزیع شده است که به دستگاه ها و سرورها لبه می رسد. شما باید ابر را به داده ها بیاورید ، نه داده ها به ابر.”

TSO با تأکید جدیدی بر کمک به مشتریان با ذخیره سازی داده های مقیاس پذیر ، توزیع شده و سازگار با ابر ، به طور رسمی Cloudian را از فناوری های موبایل Gemini Mobile در سال 2012 راه اندازی کرد.

TSO می گوید: “آنچه ما هنگام اولین بار این شرکت را شروع نکردیم ، این بود که AI قرار است مورد استفاده نهایی برای داده های موجود در لبه باشد.”

اگرچه تحقیقات TSO در MIT از بیش از دو دهه قبل آغاز شد ، اما او بین آنچه که او روی آن کار کرده و امروز در صنعت کار کرده است ، ارتباطات محکمی را مشاهده می کند.

TSO می گوید: “این مانند تمام زندگی من بازی می کند زیرا من و دیوید کلارک با شبکه های قطع شده و متناوب و متناوب برخورد می کردیم ، که امروز بخشی از پرونده استفاده از لبه است و پروفسور دالی روی اتصالات بسیار سریع و مقیاس پذیر کار می کرد. “اکنون ، هنگامی که شما به معماری مدرن تراشه Nvidia و نحوه انجام ارتباطات متقابل نگاه می کنید ، این کار دالی را در همه چیز انجام می دهد. با استاد پاپادوپولوس ، من روی نرم افزار شتاب برنامه کاربردی با سخت افزار محاسباتی موازی کار کردم بدون اینکه بخواهیم برنامه ها را بازنویسی کنم ، و این دقیقاً همان مشکلی است که ما سعی می کنیم با Nvidia حل کنیم.

امروزه پلت فرم Cloudian از یک معماری ذخیره سازی شی استفاده می کند که در آن انواع داده ها – مجموعه ها ، فیلم ها ، داده های سنسور – به عنوان یک شیء منحصر به فرد با ابرداده ذخیره می شوند. ذخیره سازی شیء می تواند مجموعه داده های عظیم را در یک ساختار فایل مسطح مدیریت کند ، و آن را برای داده های بدون ساختار و سیستم های هوش مصنوعی ایده آل می کند ، اما به طور سنتی نتوانسته است داده ها را مستقیماً به مدل های هوش مصنوعی ارسال کند بدون اینکه داده ها ابتدا در سیستم حافظه رایانه کپی شوند و باعث ایجاد تأخیر و تنگناهای انرژی برای مشاغل می شوند.

در ماه ژوئیه ، Cloudian اعلام کرد که سیستم ذخیره سازی شیء خود را با یک پایگاه داده بردار گسترش داده است که داده ها را به شکلی ذخیره می کند که بلافاصله توسط مدل های AI قابل استفاده است. با استفاده از داده ها ، Cloudian در زمان واقعی ، شکل بردار آن داده ها را به ابزارهای AI قدرت مانند موتورهای توصیه کننده ، جستجو و دستیاران هوش مصنوعی محاسبه می کند. Cloudian همچنین از همکاری با NVIDIA خبر داد که به سیستم ذخیره سازی خود اجازه می دهد تا مستقیماً با GPU های شرکت هوش مصنوعی کار کند. Cloudian می گوید سیستم جدید حتی عملیات AI را سریعتر امکان پذیر می کند و هزینه های محاسبات را کاهش می دهد.

TSO می گوید: “Nvidia حدود یک سال و نیم پیش با ما تماس گرفت زیرا GPU ها فقط با داده هایی که آنها را مشغول نگه می دارد مفید هستند.” “اکنون که مردم متوجه می شوند انتقال هوش مصنوعی به داده ها ساده تر از آن است که مجموعه داده های عظیم را جابجا کنیم. سیستم های ذخیره سازی ما بسیاری از کارکردهای هوش مصنوعی را تعبیه کرده اند ، بنابراین ما می توانیم داده های قبل و بعد از فرآیند را برای هوش مصنوعی در جایی که داده ها را جمع آوری و ذخیره می کنیم.”

ذخیره اول

Cloudian به حدود 1000 شرکت در سراسر جهان کمک می کند تا از داده های خود ، از جمله تولید کنندگان بزرگ ، ارائه دهندگان خدمات مالی ، سازمان های مراقبت های بهداشتی و سازمان های دولتی ، ارزش بیشتری کسب کنند.

به عنوان مثال ، پلت فرم ذخیره سازی Cloudian به یک خودروساز بزرگ کمک می کند ، به عنوان مثال ، از هوش مصنوعی استفاده می کند تا مشخص شود که هر یک از ربات های تولیدی آن نیاز به سرویس دهی دارند. Cloudian همچنین در حال همکاری با کتابخانه ملی پزشکی برای ذخیره مقالات و ثبت اختراعات تحقیقاتی ، و بانک اطلاعاتی ملی سرطان برای ذخیره توالی های DNA تومورها – مجموعه داده های غنی که مدل های AI می توانند برای کمک به تحقیقات در توسعه درمان های جدید یا به دست آوردن بینش های جدید پردازش کنند.

TSO می گوید: “GPU ها یک فعال کننده باورنکردنی بوده اند.” “قانون مور میزان محاسبات هر دو سال است ، اما GPU ها قادر به موازی سازی عملیات بر روی تراشه ها هستند ، بنابراین می توانید GPU ها را با هم شبکه کنید و قانون مور را خرد کنید. این مقیاس در حال سوق دادن به سطوح جدید هوش است ، اما تنها راه برای کار کردن GPU ها سخت است تا آنها را با همان سرعتی که آنها را به دست می آورند ، از بین ببرید – و تنها راهی برای انجام این کار است.



منبع

دیدگاهتان را بنویسید

دکمه بازگشت به بالا