کمک به ماشین آلات در درک محتوای بصری با AI | اخبار MIT

داده ها باید هر تصمیمی را که یک تجارت مدرن اتخاذ می کند ، هدایت کند. اما بیشتر مشاغل دارای یک نقطه کور عظیم هستند: آنها نمی دانند در داده های بصری آنها چه اتفاقی می افتد.
Coactive در تلاش است تا آن را تغییر دهد. این شرکت که توسط کودی کالمن ’13 ، منگ ’15 و ویلیام گاویریا روژاس تأسیس شده است ’13 ، یک پلتفرم با هوش مصنوعی ایجاد کرده است که می تواند داده هایی مانند تصاویر ، صدا و فیلم را برای باز کردن بینش جدید ایجاد کند.
پلتفرم Coactive می تواند فوراً محتوای بصری بدون ساختار را جستجو ، سازماندهی و تجزیه و تحلیل کند تا به مشاغل کمک کند تا سریعتر و تصمیمات بهتری بگیرند.
کلمن با اشاره به داده های جداول و صفحات گسترده می گوید: “در اولین انقلاب داده بزرگ ، مشاغل بهتر از داده های ساختاری خود ارزش کسب کردند.” “اما اکنون ، تقریباً 80 تا 90 درصد از داده های جهان بدون ساختار است. در فصل بعدی داده های بزرگ ، شرکت ها مجبورند داده هایی مانند تصاویر ، فیلم و صدا را در مقیاس پردازش کنند و هوش مصنوعی یک قطعه مهم از باز کردن این توانایی است.”
Coactive در حال حاضر با چندین رسانه بزرگ و خرده فروشی همکاری می کند تا به آنها کمک کند تا محتوای بصری خود را بدون تکیه بر مرتب سازی و برچسب زدن دستی ، درک کنند. این به آنها کمک می کند تا محتوای مناسب را برای کاربران سریعتر دریافت کنند ، محتوای صریح را از سیستم عامل های خود حذف کنند و کشف کنند که چگونه محتوای خاص بر رفتار کاربر تأثیر می گذارد.
به طور گسترده تر ، بنیانگذاران معتقدند Coactive به عنوان نمونه ای از چگونگی توانمندسازی هوش مصنوعی انسان ها برای کارآمدتر و حل مشکلات جدید ، خدمت می کند.
کلمن می گوید: “کلمه coactive به معنای همزمان با هم همکاری می کند ، و این چشم انداز عالی ما است: کمک به انسان و ماشین آلات با هم کار می کنند.” “ما معتقدیم که بینایی اکنون از همیشه مهمتر است زیرا هوش مصنوعی می تواند ما را از هم جدا کند یا ما را جمع کند.
چشم انداز رایانه
کلمن در تابستان قبل از اولین سال برنامه MIT interphase Edge در تابستان با گاویریا روژاس ملاقات کرد. هر دو در رشته مهندسی برق و علوم کامپیوتر به رشته اصلی می روند و در زمینه آوردن کار می کنند MIT OpenCourseware محتوای دانشگاه های مکزیک ، از جمله پروژه های دیگر.
کلمن از پروژه OpenCourseWare به یاد می آورد: “این یک نمونه عالی از کارآفرینی بود.” وی گفت: “این واقعاً توانمند بود که مسئولیت تجارت و توسعه نرم افزار را بر عهده داشته باشم. این باعث شد که من پس از آن مشاغل کوچک توسعه وب خود را شروع کنم و از آن استفاده کنم. [the MIT course] سفر بنیانگذار. “
کلمن برای اولین بار در هنگام کار به عنوان یک محقق فارغ التحصیل با دفتر یادگیری دیجیتال (اکنون MIT Learning Open Learning) ، قدرت AI را در MIT کاوش کرد ، جایی که او از یادگیری ماشین برای مطالعه نحوه یادگیری انسان در MITX استفاده کرد ، که میزبان دوره های گسترده و آزاد آنلاین است که توسط دانشکده های MIT و مربیان ایجاد شده است.
کلمن درباره MITX می گوید: “برای من واقعاً شگفت انگیز بود که شما می توانید این سفر تحول گرا را که من در MIT با یادگیری دیجیتال طی کردم دموکراتیک کنید – و این که شما می توانید از AI و Machine Learning استفاده کنید تا سیستم های تطبیقی ایجاد کنید که نه تنها به ما کمک کند تا درک کنیم که چگونه انسان ها یاد می گیرند ، بلکه تجربیات یادگیری شخصی تر را نیز به افراد سراسر جهان ارائه می دهند.” “این همچنین اولین باری بود که مجبور شدم محتوای ویدیویی را کشف کنم و هوش مصنوعی را برای آن اعمال کنم.”
پس از MIT ، کلمن برای دکترای خود به دانشگاه استنفورد رفت ، جایی که در کاهش موانع استفاده از هوش مصنوعی کار کرد. این تحقیق باعث شد که وی با شرکت هایی مانند Pinterest و Meta در AI و برنامه های یادگیری ماشین کار کند.
کلمن به یاد می آورد: “این جایی است که من توانستم در گوشه و کنار آنچه مردم می خواستند با هوش مصنوعی و محتوای آنها انجام دهند ، ببینم.” “من می دیدم که شرکت های پیشرو چگونه از هوش مصنوعی برای هدایت ارزش تجاری استفاده می کنند ، و این همان جایی است که جرقه اولیه برای Coactive از آنجا به وجود آمده است.
در همین حال ، گاویریا روژاس در سال 2020 به منطقه خلیج نقل مکان کرد و شروع به کار کرد یک دانشمند داده در eBay. به عنوان بخشی از این حرکت ، او به حمل و نقل نیمکت خود به کمک نیاز داشت و کلمن دوست خوش شانس او بود.
گاویریا روژاس می گوید: “در اتومبیل سواری ، فهمیدیم که هر دو شاهد انفجار در اطراف داده ها و هوش مصنوعی هستیم.” “در MIT ، ما یک صندلی ردیف جلو به Big Data Revolution گرفتیم ، و ما دیدیم که مردم در حال اختراع فن آوری برای باز کردن ارزش از آن داده ها در مقیاس هستند. کودی و من فهمیدیم که ما یک پودر پودر دیگری داریم که با شرکت های جمع آوری داده ها منفجر می شود ، اما این بار داده های چند مدلی مانند تصاویر ، فیلم ، صوتی و متن بود.
سکویی که بنیانگذاران برای ساخت آن به کار بردند – آنچه کلمن به عنوان “سیستم عامل هوش مصنوعی” توصیف می کند – مدل Agnostic است ، به این معنی که این شرکت می تواند سیستم های AI را در زیر کاپوت تعویض کند زیرا مدل ها همچنان در حال پیشرفت هستند. پلتفرم Coactive شامل برنامه های از پیش ساخته است که مشتریان تجاری می توانند از آنها برای انجام کارهایی مانند جستجو از طریق محتوای خود ، تولید ابرداده و انجام تجزیه و تحلیل برای استخراج بینش استفاده کنند.
کلمن می گوید: “قبل از هوش مصنوعی ، رایانه ها جهان را از طریق بایت می دیدند ، در حالی که انسان ها جهان را از طریق دید می دیدند.” “اکنون با هوش مصنوعی ، ماشین آلات می توانند جهان را مانند ما ببینند ، و این باعث می شود دنیای دیجیتالی و فیزیکی تار شود.”
بهبود رابط انسان و رایانه
بانک اطلاعاتی تصاویر رویترز ، روزنامه نگاران جهان را با میلیون ها عکس تهیه می کند. قبل از Coactive ، این شرکت به خبرنگاران متکی بود که با هر عکس به صورت دستی برچسب ها را وارد می کردند تا وقتی روزنامه نگاران در جستجوی موضوعات خاصی بودند ، تصاویر مناسب ظاهر شود.
کلمن می گوید: “عبور از این دارایی های خام بسیار باورنکردنی و گران بود ، بنابراین مردم فقط برچسب ها را اضافه نکردند.” “این بدان معناست که وقتی به دنبال چیزها هستید ، حتی اگر عکسهای مربوطه در پایگاه داده باشند ، نتایج محدودی نیز وجود داشت.”
اکنون ، هنگامی که روزنامه نگاران در وب سایت رویترز “فعال کردن جستجوی AI” را انتخاب می کنند ، Coactive می تواند محتوای مربوطه را بر اساس درک سیستم هوش مصنوعی خود از جزئیات در هر تصویر و فیلم ، جمع کند.
کلمن می گوید: “این باعث افزایش کیفیت نتایج برای خبرنگاران می شود ، که آنها را قادر می سازد داستانهای بهتر و دقیق تری را از گذشته بگویند.”
رویترز تنها در تلاش برای مدیریت تمام محتوای خود نیست. مدیریت دارایی دیجیتال یک مؤلفه عظیم بسیاری از رسانه های رسانه ای و خرده فروشی است که امروزه اغلب برای مرتب سازی و جستجوی آن از طریق آن محتوا به ابرداده دستی متکی هستند.
یکی دیگر از مشتری های Coactive تصادفی است که یکی از بزرگترین سیستم عامل های جهان برای اطلاعات در مورد برنامه های تلویزیونی ، بازی های ویدئویی و فیلم هایی با بیش از 300 میلیون کاربر فعال ماهانه است. Fandom از Coactive برای درک داده های بصری در جوامع آنلاین خود استفاده می کند و به حذف بیش از حد و محتوای جنسی کمک می کند.
کلمن می گوید: “این کار 24 تا 48 ساعت طول می کشد تا تصادفی هر قطعه جدید را مرور کند.” “اکنون با Coactive ، آنها دستورالعمل های جامعه خود را رمزگذاری کرده اند و می توانند اطلاعات دانه ریز تری را به طور متوسط در حدود 500 میلی ثانیه تولید کنند.”
با هر مورد استفاده ، بنیانگذاران Coactive را به عنوان یک الگوی جدید در نحوه کار انسان با ماشین ها فعال می کنند.
کلمن می گوید: “در طول تاریخ تعامل انسان و رایانه ، ما مجبور شدیم از صفحه کلید و ماوس خم شویم تا اطلاعات را به گونه ای وارد کنیم که ماشین ها بتوانند آن را درک کنند.” “اکنون ، برای اولین بار ، ما فقط می توانیم به طور طبیعی صحبت کنیم ، می توانیم تصاویر و فیلم را با هوش مصنوعی به اشتراک بگذاریم ، و می تواند آن محتوا را درک کند. این یک تغییر اساسی در نحوه فکر کردن در مورد تعامل انسان و رایانه است. چشم انداز اصلی COACTION به دلیل آن تغییر است ، ما به یک سیستم عامل جدید و یک روش جدید برای کار با محتوا و هوش مصنوعی نیاز داریم.”