SuperAnnotate به شرکت ها کمک می کند مجموعه داده های هوش مصنوعی خود را مدیریت کنند

داده های با کیفیت بالا ممکن است کلید هوش مصنوعی با کیفیت بالا باشد. با مطالعات یافتن این که تنظیم مجموعه داده، به جای اندازه، چیزی است که واقعاً بر عملکرد یک مدل هوش مصنوعی تأثیر می گذارد، جای تعجب نیست که تأکید فزاینده ای بر روی شیوه های مدیریت مجموعه داده وجود دارد. با توجه به برخی نظرسنجی هامحققان هوش مصنوعی امروزه بیشتر وقت خود را صرف آماده سازی داده ها و وظایف سازمانی می کنند.
برادران واهان پطروسیان و تیگران پطروسیان در حین آموزش الگوریتمها در کالج، رنج مدیریت دادههای زیادی را احساس کردند. وهان تا آنجا پیش رفت که در طول تحقیقات دکتری خود در زمینه تقسیم بندی تصویر، ابزاری برای مدیریت داده ایجاد کرد.
چند سال بعد، وهان متوجه شد که توسعهدهندگان – و حتی شرکتها – با خوشحالی هزینه ابزارهای مشابه را پرداخت میکنند. بنابراین برادران یک شرکت تأسیس کردند، Super Annotate، برای ساختن آن.
وهان در بیانیهای گفت: «در طول انفجار نوآوری در سال ۲۰۲۳ مدلهای پیرامونی و هوش مصنوعی چندوجهی، نیاز به مجموعه دادههای با کیفیت بالا شدیدتر شد، به طوری که هر سازمان دارای موارد استفاده چندگانه است که به دادههای تخصصی نیاز دارد.» ما فرصتی را دیدیم تا یک پلتفرم با استفاده آسان و با کد پایین، مانند یک چاقوی ارتش سوئیس برای دادههای آموزشی هوش مصنوعی مدرن بسازیم.»
SuperAnnotate، که مشتریان آن شامل Databricks و Canva هستند، به کاربران کمک می کند تا مجموعه داده های آموزشی بزرگ هوش مصنوعی را ایجاد و پیگیری کنند. این استارتآپ ابتدا بر روی نرمافزار برچسبگذاری متمرکز بود، اما اکنون ابزارهایی را برای تنظیم دقیق، تکرار و ارزیابی مجموعههای داده ارائه میکند.
با پلتفرم SuperAnnotate، کاربران میتوانند دادهها را از منابع محلی و فضای ابری به یکدیگر متصل کنند تا پروژههای دادهای ایجاد کنند تا بتوانند با هم تیمیها همکاری کنند. از روی داشبورد، کاربران میتوانند عملکرد مدلها را با دادههایی که برای آموزش آنها استفاده شده است، مقایسه کنند و پس از آماده شدن، آن مدلها را در محیطهای مختلف مستقر کنند.
SuperAnnotate همچنین دسترسی شرکت ها را به بازاری از کارگرانی که منبع آن جمعی هستند برای وظایف حاشیه نویسی داده ها فراهم می کند. حاشیه نویسی ها معمولاً تکه هایی از متن هستند که معنی یا قسمت هایی از داده ها را که مدل ها روی آنها آموزش می بینند برچسب گذاری می کنند و به عنوان راهنمای مدل ها عمل می کنند و به آنها «آموزش» تشخیص چیزها، مکان ها و ایده ها می دهند.
صادقانه بگویم، وجود دارد چندین هستند Reddit رشته ها در مورد رفتار SuperAnnotate با حاشیه نویس های داده ای که استفاده می کند، و آنها چاپلوس کننده نیستند. حاشیه نویسان از مشکلات ارتباطی، انتظارات نامشخص و دستمزد کم شکایت دارند.
به نوبه خود، SuperAnnotate ادعا میکند که نرخهای بازار منصفانه را پرداخت میکند و خواستههایش از حاشیهنویسها خارج از عرف صنعت نیست. ما از این شرکت خواستهایم اطلاعات دقیقتری درباره اقدامات خود ارائه دهد و در صورت شنیدن پاسخ، این قطعه را بهروزرسانی خواهیم کرد.
ویرایش: چند ساعت پس از انتشار این داستان، SuperAnnotate این بیانیه را از طریق ایمیل ارسال کرد: “حدود هشت ماه پیش، در یک دوره مقیاس بندی سریع، ما با چالش هایی در حفظ ارتباط واضح با برخی از حاشیه نویسان که روی پروژه هایمان کار می کردند، مواجه شدیم. همانطور که گاهی اوقات در طول رشد سریع اتفاق می افتد، چند شکاف فرآیندی ظاهر شد. ما این بازخورد را جدی گرفتیم و از آن زمان بهبودهایی در نحوه تعامل حاشیه نویس ها با پلتفرم و فرآیندهای ارتباطی ایجاد کرده ایم.
چندین رقیب در فضای مدیریت داده های هوش مصنوعی وجود دارد، از جمله استارتاپ هایی مانند Scale AI، Weka و Dataloop. SuperAnnotate مستقر در سانفرانسیسکو توانسته خود را حفظ کند، با این حال، اخیراً 36 میلیون دلار در دور سری B به رهبری Socium Ventures با مشارکت Nvidia، Databricks Ventures و Play Time Ventures جمع آوری کرده است.
سرمایه جدید، که مجموع جمع آوری شده SuperAnnotate را به بیش از 53 میلیون دلار می رساند، برای افزایش تیم فعلی حدود 100 نفر، برای تحقیق و توسعه محصول، و برای رشد پایگاه مشتریان SuperAnnotate از تقریباً 100 شرکت استفاده خواهد شد.
وهان گفت: «هدف ما ساختن پلتفرمی است که قادر به انطباق کامل با نیازهای در حال تحول شرکت ها و ارائه سفارشی سازی گسترده در تنظیم دقیق داده ها باشد.
TechCrunch یک خبرنامه متمرکز بر هوش مصنوعی دارد! اینجا ثبت نام کنید تا هر چهارشنبه آن را در صندوق پستی خود دریافت کنید.