کار آفرینی و استارتاپ

LanceDB، که Midjourney را به عنوان یک مشتری به حساب می آورد، در حال ساخت پایگاه داده برای هوش مصنوعی چندوجهی است.


چانگ شی، که قبلا معاون مهندسی در Tubi و یک کهنه سرباز کلودرا بود، سال ها تجربه ساخت ابزار و زیرساخت داده را دارد. اما زمانی که She شروع به کار در فضای هوش مصنوعی کرد، به سرعت با مشکلات زیرساخت داده سنتی مواجه شد – مشکلاتی که او را از ارائه مدل‌های هوش مصنوعی به تولید باز داشت.

او در مصاحبه‌ای با TechCrunch گفت: «مهندسین یادگیری ماشین و محققان هوش مصنوعی اغلب در تجربه‌ای از توسعه پایین‌تر گیر افتاده‌اند. شرکت‌های زیرساخت داده واقعاً مشکل داده‌های یادگیری ماشین را در سطح اساسی درک نمی‌کنند.

بنابراین چانگ – که یکی از خالقان پانداها، کتابخانه بسیار محبوب علوم داده پایتون است – با مهندس نرم افزار لی زو همکاری کرد تا راه اندازی شود. LanceDB.

LanceDB در حال ساخت نرم‌افزار منبع باز پایگاه داده LanceDB است که برای پشتیبانی از مدل‌های هوش مصنوعی چندوجهی طراحی شده است – مدل‌هایی که علاوه بر متن، تصاویر، ویدیوها و موارد دیگر را آموزش می‌دهند و تولید می‌کنند. با حمایت Y Combinator، LanceDB در این ماه 8 میلیون دلار در دور سرمایه گذاری اولیه به رهبری CRV، Essence VC و Swift Ventures جمع آوری کرد و مجموع جمع آوری خود را به 11 میلیون دلار رساند.

چانگ گفت: «اگر هوش مصنوعی چندوجهی برای موفقیت آینده شرکت شما حیاتی است، می‌خواهید تیم هوش مصنوعی بسیار گران قیمت شما بر روی مدل تمرکز کند و هوش مصنوعی را با ارزش تجاری پیوند دهد. متأسفانه، امروزه تیم‌های هوش مصنوعی بیشتر وقت خود را صرف پرداختن به جزئیات زیرساخت داده سطح پایین می‌کنند. LanceDB پایه و اساس مورد نیاز تیم‌های هوش مصنوعی را فراهم می‌کند تا بتوانند آزادانه روی آنچه واقعاً برای ارزش سازمانی اهمیت دارد تمرکز کنند و محصولات هوش مصنوعی را بسیار سریع‌تر از آنچه در غیر این صورت ممکن است به بازار عرضه کنند.

LanceDB اساساً یک پایگاه داده برداری است – پایگاه داده ای حاوی مجموعه ای از اعداد («بردارها») که معنای داده های بدون ساختار (مانند تصاویر، متن و غیره) را رمزگذاری می کند.

همانطور که همکار من پل ساورز اخیراً نوشت، پایگاه های داده برداری لحظه ای را می گذرانند که چرخه هیپ هوش مصنوعی به اوج خود می رسد. دلیل آن این است که آنها برای همه انواع برنامه های هوش مصنوعی، از توصیه های محتوا در تجارت الکترونیک و پلت فرم های رسانه های اجتماعی گرفته تا کاهش توهم مفید هستند.

رقابت پایگاه داده برداری شدید است – برای نام بردن از چند فروشنده (بدون احتساب صاحبان فناوری بزرگ) به Qdrant، Vespa، Weaviate، Pinecone و Chroma مراجعه کنید. بنابراین چه چیزی LanceDB را منحصر به فرد می کند؟ به گفته چانگ، انعطاف‌پذیری، عملکرد و مقیاس‌پذیری بهتر.

چانگ می‌گوید برای یکی، LanceDB – که در بالای آن ساخته شده است پیکان آپاچی – توسط یک قالب داده سفارشی، Lance Format، که برای آموزش و تجزیه و تحلیل هوش مصنوعی چندوجهی بهینه شده است، پشتیبانی می شود. Lance Format به LanceDB امکان می دهد تا میلیاردها بردار و پتابایت متن، تصویر و ویدئو را مدیریت کند و به مهندسان اجازه می دهد تا اشکال مختلف ابرداده مرتبط با آن داده را مدیریت کنند.

چانگ گفت: «تا به حال، هرگز سیستمی وجود نداشته است که بتواند آموزش، اکتشاف، جستجو و پردازش داده در مقیاس بزرگ را متحد کند. فرمت Lance به محققان و مهندسان هوش مصنوعی این امکان را می دهد که یک منبع حقیقت داشته باشند و عملکردی سریع در سراسر خط لوله هوش مصنوعی خود داشته باشند. این فقط در مورد ذخیره بردارها نیست.

LanceDB با فروش نسخه های کاملاً مدیریت شده نرم افزار منبع باز خود با ویژگی های اضافه شده مانند شتاب سخت افزاری و کنترل های حاکمیتی درآمد کسب می کند – و به نظر می رسد تجارت قوی پیش می رود. فهرست مشتریان این شرکت شامل پلتفرم تبدیل متن به تصویر Midjourney، ربات چت تک شاخ Character.ai، استارتاپ خودروی خودران WeRide و Airtable است.

چانگ اصرار داشت که پشتیبانی اخیر LanceDB از VC توجه آن را از پروژه منبع باز منحرف نخواهد کرد، هرچند که به گفته او اکنون حدود 600000 دانلود در ماه مشاهده می شود.

او گفت: “ما می خواستیم چیزی ایجاد کنیم که کار تیم های هوش مصنوعی را 10 برابر آسان تر کند که با داده های چندوجهی در مقیاس بزرگ کار می کنند.” LanceDB مجموعه ای بسیار غنی از ادغام های اکوسیستم را برای به حداقل رساندن تلاش های پذیرش ارائه می دهد – و به ارائه ادامه خواهد داد.

ما در حال راه اندازی یک خبرنامه هوش مصنوعی هستیم! ثبت نام اینجا برای شروع دریافت آن در صندوق ورودی خود از 5 ژوئن.



منبع

دیدگاهتان را بنویسید

دکمه بازگشت به بالا