LanceDB، که Midjourney را به عنوان یک مشتری به حساب می آورد، در حال ساخت پایگاه داده برای هوش مصنوعی چندوجهی است.

چانگ شی، که قبلا معاون مهندسی در Tubi و یک کهنه سرباز کلودرا بود، سال ها تجربه ساخت ابزار و زیرساخت داده را دارد. اما زمانی که She شروع به کار در فضای هوش مصنوعی کرد، به سرعت با مشکلات زیرساخت داده سنتی مواجه شد – مشکلاتی که او را از ارائه مدلهای هوش مصنوعی به تولید باز داشت.
او در مصاحبهای با TechCrunch گفت: «مهندسین یادگیری ماشین و محققان هوش مصنوعی اغلب در تجربهای از توسعه پایینتر گیر افتادهاند. شرکتهای زیرساخت داده واقعاً مشکل دادههای یادگیری ماشین را در سطح اساسی درک نمیکنند.
بنابراین چانگ – که یکی از خالقان پانداها، کتابخانه بسیار محبوب علوم داده پایتون است – با مهندس نرم افزار لی زو همکاری کرد تا راه اندازی شود. LanceDB.
LanceDB در حال ساخت نرمافزار منبع باز پایگاه داده LanceDB است که برای پشتیبانی از مدلهای هوش مصنوعی چندوجهی طراحی شده است – مدلهایی که علاوه بر متن، تصاویر، ویدیوها و موارد دیگر را آموزش میدهند و تولید میکنند. با حمایت Y Combinator، LanceDB در این ماه 8 میلیون دلار در دور سرمایه گذاری اولیه به رهبری CRV، Essence VC و Swift Ventures جمع آوری کرد و مجموع جمع آوری خود را به 11 میلیون دلار رساند.
چانگ گفت: «اگر هوش مصنوعی چندوجهی برای موفقیت آینده شرکت شما حیاتی است، میخواهید تیم هوش مصنوعی بسیار گران قیمت شما بر روی مدل تمرکز کند و هوش مصنوعی را با ارزش تجاری پیوند دهد. متأسفانه، امروزه تیمهای هوش مصنوعی بیشتر وقت خود را صرف پرداختن به جزئیات زیرساخت داده سطح پایین میکنند. LanceDB پایه و اساس مورد نیاز تیمهای هوش مصنوعی را فراهم میکند تا بتوانند آزادانه روی آنچه واقعاً برای ارزش سازمانی اهمیت دارد تمرکز کنند و محصولات هوش مصنوعی را بسیار سریعتر از آنچه در غیر این صورت ممکن است به بازار عرضه کنند.
LanceDB اساساً یک پایگاه داده برداری است – پایگاه داده ای حاوی مجموعه ای از اعداد («بردارها») که معنای داده های بدون ساختار (مانند تصاویر، متن و غیره) را رمزگذاری می کند.
همانطور که همکار من پل ساورز اخیراً نوشت، پایگاه های داده برداری لحظه ای را می گذرانند که چرخه هیپ هوش مصنوعی به اوج خود می رسد. دلیل آن این است که آنها برای همه انواع برنامه های هوش مصنوعی، از توصیه های محتوا در تجارت الکترونیک و پلت فرم های رسانه های اجتماعی گرفته تا کاهش توهم مفید هستند.
رقابت پایگاه داده برداری شدید است – برای نام بردن از چند فروشنده (بدون احتساب صاحبان فناوری بزرگ) به Qdrant، Vespa، Weaviate، Pinecone و Chroma مراجعه کنید. بنابراین چه چیزی LanceDB را منحصر به فرد می کند؟ به گفته چانگ، انعطافپذیری، عملکرد و مقیاسپذیری بهتر.
چانگ میگوید برای یکی، LanceDB – که در بالای آن ساخته شده است پیکان آپاچی – توسط یک قالب داده سفارشی، Lance Format، که برای آموزش و تجزیه و تحلیل هوش مصنوعی چندوجهی بهینه شده است، پشتیبانی می شود. Lance Format به LanceDB امکان می دهد تا میلیاردها بردار و پتابایت متن، تصویر و ویدئو را مدیریت کند و به مهندسان اجازه می دهد تا اشکال مختلف ابرداده مرتبط با آن داده را مدیریت کنند.
چانگ گفت: «تا به حال، هرگز سیستمی وجود نداشته است که بتواند آموزش، اکتشاف، جستجو و پردازش داده در مقیاس بزرگ را متحد کند. فرمت Lance به محققان و مهندسان هوش مصنوعی این امکان را می دهد که یک منبع حقیقت داشته باشند و عملکردی سریع در سراسر خط لوله هوش مصنوعی خود داشته باشند. این فقط در مورد ذخیره بردارها نیست.
LanceDB با فروش نسخه های کاملاً مدیریت شده نرم افزار منبع باز خود با ویژگی های اضافه شده مانند شتاب سخت افزاری و کنترل های حاکمیتی درآمد کسب می کند – و به نظر می رسد تجارت قوی پیش می رود. فهرست مشتریان این شرکت شامل پلتفرم تبدیل متن به تصویر Midjourney، ربات چت تک شاخ Character.ai، استارتاپ خودروی خودران WeRide و Airtable است.
چانگ اصرار داشت که پشتیبانی اخیر LanceDB از VC توجه آن را از پروژه منبع باز منحرف نخواهد کرد، هرچند که به گفته او اکنون حدود 600000 دانلود در ماه مشاهده می شود.
او گفت: “ما می خواستیم چیزی ایجاد کنیم که کار تیم های هوش مصنوعی را 10 برابر آسان تر کند که با داده های چندوجهی در مقیاس بزرگ کار می کنند.” LanceDB مجموعه ای بسیار غنی از ادغام های اکوسیستم را برای به حداقل رساندن تلاش های پذیرش ارائه می دهد – و به ارائه ادامه خواهد داد.
ما در حال راه اندازی یک خبرنامه هوش مصنوعی هستیم! ثبت نام اینجا برای شروع دریافت آن در صندوق ورودی خود از 5 ژوئن.