Fairgen نتایج نظرسنجی را با استفاده از داده های مصنوعی و پاسخ های تولید شده توسط هوش مصنوعی افزایش می دهد

از زمان های بسیار قدیم از نظرسنجی ها برای به دست آوردن بینش در مورد جمعیت، محصولات و افکار عمومی استفاده شده است. و در حالی که روششناسی ممکن است در طول هزارهها تغییر کرده باشد، یک چیز ثابت مانده است: نیاز به مردم، افراد زیادی.
اما اگر نتوانید افراد کافی برای ایجاد یک گروه نمونه به اندازه کافی بزرگ برای ایجاد نتایج معنادار پیدا کنید، چه؟ یا، اگر به طور بالقوه میتوانید افراد کافی پیدا کنید، اما محدودیتهای بودجه، تعداد افرادی را که میتوانید منبع و مصاحبه کنید، محدود میکند، چه میشود؟
اینجاست که فیرگن می خواهد کمک کند این استارتآپ اسرائیلی امروز پلتفرمی را راهاندازی کرد که از «هوش مصنوعی آماری» برای تولید دادههای مصنوعی استفاده میکند که میگوید به خوبی واقعی هستند. این شرکت همچنین اعلام کرده است که از Maverick Ventures Israel، The Creator Fund، Tal Ventures، Ignia و تعدادی از سرمایه گذاران فرشته، 5.5 میلیون دلار جمع آوری کمک مالی می کند و مجموع پول نقد جمع آوری شده از زمان آغاز به کار را به 8 میلیون دلار می رساند.
“داده های جعلی”
داده ها ممکن است رگ حیات هوش مصنوعی، اما همچنین سنگ بنای تحقیقات بازار از همیشه بوده است. بنابراین هنگامی که این دو جهان با هم برخورد می کنند، همانطور که در دنیای Fairgen وجود دارد، نیاز به داده های با کیفیت کمی بیشتر می شود.
Fairgen که در سال 2021 در تل آویو اسرائیل تأسیس شد، قبلاً روی آن متمرکز بود مقابله با سوگیری در هوش مصنوعی. اما در اواخر سال 2022، این شرکت به محصول جدیدی روی آورد، Fairboost، که اکنون از نسخه بتا راه اندازی می شود.
Fairboost وعده داده است که مجموعه دادههای کوچکتری را تا سه برابر «افزایش» میکند و بینشهای دقیقتری را در مورد جایگاههایی که ممکن است در غیر این صورت دسترسی به آنها بسیار دشوار یا پرهزینه باشد، امکانپذیر میسازد. با استفاده از این، شرکت ها می توانند یک مدل یادگیری ماشین عمیق برای هر مجموعه داده ای که در پلت فرم Fairgen آپلود می کنند، با الگوهای یادگیری هوش مصنوعی آماری در بخش های مختلف نظرسنجی آموزش دهند.
مفهوم «دادههای مصنوعی» – دادههایی که بهجای رویدادهای دنیای واقعی بهطور مصنوعی ایجاد شدهاند، جدید نیست. ریشه های آن به روزهای اولیه محاسبات باز می گردد، زمانی که برای آزمایش نرم افزارها و الگوریتم ها و شبیه سازی فرآیندها استفاده می شد. اما دادههای مصنوعی، همانطور که امروزه میفهمیم، زندگی خود را به خود گرفته است، به ویژه با ظهور یادگیری ماشینی، جایی که به طور فزایندهای برای آموزش مدلها استفاده میشود. ما میتوانیم با استفاده از دادههای تولید شده مصنوعی که حاوی اطلاعات حساسی نیستند، هم مشکلات کمبود داده و هم نگرانیهای مربوط به حریم خصوصی دادهها را برطرف کنیم.
Fairgen آخرین استارت آپی است که داده های مصنوعی را آزمایش کرده است و تحقیقات بازار را به عنوان هدف اصلی خود دارد. شایان ذکر است که Fairgen دادهها را از هوا تولید نمیکند، یا میلیونها بررسی تاریخی را در یک دیگ ذوب مجهز به هوش مصنوعی پرتاب نمیکند – محققان بازار باید برای نمونه کوچکی از بازار هدف خود نظرسنجی انجام دهند، و از آنجا، Fairgen. الگوهایی را برای گسترش نمونه ایجاد می کند. این شرکت میگوید که میتواند حداقل افزایش دو برابری نمونه اصلی را تضمین کند، اما به طور متوسط میتواند به تقویت سه برابری دست یابد.
به این ترتیب، Fairgen ممکن است بتواند ثابت کند که فردی با گروه سنی و/یا سطح درآمدی خاص تمایل بیشتری به پاسخگویی به یک سوال به روشی خاص دارد. یا هر تعداد نقطه داده را برای برون یابی از مجموعه داده اصلی ترکیب کنید. این اساساً در مورد ایجاد چیزی است که یکی از بنیانگذاران و مدیرعامل Fairgen است ساموئل کوهن میگوید «بخشهای قویتر و قویتر از دادهها، با حاشیه خطای کمتری هستند».
کوهن به TechCrunch توضیح داد: “تحقیق اصلی این بود که مردم به طور فزاینده ای متنوع می شوند – برندها باید با آن سازگار شوند و آنها باید بخش های مشتریان خود را درک کنند.” بخشها بسیار متفاوت هستند – ژنرال Zs متفاوت از افراد مسنتر فکر میکند. و برای اینکه بتوانید این درک بازار را در سطح بخش داشته باشید، هزینه زیادی دارد، زمان و منابع عملیاتی زیادی را می طلبد. و آنجا بود که متوجه شدم نقطه درد اینجاست. ما میدانستیم که دادههای مصنوعی نقشی در آنجا دارند.»
یک انتقاد آشکار – انتقادی که شرکت پذیرفته است که آنها با آن مخالفت کرده اند – این است که همه اینها مانند یک میانبر بزرگ برای بیرون رفتن در میدان، مصاحبه با افراد واقعی و جمع آوری نظرات واقعی به نظر می رسد.
مطمئناً هر گروهی که کمتر نمایندگی می شود باید نگران باشد که صدای واقعی آنها با صداهای جعلی جایگزین شود؟
رئیس بخش رشد Fairgen، “هر مشتری که در فضای تحقیقاتی با آنها صحبت کردیم نقاط کور بزرگی دارد – مخاطبان کاملاً غیرقابل دسترسی.” فرناندو زاتز، به TechCrunch گفت. “آنها در واقع پروژه ها را نمی فروشند، زیرا افراد کافی در دسترس نیستند، به خصوص در دنیایی که به طور فزاینده ای متنوع است، جایی که شما بخش های زیادی از بازار دارید. گاهی اوقات آنها نمی توانند به کشورهای خاصی بروند. آنها نمی توانند وارد آمارهای جمعیتی خاص شوند، بنابراین در واقع در پروژه ها ضرر می کنند زیرا نمی توانند به سهمیه خود برسند. آنها حداقل تعداد را دارند [of respondents]و اگر به این عدد نرسند، بینش را نمیفروشند.»
Fairgen تنها شرکتی نیست که از هوش مصنوعی مولد در زمینه تحقیقات بازار استفاده می کند. کوالتریکس سال گذشته اعلام کرد که 500 میلیون دلار در طول چهار سال سرمایهگذاری کرده است تا هوش مصنوعی مولد را به پلتفرم خود بیاورد. تمرکز اساسی بر تحقیقات کیفی. با این حال، شواهد دیگری است که دادههای مصنوعی اینجا هستند و اینجا باقی میمانند.
اما اعتبارسنجی نتایج نقش مهمی در متقاعد کردن مردم به این موضوع ایفا میکند که این یک معامله واقعی است و نه معیار کاهش هزینهای که نتایجی کمتر از حد مطلوب ایجاد کند. Fairgen این کار را با مقایسه تقویت نمونه “واقعی” با تقویت نمونه “مصنوعی” انجام می دهد – نمونه کوچکی از مجموعه داده را می گیرد، آن را برون یابی می کند و آن را در کنار چیز واقعی قرار می دهد.
کوهن گفت: “با هر مشتری که ثبت نام می کنیم، دقیقاً همین نوع آزمایش را انجام می دهیم.”
از نظر آماری
کوهن دارای مدرک کارشناسی ارشد در علوم آماری از دانشگاه آکسفورد، و دکترای یادگیری ماشینی از دانشگاه UCL لندن است که بخشی از آن شامل یک دوره 9 ماهه به عنوان یک دانشمند پژوهشی در متا بود.
یکی از بنیانگذاران این شرکت رئیس هیئت مدیره است بنی اشنایدر، که قبلاً در فضای نرم افزار سازمانی بود، با چهار خروجی به نام خود: Ravello به Oracle برای مبلغ 500 میلیون دلار گزارش شده است در سال 2016؛ Qumranet به کلاه قرمزی برای 107 میلیون دلار در سال 2008; مکعب پی به سیسکو برای 200 میلیون دلار در سال 2004؛ و پنتاکام به سیسکو برای 118 دلار در سال 2000.
و سپس وجود دارد امانوئل کاندس، استاد آمار و مهندسی برق در دانشگاه استنفورد، که به عنوان مشاور علمی ارشد Fairgen خدمت می کند.
این ستون فقرات تجاری و ریاضی یک نقطه فروش عمده برای شرکتی است که تلاش می کند جهان را متقاعد کند که داده های جعلی اگر به درستی اعمال شوند، می توانند به اندازه داده های واقعی باشند. همچنین به این صورت است که آنها میتوانند آستانهها و محدودیتهای فناوری آن را به وضوح توضیح دهند – نمونهها چقدر باید برای دستیابی به افزایش بهینه باشند.
به گفته کوهن، آنها در حالت ایدهآل به حداقل 300 پاسخدهنده واقعی برای یک نظرسنجی نیاز دارند و از این طریق Fairboost میتواند اندازه بخش را افزایش دهد که بیش از 15 درصد از نظرسنجی گستردهتر را تشکیل نمیدهد.
کوهن گفت: «زیر 15 درصد، میتوانیم پس از تأیید اعتبار آن با صدها آزمایش موازی، میانگین افزایش 3 برابری را تضمین کنیم. از نظر آماری، افزایش ها در بالای 15 درصد کمتر چشمگیر هستند. دادهها در حال حاضر سطوح اطمینان خوبی را ارائه میدهند، و پاسخدهندگان مصنوعی ما فقط میتوانند به طور بالقوه با آنها مطابقت داشته باشند یا ارتقای حاشیهای به همراه داشته باشند. از نظر تجاری، همچنین هیچ نقطه درد بالای 15٪ وجود ندارد – برندها می توانند از این گروه ها یاد بگیرند. آنها فقط در سطح طاقچه گیر کرده اند.»
عامل no-LLM
شایان ذکر است که Fairgen از مدلهای زبان بزرگ (LLM) استفاده نمیکند و پلتفرم آن پاسخهای «انگلیسی ساده» را در ChatGPT ایجاد نمیکند. دلیل این امر این است که یک LLM از آموختههای بیشمار منابع داده دیگر خارج از پارامترهای مطالعه استفاده میکند، که شانس معرفی سوگیری ناسازگار با تحقیقات کمی را افزایش میدهد.
Fairgen تماماً در مورد مدلهای آماری و دادههای جدولی است و آموزش آن صرفاً بر دادههای موجود در مجموعه دادههای آپلود شده متکی است. این به طور موثر به محققان بازار اجازه می دهد تا با برون یابی از بخش های مجاور در نظرسنجی، پاسخ دهندگان جدید و مصنوعی تولید کنند.
ما به یک دلیل بسیار ساده از هیچ LLM استفاده نمی کنیم، و آن این است که اگر بخواهیم در بسیاری از موارد از قبل تمرین کنیم. [other] کوهن گفت: بررسیها، فقط اطلاعات نادرست را منتقل میکند. «چون شما مواردی دارید که در نظرسنجی دیگری چیزی یاد گرفتهاید، و ما آن را نمیخواهیم. همه چیز به قابلیت اطمینان بستگی دارد.»
از نظر مدل کسب و کار، Fairgen به عنوان SaaS فروخته میشود و شرکتها نظرسنجیهای خود را در هر قالب ساختاریافته (.CSV، یا .SAV) در پلتفرم مبتنی بر ابر Fairgen آپلود میکنند. به گفته کوهن، بسته به تعداد سؤالات، آموزش مدل بر اساس داده های نظرسنجی که داده می شود، حداکثر 20 دقیقه طول می کشد. سپس کاربر یک «بخش» (زیر مجموعهای از پاسخدهندگان که ویژگیهای مشخصی دارند) را انتخاب میکند – به عنوان مثال «Gen Z که در صنعت x کار میکند» – و سپس Fairgen یک فایل جدید با ساختاری مشابه فایل آموزشی اصلی، با سؤالات مشابه ارائه میکند. ، فقط ردیف های جدید.
Fairgen توسط BVA و شرکت فرانسوی نظرسنجی و تحقیقات بازار IFOP، که قبلاً فناوری استارتاپ را در خدمات خود ادغام کرده اند. IFOP که کمی شبیه است گالوپ در ایالات متحده، از Fairgen برای اهداف نظرسنجی در انتخابات اروپا استفاده می کند، اگرچه کوهن فکر می کند که ممکن است در نهایت برای انتخابات ایالات متحده در اواخر امسال نیز استفاده شود.
کوهن گفت: «IFOP اساساً مهر تأیید ماست، زیرا حدود 100 سال است که وجود دارد. آنها این فناوری را تایید کردند و شریک اصلی طراحی ما بودند. ما همچنین در حال آزمایش یا ادغام با برخی از بزرگترین شرکت های تحقیقات بازار در جهان هستیم که هنوز اجازه ندارم در مورد آنها صحبت کنم.”