کار آفرینی و استارتاپ

Fairgen نتایج نظرسنجی را با استفاده از داده های مصنوعی و پاسخ های تولید شده توسط هوش مصنوعی افزایش می دهد


از زمان های بسیار قدیم از نظرسنجی ها برای به دست آوردن بینش در مورد جمعیت، محصولات و افکار عمومی استفاده شده است. و در حالی که روش‌شناسی ممکن است در طول هزاره‌ها تغییر کرده باشد، یک چیز ثابت مانده است: نیاز به مردم، افراد زیادی.

اما اگر نتوانید افراد کافی برای ایجاد یک گروه نمونه به اندازه کافی بزرگ برای ایجاد نتایج معنادار پیدا کنید، چه؟ یا، اگر به طور بالقوه می‌توانید افراد کافی پیدا کنید، اما محدودیت‌های بودجه، تعداد افرادی را که می‌توانید منبع و مصاحبه کنید، محدود می‌کند، چه می‌شود؟

اینجاست که فیرگن می خواهد کمک کند این استارت‌آپ اسرائیلی امروز پلتفرمی را راه‌اندازی کرد که از «هوش مصنوعی آماری» برای تولید داده‌های مصنوعی استفاده می‌کند که می‌گوید به خوبی واقعی هستند. این شرکت همچنین اعلام کرده است که از Maverick Ventures Israel، The Creator Fund، Tal Ventures، Ignia و تعدادی از سرمایه گذاران فرشته، 5.5 میلیون دلار جمع آوری کمک مالی می کند و مجموع پول نقد جمع آوری شده از زمان آغاز به کار را به 8 میلیون دلار می رساند.

“داده های جعلی”

داده ها ممکن است رگ حیات هوش مصنوعی، اما همچنین سنگ بنای تحقیقات بازار از همیشه بوده است. بنابراین هنگامی که این دو جهان با هم برخورد می کنند، همانطور که در دنیای Fairgen وجود دارد، نیاز به داده های با کیفیت کمی بیشتر می شود.

Fairgen که در سال 2021 در تل آویو اسرائیل تأسیس شد، قبلاً روی آن متمرکز بود مقابله با سوگیری در هوش مصنوعی. اما در اواخر سال 2022، این شرکت به محصول جدیدی روی آورد، Fairboost، که اکنون از نسخه بتا راه اندازی می شود.

Fairboost وعده داده است که مجموعه داده‌های کوچک‌تری را تا سه برابر «افزایش» می‌کند و بینش‌های دقیق‌تری را در مورد جایگاه‌هایی که ممکن است در غیر این صورت دسترسی به آن‌ها بسیار دشوار یا پرهزینه باشد، امکان‌پذیر می‌سازد. با استفاده از این، شرکت ها می توانند یک مدل یادگیری ماشین عمیق برای هر مجموعه داده ای که در پلت فرم Fairgen آپلود می کنند، با الگوهای یادگیری هوش مصنوعی آماری در بخش های مختلف نظرسنجی آموزش دهند.

مفهوم «داده‌های مصنوعی» – داده‌هایی که به‌جای رویدادهای دنیای واقعی به‌طور مصنوعی ایجاد شده‌اند، جدید نیست. ریشه های آن به روزهای اولیه محاسبات باز می گردد، زمانی که برای آزمایش نرم افزارها و الگوریتم ها و شبیه سازی فرآیندها استفاده می شد. اما داده‌های مصنوعی، همانطور که امروزه می‌فهمیم، زندگی خود را به خود گرفته است، به ویژه با ظهور یادگیری ماشینی، جایی که به طور فزاینده‌ای برای آموزش مدل‌ها استفاده می‌شود. ما می‌توانیم با استفاده از داده‌های تولید شده مصنوعی که حاوی اطلاعات حساسی نیستند، هم مشکلات کمبود داده و هم نگرانی‌های مربوط به حریم خصوصی داده‌ها را برطرف کنیم.

Fairgen آخرین استارت آپی است که داده های مصنوعی را آزمایش کرده است و تحقیقات بازار را به عنوان هدف اصلی خود دارد. شایان ذکر است که Fairgen داده‌ها را از هوا تولید نمی‌کند، یا میلیون‌ها بررسی تاریخی را در یک دیگ ذوب مجهز به هوش مصنوعی پرتاب نمی‌کند – محققان بازار باید برای نمونه کوچکی از بازار هدف خود نظرسنجی انجام دهند، و از آن‌جا، Fairgen. الگوهایی را برای گسترش نمونه ایجاد می کند. این شرکت می‌گوید که می‌تواند حداقل افزایش دو برابری نمونه اصلی را تضمین کند، اما به طور متوسط ​​می‌تواند به تقویت سه برابری دست یابد.

به این ترتیب، Fairgen ممکن است بتواند ثابت کند که فردی با گروه سنی و/یا سطح درآمدی خاص تمایل بیشتری به پاسخگویی به یک سوال به روشی خاص دارد. یا هر تعداد نقطه داده را برای برون یابی از مجموعه داده اصلی ترکیب کنید. این اساساً در مورد ایجاد چیزی است که یکی از بنیانگذاران و مدیرعامل Fairgen است ساموئل کوهن می‌گوید «بخش‌های قوی‌تر و قوی‌تر از داده‌ها، با حاشیه خطای کمتری هستند».

کوهن به TechCrunch توضیح داد: “تحقیق اصلی این بود که مردم به طور فزاینده ای متنوع می شوند – برندها باید با آن سازگار شوند و آنها باید بخش های مشتریان خود را درک کنند.” بخش‌ها بسیار متفاوت هستند – ژنرال Zs متفاوت از افراد مسن‌تر فکر می‌کند. و برای اینکه بتوانید این درک بازار را در سطح بخش داشته باشید، هزینه زیادی دارد، زمان و منابع عملیاتی زیادی را می طلبد. و آنجا بود که متوجه شدم نقطه درد اینجاست. ما می‌دانستیم که داده‌های مصنوعی نقشی در آنجا دارند.»

یک انتقاد آشکار – انتقادی که شرکت پذیرفته است که آنها با آن مخالفت کرده اند – این است که همه اینها مانند یک میانبر بزرگ برای بیرون رفتن در میدان، مصاحبه با افراد واقعی و جمع آوری نظرات واقعی به نظر می رسد.

مطمئناً هر گروهی که کمتر نمایندگی می شود باید نگران باشد که صدای واقعی آنها با صداهای جعلی جایگزین شود؟

رئیس بخش رشد Fairgen، “هر مشتری که در فضای تحقیقاتی با آنها صحبت کردیم نقاط کور بزرگی دارد – مخاطبان کاملاً غیرقابل دسترسی.” فرناندو زاتز، به TechCrunch گفت. “آنها در واقع پروژه ها را نمی فروشند، زیرا افراد کافی در دسترس نیستند، به خصوص در دنیایی که به طور فزاینده ای متنوع است، جایی که شما بخش های زیادی از بازار دارید. گاهی اوقات آنها نمی توانند به کشورهای خاصی بروند. آنها نمی توانند وارد آمارهای جمعیتی خاص شوند، بنابراین در واقع در پروژه ها ضرر می کنند زیرا نمی توانند به سهمیه خود برسند. آنها حداقل تعداد را دارند [of respondents]و اگر به این عدد نرسند، بینش را نمی‌فروشند.»

Fairgen تنها شرکتی نیست که از هوش مصنوعی مولد در زمینه تحقیقات بازار استفاده می کند. کوالتریکس سال گذشته اعلام کرد که 500 میلیون دلار در طول چهار سال سرمایه‌گذاری کرده است تا هوش مصنوعی مولد را به پلتفرم خود بیاورد. تمرکز اساسی بر تحقیقات کیفی. با این حال، شواهد دیگری است که داده‌های مصنوعی اینجا هستند و اینجا باقی می‌مانند.

اما اعتبارسنجی نتایج نقش مهمی در متقاعد کردن مردم به این موضوع ایفا می‌کند که این یک معامله واقعی است و نه معیار کاهش هزینه‌ای که نتایجی کمتر از حد مطلوب ایجاد کند. Fairgen این کار را با مقایسه تقویت نمونه “واقعی” با تقویت نمونه “مصنوعی” انجام می دهد – نمونه کوچکی از مجموعه داده را می گیرد، آن را برون یابی می کند و آن را در کنار چیز واقعی قرار می دهد.

کوهن گفت: “با هر مشتری که ثبت نام می کنیم، دقیقاً همین نوع آزمایش را انجام می دهیم.”

از نظر آماری

کوهن دارای مدرک کارشناسی ارشد در علوم آماری از دانشگاه آکسفورد، و دکترای یادگیری ماشینی از دانشگاه UCL لندن است که بخشی از آن شامل یک دوره 9 ماهه به عنوان یک دانشمند پژوهشی در متا بود.

یکی از بنیانگذاران این شرکت رئیس هیئت مدیره است بنی اشنایدر، که قبلاً در فضای نرم افزار سازمانی بود، با چهار خروجی به نام خود: Ravello به Oracle برای مبلغ 500 میلیون دلار گزارش شده است در سال 2016؛ Qumranet به کلاه قرمزی برای 107 میلیون دلار در سال 2008; مکعب پی به سیسکو برای 200 میلیون دلار در سال 2004؛ و پنتاکام به سیسکو برای 118 دلار در سال 2000.

و سپس وجود دارد امانوئل کاندس، استاد آمار و مهندسی برق در دانشگاه استنفورد، که به عنوان مشاور علمی ارشد Fairgen خدمت می کند.

این ستون فقرات تجاری و ریاضی یک نقطه فروش عمده برای شرکتی است که تلاش می کند جهان را متقاعد کند که داده های جعلی اگر به درستی اعمال شوند، می توانند به اندازه داده های واقعی باشند. همچنین به این صورت است که آنها می‌توانند آستانه‌ها و محدودیت‌های فناوری آن را به وضوح توضیح دهند – نمونه‌ها چقدر باید برای دستیابی به افزایش بهینه باشند.

به گفته کوهن، آنها در حالت ایده‌آل به حداقل 300 پاسخ‌دهنده واقعی برای یک نظرسنجی نیاز دارند و از این طریق Fairboost می‌تواند اندازه بخش را افزایش دهد که بیش از 15 درصد از نظرسنجی گسترده‌تر را تشکیل نمی‌دهد.

کوهن گفت: «زیر 15 درصد، می‌توانیم پس از تأیید اعتبار آن با صدها آزمایش موازی، میانگین افزایش 3 برابری را تضمین کنیم. از نظر آماری، افزایش ها در بالای 15 درصد کمتر چشمگیر هستند. داده‌ها در حال حاضر سطوح اطمینان خوبی را ارائه می‌دهند، و پاسخ‌دهندگان مصنوعی ما فقط می‌توانند به طور بالقوه با آن‌ها مطابقت داشته باشند یا ارتقای حاشیه‌ای به همراه داشته باشند. از نظر تجاری، همچنین هیچ نقطه درد بالای 15٪ وجود ندارد – برندها می توانند از این گروه ها یاد بگیرند. آنها فقط در سطح طاقچه گیر کرده اند.»

عامل no-LLM

شایان ذکر است که Fairgen از مدل‌های زبان بزرگ (LLM) استفاده نمی‌کند و پلتفرم آن پاسخ‌های «انگلیسی ساده» را در ChatGPT ایجاد نمی‌کند. دلیل این امر این است که یک LLM از آموخته‌های بی‌شمار منابع داده دیگر خارج از پارامترهای مطالعه استفاده می‌کند، که شانس معرفی سوگیری ناسازگار با تحقیقات کمی را افزایش می‌دهد.

Fairgen تماماً در مورد مدل‌های آماری و داده‌های جدولی است و آموزش آن صرفاً بر داده‌های موجود در مجموعه داده‌های آپلود شده متکی است. این به طور موثر به محققان بازار اجازه می دهد تا با برون یابی از بخش های مجاور در نظرسنجی، پاسخ دهندگان جدید و مصنوعی تولید کنند.

ما به یک دلیل بسیار ساده از هیچ LLM استفاده نمی کنیم، و آن این است که اگر بخواهیم در بسیاری از موارد از قبل تمرین کنیم. [other] کوهن گفت: بررسی‌ها، فقط اطلاعات نادرست را منتقل می‌کند. «چون شما مواردی دارید که در نظرسنجی دیگری چیزی یاد گرفته‌اید، و ما آن را نمی‌خواهیم. همه چیز به قابلیت اطمینان بستگی دارد.»

از نظر مدل کسب و کار، Fairgen به عنوان SaaS فروخته می‌شود و شرکت‌ها نظرسنجی‌های خود را در هر قالب ساختاریافته (.CSV، یا .SAV) در پلتفرم مبتنی بر ابر Fairgen آپلود می‌کنند. به گفته کوهن، بسته به تعداد سؤالات، آموزش مدل بر اساس داده های نظرسنجی که داده می شود، حداکثر 20 دقیقه طول می کشد. سپس کاربر یک «بخش» (زیر مجموعه‌ای از پاسخ‌دهندگان که ویژگی‌های مشخصی دارند) را انتخاب می‌کند – به عنوان مثال «Gen Z که در صنعت x کار می‌کند» – و سپس Fairgen یک فایل جدید با ساختاری مشابه فایل آموزشی اصلی، با سؤالات مشابه ارائه می‌کند. ، فقط ردیف های جدید.

Fairgen توسط BVA و شرکت فرانسوی نظرسنجی و تحقیقات بازار IFOP، که قبلاً فناوری استارتاپ را در خدمات خود ادغام کرده اند. IFOP که کمی شبیه است گالوپ در ایالات متحده، از Fairgen برای اهداف نظرسنجی در انتخابات اروپا استفاده می کند، اگرچه کوهن فکر می کند که ممکن است در نهایت برای انتخابات ایالات متحده در اواخر امسال نیز استفاده شود.

کوهن گفت: «IFOP اساساً مهر تأیید ماست، زیرا حدود 100 سال است که وجود دارد. آنها این فناوری را تایید کردند و شریک اصلی طراحی ما بودند. ما همچنین در حال آزمایش یا ادغام با برخی از بزرگترین شرکت های تحقیقات بازار در جهان هستیم که هنوز اجازه ندارم در مورد آنها صحبت کنم.”



منبع

دیدگاهتان را بنویسید

دکمه بازگشت به بالا