Retell AI به شرکتها اجازه میدهد تا «عاملهای صوتی» برای پاسخگویی به تماسهای تلفنی بسازند

مراکز تماس از اتوماسیون استقبال می کنند. بحث وجود دارد آیا این چیز خوبی است، اما این اتفاق می افتد – و احتمالاً شتاب می گیرد.
به گفته شرکت تحقیقاتی TechSci Research، بازار جهانی هوش مصنوعی مرکز تماس می تواند در سال 2028 از 2.4 میلیارد دلار در سال 2022 به نزدیک به 3 میلیارد دلار افزایش یابد. در همین حال، یک نظرسنجی اخیر نشان داد که حدود نیمی از مراکز تماس برنامه ریزی برای اتخاذ نوعی از هوش مصنوعی در سال آینده.
انگیزه نسبتاً واضح است: مراکز تماس به دنبال کاهش هزینه ها و در عین حال افزایش عملیات خود هستند.
ایوی وانگ، کارآفرین به TechCrunch گفت: «شرکتهایی که در مراکز تماس سنگین فعالیت میکنند و به دنبال افزایش سریع بدون محدودیتهای عوامل مرکز تماس انسانی هستند، به شدت پذیرای راهحلهای موثر عامل صوتی هوش مصنوعی هستند. “این رویکرد نه تنها هزینه های کلی آنها را کاهش می دهد، بلکه زمان انتظار را نیز کاهش می دهد.”
وانگ یکی از بنیانگذاران است هوش مصنوعی را بازگو کنیدکه پلتفرمی را فراهم میکند که شرکتها میتوانند از آن برای ایجاد «عاملهای صوتی» مبتنی بر هوش مصنوعی استفاده کنند که به تماسهای تلفنی مشتریان پاسخ میدهند و کارهای اساسی مانند برنامهریزی قرار ملاقاتها را انجام میدهند. نمایندگان Retell با ترکیبی از مدلهای زبان بزرگ (LLM) که برای موارد استفاده از خدمات مشتری بهخوبی تنظیم شدهاند و یک مدل گفتاری که به متن تولید شده توسط LLMها صدا میدهد، نیرو میگیرد.
مشتریان Retell شامل برخی از اپراتورهای مرکز تماس، اما همچنین مشاغل کوچک و متوسط هستند که به طور منظم با حجم تماس های بالا سروکار دارند، مانند شرکت بهداشت از راه دور Ro. آنها میتوانند با استفاده از ابزارهای کمکد پلتفرم، عاملهای صوتی بسازند، یا میتوانند یک LLM سفارشی (مثلاً یک مدل باز مانند Meta’s Llama 3) برای تطبیق بیشتر تجربه آپلود کنند.
وانگ گفت: «ما سرمایهگذاری زیادی روی تجربه مکالمه صوتی میکنیم، زیرا آن را مهمترین جنبه تجربه عامل صوتی هوش مصنوعی میدانیم. ما عوامل صوتی هوش مصنوعی را صرفاً اسباببازیهایی نمیدانیم که میتوان با چند خط اعلان ایجاد کرد، بلکه به عنوان ابزارهایی که میتوانند ارزش قابل توجهی برای کسبوکارها ارائه دهند و جایگزین گردشهای کاری پیچیده شوند، نگاه نمیکنیم.»
Retell در آزمایش کوتاه من به اندازه کافی خوب کار کرد، حداقل در سمت تماس.
من با یک ربات Retell با استفاده از فرم نمایشی در وب سایت Retell تماس برقرار کردم. ربات من را در روند برنامه ریزی قرار ملاقات فرضی دندانپزشک، پرسیدن سوالاتی مانند تاریخ و زمان ترجیحی من، شماره تلفن و غیره راهنمایی کرد.
نمی توانم بگویم که صدای مصنوعی ربات بهترین صدایی بود که از نظر واقع گرایی شنیده بودم – مطمئناً با Eleven Labs یا API متن به گفتار OpenAI برابری نمی کند. (بهروزرسانی: وانگ به من میگوید که Retell از صدای سفارشی ElevenLabs استفاده میکند، که ممکن است کیفیت پایینتر را توضیح دهد.) وانگ، در دفاع از Retell، گفت که تیم بیشتر بر روی کاهش تأخیر و رسیدگی به موارد لبه تمرکز کرده است، مانند وقفههایی که ممکن است در مکالمه رخ دهد. .
تأخیر است low: در آزمون من، ربات تقریباً بدون تردید به پاسخ ها و سؤالات بعدی من پاسخ داد. و به فیلمنامه اش چسبید. هرچه سعی کردم، نتوانستم آن را اشتباه بگیرم یا از او بخواهم طوری رفتار کند که نباید. (وقتی از ربات در مورد سوابق دندانپزشکی خود پرسیدم، اصرار داشت که با مدیر مطب صحبت کنم.)
پس آیا پلتفرم هایی مانند Retell آینده مراکز تماس هستند؟
شاید. برای کارهای اساسی مانند زمانبندی قرار ملاقات، اتوماسیون بسیار منطقی است، احتمالاً به همین دلیل است که هم استارتآپها و هم شرکتهای بزرگ فناوری راهحلهایی را ارائه میدهند که با Retell رقابت میکنند. (به Parloa، PolyAI، Google Cloud’s Contact Center AI و غیره مراجعه کنید.)
این میوه کم درآمد – و ظاهراً درآمدزا – است. Retell ادعا می کند که صدها مشتری دارد که همه آنها به ازای هر دقیقه مکالمه با نماینده صوتی پرداخت می کنند. Retell تا به امروز در مجموع 4.53 میلیون دلار سرمایه جمع آوری کرده است، با حسن نیت از حامیان از جمله Y Combinator (جایی که شرکت انکوباتور شد).
اما هیئت منصفه در مورد سوالات پیچیده تر، به ویژه با توجه به تمایل LLM ها به ساختن حقایق و خارج شدن از ریل حتی با وجود تدابیر امنیتی، پاسخ نمی دهد.
همانطور که جاه طلبی های Retell رشد می کند، من کنجکاو هستم که ببینم چگونه این شرکت با بسیاری از چالش های فنی تثبیت شده در فضا عبور می کند. وانگ، حداقل، به نظر می رسد به رویکرد Retell مطمئن است.
وانگ گفت: “با ظهور LLM ها و پیشرفت های اخیر در سنتز گفتار، هوش مصنوعی مکالمه به اندازه کافی خوب می شود تا موارد استفاده واقعاً هیجان انگیز ایجاد کند.” به عنوان مثال، با تأخیر زیر یک ثانیه و امکان قطع کردن هوش مصنوعی، ما کاربرانی را مشاهده کردهایم که با جملات کاملتر صحبت میکنند و همانطور که با شخص دیگری صحبت میکنند، صحبت میکنند. ما سعی می کنیم ساخت، آزمایش، استقرار و نظارت بر عوامل صوتی هوش مصنوعی را برای توسعه دهندگان آسان کنیم تا در نهایت به آنها کمک کنیم تا به آمادگی تولید دست یابند.