Papercup 20 میلیون دلار برای هوش مصنوعی جمع آوری می کند که به طور خودکار ویدیوها را دوبله می کند – TechCrunch

دوبله بازار پرسودی است، تحقیقات بازار تایید شده پیشبینی میکند که خدمات دوبله فیلم به تنهایی میتواند تا سال 2027 سالانه 3.6 میلیارد دلار درآمد داشته باشد. اما این فرآیند پر زحمت و پرهزینه نیز هست. بر میانگین، می تواند یک ساعت زمان ضبط استودیو برای پنج دقیقه گویندگی طول بکشد. یکی ماشین حساب حتی برای یک ویدیوی ساده، قیمت 75 دلار در دقیقه است.
وعده هوش مصنوعی در این حوزه، بهویژه پردازش زبان طبیعی، با ایجاد دوبلههایی با صدای انسانی در چندین زبان، این کار را سرعت میبخشد. یکی از استارتآپهای بریتانیایی که این کار را دنبال میکند، Papercup، ادعا میکند که فناوری آن توسط غولهای رسانهای Sky News، Discovery و Business Insider استفاده شده است و برای ترجمه 30 فصل از نمایش نمادین باب راس، “لذت نقاشی” استفاده شده است.
مدیر عامل شرکت جسی شمن تخمین می زند که بیش از 300 میلیون نفر در طی 12 ماه گذشته ویدیوهای ترجمه شده توسط Papercup را تماشا کرده اند.
شمن گفت: «عدم تطابق قابل توجهی بین تقاضا برای بومی سازی و ترجمه و توانایی برآورده کردن تقاضا وجود دارد. «لایکها را نشان میدهد [Netflix’s] “بازی ماهی مرکب” این تز را تأیید می کند که مردم محتوای ایجاد شده را در هر مکان و به هر زبانی تماشا می کنند، اگر سرگرم کننده و جالب باشد. به همین دلیل است که این بخش برای رشد بسیار آماده است.»
به طور کلی، Papercup امروز اعلام کرد که 20 میلیون دلار در دور سرمایه گذاری سری A به رهبری Octopus Ventures با مشارکت Local Globe، Sands Capital، Sky و Guardian Media Ventures، Entrepreneur First و BDMI جمع آوری کرده است. شمن از طریق ایمیل به TechCrunch گفت که این مجموع جمع آوری شده شرکت مستقر در لندن تا به امروز را به حدود 30.5 میلیون دلار می رساند که بیشتر آن برای تحقیق در مورد صداهای تولید شده توسط هوش مصنوعی و گسترش پشتیبانی Papercup از زبان های خارجی صرف می شود.
Papercup که در سال 2017 توسط Shemen و Jiameng Gao تأسیس شد، یک راه حل دوبله مبتنی بر هوش مصنوعی ارائه می دهد که صدای انسان را در یک فیلم یا نمایش هدف شناسایی می کند و دوبله ها را به زبانی جدید تولید می کند. تولیدکنندگان محتوای ویدیویی ویدیوهای خود را آپلود میکنند، زبانی را مشخص میکنند، منتظر میمانند تا تیمهای سخنران بومی Papercup کیفیت صدا را بررسی کنند و ترجمهای را با صدای مصنوعی دریافت کنند.
Shemen ادعا می کند که پلت فرم Papercup می تواند دوبله ها را در مقیاس و سرعتی تولید کند که با روش های دستی قابل مقایسه نیست. فراتر از ترجمههای سفارشی که برای مشتریان ایجاد میکند، Papercup فهرستی از صداها با لحنها و احساسات «واقعبینانه» ارائه میکند. به گزارش شمن، بسیاری از این موارد علاوه بر فیلم و تلویزیون در ارتباطات داخلی، اطلاعیه های شرکتی و مواد آموزشی استفاده شده است.
شمن گفت: «رویکرد «انسان در حلقه» ما به این معنی است که مترجمان انسانی کنترل کیفیت را ارائه میکنند و دقت را تضمین میکنند، اما باید بسیار کمتر از زمانی که کل ترجمه را ارائه میکردند، عمل کنند، به این معنی که میتوانند سریعتر و در ترجمههای بیشتری کار کنند. . «مردم محتوای ویدیویی بیشتری را در طول همهگیری مشاهده کردند که به طور قابل توجهی تقاضا برای خدمات ما را افزایش داد.»
بازار “رسانه های مصنوعی” تولید شده توسط هوش مصنوعی در حال رشد است. شرکت های متمرکز بر صدا و ویدئو از جمله Synthesia، Respeecher، Resemble AI و Deepdub ابزارهای دوبله هوش مصنوعی را برای نمایش ها و فیلم ها راه اندازی کرده اند. فراتر از استارت آپ ها، انویدیا در حال توسعه بوده است فن آوری که ویدئو را به گونه ای تغییر می دهد که حالات چهره یک بازیگر را می گیرد و آنها را با یک زبان جدید مطابقت می دهد.
اما ممکن است نکات منفی وجود داشته باشد. در نقش استیون زیتچیک از واشنگتن پست نشان میدهدمحتوای دوبله شده با هوش مصنوعی بدون توجه به جزئیات می تواند «طعم محلی» خود را از دست بدهد. اصطلاحات در یک زبان ممکن است در زبان دیگر معنای مشابهی نداشته باشد. علاوه بر این، دوبلههای هوش مصنوعی سوالات اخلاقی را مطرح میکنند، مانند اینکه آیا باید انجام شود یا خیر بازآفرینی صدای کسی که فوت کرده
همچنین پیامدهای صداهایی که از بازی بازیگران شاغل به وجود میآیند مبهم است. روزنامه وال استریت گزارش ها بیش از یک شرکت سعی کردهاند صدای مورگان فریمن را در دموهای خصوصی تکرار کنند، و استودیوها به طور فزایندهای در قراردادها مفادهایی را اضافه میکنند که به دنبال استفاده از صداهای مصنوعی به جای نوازندگان «در صورت لزوم» هستند – برای مثال برای تغییر خطوط دیالوگ در طول پستولید. .
Shemen، Papercup را بهعنوان یک پلتفرم عمدتاً خنثی قرار میدهد، البته پلتفرمی که استفاده از پلتفرم خود را برای سوءاستفاده احتمالی (مانند ایجاد دیپفیک) نظارت میکند. شمن فاش کرد که کار بر روی ترجمه بلادرنگ برای محتواهایی مانند اخبار و رویدادهای ورزشی و همچنین توانایی کنترل دقیق تر و اصلاح بیان صدای تولید شده توسط هوش مصنوعی در حال انجام است.
“ارزش [dubbing] واضح است: مردم هنگام تماشای یک ویدیوی کوتاه که به زبان آنها نیست، 41٪ اطلاعات را حفظ می کنند – وقتی زیرنویس می شود 50٪ و وقتی از طریق لیوان کاغذی دوبله می شود 70٪ را حفظ می کنند. این افزایش 40 درصدی در زیرنویس به تنهایی است. با دوبله هوش مصنوعی متقابل زبانی واقعاً احساسی، Papercup با تمام اشکال محتوا مقابله میکند و ویدیو و صدا را برای همه قابل دسترستر و لذتبخشتر میکند.»
Papercup در حال حاضر 38 نفر در لندن و یک شبکه مترجم در سه قاره مشغول به کار است. این شرکت انتظار دارد تا پایان سال این میزان دو برابر شود.