کار آفرینی و استارتاپ

Papercup 20 میلیون دلار برای هوش مصنوعی جمع آوری می کند که به طور خودکار ویدیوها را دوبله می کند – TechCrunch


دوبله بازار پرسودی است، تحقیقات بازار تایید شده پیش‌بینی می‌کند که خدمات دوبله فیلم به تنهایی می‌تواند تا سال 2027 سالانه 3.6 میلیارد دلار درآمد داشته باشد. اما این فرآیند پر زحمت و پرهزینه نیز هست. بر میانگین، می تواند یک ساعت زمان ضبط استودیو برای پنج دقیقه گویندگی طول بکشد. یکی ماشین حساب حتی برای یک ویدیوی ساده، قیمت 75 دلار در دقیقه است.

وعده هوش مصنوعی در این حوزه، به‌ویژه پردازش زبان طبیعی، با ایجاد دوبله‌هایی با صدای انسانی در چندین زبان، این کار را سرعت می‌بخشد. یکی از استارت‌آپ‌های بریتانیایی که این کار را دنبال می‌کند، Papercup، ادعا می‌کند که فناوری آن توسط غول‌های رسانه‌ای Sky News، Discovery و Business Insider استفاده شده است و برای ترجمه 30 فصل از نمایش نمادین باب راس، “لذت نقاشی” استفاده شده است.

مدیر عامل شرکت جسی شمن تخمین می زند که بیش از 300 میلیون نفر در طی 12 ماه گذشته ویدیوهای ترجمه شده توسط Papercup را تماشا کرده اند.

شمن گفت: «عدم تطابق قابل توجهی بین تقاضا برای بومی سازی و ترجمه و توانایی برآورده کردن تقاضا وجود دارد. «لایک‌ها را نشان می‌دهد [Netflix’s] “بازی ماهی مرکب” این تز را تأیید می کند که مردم محتوای ایجاد شده را در هر مکان و به هر زبانی تماشا می کنند، اگر سرگرم کننده و جالب باشد. به همین دلیل است که این بخش برای رشد بسیار آماده است.»

به طور کلی، Papercup امروز اعلام کرد که 20 میلیون دلار در دور سرمایه گذاری سری A به رهبری Octopus Ventures با مشارکت Local Globe، Sands Capital، Sky و Guardian Media Ventures، Entrepreneur First و BDMI جمع آوری کرده است. شمن از طریق ایمیل به TechCrunch گفت که این مجموع جمع آوری شده شرکت مستقر در لندن تا به امروز را به حدود 30.5 میلیون دلار می رساند که بیشتر آن برای تحقیق در مورد صداهای تولید شده توسط هوش مصنوعی و گسترش پشتیبانی Papercup از زبان های خارجی صرف می شود.

Papercup که در سال 2017 توسط Shemen و Jiameng Gao تأسیس شد، یک راه حل دوبله مبتنی بر هوش مصنوعی ارائه می دهد که صدای انسان را در یک فیلم یا نمایش هدف شناسایی می کند و دوبله ها را به زبانی جدید تولید می کند. تولیدکنندگان محتوای ویدیویی ویدیوهای خود را آپلود می‌کنند، زبانی را مشخص می‌کنند، منتظر می‌مانند تا تیم‌های سخنران بومی Papercup کیفیت صدا را بررسی کنند و ترجمه‌ای را با صدای مصنوعی دریافت کنند.

https://www.youtube.com/watch?v=K85DoRwy-hU

Shemen ادعا می کند که پلت فرم Papercup می تواند دوبله ها را در مقیاس و سرعتی تولید کند که با روش های دستی قابل مقایسه نیست. فراتر از ترجمه‌های سفارشی که برای مشتریان ایجاد می‌کند، Papercup فهرستی از صداها با لحن‌ها و احساسات «واقع‌بینانه» ارائه می‌کند. به گزارش شمن، بسیاری از این موارد علاوه بر فیلم و تلویزیون در ارتباطات داخلی، اطلاعیه های شرکتی و مواد آموزشی استفاده شده است.

شمن گفت: «رویکرد «انسان در حلقه» ما به این معنی است که مترجمان انسانی کنترل کیفیت را ارائه می‌کنند و دقت را تضمین می‌کنند، اما باید بسیار کمتر از زمانی که کل ترجمه را ارائه می‌کردند، عمل کنند، به این معنی که می‌توانند سریع‌تر و در ترجمه‌های بیشتری کار کنند. . «مردم محتوای ویدیویی بیشتری را در طول همه‌گیری مشاهده کردند که به طور قابل توجهی تقاضا برای خدمات ما را افزایش داد.»

بازار “رسانه های مصنوعی” تولید شده توسط هوش مصنوعی در حال رشد است. شرکت های متمرکز بر صدا و ویدئو از جمله Synthesia، Respeecher، Resemble AI و Deepdub ابزارهای دوبله هوش مصنوعی را برای نمایش ها و فیلم ها راه اندازی کرده اند. فراتر از استارت آپ ها، انویدیا در حال توسعه بوده است فن آوری که ویدئو را به گونه ای تغییر می دهد که حالات چهره یک بازیگر را می گیرد و آنها را با یک زبان جدید مطابقت می دهد.

اما ممکن است نکات منفی وجود داشته باشد. در نقش استیون زیتچیک از واشنگتن پست نشان میدهدمحتوای دوبله شده با هوش مصنوعی بدون توجه به جزئیات می تواند «طعم محلی» خود را از دست بدهد. اصطلاحات در یک زبان ممکن است در زبان دیگر معنای مشابهی نداشته باشد. علاوه بر این، دوبله‌های هوش مصنوعی سوالات اخلاقی را مطرح می‌کنند، مانند اینکه آیا باید انجام شود یا خیر بازآفرینی صدای کسی که فوت کرده

همچنین پیامدهای صداهایی که از بازی بازیگران شاغل به وجود می‌آیند مبهم است. روزنامه وال استریت گزارش ها بیش از یک شرکت سعی کرده‌اند صدای مورگان فریمن را در دموهای خصوصی تکرار کنند، و استودیوها به طور فزاینده‌ای در قراردادها مفادهایی را اضافه می‌کنند که به دنبال استفاده از صداهای مصنوعی به جای نوازندگان «در صورت لزوم» هستند – برای مثال برای تغییر خطوط دیالوگ در طول پس‌تولید. .

Shemen، Papercup را به‌عنوان یک پلت‌فرم عمدتاً خنثی قرار می‌دهد، البته پلتفرمی که استفاده از پلتفرم خود را برای سوءاستفاده احتمالی (مانند ایجاد دیپ‌فیک) نظارت می‌کند. شمن فاش کرد که کار بر روی ترجمه بلادرنگ برای محتواهایی مانند اخبار و رویدادهای ورزشی و همچنین توانایی کنترل دقیق تر و اصلاح بیان صدای تولید شده توسط هوش مصنوعی در حال انجام است.

“ارزش [dubbing] واضح است: مردم هنگام تماشای یک ویدیوی کوتاه که به زبان آنها نیست، 41٪ اطلاعات را حفظ می کنند – وقتی زیرنویس می شود 50٪ و وقتی از طریق لیوان کاغذی دوبله می شود 70٪ را حفظ می کنند. این افزایش 40 درصدی در زیرنویس به تنهایی است. با دوبله هوش مصنوعی متقابل زبانی واقعاً احساسی، Papercup با تمام اشکال محتوا مقابله می‌کند و ویدیو و صدا را برای همه قابل دسترس‌تر و لذت‌بخش‌تر می‌کند.»

Papercup در حال حاضر 38 نفر در لندن و یک شبکه مترجم در سه قاره مشغول به کار است. این شرکت انتظار دارد تا پایان سال این میزان دو برابر شود.



منبع

دیدگاهتان را بنویسید

دکمه بازگشت به بالا