شما نمی توانید از هوش مصنوعی Meta’s Voicebox استفاده کنید – این بسیار خطرناک است

متا این هفته MusicGen را منتشر کرد، یک تولیدکننده متن به موسیقی با هوش مصنوعی، منبع باز برای عموم، که به جهان در کل اجازه میدهد تا در 12 قسمت دوم تا زمانی که دلشان را ببندند، ضرب و شتم موسیقی را ایجاد کنند. اکنون متا دارد Voicebox را معرفی کرد، قدرتمندترین نرم افزار تولید متن به گفتار هوش مصنوعی که تا به امروز دیده ایم. در واقع آنقدر قدرتمند است که نمی توانید آن را داشته باشید – زیرا نمی توان به داشتن آن اعتماد کرد.
متا تکالیف خود را در این مورد انجام داد، آنها میدانند که پرتاب این نرمافزار به دنیا چیزی جز آشفتگی ایجاد نمیکند. ساعتی نگذشته بود که اینترنت پر از کلیپهای صوتی ساخته شده توسط آدمهای بدجنس از بدترین چیزهای ممکن از طریق صدای دیگران میشد. نه. ابزاری به این بزرگی باید با مسئولیتی باورنکردنی استفاده شود. محکم قفل شده و تنها توسط قابل اعتمادترین و قابل اعتمادترین افراد جامعه استفاده می شود.
به همین دلیل است که مارک زاکربرگ میخواهد از آن برای ساخت NPC در Metaverse استفاده کند.
Voicebox یک مدل هوش مصنوعی پیشرفته است که نه تنها برای تولید گفتار بلکه برای کارهای ضبط گفتار مانند ویرایش، نمونهبرداری و تغییر شکل میباشد. ابزار هوش مصنوعی مولد چند منظوره تا حدودی یک جک از تمام معاملات است که هم برای تبدیل متن به گفتار انسان و هم برای ویرایش نتایج مناسب است. این میتواند نویزهای ناخواسته در ضبطها را حذف کند، استاتیک پسزمینه را کاهش دهد، و همچنین ضبطهای موجود را در شش زبان مختلف نمونهبرداری و اصلاح کند.
در حالی که Voicebox، مانند بسیاری از ابزارهای مولد هوش مصنوعی، با بیش از 50000 ساعت گفتار ضبط شده (و رونوشتهایی از کتابهای صوتی مالکیت عمومی،) آموزش دیده است، متا رویکرد جدیدی برای یادگیری مستقیم از صدای خام و رونویسی همراه آن ایجاد کرده است. این به Voicebox اجازه میدهد نمونههای وارد شده به آن را بهتر تشخیص دهد و بخشهای خاصی از ضبط را بهتر تغییر دهد، بدون نیاز به بازسازی کل کلیپ.
معرفی Voicebox، یک سیستم گفتار مولد جدید بر اساس Flow Matching، روش جدیدی که توسط Meta AI ارائه شده است. این می تواند گفتار را در شش زبان ترکیب کند، حذف نویز را انجام دهد، محتوا را ویرایش کند، سبک صوتی را منتقل کند و موارد دیگر. جزئیات بیشتر در مورد این کار و نمونه ها ⬇️16 ژوئن 2023
محصولی که به تولید نمونههای صوتی با کیفیت بالا خلاصه میشود که واقعاً نشاندهنده نحوه صحبت مردم با یکدیگر در دنیای واقعی است – با متا از نمونهگیری متنوع گفتار برای اعمال دقیق همان اصل در زبانهای دیگر. نتایج نیز چشمگیر هستند، به طوری که متا مجموعه ای از آنها را در پست اخیر وبلاگ خود میزبانی می کند. وقتی به شما می گویم شک دارم که صدای زاکربرگ ممکن است در واقع محصول خود ابزار باشد، شوخی هم نمی کنم.
متا بر این باور است که روزی این فناوری برای کمک به سازندگان و تولیدکنندگان محتوا در ویرایش تراکهای صوتی حیاتی خواهد بود و به افراد کم بینا اجازه میدهد پیامهای مکتوب دوستان (در صدایشان) را بشنوند و به افراد اجازه میدهد هر زبان خارجی را با صدای خودشان صحبت کنند. درست است، مارک زاکربرگ به تازگی بر اختراع بابل فیش نظارت کرده است.
و شما نمی توانید آن را داشته باشید.
متأسفانه، این یکی از ابزارهایی نیست که متا در مورد توزیع آزادانه به عموم مردم احساس راحتی می کند. در حالی که محققان Meta یک طبقهبندی بسیار مؤثر ایجاد کردهاند که میتواند بین گفتار معتبر و صدای تولید شده با Voicebox تمایز قائل شود، تیم هنوز احساس میکند که «پتانسیل سوء استفاده و آسیب ناخواسته» وجود دارد. شوخی نکن.
در حالی که متا نمیخواهد محصول نهایی را به اشتراک بگذارد، آنها اقداماتی را که برای رسیدن به آن انجام دادهاند فاش کردهاند – با این اعتقاد که اعلام عمومی این فناوری چیزی است که آنها دارند و خطرات و آسیبهای احتمالی آن را در حین کار بر روی ابزارهایی برای احراز هویت درک میکنند. صدای واقعی و تولید شده اخلاقی ترین وضوح باشد.
میدونی چیه؟ کلاه به متا در این یکی. این اخلاقی ترین کاری است که باید در آن موقعیت انجام داد. در حالی که برخی می گویند که اخلاقی ترین کار این است که در وهله اول هرگز آن را توسعه ندهید، خوب است بدانید که متا منابع خود را صرف کاهش آسیب هایی می کند که چنین ابزاری در صورت سوء استفاده می تواند ایجاد کند. و خیلی بهتر است که آن را به صورت عمومی اعلام کنیم تا اینکه یک روز به عنوان احتکار این فناوری در معرض دید قرار بگیریم، فقط برای مشکوکترین افراد در میان ما که متا پس از این همه مدت در سایه از آن استفاده کرده باشد.
تلاش بزرگ متا هوش مصنوعی یک مورد جالب برای مشاهده است، با تنوع واقعی اهداف که به یکباره بررسی می شوند.
بازگشت به لپ تاپ های اولترابوک