یوتیوب با هوش مصنوعی، ویدیوها را برای شما در لحظه دوبله میکند
به گزارش کارگروه فناوری اطلاعات سایبربان ؛ با قابلیتی انقلابی، یوتیوب دوبله هوش مصنوعی ویدیوها را برای همگامسازی حرکت لبها در ویدیوها معرفی کرده است. آیا این فناوری، تجربه تماشای محتوای جهانی را دگرگون میکند؟
این پلتفرم ویدیویی غولپیکر، با هدف رفع یکی از بزرگترین مشکلات دوبلههای ماشینی، گامی جدید برداشته است. کاربران مدتها از عدم تطابق حرکات لب با صدای دوبله گلهمند بودند و این قابلیت جدید، دقیقاً همین معضل را هدف قرار داده است. ادغام هوش مصنوعی و ابزارهای ترجمه، محتوا را برای مخاطبان جهانی قابل دسترستر میکند. اما آیا این پیشرفت، چالشهای پیشین را کاملاً برطرف خواهد کرد؟
مشکلی قدیمی، راهحلی جدید: همگامسازی لب با هوش مصنوعی
یوتیوب در جدیدترین توسعه فناوری دوبله خودکار خود، قابلیت همگامسازی لب با هوش مصنوعی را به ویدیوهای دوبلهشده اضافه کرده است. این ویژگی که در رویداد Made on YouTube رونمایی شد، ویدیوهای ترجمهشده را طبیعیتر میکند و دسترسی جهانی به محتوا را افزایش میدهد. این فناوری ابتدا برای ۲۰ زبان از جمله انگلیسی، آلمانی، فرانسوی و اسپانیایی عرضه میشود و زبانهای بیشتری در ماههای آتی اضافه خواهند شد.
سیستمهای دوبله و ترجمه خودکار یوتیوب همواره بحثبرانگیز بودهاند. کاربران اغلب به دلیل ترجیح نسخه اصلی و کیفیت پایین ترجمههای هوش مصنوعی، از این قابلیتها انتقاد کردهاند. در حال حاضر، تنظیمات سراسری برای غیرفعال کردن دوبله خودکار وجود ندارد و کاربران باید برای هر ویدیو بهصورت دستی تنظیمات صدا را تغییر دهند. همین محدودیت به ساخت افزونههایی مانند YouTube Anti-Translate منجر شده است که لایههای دوبله و ترجمه ناخواسته را مسدود میکنند.
ویژگی جدید همگامسازی لب یوتیوب، مستقیماً به یکی از رایجترین شکایات درباره دوبله، یعنی عدم تطابق حرکت لبها با صدا، پاسخ میدهد. این سیستم با استفاده از هوش مصنوعی، حرکات لب سخنگو را با صدای دوبلهشده تطبیق میدهد تا تجربه تماشای یکپارچهتری ارائه دهد.
چالشها و فرصتها: تاثیر دوبله خودکار یوتیوب
تولیدکنندگان محتوا میتوانند از طریق یوتیوب استودیو (YouTube Studio) به این قابلیت دوبله خودکار با همگامسازی لب بپیوندند. فاز اولیه آزمایش بر اعضای برنامه همکاری یوتیوب (YouTube Partner Program) متمرکز است و در آینده ممکن است گوگل آن را گسترش دهد.
این طرح دوبله چندزبانه از مدلهای هوش مصنوعی اختصاصی، از جمله Gemini و Aloud، برای تولید صدای ترجمهشده، بازتولید لحن و احساس گوینده و تفکیک صدای اصلی از پسزمینه استفاده میکند. تستهای اولیه با تولیدکنندگان منتخب، نتایج موفقی داشتهاند؛ برخی کانالها پس از استفاده از این قابلیت، بینندگان غیربومی خود را تا ۳ برابر افزایش دادهاند.
با این حال، این سیستم همچنان دو دستگی ایجاد کرده است. موافقان به پتانسیل افزایش دسترسی و درآمد برای تولیدکنندگان محتوا و تبلیغکنندگان اشاره میکنند، در حالی که منتقدان معتقدند دوبله خودکار، اصالت محتوای اصلی را کاهش میدهد. باید دید که آیا فناوری همگامسازی لب میتواند شکاف بین ویدیوهای دوبلهشده با هوش مصنوعی و نسخههای اصلی را بهطور کامل پر کند یا خیر.