توسعه زبان اشاره توسط هوش مصنوعی
به گزارش کارگروه فناوری اطلاعات سایبربان، سرویسهای پخش آنلاین، نحوه تماشای رسانههای اجتماعی توسط مردم را متحول کردهاند، اما دسترسی برای بینندگان ناشنوا و کمشنوا همچنان محدود است. درحالیکه زیرنویسها در بسیاری از پلتفرمها موجود هستند، اغلب ناقص هستند یا فاقد رسایی لازم برای کسانی هستند که عمدتاً از زبان اشاره استفاده میکنند.
مترجمهای زبان اشاره بهندرت در محتوای پخش آنلاین گنجانده میشوند، عمدتاً به دلیل هزینه و محدودیتهای فنی. با این حال، رویکردهای جدید مبتنی بر هوش مصنوعی میتوانند به پر کردن این شکاف کمک کنند.
بهعنوانمثال، شرکت بیت مووین (Bitmovin) درحالتوسعه فناوری است که از پردازش زبان طبیعی و انیمیشن سهبعدی برای تولید آواتارهای اشاره استفاده میکند. این آواتارها محتوای ویدئویی را پوشش و با استفاده از نشانههایی از آهنگهای متنی شبیه زیرنویس، گفتگو را به زبان اشاره آمریکایی (ASL) ارائه میدهند.
این سیستم به نمایشهای زبان اشاره مانند همنوسیس (HamNoSys) متکی است و با اشاره بهعنوان یک آهنگ زیرنویس اضافی رفتار و امکان ادغام با فرمتهای ویدئویی استاندارد مانند DASH و HLS را فراهم میکند.
این امر با اجتناب از کانالهای ویدئویی جداگانه یا پنجرههای تصویر در تصویر، پیچیدگی را کاهش میدهد و پیادهسازی را مقیاسپذیرتر میکند.
چالشها همچنان پابرجا هستند، از جمله محدودیت تکنیکهای تفسیر، که دستور زبان اشاره را بیش از حد ساده میکنند و دشواری متحرکسازی انتقالهای روان و حالات چهره که برای اشاره مؤثر حیاتی است.
در حالی که این سیستمها ممکن است جایگزین مترجمان انسانی برای پخش زنده نشوند، میتوانند پشتیبانی از زبان اشاره را برای کتابخانههای وسیع محتوای بایگانی شده فراهم کنند.
با تکامل قابلیتهای هوش مصنوعی و انیمیشن، آواتارهای اشاره ممکن است به یک ویژگی استاندارد در بهبود دسترسی در رسانههای جریانی تبدیل شوند.