توسعه روش یادگیری عمیق برای شناسایی اهداف
به گزارش کارگروه فناوری اطلاعات سایبربان؛ «Socionext»، ارائه دهنده محصولات سیستم روی چیپ و یک گروه تحقیقاتی در مؤسسه «Datability Science» دانشگاه اوساکا یک روش یادگیری عمیق توسعه دادند که تشخیص چهره و شناسایی اهداف را در شرایط بسیار کم نور امکانپذیر میکند. این روش باعث میشود شناسایی اشیاء بدون ایجاد مجموعه دادههای عظیم فراهم شود، کاری که قبلاً بسیار ضروری بود.
یک چالش مهم در فناوری دید کامپیوتری، بهبود عملکرد تشخیص تصویر برای برنامههایی مانند دوربینهای داخل خودرو و سیستمهای نظارتی در شرایط کم نور است. تاکنون، یک روش یادگیری عمیق با استفاده از دادههای تصویر «RAW» از سنسورها استفاده شده بود و به آن «یادگیری برای مشاهده در تاریکی» میگفتند. با این حال، این روش به مجموعه اطلاعاتی از بیش از 200 هزار تصویر با بیش از 1.5 میلیون تفسیر (برای یادگیری نهایی) نیاز دارد و در نتیجه پرهزینه و مضر است.
تیم تحقیقاتی مشترک روش جدیدی برای سازگاری دامنه را ارائه دادهاند که با استفاده از تکنیکهای یادگیری ماشینی مانند انتقال یادگیری و تقطیر دانش، مدلی را با استفاده از مجموعه دادههای موجود ایجاد میکند. این مسئله چالش را از طریق مراحل زیر برطرف میکند :
یک مدل استنتاج با مجموعه دادههای موجود؛ استخراج دانش از مدل استنتاج فوق؛ ادغام مدلها با لایههای پیوسته و در نهایت ساختن مدلهای تولیدی با تقطیر دانش. در نتیجه یادگیری یک مدل تشخیص چهره مورد نظر با استفاده از مجموعه دادههای موجود امکانپذیر میشود.
با استفاده از این روش سازگاری دامنه، تیم توانست با استفاده از تصاویر RAW گرفته شده در شرایط تاریکی شدید با مدل یولو (YOLO)، یک مدل تشخیص تصویر یولو در تاریکی بسازد. یادگیری مدل شناسایی شی با تصاویر RAW میتواند با مجموعه دادههای موجود و بدون ایجاد مجموعه دادههای اضافی حاصل شود. در مقایسه با موردی که با افزایش روشنایی تصاویر با مدل YOLO موجود نمیتوان شیء را تشخیص داد، مدل پیشنهادی باعث میشود که تشخیص تصاویر RAW و شناسایی اشیاء ممکن شود. از نظر انتقادی میزان منابع محاسباتی مورد نیاز در این مدل تقریباً نیمی از مدل پایه است که از ترکیب مدلهای قبلی استفاده میکند.
انتظار میرود این تشخیص مستقیم تصاویرRAW برای شناسایی اشیاء در شرایط بسیار تاریک و بسیاری کاربردهای دیگر مورد استفاده قرار گیرد. Socionext گفت که قصد دارد این روش جدید را در پردازندههای سیگنال تصویر شرکت بگنجاند تا «SoC»های جدید و سیستمهای جدید دوربین در اطراف چنین SoC ها را توسعه و راهحلهای پیشرو را برای برنامههایی از جمله خودرو، امنیت، صنعتی و سایر مواردی ارائه دهد که نیاز به عملکرد بالای تشخیص تصویر دارند.