ارزیابی دقیق از قابلیتهای هوش مصنوعی توسط بریتانیا
به گزارش کارگروه فناوری اطلاعات سایبربان، برای اولینبار، بریتانیا یک ارزیابی دقیق و مبتنی بر شواهد از قابلیتهای هوش مصنوعی پیشرو منتشر کرده است. گزارش روندهای هوش مصنوعی پیشرو، حاصل دو سال آزمایش ساختاریافته در حوزههایی از جمله امنیت سایبری، مهندسی نرمافزار، شیمی و زیستشناسی است.
یافتهها پیشرفت سریعی را در عملکرد فنی نشان میدهند. میزان موفقیت در وظایف سایبری سطح کارآموز از کمتر از ۹ درصد در سال ۲۰۲۳ به حدود ۵۰ درصد در سال ۲۰۲۵ افزایشیافته است، درحالیکه مدلها همچنین چالشهای سایبری سطح متخصص را که قبلاً به یک دهه تجربه نیاز داشتند، تکمیل کردهاند.
طبق این گزارش، اقدامات حفاظتی طراحیشده برای محدودکردن سوءاستفاده نیز در حال بهبود است. آزمایش تیم قرمز نشان داد که زمان لازم برای شناسایی جیلبریکهای جهانی از چند دقیقه به چند ساعت بین نسلهای مدل افزایشیافته است که نشاندهنده بهبود تقریبی چهل برابری در مقاومت است.
این تجزیهوتحلیل، پیشرفتهایی فراتر از امنیت سایبری را برجسته میکند. سیستمهای هوش مصنوعی اکنون وظایف مهندسی نرمافزار یکساعته را بیش از ۴۰درصد مواقع انجام میدهند، درحالیکه مدلهای زیستشناسی و شیمی در آزمونهای دانش کنترلشده از محققان سطح دکترا بهتر عمل میکنند و از افراد غیرمتخصص در گردشهای کاری به سبک آزمایشگاهی پشتیبانی میکنند.
اگرچه این گزارش از ارائه توصیههای سیاستی خودداری میکند، مقامات بریتانیا میگویند که این گزارش شفافیت پیرامون سیستمهای پیشرفته هوش مصنوعی را تقویت میکند.
دولت قصد دارد از طریق مؤسسه امنیت هوش مصنوعی به سرمایهگذاری در علم ارزیابی ادامه دهد و از آزمایشهای مستقل و همکاریهای بینالمللی حمایت کند.