کاهش پاسخهای ناامن در مدل جدید چت جیپیتی
به گزارش کارگروه فناوری اطلاعات سایبربان، شرکت اوپن اِی آی (OpenAI) پس از همکاری با بیش از ۱۷۰ پزشک متخصص سلامت روان، مدل پیشفرض چت جیپیتی (ChatGPT) را بهروزرسانی کرده است تا به سیستم کمک کند که پریشانی را بهتر تشخیص دهد، مکالمات را کاهش دهد و کاربران را به پشتیبانی در دنیای واقعی هدایت کند.
این بهروزرسانی، تبادلات حساس را به مدلهای امنتر هدایت میکند، دسترسی به خطوط تلفن اضطراری را گسترش میدهد و دستورالعملهای ملایمی برای استراحت اضافه میکند و هدف آن کاهش پاسخهای مضر بهجای ارائه محتوای بیشتر است.
بهبودهای اندازهگیری شده در سه حوزه اولویتدار قابلتوجه هستند: علائم شدید سلامت روان مانند روانپریشی و شیدایی، خودآزاری و خودکشی و اتکای عاطفی ناسالم به هوش مصنوعی.
شرکت اوپن اِی آی اعلام کرد که پاسخهای نامطلوب بین ۶۵ تا ۸۰ درصد در ترافیک تولید کاهشیافته است و بررسیهای مستقل پزشکان، دستاوردهای قابلتوجهی را در مقایسه با مدلهای قبلی نشان میدهد. درعینحال، سناریوهای نادر اما پرخطر همچنان موردتوجه آزمایشهای بیشتر هستند.
این شرکت از یک فرایند پنجمرحلهای برای شکلدهی به تغییرات استفاده کرد: تعریف آسیبها، اندازهگیری آنها، اعتبارسنجی رویکردها با متخصصان، کاهش خطرات از طریق بهروزرسانیهای پس از آموزش و محصول و تکرار مداوم.