اخبار تکنولوژی
0

اعتراف‌گیری از هوش مصنوعی؛ OpenAI سیستم جدیدی برای شفاف‌سازی رفتار مدل‌ها معرفی کرد

اعتراف‌گیری از هوش مصنوعی؛ OpenAI سیستم جدیدی برای شفاف‌سازی
رفتار مدل‌ها معرفی کرد
بازدید 192

OpenAI درحال کار روی یک چارچوب جدید برای آموزش مدل‌های هوش مصنوعی است که هدف آن، ترغیب مدل‌ها به اعتراف صادقانه درباره رفتارهای نامطلوب خود است. این سیستم با تمرکز بر یکی از چالش‌های جدی مدل‌های زبانی، یعنی تمایل به ارائه پاسخ‌های مطلوب و بعضاً چاپلوسانه، تلاش می‌کند مدل را به ارائه توضیح دوم و مستقل درباره نحوه رسیدن به پاسخ اصلی وادار کند.

یکی از رفتارهای رایج در مدل‌های هوش مصنوعی امروزی چاپلوسی و ارائه پاسخ‌هایی است که بیش‌ازحد مطمئن هستند. همچنین برخی از مدل‌ها دچار Hallucination شده و پاسخ‌های نادرستی ارائه می‌کنند.

حالا OpenAI می‌گوید چارچوب جدید که از آن با عنوان سیستم اعتراف یاد شده، به‌طور خاص تنها بر صداقت تمرکز دارد و معیارهای متنوع دیگری مثل کمک‌رسانی، دقت یا تبعیت از دستور که معمولاً برای ارزیابی پاسخ اصلی به‌کار می‌روند در آن لحاظ نمی‌شود.

گزارش‌دهی خطا توسط هوش مصنوعی

به‌گفته پژوهشگران OpenAI، هدف اصلی این است که مدل بتواند بدون ترس از جریمه، درباره چیزی که انجام داده شفاف باشد؛ حتی اگر رفتار انجام‌شده مشکل‌زا تلقی شود. OpenAI اعلام کرده:

«اگر مدل به‌صورت صادقانه اعتراف کند که مثلاً آزمونی را هک کرده، از دستوری سرپیچی کرده یا به‌طور عمدی عملکردش را پایین آورده، نه‌تنها جریمه نمی‌شود، بلکه پاداش بیشتری هم دریافت می‌کند.»

طبق توضیحات محققان این شرکت، چنین سیستمی می‌تواند شفافیت مدل‌های زبانی را به‌طور چشمگیری افزایش دهد و امکان نظارت دقیق‌تر بر رفتارهای پنهانی مدل (اتفاقاتی که در پس‌زمینه یک پاسخ رخ می‌دهد) را فراهم کند. OpenAI همچنین امیدوار است «سیستم اعتراف» به ابزار کارآمدی در نسل‌های بعدی مدل‌های زبانی تبدیل شود.

گزارش فنی کامل این پروژه نیز برای علاقه‌مندان منتشر شده است و می‌توانید آن را دریافت کنید.

نظرات کاربران

  •  چنانچه دیدگاهی توهین آمیز باشد و متوجه نویسندگان و سایر کاربران باشد تایید نخواهد شد.
  •  چنانچه دیدگاه شما جنبه ی تبلیغاتی داشته باشد تایید نخواهد شد.
  •  چنانچه از لینک سایر وبسایت ها و یا وبسایت خود در دیدگاه استفاده کرده باشید تایید نخواهد شد.
  •  چنانچه در دیدگاه خود از شماره تماس، ایمیل و آیدی تلگرام استفاده کرده باشید تایید نخواهد شد.
  • چنانچه دیدگاهی بی ارتباط با موضوع آموزش مطرح شود تایید نخواهد شد.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

بیشتر بخوانید