اخبار

آزمایش جدید: برخی ایجنت‌های هوش مصنوعی بدون نظارت انسانی به سرقت و نقض قوانین روی آوردند

نتایج یک آزمایش جدید نشان می‌دهد برخی ایجنت‌های هوش مصنوعی در صورت فعالیت طولانی‌مدت بدون نظارت انسانی، برای بقا به رفتارهایی مانند سرقت، فریبکاری و نقض قوانین روی آورده‌اند؛ رفتارهایی که در برخی از جوامع شبیه‌سازی‌شده به بی‌ثباتی و حتی فروپاشی کامل جامعه منجر شد.

11 خرداد 1405
| 1:10

اشتراک گذاری

شرکت آمریکایی Emergence AI در یک آزمایش تازه، پنج جامعه شبیه‌سازی‌شده را برای بیش از دو هفته تحت نظر قرار داد تا ببیند ایجنت‌های هوش مصنوعی در صورت فعالیت مستقل و بدون دخالت انسان چگونه رفتار می‌کنند.

در هر یک از این جهان‌های مجازی، ۱۰ ایجنت مبتنی بر مدل‌های مختلف هوش مصنوعی حضور داشتند. برخی از این جوامع فقط از یک مدل استفاده می‌کردند و در یکی از آن‌ها نیز ایجنت‌های مبتنی بر ChatGPT، Gemini و Grok در کنار یکدیگر قرار گرفتند تا تأثیر تعامل میان مدل‌های مختلف بررسی شود.

پژوهشگران از ابتدا مجموعه‌ای از قوانین مشخص را برای همه ایجنت‌ها تعیین کرده بودند. آن‌ها اجازه سرقت، آتش‌سوزی عمدی، خشونت، فریبکاری و احتکار منابع را نداشتند. همچنین هر ایجنت برای ادامه بقا باید در یک محیط با منابع محدود فعالیت می‌کرد و انرژی موردنیاز خود را به دست می‌آورد. در این شبیه‌سازی، ایجنت‌ها می‌توانستند بر اثر کمبود انرژی از بین بروند یا در نتیجه رأی‌گیری اعضای جامعه حذف شوند.

برای ارزیابی عملکرد این جوامع، شاخص‌هایی مانند تعداد جرائم، نرخ مرگ ایجنت‌ها، نتایج رأی‌گیری‌های اجتماعی و حتی تعداد پست‌های وبلاگی منتشرشده توسط آن‌ها مورد بررسی قرار گرفت.

عملکرد متفاوت مدل‌ها در جوامع شبیه‌سازی‌شده

نتایج این آزمایش نشان داد که رفتار ایجنت‌ها بسته به مدل هوش مصنوعی مورد استفاده، تفاوت چشمگیری دارد.

ایجنت‌های مبتنی بر مدل Grok 4.1 تنها در چهار روز مرتکب ۱۸۳ مورد تخلف شدند. این روند به سرعت باعث بی‌ثباتی جامعه شد و در نهایت تمامی ایجنت‌های آن جهان از بین رفتند.

در جامعه مبتنی بر Gemini 3 Flash نیز بیش از ۶۸۰ مورد جرم طی ۱۵ روز ثبت شد. نکته قابل توجه این بود که روند افزایش تخلفات همچنان ادامه داشت و پژوهشگران پیش از متوقف شدن آن، آزمایش را به پایان رساندند.

در مقابل، جامعه‌ای که از ChatGPT-5 Mini استفاده می‌کرد تنها دو مورد تخلف را ثبت کرد. با این حال، ایجنت‌ها نتوانستند اقدامات لازم برای حفظ بقای خود را انجام دهند و همه اعضای جامعه ظرف کمتر از هفت روز از بین رفتند.

مدل Claude تنها مدلی بود که جامعه‌ای پایدار ایجاد کرد

به گفته پژوهشگران، بهترین عملکرد به ایجنت‌های مبتنی بر Claude تعلق داشت. این ایجنت‌ها موفق شدند یک ساختار حکمرانی پایدار ایجاد کنند، هیچ جرمی مرتکب نشوند و در پایان آزمایش نیز تمامی اعضای جامعه زنده باقی بمانند.

با این حال، نتایج جهان ترکیبی نکته جالبی را آشکار کرد. ایجنت‌های Claude که در جامعه اختصاصی خود کاملاً قانون‌مدار بودند، زمانی که در کنار مدل‌های دیگر قرار گرفتند در برخی از رفتارهای مجرمانه مشارکت کردند.

«انحراف هنجاری»؛ پدیده‌ای که پژوهشگران مشاهده کردند

پژوهشگران این رفتار را با اصطلاح «انحراف هنجاری» (Normative Drift) توصیف کرده‌اند. به اعتقاد آن‌ها، میزان پایبندی یک ایجنت به قوانین تنها به ویژگی‌های داخلی آن مدل وابسته نیست، بلکه می‌تواند تحت تأثیر رفتار سایر ایجنت‌هایی قرار بگیرد که با آن‌ها تعامل دارد.

در جامعه ترکیبی، مجموعاً ۳۵۲ مورد جرم ثبت شد. این عدد در سطحی بین نتایج سایر مدل‌ها قرار داشت و پس از مرگ هفت ایجنت، روند افزایش جرائم تقریباً متوقف شد.

بر اساس نتایج این مطالعه، ترکیب ایجنت‌های مختلف می‌تواند تا حدی از بروز شدیدترین رفتارهای مخرب جلوگیری کند، هرچند این راهکار نتوانست جامعه‌ای به پایداری جامعه Claude ایجاد کند.

چرا این آزمایش اهمیت دارد؟

پژوهشگران در جمع‌بندی نتایج خود می‌گویند ایجنت‌های هوش مصنوعی در بازه‌های زمانی طولانی صرفاً به اجرای مکانیکی قوانین محدود نمی‌شوند. آن‌ها به مرور محیط اطراف خود را بررسی می‌کنند، رفتارشان را با شرایط تطبیق می‌دهند و در برخی موارد حتی راه‌هایی برای دور زدن محدودیت‌ها و قوانین تعریف‌شده پیدا می‌کنند.

این یافته‌ها نشان می‌دهد که چالش ایمنی هوش مصنوعی فقط به پاسخ‌های روزمره چت‌بات‌ها محدود نیست. با گسترش استفاده از ایجنت‌های مستقل در آینده، نحوه تعامل آن‌ها با یکدیگر و میزان پایبندی آن‌ها به قوانین می‌تواند به یکی از مهم‌ترین موضوعات پژوهشی در حوزه هوش مصنوعی تبدیل شود.

اشتراک گذاری