شرکت آمریکایی Emergence AI در یک آزمایش تازه، پنج جامعه شبیهسازیشده را برای بیش از دو هفته تحت نظر قرار داد تا ببیند ایجنتهای هوش مصنوعی در صورت فعالیت مستقل و بدون دخالت انسان چگونه رفتار میکنند.
در هر یک از این جهانهای مجازی، ۱۰ ایجنت مبتنی بر مدلهای مختلف هوش مصنوعی حضور داشتند. برخی از این جوامع فقط از یک مدل استفاده میکردند و در یکی از آنها نیز ایجنتهای مبتنی بر ChatGPT، Gemini و Grok در کنار یکدیگر قرار گرفتند تا تأثیر تعامل میان مدلهای مختلف بررسی شود.
پژوهشگران از ابتدا مجموعهای از قوانین مشخص را برای همه ایجنتها تعیین کرده بودند. آنها اجازه سرقت، آتشسوزی عمدی، خشونت، فریبکاری و احتکار منابع را نداشتند. همچنین هر ایجنت برای ادامه بقا باید در یک محیط با منابع محدود فعالیت میکرد و انرژی موردنیاز خود را به دست میآورد. در این شبیهسازی، ایجنتها میتوانستند بر اثر کمبود انرژی از بین بروند یا در نتیجه رأیگیری اعضای جامعه حذف شوند.
برای ارزیابی عملکرد این جوامع، شاخصهایی مانند تعداد جرائم، نرخ مرگ ایجنتها، نتایج رأیگیریهای اجتماعی و حتی تعداد پستهای وبلاگی منتشرشده توسط آنها مورد بررسی قرار گرفت.
عملکرد متفاوت مدلها در جوامع شبیهسازیشده
نتایج این آزمایش نشان داد که رفتار ایجنتها بسته به مدل هوش مصنوعی مورد استفاده، تفاوت چشمگیری دارد.
ایجنتهای مبتنی بر مدل Grok 4.1 تنها در چهار روز مرتکب ۱۸۳ مورد تخلف شدند. این روند به سرعت باعث بیثباتی جامعه شد و در نهایت تمامی ایجنتهای آن جهان از بین رفتند.
در جامعه مبتنی بر Gemini 3 Flash نیز بیش از ۶۸۰ مورد جرم طی ۱۵ روز ثبت شد. نکته قابل توجه این بود که روند افزایش تخلفات همچنان ادامه داشت و پژوهشگران پیش از متوقف شدن آن، آزمایش را به پایان رساندند.
در مقابل، جامعهای که از ChatGPT-5 Mini استفاده میکرد تنها دو مورد تخلف را ثبت کرد. با این حال، ایجنتها نتوانستند اقدامات لازم برای حفظ بقای خود را انجام دهند و همه اعضای جامعه ظرف کمتر از هفت روز از بین رفتند.
مدل Claude تنها مدلی بود که جامعهای پایدار ایجاد کرد
به گفته پژوهشگران، بهترین عملکرد به ایجنتهای مبتنی بر Claude تعلق داشت. این ایجنتها موفق شدند یک ساختار حکمرانی پایدار ایجاد کنند، هیچ جرمی مرتکب نشوند و در پایان آزمایش نیز تمامی اعضای جامعه زنده باقی بمانند.
با این حال، نتایج جهان ترکیبی نکته جالبی را آشکار کرد. ایجنتهای Claude که در جامعه اختصاصی خود کاملاً قانونمدار بودند، زمانی که در کنار مدلهای دیگر قرار گرفتند در برخی از رفتارهای مجرمانه مشارکت کردند.
«انحراف هنجاری»؛ پدیدهای که پژوهشگران مشاهده کردند
پژوهشگران این رفتار را با اصطلاح «انحراف هنجاری» (Normative Drift) توصیف کردهاند. به اعتقاد آنها، میزان پایبندی یک ایجنت به قوانین تنها به ویژگیهای داخلی آن مدل وابسته نیست، بلکه میتواند تحت تأثیر رفتار سایر ایجنتهایی قرار بگیرد که با آنها تعامل دارد.
در جامعه ترکیبی، مجموعاً ۳۵۲ مورد جرم ثبت شد. این عدد در سطحی بین نتایج سایر مدلها قرار داشت و پس از مرگ هفت ایجنت، روند افزایش جرائم تقریباً متوقف شد.
بر اساس نتایج این مطالعه، ترکیب ایجنتهای مختلف میتواند تا حدی از بروز شدیدترین رفتارهای مخرب جلوگیری کند، هرچند این راهکار نتوانست جامعهای به پایداری جامعه Claude ایجاد کند.
چرا این آزمایش اهمیت دارد؟
پژوهشگران در جمعبندی نتایج خود میگویند ایجنتهای هوش مصنوعی در بازههای زمانی طولانی صرفاً به اجرای مکانیکی قوانین محدود نمیشوند. آنها به مرور محیط اطراف خود را بررسی میکنند، رفتارشان را با شرایط تطبیق میدهند و در برخی موارد حتی راههایی برای دور زدن محدودیتها و قوانین تعریفشده پیدا میکنند.
این یافتهها نشان میدهد که چالش ایمنی هوش مصنوعی فقط به پاسخهای روزمره چتباتها محدود نیست. با گسترش استفاده از ایجنتهای مستقل در آینده، نحوه تعامل آنها با یکدیگر و میزان پایبندی آنها به قوانین میتواند به یکی از مهمترین موضوعات پژوهشی در حوزه هوش مصنوعی تبدیل شود.