هوش مصنوعی در درک تعارفات ایرانی ناتوان است
پژوهشی تازه نشان میدهد مدلهای زبانی پیشرفته مانند GPT-4o، Claude 3.5 و LLaMA3 در بازنمایی «تعارف» فارسی عملکرد ضعیفی دارند.

طبق پژوهش انجام گرفته، تنها در ۳۴ تا ۴۲ درصد موقعیتها درست عمل میکنند، در حالی که گویشوران بومی تا ۸۲ درصد موفقاند.
این مطالعه با معرفی معیار «TAAROFBENCH» به رهبری نیکتا گوهریصدر از دانشگاه براک انجام شده است.
ناتوانی هوش مصنوعی در درک رمزگانهای فرهنگی، میتواند روابط اجتماعی و حتی مذاکرات حساس را مختل کند.