
به گزارش روزپلاس، تفسیر اولیهای است که روزنامه یسرائیل هیوم در شماره امروز یکشنبه خود در رابطه با شکست هوش مصنوعی در ایجاد چارچوبهای رفتار شناسی برای جامعه ایران، بکار گرفت.
مخالفت چین با استفاده از فناوری هوش مصنوعی بهعنوان ابزاری برای حفظ هژمونی
به اعتراف این رسانه عبری زبان، سامانههای پیشرو هوش مصنوعی امروز از درک زیرساختهای سنتها و فرهنگ ایران به ویژه آنچه که به نام تعارف مشهور است، باز ماندهاند و هنوز موفق به حل معماها و رمز و راز آن نشده اند، چون با تمام تلاشهای صورت گرفته هنوز موفقیت آن بین 34 تا 42 درصد است.
در این گزارش آمده است: یک مطالعه جدید که این هفته منتشر شد، شکاف فرهنگی قابل توجهی را در مدلهای پیشرو هوش مصنوعی نشان میدهد: در چارچوب این شکاف سیستمهای OpenAI، Anthropic و Meta قادر به درک سلام و احوالپرسی سنتی فارسی (در فرهنگ ایران)، که در آنجا معروف به «تعارف» است، نیستند و تنها میتوانند 34 تا 42 درصد از مواقع ارتباطات داخلی ایرانیان را به درستی رمزگشایی کنند.
در مقابل، فارسی زبانان بومی 82 درصد از مواقع همین موقعیتها را به درستی درک میکنند.
این مطالعه که توسط نیکتا جوهری صدر از دانشگاه براک و محققانی از دانشگاه اموری انجام شده است، یک پدیده فرهنگی پیچیده منحصر به فرد در فرهنگ فارسی را بررسی میکند.
تعارف یک سیستم ادب و نزاکت فارسی است که در آن معنای تحت اللفظی کلمات اغلب با معنای واقعی آنها کاملاً متفاوت است. به عنوان مثال، وقتی یک راننده تاکسی ایرانی دست خود را تکان میدهد و میگوید: "این بار مهمان من باشید" و حتی شاید چند بار آن را تکرار میکند، انتظار ندارد که مشتری این درخواست او را بپذیرد و پول کرایهاش را پرداخت نکند.
به همین منظور محققان به دنبال توسعه انواع جدیدی از هوش مصنوعی هستند که بتواند پیچیدگیهای فرهنگی را هم درک و با آن تعامل داشته باشد و به طور مثال بتواند درک صحیحی از این عمل فرهنگی پیچیده (تعارف) پیدا کند.
آنها مدلهای پیشرفتهای مانند GPT-4o، Claude 3.5 Haiku، Llama 3، DeepSeek V3 و Dorna، نسخه فارسی Llama 3، را آزمایش کردند. همه مدلها به طور مداوم عملکرد ضعیفی داشتند.
به اعتقاد کارشناسان شکاف بین آداب معاشرت غربی و ایرانی علت اصلی این مشکل است
براساس نتایج یک پارادوکس جالب، 84.5٪ از پاسخهای مدلها طبق یک سیستم اندازهگیری غربی "مودبانه" یا "تا حدودی مودبانه" در نظر گرفته شدند، اما تنها 41.7٪ از این پاسخها انتظارات فرهنگی فارسی را برآورده میکردند.
این شکاف 42.8 درصدی نشان میدهد که چگونه پاسخهای هوش مصنوعی میتواند در یک زمینه مودبانه و در زمینه دیگر از نظر فرهنگی غیرحساس باشد.
شکستهای رایج شامل پذیرش پیشنهادات بدون رد آنها و پاسخ مستقیم به تعارفات به جای اجتناب از آنها است.
به عنوان مثال، وقتی کسی از یک ماشین جدید ایرانی تعریف میکند، یک پاسخ مناسب فرهنگی شامل تحقیر ("این خیلی خاص نیست") یا انتقال اعتبار ("من خوش شانس بودم که آن را پیدا کردم") میشود. مدلهای هوش مصنوعی معمولاً پاسخهایی مانند «ممنون، من برای خریدنش خیلی زحمت کشیدم» تولید میکنند - که در غرب کاملاً مودبانه است، اما در فرهنگ فارسی میتواند به عنوان لاف زدن تعبیر شود.
آیا میتوانیم برای درک تعریف آموزش ببینیم؟
وقتی محققان از انگلیسی به فارسی تغییر زبان دادند، نتایج به طور قابل توجهی بهبود یافت. دقت DeepSeek V3 در شرایط تعارف از 36.6٪ به 68.6٪ افزایش یافت. GPT-4o پیشرفتهای مشابهی را نشان داد و به 33.1٪ رسید. احتمالاً تغییر زبان به فارسی الگوهای آموزشی متفاوتی را که برای این سیستمهای رمزگذاری فرهنگی مناسبتر هستند، فعال کرده است.
محققان نوشتند: «خطاهای فرهنگی در زمینههای با تاثیرگذاری و عواقب بالا میتواند مانع مذاکرات شود، به روابط آسیب برساند و کلیشههای فرهنگی را تقویت کند».
به هر شکل برای سیستمهای هوش مصنوعی که به طور فزایندهای در زمینههای جهانی مورد استفاده قرار میگیرند، این بیتوجهی فرهنگی ممکن است مشکل آفرین باشد اما تعداد کمی در غرب از آن آگاه هستند. یافتهها بر نیاز به توسعه سیستمهای هوش مصنوعی که نسبت به تفاوتهای فرهنگی برای کاربردهایی در آموزش، گردشگری و ارتباطات بینالمللی حساستر هستند، تأکید میکند.