מחקר חדש בכתב עת לפסיכולוגיה שעבר ביקורת עמיתים מצא שמודלי שפה גדולים משכפלים סטריאוטיפים אנטישמיים, גם לאחר מאמצים לסנן הטיות באימון המודלים. החוקרים מזהירים כי הדפוס עלול להשפיע על תהליכי קבלה אוטומטיים לעבודה ובתחומים נוספים.
מחקר שעבר ביקורת עמיתים מצא כי מודלי שפה גדולים — מערכות הבינה המלאכותית העומדות בבסיס צ׳אטבוטים וכלי יצירת טקסט — משכפלים סטריאוטיפים אנטישמיים גם לאחר יישום אמצעי סינון סטנדרטיים. המחקר, שדווח על ידי Times of Israel, בחן תפוקות של מספר מודלים מרכזיים וזיהה דפוסים חוזרים של סטריאוטיפים אנטישמיים. החוקרים ציינו שנתוני האימון של המודלים, שמקורם בטקסטים אנושיים מהאינטרנט, משקפים דעות קדומות חברתיות שלא מוסרות לחלוטין על ידי מסנני הבטיחות. לממצאים יש השלכות מעשיות על קבלת החלטות אוטומטית בגיוס עובדים, סינון תוכן ותחומים נוספים שבהם נעשה שימוש גובר בבינה מלאכותית. המחקר טרם שוכפל באופן עצמאי, והמודלים הספציפיים שנבדקו לא פורטו בדיווח הזמין.
מקורות ואות
ידיעה ממקור יחיד לעולם אינה מדורגת “מאומת” או “מבוסס”. דירוג האות יתחזק רק כשמקור שני, עצמאי, יאשש אותה.
- קליטה פנימית