זיהוי אמת או שקר בשימוש בינה מלאכותית

מחקר באוניברסיטת אריאל במסגרת תוכנית לאומית בהובלת רשות החדשנות לעידוד מחקר ופיתוח בתחום עיבוד השפה הטבעית (NLP) האפשרות למחוק ולנסח מחדש פרופ' עמוס עזריה, בית הספר למדעי המחשב באוניברסיטת אריאל עוסק במדעי הנתונים, בינה מלאכותית ואינטראקציה אדם סוכן

07.02.2024 מאת: פורטל הכרמל והצפון

דר עמוס עזריה אוני אריאל

מחקר זה נעשה במימון הרשות לחדשנות לצורך שיפור יכולות עיבוד שפה בעברית. "כיום ברור, מסביר פרופ' עמוס עזריה,שהבינה המלאכותית היא חלק בלתי נפרד מהעתיד של כולנו, אך בשל סיבות שונות, יכולות הבינה המלאכותית בעברית לוקות בחסר, לכן, הרשות לחדשנות יצאה בקול קורא במטרה לצמצם את הפער בין היכולות של הבינה המלאכותית בעברית ליכולותיה באנגלית".

מודלי שפה, כדוגמת ChatGPT, מאומנים על כמויות עצומות של דאטה. הם יוצרים תגובה על ידי יצירת מילה אחר מילה. אבל, בניגוד לאנשים, הם לעולם לא בוחרים באפשרות למחוק. זה לא מפתיע, כי למרות שבדאטה, שמודלי השפה התאמנו עליה מן הסתם התלוו מחיקות רבות, המחיקות האלו לא מופיעות בדאטה. אבל, כמו שבתהליך כתיבה, ניתן לזהות תוך כדי כתיבה שככל הנראה נכון למחוק את המשפט האחרון ולכתוב אותו אחרת, לעיתים בגלל שהניסוח המקורי לא היה מדויק, או לא לגמרי נכון , גם למודלי שפה יכולה להיות היכולת הזאת.

במחקר בהובלת פרופ' עמוס עזריה במסגרת תארים מתקדמים בבית הספר למדעי המחשב באוניברסיטת אריאל, נעשה שימוש בערכים הפנימיים של מודל השפה, כדי לזהות מתי משפט שמודל השפה עצמו יצר אינו נכון. לדוגמא, "פריז היא עיר הבירה של צרפת אמת", "כדור הארץ הוא שטוח שקר". כלומר, בתהליך הניבוי מודל השפה מחשב המון ערכי ביניים, שעוזרים לו לנבא את המילה הבאה. אנו בונים מערכת למידת מכונה שיכולה להשתמש בערכי הביניים המחושבים על ידי מודל השפה כדי לנבא האם המשפט אותו המודל מייצר הוא אמת או שקר.

"מערכת למידת המכונה הנבנית, במסגרת זו, מסביר פרופ' עמוס עזריה, מבוססת על מאגר משפטים בהם אנו יודעים האם מדובר במשפט אמת או משפט שקר. במחקר זה נעשית בחינה של ערכי הביניים עבור משפטים אלו, כך, שכאשר שמגיע משפט חדש, אפשר לבחון האם ערכי הביניים של המשפט החדש דומים יותר לערכי הביניים של משפט שקרי או של משפט אמיתי".

מודל שפה, זו סטטיסטיקה של רצפים של מילים. המודל מקבל טקסט ומחזיר את ההסתברות מודל שפה, של טקסט זה על פי כל המילים במילון של המודל. הדוגמאות המוכרות ביותר של שימוש במודלי שפה הן "השלמה אוטומטית" המציעה את המילה או המילים הכי סבירות ביחס לטקסט שהוקלד עד כה, וכלי בינה מלאכותית טקסטואליים כמו דוגמת ChatGPT או Bard.