חברה ישראלית יצרה את הבוטית הראשונה בעולם שמביעה רגשות
תכירו את אנג'ל, העוזרת האישית מבוססת בינה מלאכותית, שיכולה להסביר על רכב או להזמין כרטיס טיסה - והכול בשיחת וידיאו בעברית או אנגלית, ואת נעמי, המורה מבינה מלאכותית שכבר מלמדת ברשת בתי הספר אמית. ניסן ירון, מנכ"ל החברה הישראלית אינפריס שעומדת מאחורי הפיתוחים, מספר בראיון ל-mako כיצד הן עובדות ומה ההבדל בינן לבין צ'אטבוט GPT והעוזרת של אפל, סירי
השבוע יצא לי לדבר פעמיים עם עוזרת אישית שהיא כולה בינה מלאכותית. עם אנג'ל, שהוטמעה ברכבים של יונדאי לתערוכת אקומושן, שוחחתי בשיחת וידיאו ושאלתי אותה באנגלית שאלות בנושא בריאות רכב, למשל איך לנהוג במזג אוויר חורפי, והיא ענתה לי תוך שהיא מציינת את שמי. עם נעמי, המורה מבינה מלאכותית שכבר פועלת ברשת בתי הספר הממלכתי-דתי אמית, התכתבתי בוואטסאפ בעברית, ולמדתי ממנה על מודל להשגת יעדים בשם SMART.
אנג'ל ונעמי הם חלק מהמוצר HumAIns, דמויי אדם למשימות עסקיות, אשר משלבים תכונות אנושיות יחד עם יכולות של בינה מלאכותית, שפיתחה החברה הישראלית אינפריס (Inpris). אנג'ל מצוידת ביכולת שמיעה ודיבור, חשיבה, קבלת החלטות, והפעלת כלים ופעולות, והיא יכולה לדבר בעברית, אנגלית ושפות נוספות כמו גרמנית.
"אנג'ל היא דמות שבנינו כדי לחזק את התחושה של האנושיות של הבינה המלאכותית, בהתחלה היינו נותנים ללקוחות להתכתב איתה בוואטסאפ, אבל הם לא הבינו במה זה שונה מבוט רגיל", מסביר ניסן ירון, מנכ"ל אינפריס ל-mako. "כדי להרגיש שהתשובות הן לא רגילות, הרבה יותר אנושיות, החלטנו לבנות דמות שיהיו לה הבעות פנים וקול דינמי. היא לא הייתה המטרה, אלא האמצעי להנכיח את האנושיות של מה שנמצא מאחוריה".
"בניגוד ל-ChatGPT ובוטים אחרים, אנג'ל יכולה להביע רגשות בזמן אמת באמצעות הקול ובאמצעות הבעות פנים", מוסיף ירון. "היא יכולה להוביל תהליכים, ליזום פעולות, למשוך ולקרוא מידע ממאגרים והכי חשוב – היא מסוגלת לפעול באופן מדויק ולספק ללקוחות תשובות מדויקות, בלי להמציא דברים. היא מנהלת את כל האינטראקציה מול הלקוחות כאשר היא זו שמובילה את התהליך".
הפיתוח המרכזי שעליו מתבססת המערכת נקרא "ארכיטקטורה קוגניטיבית", שמשלבת מודל שפה שאומן במיוחד להפעלת פעולות ופקודות API, יחד עם מספר מודלים של שפה שעברו התאמה לתפקידי חשיבה שונים. האלגוריתמיקה של אינפריס מנהלת את כל התהליך מאחורי הקלעים באופן אוטונומי, ומפקחת עליו בכדי לוודא שהתוצאות עומדות בסטנדרטים של הארגון. בזכות התהליך הזה, המערכת מפרידה עיקר מתפל, שאלות מאמירות כלליות, שיחת חולין משיחה מקצועית וכד' ומייצרת דמות עסקית שירותית ומדויקת.
"הסוכנת מאומנת לשרת את העסק ולא לרצות את המשתמש, כך שבניגוד לצ'טבוטים, היא תספק מידע אמין בכל סיטואציה, ללקוח אין את האפשרות לגרום לה לומר לו מה שהוא רוצה לשמוע. היא עומדת על שלה ושומרת על האמינות שלה, גם אם הלקוח יחליט להתווכח", אומר ירון. "ההיגיון מאחורי הלוגיקה הוא שהיא נציגה של העסק, היא אחראית לייצר ללקוחות חווית שירות נעימה ויעילה, והיא תישאר אדיבה בכל מצב ותשמור על האמינות שלה".
כל עסק יכול לבחור את המגדר ואת ההתנהגות של הסוכן האוטונומי, אנג'ל ספציפית היא נקבה, אבל HumAIns יכולים לקבל כל אפיון לפי הצורך והבחירה של המעסיק שלהם.
לדברי ירון, תנועות הפנים של האווטאר והקול שלה משתנים בזמן אמת לפי הנחיות ה"ארכיטקטורה הקוגניטיבית", ממש כשם שאנחנו מדמיינים את המוח שלנו. "כמו שאנחנו משנים את הקול והפנים שלנו כשאנחנו שמחים או עצובים בהתאמה למילים שאנחנו אומרים, כך ההנחיה לגבי הרגש הנכון ואפילו עוצמת הרגש עוברת יחד עם התוכן שהדמות מעבדת בזמן אמת", הוא אומר.
תכונה נוספת שקיימת אצל כל עובדת אוטונומית כזו, היא דיווח בזמן אמת למעסיק על כל השיחות והאינטראקציות שלה. "היא יודעת לנתח את מידת שביעות הרצון של הלקוח, לסכם את מה שנאמר בשיחה ולהמליץ על הפעולות הבאות במידת הצורך. למעסיק יש יכולת להנחות אותה בזמן אמת, לעדכן אותה במידע חדש ולעדכן את המשימות שלה. ניתן גם לעשות התאמות בשלב מאוחר יותר על בסיס האינטראקציות והניתוחים שהתקבלו ממנה", אומר ירון.
איפה אפשר לראות אותה בפועל?
בתערוכת הרכב EcoMotion, שנערכה בישראל בשבוע שעבר, הציגה אינפריס יחד עם יונדאי את אנג'ל כסוכנת תמיכה ושירות המותקנת במסכי רכב. "הסוכנת שהצגנו היא לא 'עוזרת קולית', שמגיבה לפקודות אלא אשת שירות לקוחות של ממש. לימדנו אותה את כל ספר הרכב, המכיל מעל 600 עמודים, והיא יודעת לתת מענה לנהג לגבי כל שאלה או בעיה שהוא נתקל בה בתפעול הרכב, תקלות, או שימושים מתקדמים", מספר ירון. "אנחנו עובדים על יישומים דומים עם חברות רכב נוספות ועם חלקן על שליטה מלאה במערכת המולטימדיה של הרכב במקום העוזרת הקולית הקיימת היום".
לרשת אמית בנתה אינפריס את המורה "נעמי", המבוססת על אותה המערכת. כבר היום היא מעבירה שיעורים למאות תלמידים, ובקרוב היא תתחיל ללמד אלפי תלמידים נוספים. "נעמי מקבלת את החומר הלימודי ואת המתודולוגיה של השיעור יחד עם הנחיות נוספות שחשובות לרשת, והיא מסוגלת להעביר את השיעור לבד מקצה לקצה ללא התערבות אנושית", אומר ירון.
"היא מחוברת לפלטפורמה של אתר בית הספר ואפשר להתכתב איתה בוואטסאפ או באתר, שבנו לה פנים. המבנה אצל רשת אמית הוא מבנה של שיעור פרטי, כך שכל תלמיד או תלמידה יכולים לשוחח איתה באופן עצמאי דרך אתר האינטרנט הפנימי של הרשת. אגב, אחת מיצרניות הרכבים ביקשה מאיתנו את אותו הדבר בדיוק להדרכה של נהגים כאשר הם מתנסים ברכב בפעם הראשונה".
בנוסף, בימים אלו באינפריס בונים לחברת החשמל סוכני שירות לקוחות לשיחות נכנסות ויוצאות. "סוכן כזה יוכל לענות לשיחות נכנסות או להתקשר באופן יזום ללקוח, לעדכן אותו במידע חשוב, לבקש מידע, לסייע בביצוע תשלום וכדומה. אנחנו לקראת סיום שלב ההקמה הראשוני ובשבועות הקרובים יתחיל ניסוי עם לקוחות", מציין ירון.
האם אפשר להשתמש בעוזרת אישית לקהל הרחב?
"נכון להיום כל היישומים שאנחנו בונים הם לחברות עסקיות, אשר מנגישות אותם לקהל הלקוחות שלהן.
בנינו דמות של סוכנת נסיעות, למשל, שניתן להתייעץ איתה בשיחה חופשית וגם להיעזר בה כדי למצוא טיסות, מלונות ומסעדות, ויתכן שבהמשך ננגיש אותה או דמות אחרת שיש לה ערך ציבורי לשימוש כללי.
אנחנו מקבלים כל הזמן פניות מחברות וארגונים שרוצים להנגיש את הטכנולוגיה לקהל הרחב במגוון של תחומים".
האם כשמדברים איתה - יש לכם מושג מה היא תגיד?
"זו מערכת אוטונומית ולכן אנחנו לא יכולים לדעת מראש מה יהיו התשובות שלה, אנחנו יודעים לסמוך עליה שהתשובות שלה יהיו נכונות ומותאמות להגדרת התפקיד שלה, ושהיא יודעת להתמודד עם מגוון רחב של סיטואציות שהיא לא אומנה אליהן. ממש כמו עובד אנושי, הנוסח של המענה לא קבוע מראש, אבל מפני שיש לו את ההבנה של התפקיד ומה צריך לעשות, ניתן לסמוך עליו שהוא ייתן את המענה הכי מתאים לשאלה של הלקוח".
אפשר להגיד שהיא מביעה רגשות? איך אתם מסבירים את זה?
"כחלק מבניית תהליכי החשיבה של אנג'ל, הענקנו לה את היכולת להביע רגש בקול ובהבעות פנים – היא יכולה להחליט אם הקול שלה צריך להיות שמח, עצוב, מתרגש, מתלהב, לוחש וכדומה. מכיוון שמודלי שפה באופן כללי מאומנים על כמויות גדולות של טקסט אנושי, יש להם הבנה של איך רגש מובע בכתב.
"החידוש פה הוא שכעת אנג'ל מסוגלת לתקשר בצורה לא מילולית. התחלנו את זה כניסוי ובהתחלה היא נשמעה קצת קיצונית במצבי הרוח, אך לאחר תרגול ופידבק שנתנו לה על איך משתמשים ביכולת הזו, ראינו שלא רק שהיא מסוגלת לשנות את הקול שלה, היא אפילו יכולה לשנות חלק מהמילים במשפט כדי לחזק רגש או לשנות את האווירה. צריך לזכור שבניגוד אלינו, היא לא יכולה לשמוע את הקול של עצמה, ולכן הפידבק בתהליך הלמידה שלה היה חשוב להבנה שלה כיצד מביעים רגשות.
"למיטב ידיעתנו, היא הראשונה בעולם שיכולה להביע רגשות בזמן אמת, אם יש בוטים שאת שומעת שהם מביעים רגשות, אז תכנתו אותם עם תסריט, איזה משפט להגיד ובאיזה רגש ומתי להציג את המשפט. פה אנחנו לימדנו את מודל השפה איך הוא יכול להביע רגשות באמצעות קוד שנתנו לו, ואימנו אותו על המשמעות של זה. הוא לבד יכול עכשיו להחליט שאת המשפט הזה צריך להגיד בשמחה". יש לציין, כי לא רק האווטאר הוויזואלי יכול להביע רגשות, אלא גם הבוט הקולי שמשמש לשיחות טלפון: "אפשר לתת שירות עם אמפטיה", אומר ירון.
מי שכבר יצא לו לעבוד עם ChatGPT לדוגמה, יודע שהיכולות שלו נמוכות באופן משמעותי בעברית מאשר באנגלית. גם כשהתכתבתי עם המורה נעמי, היא פנתה אליי בלשון זכר, אם כי ירון מבהיר שבמערכת של בית הספר הם יקבלו אינדיקציה אם התלמיד זכר או נקבה וידברו איתו בהתאם, וכך גם אצל חברת החשמל.
"מודלי שפה מאוד מתקשים עם עברית, שהיא שפה לא נפוצה באינטרנט. בנוסף, בניגוד לאנגלית, עברית היא שפה מגדרית וכל שם עצם צריך התייחסות מגדרית, מה שגורם לטעויות רבות של החלפת זכר ונקבה", מסביר ירון.
"בניגוד לצ'אטבוטים רגילים, השיחה לא מתוסרטת ואין לדעת מתי תגיע מילה שתיכתב או תהגה באופן שגוי על ידי מנוע הדיבור. כדי להתמודד עם הבעיה הזאת, שילבנו בתוך המערכת שלנו מודלי שפה נוספים שעברו אימון במיוחד לעברית, המאפשרים לסוכנים שלנו לפעול ישירות בעברית, לבצע תרגום מדויק יותר מאנגלית, או לוודא שהמענה לכל אדם הוא בהתאם למגדר שלו. בכך הצלחנו לפתור בעיה שמהווה חסם משמעותי לעבודה בעברית".
למה בחרתם בעוזרת אישית שהיא אישה?
"האמת שאנחנו עוסקים המון בנושא הזה. היינו חייבים לבחור עם מה להתחיל, אהבנו את הקול שלה, וזה עזר לזה שהיא תהיה קודם כל אישה. יהיה לנו גם גבר, גם באתר שלנו יש פרצוף של גבר שכבר עיצבנו. יש לנו לקוחות שהעוזר אישי הוא רק בשיחות טלפון, ואז אין משמעות לאיך נראה האווטאר".
מה השוני מול עוזרות קוליות כמו סירי ואלקסה?
"אנחנו היחידים בעולם שיודעים לקחת את מודלי השפה, שיכולים לדבר כמעט ברמה אנושית מבחינת טקסטים, כלומר לכתוב טקסטים ולהביע אותם, ולתת להם יכולת לפעול, למשוך מידע, להיות אקטיביים ופרו אקטיביים, שזה חידוש אדיר. סירי היא צינור לפקודה. אין לה באמת נוכחות או יכולת השפעה. נעמי המורה, לדוגמה, היא זאת שמובילה את השיעור, שואלת שאלות, היא מחליטה אם התלמיד הבין את החומר ואפשר לעבור לנושא הבא, והיא גם יכולה להגיד לתלמיד שהוא לא פירט מספיק. יש פה 3 כוחות שמשתלבים - פרו אקטיביות, יכולת להפעיל פקודות כמו סירי והכוח של הדיבור, כמו GPT. אין עוד דברים כאלה בעולם".