דיבור בעידן הקוגניטיבי - Speech in the Cognitive Era
בעשור האחרון אנו עדים לשינויים מרחיקי לכת בטכנולוגיות לניתוח והפקת דיבור - שהפכו להיות מדויקות, אפקטיביות ונפוצות יותר בשימוש יום יומי. שינויים אלו התרחשו בעקבות הופעתם של הטלפונים החכמים, חישוב בענן ולמידה עמוקה. מערכות קוגניטיביות המוצעות כשירותי ענן ומשתמשות בלמידה עמוקה, מתקדמות בצעדי ענק לעבר היכולות האנושיות, לדוגמא בזיהוי דיבור ובשילוב עם טכנולוגיות ניתוח והפקת טקסט, לא ירחק היום שנוכל לנהל שיחה טבעית לחלוטין עם מחשב, כמו בסרטי מסע בין כוכבים ואודיסאה בחלל 2001. אלמנט נוסף שיכול להאיץ את ההתקדמות הוא שכיום במקרים רבים ניתן לצרף לדיבור תמונת וידאו של הדובר ובאופן זה לשלב בין ניתוח וידאו, כמו למשל תנועות השפתיים, הבעות פנים וכו' וניתוח הדיבור וכך להגדיל את הדיוק, בעיקר בסביבה רועשת. לניתוח קול ודיבור חשיבות גדולה גם באחזור מידע ובניגוד למצב בעבר בו אחזור המידע התבסס על מידע טקסטואלי בלבד כיום אפשר לחפש על סרטי וידאו או הקלטות של שיחות ע"י שימוש בטכנולוגיות דיבור. בהרצאה אסקור טכנולוגיות דיבור שונות כמו זיהוי דיבור, סינתזה של דיבור, זיהוי דובר וזיהוי רגשות בדיבור - ואסביר כיצד הן עובדות, מהם השימושים שלהן ומהם האתגרים וכיווני המחקר הקיימים היום.
רון חורי, מנהל קבוצת טכנולוגיות דיבור במעבדת המחקר של IBM בחיפה. בעל MSc מהטכניון בסינתזה של דיבור ועוסק מזה 25 בכל התחומים בעיבוד דיבור במסגרת הטכניון וב-IBM.
מצגת ההרצאה
קטע מתוך הסרט אודיסיאה בחלל על דיבור אדם מכונה