שיחה, שתיקה ומה שביניהן: כריית מידע והפקת ידע מאודיו

ד"ר ורד זילבר-ורוד 11.07.2019 02:24
שיחה, שתיקה ומה שביניהן: כריית מידע והפקת ידע מאודיו


בהרצאה הוצגו דוגמאות של קטעי הקלטות הסטוריות מהתקשורת שהגישה אליהן מוגבלת שלא כמו טקסטים כתובים שניתן לבצע חיפשו עליהם. הוצגה התפתחות התחום בעולם ואת היכולת לתמלול עברית רק בשנים האחרונות. הוצגו ניתוחי שיחות מהתקשורת הישראלית בהווה.



בחברה האוריינית של המאה ה-21 דיבור הוא רק אחת המיומנויות המשמשות לתקשורת אנושית. בעידן שבו התקשורת המוקלדת משמשת באפליקציות מסרים מהירים וברשתות החברתיות, הפך הדיבור מפעולה פשוטה וחיונית בחיי היומיום לאמצעי תקשורת שהוא לא יותר מ-nice to have.

אף על פי כן, חברות הייטק מבוססות כמו גם חברות הזנק פועלות במלוא המרץ על מנת להפיק ידע משמעותי מבסיסי הנתונים הענקיים המבוססים על דיבור, יוטיוב בראשם.

בשנים האחרונות חלה התקדמות טכנולוגית גדולה שהביאה לגידול עצום בנפחי התעבורה באינטרנט של מידע אודיטורי, שדיבור מהווה בו מרכיב חשוב. גידול זה גורם למהפך בצורך בשירותים וביישומים בכל ערוץ שבו קיימת תקשורת אדם-מכונה או בפלטפורמות שכוללות תוכני מולטימדיה: החל מהאפשרות לזיהוי קלט מדובר באופן מהיר (הכתבת מסרון (SMS), חיוג קולי בטלפון, חיפוש קולי במאגרי מידע), דרך האפשרות לשלוף מידע מתוך קטעי אודיו (כגון הרצאות מקוונות), וכלה באיתור מודיעיני מתוך דיבור בזמן אמת.

בהרצאה אטען שעל אף שהמרחב הווירטואלי מוצף באינפורמציה, ועל אף הגידול העצום בצְפיות של וידאו מקוון, עד לאחרונה לא היתה דרך יעילה לחפש ולגשת לתוכן הקולי. בהמשך לכך, אציג את התחום של אנליטיקות דיבור (עיבוד כמות מאסיבית של נתונים שמצטברים במהלך שיחה מרובת משתתפים, כולל – תוכן, תכוניות הקול, ואפילו שפת הגוף), וכיצד ניתן להגיע להבנה של דפוסים, מבנים ויכולות ניבוי של התקשורת המדוברת מרובת הרבדים.

חלקים מההרצאה



הוספת תגובה
  מגיב אנונימי
שם או כינוי:
חסימת סיסמה:
  זכור אותי תמיד במחשב זה

כותרת ראשית:
אבקש לקבל בדואר אלקטרוני כל תגובה לטוקבק שלי
אבקש לקבל בדואר אלקטרוני כל תגובה למאמר הזה