שיחה, שתיקה ומה שביניהן: כריית מידע והפקת ידע מאודיו
בחברה האוריינית של המאה ה-21 דיבור הוא רק אחת המיומנויות המשמשות לתקשורת אנושית. בעידן שבו התקשורת המוקלדת משמשת באפליקציות מסרים מהירים וברשתות החברתיות, הפך הדיבור מפעולה פשוטה וחיונית בחיי היומיום לאמצעי תקשורת שהוא לא יותר מ-nice to have.
אף על פי כן, חברות הייטק מבוססות כמו גם חברות הזנק פועלות במלוא המרץ על מנת להפיק ידע משמעותי מבסיסי הנתונים הענקיים המבוססים על דיבור, יוטיוב בראשם.
בשנים האחרונות חלה התקדמות טכנולוגית גדולה שהביאה לגידול עצום בנפחי התעבורה באינטרנט של מידע אודיטורי, שדיבור מהווה בו מרכיב חשוב. גידול זה גורם למהפך בצורך בשירותים וביישומים בכל ערוץ שבו קיימת תקשורת אדם-מכונה או בפלטפורמות שכוללות תוכני מולטימדיה: החל מהאפשרות לזיהוי קלט מדובר באופן מהיר (הכתבת מסרון (SMS), חיוג קולי בטלפון, חיפוש קולי במאגרי מידע), דרך האפשרות לשלוף מידע מתוך קטעי אודיו (כגון הרצאות מקוונות), וכלה באיתור מודיעיני מתוך דיבור בזמן אמת.
בהרצאה אטען שעל אף שהמרחב הווירטואלי מוצף באינפורמציה, ועל אף הגידול העצום בצְפיות של וידאו מקוון, עד לאחרונה לא היתה דרך יעילה לחפש ולגשת לתוכן הקולי. בהמשך לכך, אציג את התחום של אנליטיקות דיבור (עיבוד כמות מאסיבית של נתונים שמצטברים במהלך שיחה מרובת משתתפים, כולל – תוכן, תכוניות הקול, ואפילו שפת הגוף), וכיצד ניתן להגיע להבנה של דפוסים, מבנים ויכולות ניבוי של התקשורת המדוברת מרובת הרבדים.
חלקים מההרצאה
כריית מידע והפקת ידע מאודיו from offer drori on Vimeo.