מנוע גילוי מבוסס ניתוח שפה טבעית ולמידה חישובית

יורם שפר 09.01.2019 20:58
מנוע גילוי מבוסס ניתוח שפה טבעית ולמידה חישובית


המנוע שפיתחנו בא לענות על אחד האתגרים המורכבים ביותר בעולם התוכן: יצירת התאמות (שידוכים) בין סוגי תוכן תואמים, תחום המכונה גם ״גילוי״. באופן ספציפי, המנוע עונה על האתגר של התאמת סרט לנושא הרצאה או שיעור.



המנוע שפיתחנו בא לענות על אחד האתגרים המורכבים ביותר בעולם התוכן: יצירת התאמות (שידוכים) בין סוגי תוכן תואמים, תחום המכונה גם ״גילוי״.

באופן ספציפי, המנוע עונה על האתגר של התאמת סרט לנושא הרצאה או שיעור.

הדרך המקובלת עד היום הייתה לבקש המלצות מאנשים בעלי ידע נרחב, לקרוא סקירת הסרטים, לשאול קולגות, לחפש סרטים על פי מילות מפתח ועוד.
׳כל התשובות נכונות׳ כמאמר הפראפראזה המפורסמת על מבחני ברירה, אלא שמדובר בתהליך ארוך ודי מייגע, לא תמיד ההמלצות שנקבל תהיינה טובות והגרוע מכל - הן מצומצמות.

תכונה אנושית ידועה היא להכניס מספר מצומצם של סרטים (או ספרים, או אמנים, או בעלי מקצוע) לתוך ״רשימה קאנונית״ וירטואלית שנוצרת באופן טבעי. היתרון של רשימות כאלה הוא קיצור הזמן עבור המחפש/ת.

החיסרון הוא צמצום האופקים: שאלו אוהבי קולנוע מה הם הסרטים המוערכים והאהובים עליהם. סביר להניח ש - 90% ימנו את האזרח קיין כאחד מהם. אז לא שאנחנו מטילים ספק בגאוניותו של אורסון ווילס, אבל יש בתשובה המוחצת הזו, שחוזרת על עצמה כבר יותר מ - 40 שנה, ריח חריף של קונפורמיזם ואופנה. ויש גם את מחשבתו של הדובר/ת איך הוא או היא ייראו בעיני השומע. מה לעשות, טבע אנושי.

אנחנו מאמינים במכונות!
ליתר דיוק, במכונות חכמות ולא במכונות לקילוף תפוחי אדמה (למרות שהמהנדסים שלהן חכמים).
לשם כך הושבנו בחדר קופיף קטן והתחלנו ללמד אותו קיטלוג ולסווג סרטים. אל דאגה, הקופיף אינו חיית מעבדה ולא חשמלנו והרעבנו אותו, או גרמנו לו לחלות בסרטן. מדובר בקוף וירטואלי. תפקידו בחיים הוא לדעת להמליץ על טקסט אחד כתוצאה מטקסט אחר על ידי מציאת הקשרים ביניהם ותוך תהליך לימוד (כלומר, השתפרות על ידי משובים) בלתי פוסק.
התהליך הזה ידוע בעולם המידענות כ - 
Content Discovery ובאופן בלתי מקרי גם קראנו לאתר שלנו באנגלית Movie Discovery.
התוצאה היא תכלס המלצה שיצאה מרובוט. קוראים לזה גם המלצה תלוית הקשר או
Contextual Recommendation.

ֿתהליך של למידה על ידי מכונה עדיין עושה את צעדיו הראשונים, ככל שמדובר בעיבוד שפה. בניגוד למחשב, שמעבד מידע על פי נוסחאות שהוכתבו לו מראש, בלימוד מכונה מתקיים תהליך המנסה לדמות למידה אנושית.

 באופן מעשי, למידה חישובית מאפשרת למחשב להתמודד עם תוכן שלא פגש בו קודם לכן, כלומר לא מדובר באחזור מידע שכבר הוכנס בעבר, אלא בעיבוד מידע חדש לחלוטין והחזרת/הצגת תוצאה הגיונית לשואל .

 


 

הרציונל

במנוע של מובי דיסקברי מתרחש תהליך כפול: 

  1. סיווג של סרטים שהוכנסו מראש למסד הנתונים. למשל ״אנתרופולוגיה״ ״היסטוריה״ ״כלכלה״ ועוד. לכל סרט יכולים להיות מספר סיווגים (multi label).
  2. סיווג של טקסט שהמכונה הוזנה בו על ידי השואל (משתמש-ת). דבר זה נעשה בזמן אמת.


השידוך בין השאלה של המשתמש לבין הסרט נעשה באמצעות השוואת סיווגים. אם סיווג טקסט השואל הוא אנתרופולוגיה וסיווג סרט גם אנתרופולוגיה, אותו סרט יוצג למחפש כהמלצה.

איך זה עובד
הכניסו לתוך תיבת הטקסט במנוע חפשי או תקציר של מאמר, המתאר את הנושא עבורו אתן מעוניינות למצוא סרט. תוכלו לכתוב תקציר כזה או להדביק תקציר (
abstract) קיים, או להעתיק ולהדביק טקסט מויקיפדיה, המתאר את הנושא עבורו תרצו למצוא סרט.
הקופיף שלנו ינתח את התקציר ויציע מספר סרטים המתאימים לנושא זה מתוך הספרייה שלנו.
אנחנו מציעים המלצות מכל רחבי האינטרנט! לא רק מהקטלוג שלנו, אלא גם מספקי
VOD
אחרים ומיוטיוב. באשר ליוטיוב, אנחנו דואגים להציע המלצות רק לסרטונים איכותיים, מבחינת התוכן.
בקרו את הקופיף ב
מעבדתו הממוזגת, אתגרו אותו עם טקסטים משלכם וספרו לנו על התוצאות.
אנחנו והוא תמיד שמחים להשתפר.


סרטון המצגת




הוספת תגובה
  מגיב אנונימי
שם או כינוי:
חסימת סיסמה:
  זכור אותי תמיד במחשב זה

כותרת ראשית:
אבקש לקבל בדואר אלקטרוני כל תגובה לטוקבק שלי
אבקש לקבל בדואר אלקטרוני כל תגובה למאמר הזה