מנוע החיפוש של אי.בי.אם

צור חזן 18.11.2015 19:36
מנוע החיפוש של אי.בי.אם


ווטסון, מנוע החיפוש של אי.בי.אם



 

מנוע החיפוש של IBM

צור חזן

כללי

IBM® Content Classification מאפשר סיווג וקטלוג מידע תוך שימוש בטקסונומיות והבנת שפה טבעית (NLP). הפתרון מקנה יכולות רבות בתחום הניתוח הטקסטואלי, הבנת שפה טבעית, סיווג וקטלוג מידע. המערכת מאפשרת ליצור פאות (Facets) במידע הטקסטואלי לצורך מיקוד תוצאות החיפוש, שיוך לקטגוריות ותחומי עניין ולהשיג צמצום משמעותי של משך החיפוש ברמת דיוק גבוהה.

מעבר לכך המוצר משתייך לחבילת מוצרי ה ECM  של IBM וככזה מאפשר אינטגרציה מובנית למנועי ניהול תוכן, תוך אפשרויות רבות לקטלוג אוטומטי בתוך מאגרי המידע.

מאפיינים

Categorization: 

שיוך של מסמך או טקסט נתון לקטגוריה (תחום עניין) מוכר שאופיין מראש. 
עם הגדרת מכלול הקטגוריות האפשריות והרלבנטיות לאותו מקור מידע יתבצע סיווג לקטגוריות:

ü        הבנת ההקשר (Context Understanding) בעזרת אלגוריתמים מבוססיMachine Learning , וכן באמצעות מנגנון חוקים המשלב החלטה דטרמיניסטית והחלטה מבוססת שיטות סטטיסטיות.

ü        עדכון ומיקוד קביעת הפאה (Facet) ע"י מתן חיווי משתמש (Online Feedback).

Clustering: 

סיווג (קביעת פאה) אוטומטי מבלי להכיר / לדעת מראש את עצי הידע או קטגוריות (תחומי העניין) הקיימים בטקסט. מתבצע ניתוח טקסט מעמיק והפתרון מייצר קטגוריות (הפאות) אפשריות (עם מרווח טעות מינימאלי). יכולת זו מבוצעת באמצעות שימוש באלגוריתמי NLP –  Natural Language Processing שהכלי מבוסס עליהם.

יתרונות לארגון

ייבוא ואיסוף מידע ממקורות מגוונים ע"י אוסף זחלנים (Crawlers) מוגדר מראש. אפשרות בניית ממשק (Crawler) למקורות מידע נוספים ומערכות אחרות בארגון.

חיפוש ואחזור: חיפוש ואחזור באמצעות מנוע חיפוש ארגוני במגוון דרכים:

ü        הדגשת מילות חיפוש בצבע (Highlighting)

ü        חיפוש בתוך חיפוש

ü        מורפולוגיה, Stemming) וזיהוי מילים נרדפות

ü        תצוגה מקדימה של תוכן

ü        הצגת תוצאות לפי סבירות ושייכות לנושא החיפוש

ü        חיפוש לפי אוספים ותחומי עניין

 ניתוח ועיבוד: רובד אנליטי לביצוע ניתוח טקסטואלי מלא להפקת תובנות.  

ü        התפלגות מילות מפתח לפי נושאים

ü        זיהוי סטיות ואנומליות בתוך הטקסט

ü        השתנות על פני ציר הזמן

ü        חיתוכים סטטיסטיים בתצורה גרפית (Dashboards)

ü        יצירת מפת קשרים בין תכנים מילים ומסמכים

ü        זיהוי דפוסים בתוך הטקסט.


זיהוי ואפיון פאות (Facets) וסדרות עיתיות (Time Series

 

 

מצגת ההרצאה

מנוע החיפוש של אי.בי.אם from sigtrs on Vimeo.

הדגמה נחמדה של ווטסון

 


attachment 222-Watson Explorer Advanced Edition v10.pdf



הוספת תגובה
  מגיב אנונימי
שם או כינוי:
חסימת סיסמה:
  זכור אותי תמיד במחשב זה

כותרת ראשית:
אבקש לקבל בדואר אלקטרוני כל תגובה לטוקבק שלי
אבקש לקבל בדואר אלקטרוני כל תגובה למאמר הזה