ניתוח טקסט בטכנולוגיה סמנטית
באמצעים הטכנולוגיים הזמינים כיום, איסוף מידע ממקורות מגוונים בכמויות עצומות היא עובדה קיימת, הדרישה והאמצעים לאיסוף עוד ועוד מידע הולכים ומתפתחים כל העת, ומדגישים את הצורך ההולך וגבר להתמודד עם המידע ולהפיק ממנו תוצרים שישרתו את הארגון בבצוע משימותיו. הקושי להפיק תובנות מכמויות חומר עצומות מתעצם עוד יותר כאשר רוב החומר הנאסף הוא טקסט שאינו מובנה, ועובדה זו מחדדת את הצורך להתמודד עם האתגר שלא רק באמצעים מסורתיים – זה לבד כבר לא מספיק. טכנולוגיות אלה, בין שיהיו מבוססות מילות מפתח, או מבוססות זיהוי תבנית או מבוססות מודלים סטטיסטיים, נבחרות לעיתים קרובות בגלל הפשטות שלהן, ובהרבה מקרים זה אכן מספק. כאשר נדרש לטפל באופן מעמיק בניתוח טקסט ולייצר ממנו תשתית חזקה ליישום מערכת ניהול ידע וקבלת החלטות. קבלת ההחלטות הסתמכו פעם על מודלים של מידע המבוסס על ERPs, או CRM's או מחקרי שוק יקרים. שווי פעילות כזאת היה לעזור להבין מה עלול לקרות בעתיד על סמך מה שכבר קרה. מודלים אלה הפכו עם הזמן לפחות יעילים, לא רק משום שהם מבוססים על נתונים היסטוריים, אלא מכיוון שהם גם לא הכלילו בתוכם את הנתונים הלא מובנים, ממקורות פנימיים, כגון תקשורת פנימית, ניהול מסמכים, הודעות דוא"ל, קבצי טקסט, מסמכי Word, מצגות, או מקורות חיצוניים, כגון זרמי מידע, דוחות ואמצעי מדיה חברתית ופתוחה שיכולים להפוך מידע תיאורי למידע תומך תחזיות. מקורות מידע בלתי מובנים מהווים חלק קריטי במשוואה. הקושי של מינוף הידע הפנימי הקבור בפלטפורמות ייעודיות ומובנות, וההכרה בחשיבות האסטרטגית של זרמי מידע ופלטפורמות שיתוף מידע פתוח אחרות (כמו מדיה חברתית) הוא הזרז המוביל לשימוש בטכנולוגיות שיאפשרו טיפול בטקסט תוך הבנה טובה יותר של מושגים ויחסים בין מושגים, תוך שימת דגש על הבנת משמעות המילים והפרדת משמעות בהתאם להקשר. זהו בדיוק המקום שבו טכנולוגיה סמנטית בולטת וזורחת. בהמשך המאמר תגלו את הפוטנציאל של טכנולוגיה סמנטית לפתרון אחד האתגרים הגדולים של ימינו ביצירת תובנות ממידע.