ניתוח מוכוון נתונים של שיח פוליטי (מבוסס ניתוח סמנטי של טקסטים)

יאיר פוגל דרור 11.04.2019 22:10
ניתוח מוכוון נתונים של שיח פוליטי (מבוסס ניתוח סמנטי של טקסטים)


כלים ממוחשבים לניתוח טקסט משמשים מחקרים אמפיריים במדעי החברה, בכלל, ובמדע המדינה, בפרט. כלים אלה מאפשרים ניתוח שיטתי של קורפוס גדול, ובכך מרחיבים את אפשרויות המחקר מבחינת היקף הזמן, זירות המחקר ומגוון הנושאים הנחקרים. שיטות מסורתיות לניתוח טקסט גזרו פשרה באופי השאלות עליהן ניתן היה לענות, כך ששאלות איכותניות העוסקות במאפיינים הרכים יותר של השיח הפוליטי נותרו מנת חלקן של שיטות ניתוח אנושיות-פרשניות. ההתפתחויות האחרונות בתחום הלמידה החישובית וניתוח השפה הטבעית מאפשרות לשנות את ההנחה הזו, שכן במקרה של למידה חישובית כמות הטקסטים הגדולה מהווה דווקא יתרון, ומאפשרת למחשב ללמוד לזהות דפוסי שיח עדינים יותר. למשל, שיטות המבוססות על למידה לא מפוקחת מאפשרות ניתוח של קורפוס גדול בעלות נמוכה, שכן הן אינן דורשות קידוד ידני מקדים של טקסטים. הנגישות של שיטות אלו הפכה אותן לפופולריות במיוחד בשנים האחרונות, בפרט כאשר מטרת המחקר הינה לבחון אילו נושאים מופיעים בקורפוס הנבחן. עם זאת, שיטות אלו אינן מתאימות בהכרח למחקרים אשר מבקשים לבחון תיאוריות קיימות, עקב הקושי לתקף אותן, להוסיף להן קטגוריות מוגדרות מראש, ולהכליל מהן לקורפוסים נוספים. אתגרים אלו יכולים להיפתר בקלות יחסית באמצעות שימוש בשיטות למידה מפוקחות, בהן המחשב לומד לזהות דפוסים בהתאם לקידוד אנושי מקדים. אלא שהעלות הגבוהה של קידוד אנושי הופכת אותן לאטרקטיביות פחות עבור מחקרים במדעי החברה, והשימוש בהן נדיר יחסית עקב כך. בהרצאה נציג שיטה שפיתחנו המגשרת בין שתי הגישות – מפוקחת ולא מפוקחת – במטרה לאפשר ניתוח שיטתי רחב היקף תוך צמצום משמעותי של כמות העבודה האנושית הנדרשת לשם כך, מחד גיסא, והתאמה לתיאוריות שונות, מאידך גיסא. השיטה עושה שימוש בכלים מתחום הלמידה העמוקה ומאפשרת ניתוח של טקסט בהקשר בו הוא מופיע, ובכך מאפשרת הבחנה בין מספר רב של קטגוריות שיח.

הוספת תגובה
  מגיב אנונימי
שם או כינוי:
חסימת סיסמה:
  זכור אותי תמיד במחשב זה

כותרת ראשית:
אבקש לקבל בדואר אלקטרוני כל תגובה לטוקבק שלי
אבקש לקבל בדואר אלקטרוני כל תגובה למאמר הזה