מגלה סרקזם - ההמצאה הכי שימושית שהומצאה אי פעם

אורן צור 03.04.2011 23:02
מגלה סרקזם - ההמצאה הכי שימושית שהומצאה אי פעם


התקציר והמאמר הנילווה מציגים אלגוריתם מבוסס תבניות שמזהה משפטים סרקסטיים. האלגוריתם נבדק על ביקורות מוצרים באמזון ועל ציוצים בטוויטר והציג ציון משוקלל (F) של קרוב ל-80%.




קשה להגדיר מהו מבע סרקסטי. לעיתים  קשה אפילו לבני אדם לזהות מבעים סרקסטיים. יחד עם זאת, להבנה נכונה של מבעים סרקסטיים ישנה חשיבות גדולה הן מבחינה בין אישית, הן מבחינה קוגניטיבית - איך אנו, כבני אדם, מבינים ומשתמשים בכלי שפה משוכללים, והן מבחינה עסקית, בעיקר כיום כשהרשת מוצפת בתוכן גולשים (למשל, פרשנות נכונה של דעות של גולשים על מוצר מסוים).

במפגש זה אציג אלגוריתם מבוסס תבניות שמזהה משפטים סרקסטיים. אלגוריתמים מבוססי תבניות נמצאו שימושיים מאוד בהרבה בעיות של עיבוד שפה (ובעיות למידה בכלל). האלגוריתם שאציג הינו אלגוריתם למידה מבוסס תבניות המצריך קבוצה קטנה של משפטים לאימון, על קורפוסים גדולים לחישוב שכיחויות מילים ועל תבניות גמישות במיוחד.  המבנה הכלל של התבניות מוגדר מראש בצורה מאוד רופפת והאלגוריתם לומד את התבניות הרלוונטיות ואת המשקלים לכל תבנית. כל משפט בקבוצת האימון הקטנה (seed) מומר לייצוג הווקטורי שלו וכל משפט חדש שמתקבל מומר גם הוא לייצוג וקטורי ומושווה לתת קבוצה של הסיד בוואריאציה משוקללת של אלגוריתם המישקול  k-שכנים קרובים (k nearest neighbors).

האלגוריתם נבדק על ביקורות מוצרים באמזון ועל ציוצים בטוויטר והציג ציון משוקלל (F) של קרוב ל-80%. הערכת האלגוריתם נעשתה על ידי דגימות של תוצאות האלגוריתם והשוואה מול שלושה מתייגים תוך שימוש בשירות ה "'טורקי המכאני" של אמזון.

כמו כן אדבר מעט על שימושים נוספים באלגוריתם, כגון זיהוי מבעי רגש מגוונים (גרסה מפוקחת [supervised] של האלגוריתם), אדבר על התיאוריות הפסיכולוגיות והפסיכו-בלשניות למידול השיח הסרקסטי ואציע מודל בהשראת תורת המשחקים לתיאור מצבים בהם אנו נוקטים בלשון סרקסטית.



attachment 172-zur-paper.pdf



הוספת תגובה
  מגיב אנונימי
שם או כינוי:
חסימת סיסמה:
  זכור אותי תמיד במחשב זה

כותרת ראשית:
אבקש לקבל בדואר אלקטרוני כל תגובה לטוקבק שלי
אבקש לקבל בדואר אלקטרוני כל תגובה למאמר הזה