חיפוש בטקסט חופשי גדול (BIG DATA) בעברית באמצעות שאילתות הכוללות כמה
מה הדרך היעילה לחפש קטעים רלוונטיים (לדוגמה, תשובות לשאלות) בטקסט חופשי בעברית? הדרך המקובלת ו"הפשוטה" ביותר היא: רושמים מילה, והתוכנה מחפשת את המחרוזת. השיטה עובדת לא רע באנגלית, אבל בעברית היא יוצרת הרבה החטאות ואזעקות שווא, עקב הגורמים הבאים: ניקוד: לדוגמה, "שבת" במובן "יום שבת", לעומת "שבת" במובן "השתתף בשביתה". הטיות לשוניות: לדוגמה הם מכים, הוא הכה (רק האות "כ" משותפת) אותיות שבשפות אחרות הן מילות יחס עצמאיות מהוות חלק מהמחרוזת: לדוגמה, "מועד" במובן חג, לעומת "מועד העובדים". אין כתיב אחיד, לדוגמה שיפור לעומת שפור.
הקלטת ההרצאה
חיפוש בטקסט חופשי בעברית באמצעות שאילתות הכוללות כמה מילים272.pdf
הוספת תגובה