מסמטאות קהיר לאינטרנט המהיר - עולם המחשוב פוגש את גניזת קהיר
"הגניזה הקהירית" הוא שמו של אוסף כתבי יד יהודיים שהתגלו בעליית גג בבית כנסת בפוסטאט, הלא היא קהיר העתיקה, בסוף המאה ה-19. אוצר בלום זה מכיל כרבע מליון דפים שנכתבו בין המאה ה-9 למאה ה-19, תקופה של כאלף שנה. כתבי היד כוללים קטעים מספרי יסוד במורשת ישראל, כגון תנ"ך, משנה, תלמוד, מדרשי הלכה ומדרשי אגדה, סידורי תפילה, חיבורים פרשניים והלכתיים, וכן מסמכים אישיים רבים כגון חוזים, אגרות, שטרות, מסמכי אירוסין, קידושין וגיטין, מכתבים, מרשמים, וכדומה, השופכים אור חדש על עולמם של היהודים בתקופות קדומות. כל כתבי היד שבגניזה כתובים באותיות עבריות, ובחלקם העיקרי בשפה העברית ובשפה הערבית-יהודית.
כתבי היד שבגניזה הגיעו לידי חוקרים, אספנים וסוחרי עתיקות שרכשו אותם או פשוט שמו יד עליהם, וכך הם התפזרו והתגלגלו והם נמצאים היום בלמעלה משבעים ספריות אוניברסיטאיות וציבוריות שונות ברחבי העולם כולו ובמספר אוספים פרטיים.
בשנת 2006 יזם פרויקט פרידברג לחקר הגניזה מפעיל מקיף למחשוב גניזת קהיר, שבמסגרתו נערך מצאי שלם, מדויק וממוחשב של כל מספרי המדף של קטעי הגניזה בעולם, וכן הוחל בצילום דיגיטאלי איכותי של כל הקטעים הללו המפוזרים בעולם כולו, תוך פיתוח אתר אינטרנט נגיש חינם לכל דורש, המציג כיום בפני החוקרים כ 400,000 תמונות דיגיטאליות באיכות גבוהה, המכסות את מרבית כתבי היד של הגניזה, ומבצע הדיגיטציה של כל אוספי הגניזה עומד להסתיים לקראת סוף שנה זו ויסתכם בכחצי מליון תמונות.
מלבד התמונות מציג האתר את כל המידע הקטלוגי (קרוב למיליון פריטים) הידוע היום על כל קטע וכן מידע על צירופים בין קטעים שונים, עם תוכנה משוכללת לחיפוש, סינון, הצגה ושמירה של מידע זה. האתר, אשר כבר היום מרבית חוקרי הגניזה נעזרים בו באופן יום יומי. חולל מהפכה של ממש בחקר הגניזה ומתווה פריצת דרך בחקר זה. כמדומה שזהו האתר המקיף והמשוכלל ביותר הקיים כיום בעולם לטיפול באוסף היסטורי של כתבי יד,
מלבד הצגת המידע, מאפשר האתר לחוקרים להוסיף מידע חדש באופן מקוון, וכך נוצרת קהילת מחקר מקוונת אשר חבריה משתפים ביניהם מידע ותורמים למאמץ הכללי לזיהוי ושיחזור של כלל כתבי היד של הגניזה הקהירית.
על המרצה:
יעקב שויקה, כיום פרופסור אמריטוס למדעי המחשב, הוא יליד קהיר, עלה ארצה ב 1957, סיים תואר שני ושלישי במתמטיקה באוניברסיטה העברית בירושלים, הצטרף לבר-אילו ועסק בה בהוראה ומחקר במשך 41 שנה, תחילה בתורת האוטומטים, לאחר מכן באחזור מידע ולבסוף בעיבוד שפות טבעיות.
היה שותף בפיתוח פרויקט השו"ת מראשיתו באמצע שנות הששים, עמד בראשו כ 12 שנה. וזוקף לזכותו את פיתוח המהדורה המקוונת של הפרויקט וכן את המנגנון הלשוני בפרויקט, שעד היום, כארבעים שנה לאחר מכן, הוא ייחודי בין כל מערכות המידע בארץ. הפרויקט זכה בפרס ישראל בשנת 2009.
בבר-אילן הוא גם ייסד את המכון לאחזור מידע ובלשנות חישובית ב 1974 ועמד בראשו עד פרישתו ב 2004. במסגרתו הוא הקים בשנות השמונים את "מאגר בר-אילן לעברית בת-זמננו" (מב"ע) שהקיף כ 25 מיליון מלה.
היה חוקר ראשי וראש פרויקט "רב מילים" למחשוב נבון של השפה העברית שבין תוצריו מילון "רב-מילים" השלם לעברית בת-זמננו (6 כרכים, 1997) מערכת לניתוח מורפולוגי מדויק ומקיף ללשון העברית, ומערכת לניקוד אוטומאטי מדויק של טקסט עברי, וכן גם בודק הכתיב שאומץ על ידי מיקרוסופט במעבד התמלילים וורד.
זכה בפרס ראש הממשלה לתכנות לשנת 1997, ופעמיים בפרס האיגוד הישראלי לטכנולוגיה של המידע.
בשנים האחרונות הוא משמש ראש פרויקט רחב היקף ומאתגר למחשוב כתבי היד של גניזת קהיר.
מצגת ההרצאה