כתב יד, אחזור וקריאה בעברית ובערבית

דרור בן דוד ועידן בר 11.07.2020 22:07
כתב יד, אחזור וקריאה בעברית ובערבית


החברה פיתחה יישום OCR המבוסס על ארכיטקטורה של Encoder-Decoder וביניהם מנגנוני Attention ו-BILSTM לקידוד Sequence. פיתוח היישום נמשך למעלה משנה והוא כלל פיתוח יכולת "לסנטז" כתב בעברית ובערבית במגוון פונטים וסוגי הרעשות – "תפור" לסוגי ההרעשות שהלקוח פוגש. היכולת לאמן את המערכת נשענת על מחקרי עומק של חומרי הלקוח, כולל ניתוחים סטטיסטיים של תדירות הופעת מילים מסוימות, התמודדות עם כותרות, טבלאות, הערות שוליים, משפטים באנגלית שהשתרבבו לטקסט וכיוצא באלו. היישום שולב במערכות הלקוח, כולל התאמת הפתרון למערכות ההפעלה של הלקוח ויכולותיו בתחום תמיכה בתשתיות. המעבר לסביבת הלקוח כלל ביצוע בדיקות על חומרים שלו, ביצוע Fine Tuning וכיוצא באלו. על בסיס ממלאי התפקיד אצל הלקוח – המערכת נותנת ביצועים טובים יותר מכל מערכת אחרת שהלקוח הצליח למצוא בעולם (סד"ג 93% סיכויי הצלחה בפענוח מילה בערבית).




attachment 272-זיהוי כתב יד בעברית.pdf



הוספת תגובה
  מגיב אנונימי
שם או כינוי:
חסימת סיסמה:
  זכור אותי תמיד במחשב זה

כותרת ראשית:
אבקש לקבל בדואר אלקטרוני כל תגובה לטוקבק שלי
אבקש לקבל בדואר אלקטרוני כל תגובה למאמר הזה