כתב יד, אחזור וקריאה בעברית ובערבית
החברה פיתחה יישום OCR המבוסס על ארכיטקטורה של Encoder-Decoder וביניהם מנגנוני Attention ו-BILSTM לקידוד Sequence. פיתוח היישום נמשך למעלה משנה והוא כלל פיתוח יכולת "לסנטז" כתב בעברית ובערבית במגוון פונטים וסוגי הרעשות – "תפור" לסוגי ההרעשות שהלקוח פוגש. היכולת לאמן את המערכת נשענת על מחקרי עומק של חומרי הלקוח, כולל ניתוחים סטטיסטיים של תדירות הופעת מילים מסוימות, התמודדות עם כותרות, טבלאות, הערות שוליים, משפטים באנגלית שהשתרבבו לטקסט וכיוצא באלו. היישום שולב במערכות הלקוח, כולל התאמת הפתרון למערכות ההפעלה של הלקוח ויכולותיו בתחום תמיכה בתשתיות. המעבר לסביבת הלקוח כלל ביצוע בדיקות על חומרים שלו, ביצוע Fine Tuning וכיוצא באלו. על בסיס ממלאי התפקיד אצל הלקוח – המערכת נותנת ביצועים טובים יותר מכל מערכת אחרת שהלקוח הצליח למצוא בעולם (סד"ג 93% סיכויי הצלחה בפענוח מילה בערבית).
מצגת ההרצאה
זיהוי כתב יד בעברית ובערבית / עידן בר from sigtrs on Vimeo.
הקלטה של המפגש