OCR במערכת נט המשפט

ירדן ירדני 27.10.2011 03:55
OCR במערכת נט המשפט


בבתי המשפט נפתחים ביום כ-4,000 תיקים חדשים, ובמערכת מתויקים מידי יממה כ-135,000 מסמכים חדשים. כל המסמכים המוגשים בנייר במזכירויות בתי המשפט, נסרקים ומתויקים בתוך התיקים האלקטרוניים. באמצעות אתר האינטרנט יכולים עורכי דין בעלי כרטיס חכם להגיש מסמכים החתומים בחתימה אלקטרונית מאושרת כמתחייב מתקנות סדר הדין.



OCR במערכת נט המשפט

ירדן ירדני

 בבתי המשפט נפתחים ביום כ-4,000 תיקים חדשים, ובמערכת מתויקים מידי יממה כ-135,000 מסמכים חדשים. כל המסמכים המוגשים בנייר במזכירויות בתי המשפט, נסרקים ומתויקים בתוך התיקים האלקטרוניים. באמצעות אתר האינטרנט יכולים עורכי דין בעלי כרטיס חכם להגיש מסמכים החתומים בחתימה אלקטרונית מאושרת כמתחייב מתקנות סדר הדין. 

תיוק המסמכים, ניהול מחזור החיים שלהם והאינדוקס שלהם מתבצע בתוך מערכת ניהול תוכן ארגוני מבוססת דוקומנטום. מחזור חיים של מסמך כולל 7 שלבים בניהם המרה ל-PDF, המרה ל-PNG עטוף ב-XML, זיהוי טקסט OCR, אינדוקס באמצעות FAST, ופרסום מסמך באתר האינטרנט. תהליכים אלה מאפשרים גישה אחידה לכל מסמכי התיק הן למשתמשים הפנים ארגוניים והן למשתמשים החיצוניים (עו"ד, צדדים בתיק וכל שאר האזרחים). יכולת חשובה נוספת המתאפשרת, היא איתו מסמכים לפי מחרוזת טקסט חופשית. זהו יתרון עצום שלא היה קיים בתיקי הנייר.

תהליך זיהוי הטקסט (OCR) מתבצע באמצעות מערך של 44 שרתי Olive, שרתים בעלי מעבד גראפי חזק הפועלים במקביל בסביבת Windows 2003/2008. על שרתים אלו מותקן מוצר של Olive המכונה XML Distiller. מוצר זה מבצע זיהוי טקסט רב לשוני באמצעות OCR ABBYY עם תוספות של עיבוד גראפי חכם של חברת אוליב. התוצרים של מערך עיבוד זה הם שניים:

  1. קובץ PDF בעל שכבת טקסט.
  2. קובץ PNG עטוף ב-XML.


 מצגת ההרצאה

 



הוספת תגובה
  מגיב אנונימי
שם או כינוי:
חסימת סיסמה:
  זכור אותי תמיד במחשב זה

כותרת ראשית:
אבקש לקבל בדואר אלקטרוני כל תגובה לטוקבק שלי
אבקש לקבל בדואר אלקטרוני כל תגובה למאמר הזה