ELK הוא לא רק אייל (מבוא לסדרת מוצרים בסביבה פתוחה לאינדוקס, יצירת ממשק ועוד)

סימונה מריאם 04.05.2016 22:37

ElasticSearch מתפקד כמוצר לניתוח וחיפוש בטקסט, כאשר בלב ליבו נמצאת הספרייה Lucene. בשעה שמוקצבת לנו נדבר על שלושה מוצרים מעולם הקוד הפתוח: Logstash, ElasticSearch ו-Kibana. נדבר על היכולות של כל אחד מהמוצרים וננסה לראות איך אריכטקטורה שבנויה משלושתם יכולה לשמש אותנו על מנת לתרום לארגון בכלל ולנו בפיתוח שלנו בפרט.

ELK הינה אריכטקטורת קוד פתוח המורכבת משלושה מוצרים – Logstash, ElasticSearch וKibana, ונמצאת באחריותה של חברת elastic.co. נעבור על כל שלושת המוצרים בקצרה וננסה להבין את הארכיטקטורה המתקבלת וייתרונותיה.
Logstash
Logstash הינו כלי מבוסס pluginים לאיסוף, פרסור ושליחה של נתונים, בעיקר לוגים. כל מקור נתונים בLogstash ניתן להגדרה בקובץ קונפיגורציה נפרד, וכל קובץ קונפיגורציה מורכב משלושה חלקים:
• Input – המקור ממנו מגיעים הנתונים. לדוגמא: קובץ, socket tcp, kafka, twitter
• Filter – חלק זה אחראי על פרסור והעשרת הנתונים. בדרך כלל נתחיל בלפרסר את הנתונים תוך שימוש בgrok וregex, ולאחר מכן נעשיר את הערכים שהתקבלו על ידי מספר נרחב של פלאגיניים.
• Output – כאן נגדיר לאן יישלחו הנתונים. גם כאן האפשרויות הן רבות, אך החשובה מביניהן היא ElasticSearch.
קיימת גמישות רבה בהגדרת קובץ קונפיגורציה מכיוון שקיימים פלאגינים רבים המותאמים לכל חלק. חלק מן הפלאגינים האלו פותחו על ידי elastic וחלקם פותחו על ידי קהילת הopen source. במידה וניסיתם לכתוב קובץ קונפיגורציה ולא מצאתם את הPlugin המתאים לכם, תוכלו בקלות רבה לכתוב גם קטע קוד משל עצמכם.
ElasticSearch
אמנם ElasticSearch נראה למראית עין כDatabase NoSQL רגיל אך הוא הרבה מעבר. מדובר במנוע לאינדוקס וחיפוש בטקסט המבוסס על ספריית Lucene, המאפשר גם יכולות אנליטיות רבות. ElasticSearch חושף RESTAPI עשיר למפתחים והעבודה מול הנתונים מבוססת JSON.
מספר מושגים בסיסיים לתחילת הדרך:
• Cluster – מקבץ שרתי ElasticSearch העובדים ביחד כElasticSearch אחד
• Node – Instance אחד יחיד של ElasticSearch, בדרך כלל נהוג שכל node יימצא על שרת משל עצמו
• Index – אוסף מסמכים להם מאפיינים דומים. המקבילה היחסית לDatabase במסדי נתונים רלציוניים
• Type – איגוד לוגי של מסמכים תחת הindex. הmapping, הגדרות ומבנה המסמכים, יישמר תחת הtype.
• Shard - יחידת נתונים פיזית תחת index המכילה חלק מן הנתונים. זהו בעצמם instance בודד של lucene המנוהל כולו תחת ElasticSearch. קיימים שני סוגים של shardים:
o Primary Shards – הנתונים עצמם. ממנו קוראים ואליו כותבים.
o Replica Shards – העתק של הנתונים, ממנו קוראים בלבד. מתעדכן אל מול הPrimary Shards.
Kibana
מייצג גרפי של הנתונים הנשמרים בElasticSearch. הKibana ניגשת אל הנתונים השמורים באינדקסים השונים, מפלטרת לפי בקשתינו ומציגה וויזואליזציות שונות תוך ביצוע שליפות אגרגטיביות על הנתונים. התוצאות הטובות ביותר בעבודה מול הKibana יהיו בעבודה מול נתוני TimeSeries – לוגים למיניהם. הוויזואליזציות כוללות בין הייתר:
• היסטוגרמות שונות
• גרף מקלות
• PieChart
• טבלאות מידע אגרגטיביות
• תצוגת מפות עבור נתוני GeoIP
הכי חשוב - מאפשרת עבודה נוחה ואינטואיטיבית עבור משתמשי הקצה.

שילוב של שלושת המוצרים שתוארו, יוצר ארכיטקטורה הקלה להקמה ותפעול ומציגה תוצרים מהם ניתן להפיק מסקנות בייתר קלות בזמן קצר.

מצגת ההרצאה

231-ELK from sigtrs on Vimeo.

הוספת תגובה שלח הדפסה דווח

הוספת תגובה

	מגיב אנונימי

מגיב אנונימי

שם או כינוי:	הירשם לקבלת שם מגיב שיהיה רק שלך הירשם לקבלת שם מגיב שיהיה רק שלך בחר בבקשה שם כינוי קבוע וייחודי לך וסיסמה לשימוש עם השם הזה. שם או כינוי: חסימת סיסמה: הקלדה נוספת של אותה סיסמה: כתובת דואר אלקטרוני:
חסימת סיסמה:
	זכור אותי תמיד במחשב זה

כותרת ראשית:

כותרת ראשית:

אבקש לקבל בדואר אלקטרוני כל תגובה לטוקבק שלי
אבקש לקבל בדואר אלקטרוני כל תגובה למאמר הזה

עמוד הבית | "מידע וטקסט" עלון ק.עניין Information and Text", SIGTRS"

המאמרים החדשים

אתר הגבורה – איסוף מידע נרחב, עיבודו והפצתו לציבור כפרויקט לאומי המוצר אוטונומי עלון קבוצת העניין אחזור מידע וטקסט, חוברת 2 כרך י"ט - דצמבר 2012, קובץ מלא להורדה חדשות קבוצת עניין אחזור מידע וטקסט - SIGiTRS - כרך י"ט חוברת 2 - דצמבר 2012 אינדקס לכרכים א' עד י"ט (כולל חוברת 2) עפ"י מחברים אינדקס לכרכים א' עד י"ט (כולל חוברת 2) עפ"י כותרים חברי הכנסת כצרכני מידע Full Text Search – צעד מעבר (beyond) למסד נתונים יחסי זיכרון לטווח רחוק מחשוב ארכיונים

הנקראים ביותר

SIGTRS - המפגש הבא Next meeting מפגשים קודמים Previous meetings הספר Information Retrieval של C.J. van RIJSBERGEN תכונות מנוע החיפוש Attivio "אנו משתדלים יותר" – שימושי אחזור מידע באתר השאלות והתשובות השני בגדלו בעולם Web 3.0 מעבר לפינה – טכנולוגיות סמנטיות באינטרנט ובארגונים רשימת תפוצה Mailing list כנס טלדן 2009 על אודות הקבוצה חיפוש עברי: לראשונה בקוד פתוח. אתגרים, פתרונות והתמודדויות אחרות.

עוד מאמרים מ "מידע וטקסט" עלון ק.עניין Information and Text", SIGTRS"

ממצאי הדוח על תחזית איומי הסייבר לקראת בחירות האמצע בארה"ב בשנת 2026 מערכת בינה מלאכותית - ישות עצמאית הסרט: מבוקש / Person of Interest עלון קבוצת העניין אחזור מידע וטקסט, חוברת 1 כרך ל"ג - יוני 2026, קובץ מלא לקריאה והורדה חדשות קבוצת עניין אחזור מידע וטקסט - SIGiTRS - כרך ל"ג חוברת 1 - יוני 2026 אינדקס לכרכים א' עד ל"ג (כולל חוברת 1) עפ"י תאריך פרסום אינדקס לכרכים א' עד ל"ג (כולל חוברת 1) עפ"י מחברים "את ההשפעה שלו אי אפשר לחשב, כפי שאת ההצפנה שלו אי אפשר לפצח": מת פרופ' מיכאל רבין יומן מסע, עדים במדים האיש שהמציא את ה World Wide Web רשלנות מקצועית וחוסר עקביות בביצועי המודל ג'מיני של גוגל הצעה לשיפור ותלונה על מודל ג'מיני של גוגל ליצירת שילוב גרפי וטקסט לא מורכב תחזית לעולם ה-AI מבוסס מאמר AI2027 ספר חדש של האקדמיה ללשון לזכרו של פרופ' עוזי אורנן הצעה לשיפור התנהגות מודלים מול משתמשים ב- chat gpt 5 בטיפול בטקסט עברי עלון קבוצת העניין אחזור מידע וטקסט, חוברת 2 כרך ל"ב - דצמבר 2025, קובץ מלא לקריאה והורדה חדשות קבוצת עניין אחזור מידע וטקסט - SIGiTRS - כרך ל"ב חוברת 2 - דצמבר 2025 אינדקס לכרכים א' עד ל"ב (כולל חוברת 2) עפ"י תאריך פרסום אינדקס לכרכים א' עד ל"ב (כולל חוברת 2) עפ"י מחברים יד ושם זיהה חמישה מיליון משמות הנרצחים בשואה