מרצה: גד מאיר, IDAG

 

כותרת:

לקחים מסקנות ושאלות פתוחות, מתהליכי איתור תקלות במערכות מיחשוב בסביבת התפעול ובשטח.

כותרת משנה:

ה Root cause of failure במבט מלמטה, מהעיניים של השרברב שמנקה את קרקעית הביוב.

 

תקציר:

כאשר מערכת מתמוטטת אצל הלקוח או בסביבת הייצור, וכאשר צוות ה IT ו/או צוות הפיתוח לא מצליח לתת תגובה בזמן סביר. קוראים לשרברב כדי שימצא איפה הסתימה וינקה אותה. התהליך של איתור שגיאות בתנאי שטח, שונה מהתהליך של איתור שגיאות בזמן הפיתוח או במעבדות ה QA. הרבה מהכלים שיכולם לעזור במעבדה ובסביבת הפיתוח, לא זמינים בסביבת הייצור. לא ניתן לעצור אתר קניות עמוס עם 100,000 משתמשים, כדי לעשות Single Step לקוד לצורך איתור שגיאה. רוב כלי הבדיקות הזמינים בסביבת הפיתוח, לא ניתנים בכלל להפעלה בסביבת הייצור (בגלל שיקולי ביצועים או דרישות הקשחה). בנוסף, יש בסביבת הייצור מרכיבים נוספים, שאין להם מקבילה בסביבת הפיתוח. ויש תקלות שמופיעות רק בסביבת הייצור, ולא ניתנות לשחזור בסביבת הפיתוח או ה QA.

כאשר בסופו של דבר, לאחר לילה או שניים של מאמץ, נמצא מקור התקלה, כולם מאושרים. תולים את המפתח שכתב את הטעות על עץ (אם הוא עדיין נמצא בארגון) והולכים הביתה שמחים וטובי לב. אבל האמת היא, שהתכנת הוא לא באמת האשם האמיתי. כי אם אתה ממשיך ומנתח את הבעיה לעומק, מסתבר שהמפתח שייצר את התקלה, הוא רק החוליה האחרונה בשרשרת של טעויות ותקלות, שהם אלה שהביאו בסופו של דבר להופעתה של אותה הבעיה בסביבת הייצור.

במסגרת ההרצאה יסקרו בקצרה כלים וטכניקות המשמשות לאיתור תקלות בשטח (בסביבת מערכות הפעלה של מיקרוסופט) תוצג הבעיתיות המובנה בשימוש הנכון בהם, ויוצגו פערי הידע הנדרשים ממאתר התקלות על מנת שיוכל להפיק תועלת מהכלים הללו. לאחר מכן יוצגו מקרה אחד או יותר של תקלות אמיתיות מהשטח, תוך ניתוח דרכי איתור הבעיה, סיבת הכשל המיידית, ועץ הכשלים שמסתתר מאחורי הסיבה המיידית, שמוליכים בסופו של דבר לשורשי הבעיה האמיתיים, שאינם קשורים בכלל לקוד או לשפת התכנות.

לסיום, במגבלות הזמן, יוצג קונספט של שו"ב אפליקטיבי, שיכול (אם יאומץ על ידי קהילת המפתחים וכותבי מפרטי הדרישות), לסייע לאיתור מהיר יותר של תקלות בשטח.

 

אודות:

גדי עוסק בתחום המחשבים כבר הרבה שנים (מאז 1975), תחום העיסוק העיקרי שלו הוא שרברבות, ההתמחות שלו היא איתור בעיות מערכתיות בתהליכי פיתוח והטמעה (איתור סתימות ושיחרור חסמים). עיקר תפקידו הוא לנסות למנוע בעיות כאלה עוד בשלב תכנון הפרויקט. למרות שבדרך כלל, מזעיקים אותו לניתוח לאחר המוות. התפקיד האהוב עליו הוא ליווי פרויקטים כיועץ וכמנחה מקצועי, פעילות שחושפת אותו למגוון רחב של בעיות מעניינות להן הוא אמור למצוא פתרונות יצירתיים. גדי מקפיד להדריך מדי פעם, הוא משמש כמנהל מו"פ בחברת ידאג בע"מ www.idag.co.il ויש לו בלוג באתר הבלוגים של מיקרוסופט ישראל http://blogs.microsoft.co.il/blogs/gadim והפעילות שלו בתחום איתור התקלות במערכות מרוכזת באתר http://productiondebugging.com/