סביבת בדיקות

05/07/2018

חבר סיפר לי השבוע בדמעות איך בטעות העלה גירסא לשרת הייצור במקום לשרת הבדיקות. השידרוג הלא מתוכנן הפיל את המערכת ומחק מידע רב מבסיס הנתונים. רק אחרי 20 שעות ללא זמינות המערכת וללא שינה הם הצליחו להקים את הכל חזרה.

שתי מחשבות בעקבות הסיפור-

  1. אפשר לוותר על הבלבול: ככל שיש לנו יותר מנגנונים אוטומטיים ל Deployment כך גדל הסיכון בהקלדת פקודה אחת לא נכונה. לפעמים משתלם ללכת הפוך מהאינטואיציה ולהוסיף מנגנונים ידניים ומסורבלים ל Deployment רק בשביל להאט את עצמנו. אם כל Deploy למערכת הייצור היה דורש קבלה של קוד בסמס לטלפון והקלדה שלו לתוך תיבה אדומה ומהבהבת יכול להיות שהבן אדם היה חושב פעמיים לפני העלאה של הגירסא הלא נכונה.

  2. אפשר לוותר על הדמעות: שווה להשקיע את הזמן פעם בכמה שבועות או חודשים (תלוי במערכת שלכם) ולוודא שקיים גיבוי עדכני ושאתם יודעים לחזור ממנו. ככל שמתאמנים יותר על שיחזורים כך יותר קל כשצריך באמת להציל את המערכת.