תשתית אמינה היא דרישה קריטית לעומסי עבודה בענן. כ-Cloud Architect, כדי לתכנן תשתית אמינה לעומסי העבודה, אתם צריכים להבין היטב את יכולות האמינות של ספק שירותי הענן שבחרתם. במסמך הזה מתוארים אבני הבניין של האמינות ב-Google Cloud (אזורים, אזורים גיאוגרפיים ומשאבים בהיקף מיקום) ורמות הזמינות שהם מספקים. במסמך הזה מפורטות גם הנחיות להערכת דרישות האמינות של עומסי העבודה, ומוצגות המלצות לגבי ארכיטקטורה לבנייה ולניהול של תשתית אמינה ב- Google Cloud.
המסמך הזה מחולק לחלקים הבאים:
- סקירה כללית על מהימנות (החלק הזה)
- אבני בניין של מהימנות ב- Google Cloud
- הערכת דרישות האמינות של עומסי העבודה בענן
- תכנון תשתית אמינה לעומסי העבודה ב- Google Cloud
- ניהול התנועה והעומס של עומסי העבודה ב- Google Cloud
- ניהול של התשתית ומעקב אחריה Google Cloud
אם קראתם את המדריך הזה בעבר ואתם רוצים לראות מה השתנה, תוכלו לעיין בהערות לגבי הגרסה.
סקירה כללית על אמינות
אפליקציה או עומס עבודה נחשבים לאמינים אם הם עומדים ביעדים הנוכחיים שלכם לגבי זמינות ועמידות בפני כשלים.
זמינות (או זמן פעולה) היא אחוז הזמן שבו אפשר להשתמש באפליקציה. לדוגמה, אם אפליקציה מסוימת מוגדרת עם יעד זמינות של 99.99%, זמן ההשבתה הכולל שלה לא יכול לעלות על 8.64 שניות במהלך תקופה של 24 שעות. לפעמים, הזמינות נמדדת כשיעור הבקשות שהאפליקציה משרתת בהצלחה במהלך תקופה מסוימת. לדוגמה, באפליקציה עם יעד זמינות של 99.99%, מתוך כל 100,000 בקשות שמתקבלות, יכולות להיכשל עד עשר בקשות. הזמינות מוצגת בדרך כלל כמספר התשיעיות באחוז. לדוגמה, זמינות של 99.99% נקראת '4 תשיעיות'.
בהתאם למטרה של האפליקציה, יכול להיות שיהיו לכם קבוצות שונות של אינדיקטורים שיצביעו על רמת המהימנות שלה. הנה כמה דוגמאות לאינדיקטורים כאלה:
- באפליקציות שמציגות תוכן, הזמינות, זמן האחזור והתפוקה הם אינדיקטורים חשובים לאמינות. הם מציינים אם האפליקציה יכולה להגיב לבקשות, כמה זמן לוקח לאפליקציה להגיב לבקשות וכמה בקשות האפליקציה יכולה לעבד בהצלחה בפרק זמן נתון.
- במסדי נתונים ובמערכות אחסון, חביון, קצב העברת נתונים, זמינות ועמידות (עד כמה הנתונים מוגנים מפני אובדן או השחתה) הם אינדיקטורים של מהימנות. הם מציינים כמה זמן לוקח למערכת לקרוא או לכתוב נתונים, ואם אפשר לגשת לנתונים לפי דרישה.
- במקרים של עומסי עבודה של ניתוח נתונים גדולים, כמו צינורות לעיבוד נתונים, ביצועים עקביים של הצינור (קצב העברת נתונים וחביון) הם חיוניים כדי להבטיח את עדכניות מוצרי הנתונים, והם מהווים אינדיקטור חשוב לאמינות. הוא מציין כמה נתונים אפשר לעבד, וכמה זמן לוקח לצינור להתקדם משלב הטמעת הנתונים לשלב עיבוד הנתונים.
- ברוב האפליקציות, נכונות הנתונים היא אינדיקטור מהימנות חיוני.
הנחיות נוספות להגדרת יעדי המהימנות של האפליקציות זמינות במאמר הערכת דרישות המהימנות של עומסי העבודה בענן.
גורמים שמשפיעים על מהימנות האפליקציה
המהימנות של אפליקציה שנפרסה ב- Google Cloud תלויה בגורמים הבאים:
- העיצוב הפנימי של האפליקציה.
- האפליקציות או הרכיבים המשניים שהאפליקציה תלויה בהם.
- Google Cloud משאבי תשתית כמו מחשוב, רשת, אחסון, מסדי נתונים ואבטחה שהאפליקציה פועלת עליהם, ואיך האפליקציה משתמשת בתשתית.
- קיבולת התשתית שאתם מקצים, ואיך הקיבולת מתרחבת.
- תהליכי ה-DevOps והכלים שבהם אתם משתמשים כדי ליצור, לפרוס ולתחזק את האפליקציה, את קשרי התלות שלה ואת התשתית. Google Cloud
הגורמים האלה מסוכמים בתרשים הבא:
כפי שמוצג בתרשים הקודם, המהימנות של אפליקציה שנפרסה ב- Google Cloud תלויה בכמה גורמים. המדריך הזה מתמקד באמינות של התשתית. Google Cloud
המאמרים הבאים
- אבני בניין של מהימנות ב- Google Cloud
- הערכת דרישות האמינות של עומסי העבודה בענן
- תכנון תשתית אמינה לעומסי העבודה ב- Google Cloud
- ניהול התנועה והעומס של עומסי העבודה ב- Google Cloud
- ניהול של התשתית ומעקב אחריה Google Cloud
שותפים ביצירת התוכן
מחברים:
- Nir Tarcic | Cloud Lifecycle SRE UTL
- קומאר דהנגופאל | מפתח פתרונות חוצי-מוצרים
תורמי תוכן אחרים:
- Alok Kumar | Distinguished Engineer
- אנדרו פייקס | עמית הנדסה, אמינות
- כריס הייזר | SRE TL
- David Ferguson | Director, Site Reliability Engineering
- Joe Tan | Senior Product Counsel
- Krzysztof Duleba | Principal Engineer
- נאראיאן דסאי | מהנדס SRE ראשי
- Sailesh Krishnamurthy | VP, Engineering
- Steve McGhee | Reliability Advocate
- סודהנשו ג'אין | מנהל מוצר
- Yaniv Aknin | Software Engineer