: Panduan
—Meng, hati- saat menguncinya untuk berhenti- adalah yang terburuk. Mereka, membutuhkan biaya, dan menguji tim Anda untuk di bawah. Tetapi dengan sumur di tempat, Anda bisa, data, dan kembali dari yang Anda kira! Mari kita hancurkan apa yang perlu Anda ketahui ,, dan dari tinggi ini.
Apa itu ""?
ke dalam, mari kita maksud dengan "." Ini tidak kecil atau singkat. , mereka , untuk itu untuk inti – pikirkan untuk, atau alat untuk. Kuncinya di sini adalah bahwa Anda untuk melayani, atau bertemu legal.
Langkah 1: & – 15 Pertama
Saat menjadi gelap, setiap. Inilah cara Anda:
1. & On-Call : Gunakan alat (seperti atau) untuk ketika vital gagal. Memiliki pra-panggilan jadi hak –,, —debak .
2. : Pekerjaan pertama adalah ruang lingkup. Tanyakan: Apakah itu A, data, atau masalah? Periksa: Apakah badai menurunkan daya? Apakah ada kesalahan?
3. : Jika (misalnya, aplikasi,), hingga 5-10 . Di sini kepercayaan – tidak ada orang yang suka disimpan dalam kegelapan!
Langkah 2: & – di loop
Setelah Anda, saatnya untuk [masalah] dan:
The : Jika itu karena atau A, dari bersih ke. Karena, jika A turun, matikan API -nya ke aplikasi lain sampai akar penyebabnya ditemukan.
: Gunakan (slack, tim, atau bahkan pohon telepon) untuk berbagi waktu nyata: "Down. Team Eta ke: 20 menit."
: For -, draft in. Simpan, hindari, dan atur (misalnya, “Kami sadar kartu debit. Tim kami adalah untuk memperbaikinya dan membidiknya pada pukul 3 sore EST.”).
Langkah 3: & Akar Penyebab
Sekarang, gulung dan gali mengapa . Fase ini untuk jangka pendek dan jangka panjang:
1. Periksa : Mulailah dengan:
Daya atau data Anda
atau kebocoran
atau
Kesalahan manusia (misalnya kode atau)
2. Gunakan Post- Tools : untuk, gunakan log (, rusa tumpukan) dan untuk melacak. Cari: Apakah awal setelah yang baru? Apakah ada lonjakan pengguna?
3. : Bahkan jika perbaikan tampak, tuliskan setiap langkah – yang melakukan apa, kapan, dan apa. Ini akan menjadi emas untuk posting Anda!
Langkah 4: & – Kembali
Setelah Anda menjadi penyebabnya, saatnya. berdasarkan:
vs. non- : Tanyakan: "Apa yang harus disimpan?" Sebab, bank mungkin membayar tagihan ATM.
& : Jika A, putar situs Anda (DR). Uji mereka bekerja saat Anda membutuhkannya!
Lengkap : untuk semua pengguna, tes dalam a. Pastikan data adalah, dan tidak ada bug.
Langkah T&J: Anda
T: Seberapa sering kami menguji?
A: at, run () setiap 6. Untuk risiko tinggi (,), bertujuan untuk cross-tim penuh.
T: Kami kecil – apakah kami membutuhkan?
A: ! Bahkan 10-tim bisa dari, rencana. Mulailah dengan 1 halaman: Siapa yang harus dihubungi, di mana, dan kunci-Anda akan berterima kasih nanti.
T: "" Terakhir kami setelah satu jam … kami masih?
A: Tidak ada "terlalu kecil" untuk! (Misalnya, disk yang) sering dibangun di kemudian hari – jangan biarkan "perbaikan keberuntungan" meninggalkan Anda.
Terakhir
Uji tim Anda, tetapi mereka juga menawarkan untuk belajar. Yang terbaik adalah – mereka setelah setiap, alat baru, dan melatih tim Anda sehingga mereka siap saat. : bukan hanya tentang kekacauan; Ini tentang kasus terburuk menjadi (dan bahkan!). Sekarang pergi rencanamu – kamu akan tidur kamu siap! .
Tinggalkan Balasan