こんにちは、最近暑かったり寒かったりで衣替えのタイミングを完全に見失っているソフトウェアエンジニアのoinumeです。今日はドクターズプライムで行っているポストモーテムについて紹介したいと思います。
ポストモーテムとは?
弊社ではプロダクトに毎日のように機能追加・改修を行っています。機能追加や改修は人間が行うものなので、リリース後に不具合や障害が発生することはどうしても避けられません。そのため、もし不具合や障害が発生した場合は
- どういう問題がいつ起こったのか?
- 何が原因だったのか?
- どうやって問題を解決したのか?
を振り返り、同様の問題が起きないように再発防止策を練っていきます。この振り返りがポストモーテムです。
ポストモーテムについて、より詳しくはGoogle社が出しているSRE本を読まれると良いでしょう。
ポストモーテムのレポートのフォーマット
何かしらの不具合や障害が発生しその対応が終わった後に、以下の項目をNotionに記載してデータベースに蓄積しています。
- インシデント(不具合)の概要
- 発生日時
- 対応者
- インシデント発生・対応のタイムライン
- インシデントの詳細
- エンドユーザーへの影響
- インシデントの原因の詳細
- 仕組みによる根本解決策
なお、いつからポストモーテムをやり始めたのかを調べてみたところ、私が入社する前の2019年から始まっていました。手前味噌ではありますが、社員がまだ10人もいない時期から振り返りの文化があったのはすごいなぁとあらためて感じています。
ポストモーテムの運用
週に1回会議をして、新規で上がってきたレポートをプロダクト開発メンバーで振り返るようにしています。会議にはプロダクトマネージャー、カスタマーサポート、デザイナー、ソフトウェアエンジニアなど開発に関わるメンバーが参加し、ポストモーテムのレポートの内容を確認したり、仕組みによる根本的な解決策・再発防止策を考えたり、再発防止策が完了していないものをチェックしています。
運用していく上で重視していること
先に書いたように、プロダクトに対して何かしらの機能追加・改修・オペレーションを行うのは人間であるため、どうしてもミスが発生します。そのため、ポストモーテムを運用するにあたり以下のようなことを重視しています。
- ミスをした人を責めるのではなく、仕組みでミスが起こらないようにすること
- 仕組みを整えるために、本質的な原因は何だったのかを考え抜くこと
- 本質的な原因をレポートに書いてもらうために心理的安全性を確保すること
- 書き上げたレポートや再発防止策の仕組みは資産だと考えること
また、エンジニアだけで振り返りを実施するのではなく、プロダクトマネージャー、デザイナー、カスタマーサポートのメンバーも含めて振り返りをすることで、「今後どうしていくと良いか」のアイデアが多角的な視点で生まれてきます。
次回作として、社内のポストモーテムのレポートの実例をお見せしながら、どういった再発防止策が取られているかをお伝えする予定です。
最後に
弊社でのポストモーテムについて、実例も交えた形で記事にしてみました。最後にお決まりのアレではありますが、ドクターズプライムではポストモーテムのような振り返りの文化を大事にするプロダクト開発メンバーを大募集しています!「ちょっと気になっている」ぐらいでも構いません。MeetyやTwitterからのカジュアル面談をお待ちしています。