書籍情報
タイトル
システムはなぜダウンするのか
知っておきたいシステム障害、信頼性の基礎知識
著者
大和田尚孝
監修
日経コンピュータ
定価
本体2400円+税
目次
第1章 システムが止まった…ー「ダウン」とは何か
第2章 きちんとテストしたはずなのに…ーアプリケーション・ソフトの不具合
第3章 アプリケーションだけではない…ーOS、ミドルウェアの不具合
第4章 アクセス殺到に耐えきれず…ー性能・容量不足
第5章 気づかなかったは許されない…ー環境設定・変更ミス
第6章 その「うっかり」が致命傷…ー運用・操作ミス
第7章 まさか、こんなことが起こるとは…ーハード故障、不慮の事故
第8章 障害対応は時間との闘い…ーダウンに学ぶ
書籍紹介
銀行ATM停止、座席予約不能、株の誤発注――原因とメカニズムを徹底解説! 24時間利用できて当たり前、正常稼働して当然。社会インフラとして便利な世の中を支えている企業や官公庁の情報システムが、ひとたびダウンすると大きなトラブルを生みます。多くの情報システムのトラブル事例を追ってきた日経コンピュータ誌の記者が、過去10年間に発生したダウン事例を冷静な視点で分析。システムを正常稼働させる技術とダウンの原因を、多くの実例を交えながら体系だって解説します。
特徴1:「ダウン」という切り口から見る信頼性のしくみ 情報システムは、例外的な状況も想定して正常に動くためにさまざまな技術を取り入れ、運用ルールにもとづいて利用しています。しかしそうした技術や工夫を施し、テストを繰り返しても、システム・ダウンは起きています。本書では、まず、正常稼働のための 基本的技術や運用方法を説明し、続いて、そうした技術があるにもかかわらず、実際に起きたダウン事例を取り上げて、現実にどの部分にダウンの要因が潜んでいたかを見ていきます。
特徴2:システム・ダウンの原因を4つに分類し解説! システム・ダウンの原因はさまざまで、複数の要因が絡んでいることもありますが、突きつめると1つの原因にたどり着きます。本書では、「ソフトウエアの不具合」「性能・容量不足」「設定・操作ミス」「不慮の事故」の4つに分類し、根本原因がどういう不具合を次々に引き起こしダウンにつながっていたか、複雑に絡みあう原因をひも解いてきます。
書評
システムというのは24時間365日安定して動くということはなく、
常に何かしらのタイミングでシステム障害が発生します。
・仕様が漏れていた
・仕様が間違っていた
・プログラムにバグがあった
・プログラム同士の相性が悪かった
・移行に失敗した
・時刻の計算が正しくなかった
・本番環境とテスト環境を間違えた
・想定したキャパシティを超えた
などなど、システムがダウンする理由はいくらでも存在します。
某銀行の大規模なATM障害や、
証券取引所で起きた発注ミスによる400億円の損失など、
過去に発生した様々な障害を、
発生した原因や経緯を詳細に書かれていました。
「システムはなぜダウンするのか」というタイトルの通り、
システムがダウンする理由について事細かく書かれているため、
これらの原因をリスト化し対策することで、
同じ理由でシステムがダウンすることを減らせると思います。