京都府立高等学校情報教育研究会が2010年10月15日,京都コンピュータ学院京都駅前校で開かれ,京都コンピュータ学院・総合情報システム部の木村章弘部長(コンピュータサイエンス学系教授)が,出席した52人の教員に「ネットワークの運用管理入門」と題し,実習を交えて講演した。教育業務を抱えながら,ネットワークの運用管理業務も任される教員の方々にとって,その負担は大きいだろう。スムーズな管理業務の推進と,各学校のICT化促進を支援するために,講演の要旨を紹介する。 |
ネットワークの運用管理といっても幅が広い。一般的には①構成管理~ネットワークを構成する機器の把握,状態監視,動作制御②性能管理~ネットワークを構成する機器や通信トラフィックの性能測定③セキュリティ管理~ネットワーク資源に対する利用制御や監視④障害管理~障害情報の収集と特定,障害原因の切り離しと復旧⑤課金管理~ネットワークの利用状況の記録や集計―の5つがある。今回はこの中の①構成管理④障害管理―の2点に絞って話をしたい。
まず一般的なコンピュータシステムの障害としては▽ハードウェア障害▽ソフトウェア障害▽人的障害―に分類される。この障害をネットワーク的な面で絞り込んでみると,次の3点が挙げられる。①回線の障害~ケーブルの断線やコネクタ接触不良,ケーブル品質の低下・劣化,ノイズ障害など②中継機器の障害~スイッチやハブ,ルータなどの電源が入らないといった問題,また特定のポートだけが異常となる場合など③パソコンやサーバの障害~サーバの各種サービスが停止している,LANアダプタが故障,IPアドレスなどネットワーク情報の設定ミス―。これら障害発生の原因は前述の3つのうちのどれなのか,早く特定することが大事だ。
参考までに日経ネットワーク2006年10月号に掲載されていたネットワーク障害に関する読者アンケートの集計結果(複数回答)を紹介したい。「ネットワーク障害が判明するきっかけとなる現象」の第1位は「Webがみられない」,次いで「メールが使えない」,この2つが圧倒的だった。Web,メールはやはりビジネスにおいて使われる頻度が高いためであろう。「ネットワークの障害の原因」では,トップがハードウェア系の障害である「LANスイッチやハブの故障」だった。最近,LANスイッチなどは安価になったが同時に品質が下がっていることも理由だと思われる。2位は「パソコンなどの端末の設定内容の不 具合」で,これはまさにユーザ側の責任といえる。そして「ネットワーク機器の設定内容の不具合」が続く。これらの結果を参考にしていただきたい。
ここで京都コンピュータ学院のキャンパスネットワークについて紹介したい。京都市内にある京都駅前校,洛北校,鴨川校,京都情報大学院大学の4校が専用線で接続しており,京都駅前校から光ファイバーでインターネットに接続している。一方,京都情報大学院大学は学術研究ネットワーク「SINET」に接続しており,これらでマルチホーミングを実現している。ちなみに京都駅前校ではすべての教室・フロアに有線と無線のネットワークが配備されている。同校本館だけで約600台,学内全体で約1000台のデスクトップパソコンがあり,すべてがネットワークに接続している。サーバ室には4台の専用ラックに,サーバ約 40台,ネットワーク機器約30台が収められ,一元管理している。
これらのネットワークシステムに障害が発生した場合どのような手順で究明すればよいのか。ここで障害原因の基本的な究明手順を押さえるためのフローを示したい。障害発生後はまず「障害内容と範囲の切り分け」が必要。発生しているのはネットワーク全体なのか,特定部分だけなのか,あるいは自分だけなのか。それを把握してから,影響を受けると思われる関係者および管理責任者に障害が発生しているということを連絡しなければならない。障害箇所を切り離してから原因の解析,対応・復旧,関係者への連絡という流れになるが,この後は必ず「障害の記録」を怠らないでほしい。同じような障害は繰り返し発生することが多々あるので,その時の経験値となる。
障害を切り分けるとき,まず重要なことは「慌てない」こと。ユーザの苦情を鵜呑みにして正確な判断がされずに対処してしまうと,問題を複雑にしてしまうこともある。また,障害が発生しているユーザ側から目的地点(サービス=メール,インターネットなど)に向かって段階的に調査する方法を取るのがよいだろう。具体的なネットワーク障害の究明手順としては①障害はネットワーク側なのか自マシン側なのか②自マシン側のネットワーク設定(ハード,ソフト)は大丈夫か③目的地点までの経路は通信可能かどうか④目的地点との送受信内容にエラーはないか⑤サーバなど目的地点でサービスは正常稼働しているか―という流れになる。
続いて原因究明に役立つ,Windows系OSに標準装備されている6つの基本コマンドを紹介したい(表1)。障害が起きた場合,管理者が使用しているパソコンを使用せず,現地のパソコンで原因を究明しなければならないことがある。これらのコマンドを使えば,障害が発生したパソコンでも,ある程度調査することができる。
「ping」「tracert」は,ネットワークが目的地点までIPレベルで通信できているかどうか,つまりネットワークの経路に問題が無いかを調べるのによく使う。「ipconfig」は自パソコンのネットワーク設定情報を表示させるコマンドであり,「netstat」は自パソコンとネットワーク間の送受信パケットにエラーが無いかどうか,「telnet」はサーバ側のサービスプログラムが稼働しているかどうか,「nslookup」はDNSサービスが稼働しているかどうかを確認するコマンドである。コマンドの使用例は表2の通り。最近はファイアウォール「ping」や「tracert」のコマンドへの応答(厳密にはICMP エコー要求に対する応答)を拒否する設定が多いので注意が必要だ。
ping コマンドの例 |
tracert コマンドの例 |
netstat コマンドの例 |
(表2)コマンドの使用例 |
最後に,これらの基本コマンドで障害原因が判明しない場合に使用できるネットワーク監視系フリーツールを紹介する。▽「ExPing」=通信経路の疎通確認で利用すると便利。実行ファイル形式なので起動するだけで動作し,USBでも持ち歩ける▽「TWSNMPマネージャ」= Windows 上で動作するネットワーク統合監視ツールの入門版。Ping による経路疎通確認,サービスプロトコルによるポート監視,SNMP による情報収集が可能。特にSNMP 対応機器を自動発見して登録できる▽「Network Notepad」=ネットワーク構成図の作成に利用。必要なパーツがそろっている。
第2部では小規模ネットワークシステムの管理について紹介する。学校内のICTを浸透させるためにシステム管理を担当している先生方は尽力されていると思うが,その苦労は計り知れないだろう。教育業務と管理業務の両立も大変だと思う。そんな中,できるだけ管理は範囲を明確化したうえで,業務の自動化,分散化を実現しておきたい。文書化し,資料をきっちりそろえておくことが管理をたやすくさせる。ネットワークの構成図があれば,機器管理台帳の役割も果たす。Excel でよいので,ぜひ作っておいてほしい。本来ならシステム導入時に導入・設定業者に作成してもらうべきものである。
まず①「定期的な業務」としては,特にファイルとログのバックアップを怠らないでいただきたい。②「突発的な対応」には,前述の障害対応,急な依頼などがある。③「将来的な業務」としては,システム拡張や改善が挙げられるだろう。管理対象は主にネットワーク機器,サーバ,クライアントPC,共有周辺機器など。管理に当たって,可能な限り文書化しておきたいのは▽管理ポリシー(原則)▽管理資産(ハードの管理番号,ソフトのバージョン・設定など)▽ネットワーク構成図(ネットワーク機器の名称,ネットワークの設定なども)を挙げておきたい。
次に,機器別管理の基本内容を掲げる。
◇ネットワーク機器
■ハブ・スイッチハブ・L2やL3スイッチ・ルータ等
■設置・設定すれば頻繁に設定変更は発生しない
■ネットワーク拡張・引っ越しやレイアウト変更で設定変更が発生
①ケーブルの再配線を考慮して両端には必ずタグを付ける。
②LANケーブル・ハブ・スイッチハブは予備を用意(安価なものでよい)
LANケーブルの障害は基本的にケーブル交換だが,再配線が容易でない経路は最初から二重化配線(本番配線と予備配線)しておくとよい。ハブ・スイッチハブの物理的な障害の見分け方として,LEDランプの点灯・点滅でリンクやトラフィックの状態を確認,電源故障は電源交換もしくは機器そのものの交換,特定ポートのみの故障は空きポートと入れ替えてリセット。また,各ポートの接続先(場所)を把握する表を作成するのも有効(Excel の表)。
③ルータ・L2やL3スイッチ等の高価なネットワーク機器
これらの機器故障は致命的なネットワーク障害になることが多いので,経費的に可能であれば予備を準備または冗長化(二重化),保守契約の内容によっては代替品の無償貸与も有るので契約時に確認しておくとよい。また,定期的に機器設定とログを確認することも必要である。
④外部業者に委託する作業は必ず立ち会う(電話,電気,LAN工事など)
◇サーバ機器
■ネットワークシステムにはほとんどサーバがあり,何らかのサービスを提供
■サービスに障害が発生すれば業務に影響
①サーバ監視
定期的に監視することで障害の発生や予兆をすばやくキャッチできる。毎日定時に監視すべきではあるが,最低でも週1回程度は実施しよう。特に,サーバの設定変更後や再起動後に障害は発生しやすいので注意して監視する。Windows 系サーバO S(2008Server)の場合は,タスクマネージャー(パフォーマンス・ネットワーク・リソースモニター)やイベントビューアなどの管理ツールで十分なので,各自のパソコンから「リモートデスクトップ接続」でサーバに接続して確認するとよい。
②サーバディスクの空き容量
ディスク空き容量不足はサービスに影響することが多いので,ログ等の日々増大するファイルは定期的にメンテナンス(外部記憶媒体に保存した後にローテーション)する。また,OSの設定でユーザ・グループ・フォルダごとのディスク利用率や容量を制限できるので,これらの管理ツール(Windows 系ではクォータ)を有効に利用するとよい。
③障害の予兆をキャッチ
イベントログ等の警告やエラーメッセージに注意するとともに,イベントログに現れない現象(例えば,応答時間がいつもより遅い,印刷時間がいつもより遅い,ハードディスクから異音が発生する,高負荷でないのにディスクのアクセスランプが点灯し続けるなど)が発生した場合,バックアップの頻度を上げて,交換用ディスクを準備する。非常にアナログ的なのだが,「いつもと違う?」と思ったら,すぐに原因究明するようなクセを付けておくことが障害発生時の被害を最小限にできる。
④管理者不在時の緊急対応
障害発生時の連絡体制を整備することは重要で,管理者が不在の際はなおさらである。まずは管理者に状況連絡し,その後の対応を確認する。また,サーバやネットワーク機器類の再起動の手順を文書化して分かりやすい場所に保管しておくとよい。サーバやネットワーク機器がクラッシュあるいはフリーズした場合,再起動すると復旧することが多い。ただし本質的な問題解決ではないので,対応後は管理者や業者に必ず連絡する。 一方,外部ネット(インターネット)からリモートでサーバを管理・制御できる環境を整備しておくことも有効である。
⑤重要ファイルのバックアップ
システムの特性や役割を検討して,バックアップ内容と優先順位を決定することになるが,重要ファイルは定期的(日次,週次,月次など)にバックアップすることを推奨する。理想はバックアップシステム(専用装置と管理ソフト)を導入すべきだが,最近では,バックアップデータが少ない場合は,リムーバブルメディア(DVD-R/W・USBメモリ・SDメモリ等)に,多い場合は,RAID 構成のNASやUSB外付けHDDでバックアップすることも増えているようだ。教育機関でのバックアップの目安としては,週次程度のフルバックアップで良いのでは。
◇クライアントパソコン
クライアントパソコンの管理方法は,大きく分類すると次のようになる。
①完全放置=IPアドレス割当てなどのネットワーク接続情報の管理のみを行う
②原則管理=ネットワーク接続情報以外に,クライアントのOSや業務上の推奨アプリケーションなどのインストールまでの管理を行う
③完全管理 =クライアントのすべての設定を完全に管理し,ユーザには設定変更させない
最近は情報セキュリティの観点から完全管理が多くなってきているが,教育機関の場合,教材コンテンツ作成など特性を考慮すると,完全管理は難しい面もある。
管理資料の例(ネットワーク構成図,機器管理台帳,障害管理台帳など) |
最後に,作成しておくと役に立つ最低限の管理資料は次の通りである。
①管理対象機器と設定一覧(管理台帳)= Excel で作成したもので十分なので,必ず作成しておく。
②ネットワーク構成図(物理構成または論理構成,IPアドレス管理表)=基本的にはネットワーク敷設・設定業者が作成するべきもので,Visio やPowerPoint で作成しておきたい。小規模ネットワークであれば,物理構成と論理構成を一つで作成してもよい。
③ユーザ管理表=基本的にはシステム設定業者が作成するべきもので,Excel で作成しておきたい。
④サーバ及びクライアントPC設定シート=基本的にはシステム設定業者が作成するべきもので,Excel で作成しておきたい。
⑤障害記録台帳=Excel やWord で作成したもので十分である。
⑥その他(FAQ,運転手順書等)=管理者不在時や自動化,同じ質問に何度も答える手間を考慮するなら,FAQや運転手順書をExcel やWord で作成しておくとよい。
①サーバやネットワークの監視,緊急時の障害対応以外は,機器管理台帳,ネットワーク構成図やIPアドレス管理表の作成など事務的な業務も多い。
②管理資料は一度作成すれば,引っ越しやレイアウト変更の際のネットワーク構成変更や,障害発生時の原因究明に役立つ。また,人事異動などで後任に管理業務を引き継ぐ場合,こうした管理資料を作成しておくと,引き継ぎ作業はよりスムーズになる。
③管理するネットワーク(サーバ含む)の現状を常に把握しておくことが,ネットワーク運用管理では最も重要である。