2015年3月14日土曜日

CIMC(Cisco Integrated Management Controller)のCUI(CLI)操作手順



CIMCの運用上最低限必要な操作手順を残しておく.
CIMCへはweb(http)経由ではなく、sshでログインしているものとする.

(参考)
その他サーバ.
HP系サーバ
DELL系サーバ



【基本操作】
● スコープの変更(ディレクトリ移動)
存在するスコープの確認.
# scope ?

特定のスコープへ変更(ここではcimcへ移ることを想定).
# scope cimc

ホームへ戻る.
# top



【サーバの情報確認】
● バージョン、ファームウェア確認
# show version
もしくは
# show cimc



【HW(ハードウェア)のステータス確認】
● HDD(Hard Disk Drive)の状態確認
# scope chassis

# show hdd detail

# show storageadapter detail


● DIMM(Dual Inline Memory Module)の状態確認
# scope chassis

# show dimm-summary

# show dimm detail


● PSU(Power Supply Unit)の状態確認
# scope chassis

# show psu detail


● FANの状態確認
# scope chassis

# show fan-policy



【電源操作】

● cimcからサーバの電源オン、オフ
# scope chassis

# power shutdown

# power on

停止と起動の2コマンドを1回で実施することもできる.
# power cycle

完全にサーバOSが応答しなくなり、強制的な再起動が必要になったときは
物理的な電源OFFと同等のこともできる.
# power off

それでも反応がない場合は、リセット対応も可能である。
# power hard-reset 


● cimcからcimc自体の再起動
# scope cimc

# reboot



【設定周り】
● 新規ユーザの作成
# show user
1  admin  admin  no
(略)
4  (n/a)  (n/a)  no

# scope user 4
# set name アカウント名
# set password
# set enabled yes
# set role {readonly | user | admin}
# commit


● snmpの設定
# scope snmp
# set enabled yes
# set community-str cimcpublic
# commit
# show detail


● snmp trapの設定
# set trap-community-str public
# set trap-ver 3
# set inform-type inform
# scope trap-destination 1
# set enabled yes
# set addr 192.168.0.1
# commit
# show detail



【ログ確認】
● CIMCログの確認
# scope cimc/log/

# show entries detail

scopeを移動しない場合はdetailが付与できない.
# show cimc/log/entries


● システムイベントログ(System Event Log)
# show sel/entries


● 調査ログの取得
# scope cimc
# scope tech-support
# set remote-ip 192.0.2.1
# set remote-username hoge
# set remote-password
  Please enter remote-password:
  Please confirm remote-password:
# set remote-path /tmp/yyyymmdd_teck-support.tar.gz
# set remote-protocol tftp | ftp | sftp | scp | http
# commit
# start
# show detail

進捗が確認できる



【HWのステータス確認用MIB】
snmpgetなりsnmpwalkでsnmp mibからHWのステータスを確認もできる.
(CISCO-UNIFIED-COMPUTING-STORAGE-MIB から参照)

● HDD(Hard Disk Drive)の状態確認
cucsStorageControllerOperState
.1.3.6.1.4.1.9.9.719.1.45.1.1.6


● DIMM(Dual Inline Memory Module)の状態確認
cucsMemoryUnitOperState
.1.3.6.1.4.1.9.9.719.1.30.11.1.13


● PSU(Power Supply Unit)の状態確認
cucsEquipmentPsuOperState
.1.3.6.1.4.1.9.9.719.1.15.56.1.7


● FANの状態確認
cucsEquipmentFanOperState
.1.3.6.1.4.1.9.9.719.1.15.12.1.9




定期的に飛んでくるTRAP
● MegaRAID のPatrol Read
RAIDを構成するディスクの全セクタの定期的な検査の始まりと終わりに出力される.

開始時
.1.3.6.1.4.1.3582.4.1.6.0.8021

終了時
.1.3.6.1.4.1.3582.4.1.6.0.8018


● Raid Battery Relearn
Raid Batteryの状態確認時の、放電、充電時に出力される.
下の5つは定期的なルーティン処理中の発報なので無視してもいいだろう.

開始時(Battery relearn started)
.1.3.6.1.4.1.3582.4.1.6.0.8041

稼働中(Battery relearn in progress)
.1.3.6.1.4.1.3582.4.1.6.0.8042

終了時(Battery relearn in completed)
.1.3.6.1.4.1.3582.4.1.6.0.8043

終了時(Battery relearn timed out)
.1.3.6.1.4.1.3582.4.1.6.0.8044

稼働待ち終了時(Battery relearn in pending
.1.3.6.1.4.1.3582.4.1.6.0.8045


バッテリのステータス変化時は以下も飛んでくる.
.1.3.6.1.4.1.9.9.719.0.2

これは、故障時にも、復旧時にも同一MIB番号で発報するため注意が必要である。
Raid Battery XX degraded: Cleared"の記載があれば
一時的な劣化であったと判断すればいい.




(参考)
Cisco UCS C-Series Servers Integrated Management Controller CLI Configuration Guide
CIMC CLI Navigator