【NetApp】ONTAP のバージョンアップ手順 | 自動更新(ANDU)と手動コマンド

  • URLをコピーしました!
目次

はじめに

NetApp ONTAP ストレージの OS アップデート(バージョンアップ)は、かつては管理者が手動でテイクオーバー(切り替え)とギブバック(切り戻し)をコマンドで一つ一つ実行する、緊張感のある作業でした。

しかし、現在の ONTAP 9 では、システムが自動的にこれらの手順を行ってくれる ANDU(Automated Non-Disruptive Upgrade)機能が標準となり、非常に安全かつ簡単に実行できるようになっています。

本記事では、推奨される「自動更新(ANDU)」の手順を中心に、バックグラウンドで行われている「テイクオーバー / ギブバック」の仕組みや、トラブルシューティングで役立つ手動コマンド (storage failover) についても解説します。

この記事でわかること
  • ANDU の仕組み: 自動無停止アップグレードの流れ
  • 準備: ONTAP イメージの入手と検証 (cluster image)
  • 実践: コマンド一発で完了する自動アップデート手順
  • 深掘り: 手動コマンドによる制御(takeover / giveback)と旧コマンド(sysconfig)の現在

ONTAP アップデートの概要

NetApp ONTAP システムは、通常 2 台のコントローラ(ノード)で 1 つのペア(HA ペア)を構成しています。 アップデートの際は、この 2 台が互いに助け合うことで、クライアントからのアクセス(NFS/CIFS/iSCSI)を止めることなく、片方ずつ順番に更新を行います。

ANDU(Automated Non-Disruptive Upgrade)とは

かつては、この「片方を停止させて(Takeover)、更新して、戻す(Giveback)」という手順を、管理者が手動でコマンド入力して行っていました。しかし、これは手順が複雑で、オペレーションミスのリスクがありました。

ANDU(Automated Non-Disruptive Upgrade)は、これらの一連の複雑な工程を システムが自動で制御してくれる機能 です。 コマンド一発(または GUI でクリック一回)で、検証・インストール・再起動・切り替え・切り戻しをすべて全自動で完了させます。現在の ONTAP 運用では、この ANDU を使うのが基本です。

事前準備 | イメージファイルの入手(NetApp Support Site)

アップデートを行うには、まず NetApp サポートサイト(NSS)から対象の ONTAP ソフトウェアを入手する必要があります。

  1. NetApp Support Site へログインします。
  2. Downloads > Software へ進み、ONTAP 9 を選択します。
  3. 目的のバージョン(例: 9.12.1P5 など)を選び、Image for All Platforms (.tgz) をダウンロードします。
💡重要

ダウンロードページにある Upgrade Advisor ツールを使い、「現在のバージョンから、目的のバージョンへ直接アップデート可能か(アップグレードパス)」を必ず確認してください。

ONTAP は通常、2 つ先のメジャーバージョンまでしか飛ばせません(例: 9.8 → 9.10 はOK、9.8 → 9.11 は NG の場合が多い)

手順

イメージのアップロードと検証

ONTAP のアップグレードを行うには、まず入手したソフトウェア(イメージファイル)をクラスタ内のすべてのノードに配置(インストール)する必要があります。

HTTP サーバーの準備(Mongoose 等)

コマンドライン (CLI) でイメージを取得する場合、HTTP サーバー経由でのダウンロードが一般的です。 Windows 環境であれば、Mongoose などの軽量 Web サーバーを利用すると便利です。

  1. Mongoose を起動し、ルートディレクトリにダウンロードした .tgz ファイル(例: 9121P5_q_image.tgz)を配置します。
  2. Web ブラウザ等で http://<PCのIP>/9121P5_q_image.tgz にアクセスできることを確認します。

cluster image package get によるイメージ取得

かつての software get コマンドは、現在は cluster image package get に変わりました。

# Web サーバーからイメージをダウンロード
cluster image package get -url http://192.168.1.100/9121P5_q_image.tgz

cluster image validate による事前検証

イメージが破損していないか、また現在のハードウェア構成と互換性があるかを検証します。 このステップでエラーが出た場合、アップグレードは開始できません。

# 検証の実行
cluster image validate -version 9.12.1P5

# 検証結果の確認(エラーがないことを確認)
cluster image show-update-validation
手順

自動更新(ANDU)の実行

推奨される更新方法

ONTAP 9 以降では、システムが自動的に検証・インストール・テイクオーバー・ギブバックを行う ANDU(Automated Non-Disruptive Upgrade)が標準かつ推奨される方法です。 手動で行う場合に比べ、オペレーションミスによる停止リスクを大幅に低減できます。

cluster image update コマンド一発での実行

検証が完了したら、以下のコマンドを実行するだけでアップグレードが開始されます。

# 自動アップデートの開始
cluster image update -version 9.12.1P5

特定の警告を無視する必要がある場合は -validation-ignore オプションなどを付与することもありますが、基本的には上記のみで OK です。

進捗確認(show-progress)

アップデート中は、どのフェーズ(検証中、インストール中、再起動中など)にいるかを確認できます。

# 進捗状況のモニタリング
cluster image show-update-progress
手順

手動での更新手順(CLI)

なぜ手動手順を知っておく必要があるのか

「ANDU があるなら手動コマンドは不要では?」と思うかもしれませんが、そうではありません。 ANDU が途中で一時停止(Pause)した場合や、ギブバックが自動で走らなかった場合、管理者が手動でコマンドを実行してプロセスを進める必要があるからです。

ここでは、検索需要の高い旧コマンド (cf) と、現在の対応コマンド (storage failover) を比較して解説します。

HA ペアの制御 | storage failover takeover(旧 cf takeover)

片方のノードを停止させ、パートナーノードに処理を引き継がせる操作です。

旧コマンド(7-Mode)
head2> cf takeover
新コマンド(ONTAP 9)
# node-01 をテイクオーバーさせる(node-02 から実行、またはクラスタシェルから実行)
storage failover takeover -ofnode node-01

役割の戻し | storage failover giveback(旧 cf giveback)

停止していたノードが復旧した後、ストレージの制御権を元の持ち主に戻す操作です。

旧コマンド(7-Mode)
head2(takeover)> cf giveback
新コマンド(ONTAP 9)
# node-01 へ制御権を戻す(ギブバックする)
storage failover giveback -ofnode node-01

sysconfig -a と現在の確認コマンド

ハードウェア構成の詳細を確認する sysconfig -a は、今でも多くのエンジニアが使用するコマンドです。 ONTAP 9 では、このコマンドは「ノードシェル(OS の下層)」に隠蔽されましたが、以下の方法で実行可能です。

方法1: クラスタシェルから直接実行する(推奨)
# node-01 に対して sysconfig -a を実行
system node run -node node-01 -command sysconfig -a
方法2: ONTAP 9 ネイティブのコマンドで確認する

現在は sysconfig ではなく、各コンポーネントごとの show コマンドを使うのが作法です。

# システム構成の概要
system node show

# ディスク等のハードウェア接続状況
system node hardware unified-connect show

作業後の確認

アップグレードプロセスが完了したら、必ず以下の項目を確認し、システムが正常な状態で稼働していることを裏付けましょう。

バージョン確認(version)

まずは、ターゲットとしていたバージョン(例: 9.12.1P5)が、クラスタ内のすべてのノードに適用されているか確認します。

# クラスタ全体のバージョンを確認
version

# 各ノードごとの詳細イメージを確認
cluster image show

ここで Current Version が目的のバージョンになっており、かつ Is Currenttrue になっていれば更新成功です。

HA 構成の健全性確認

最も重要なのが、HA ペア(冗長構成)の状態確認です。 アップグレード中は一時的にテイクオーバー(片系稼働)状態になりますが、作業後は必ず「両系稼働」かつ「いつでもテイクオーバー可能」な状態に戻っている必要があります。

かつての cf status コマンドに代わり、現在は以下のコマンドを使用します。

# HA ペアの状態確認
storage failover show
💡確認ポイント
  • Takeover Possible: true になっていること。
  • State: Connected になっていること。

もしここが falsePartial Giveback などになっている場合は、まだ完全に復旧していません。エラーログを確認し、ギブバックの完了を待つか、手動での介入が必要になります。

まとめ

本記事では、NetApp ONTAP 9 におけるアップグレード手順について、自動化された現代の手法(ANDU)と、基礎となる手動コマンドの両面から解説しました。

  • 複雑なテイクオーバー/ギブバック手順を自動化する cluster image update が現在のスタンダードです。
  • トラブルシューティングのために storage failover takeover / giveback の理解は重要です。
  • sysconfig -a などの旧コマンドも、ノードシェル (system node run) 経由で使用可能です。

以上、最後までお読みいただきありがとうございました。


よかったらシェアしてね!
  • URLをコピーしました!

この記事を書いた人

インフラ(クラウド/NW/仮想化)から Web 開発まで、技術領域を横断して活動するエンジニア💻 コンシューマー向けエンタメ事業での新規開発・運営経験を活かし、実戦的な技術ノウハウを発信中

[ Certs ] CCIE Lifetime Emeritus / VCAP-DCA ✒️ [ Life ] 技術書・ビジネス書愛好家📖 / 小・中学校で卓球コーチ👟

目次