インテル® Xeon Phi™ コプロセッサー

プラットフォーム・コントロール・パネル・ユーザーガイド

第 1.4 版

 

2014年5月1日

 

 

 

 

作成者:

インテル® Xeon Phi™ コプロセッサー・システム・ツールおよびライブラリー・チーム

 


 

 

 

本資料に掲載されている情報は、インテル製品およびサービスの概要説明を目的としたものです。製品およびサービスに付属のインテルの売買契約書に規定されている場合を除き、インテルはいかなる責任を負うものではなく、またインテル製品およびサービスの販売や使用に関する明示または黙示の保証 (特定目的への適合性、商品性に関する保証、第三者の特許権、著作権、その他、知的所有権を侵害していないことへの保証を含む) に関しても一切責任を負わないものとします。

 

インテルは、本書に記載された内容に関して、特許または出願中の特許、商標、著作権などの知的財産権を保有することがあります。明示されているか否かにかかわらず、また禁反言によるとよらずにかかわらず、文書およびその他の資料や情報の提供が、これらの特許、商標、著作権やその他知的財産権についてのライセンスを供与することにはなりません。

 

インテル製品は、医療、救命、延命措置、重要な制御または安全システム、核施設などの目的での使用を意図していません。

 

インテル製品は、予告なく仕様や説明が変更されることがあります。

本資料には、開発設計段階にある製品およびサービスの情報が含まれます。この情報は予告なく変更されることがあります。この情報だけに基づいて設計を最終的なものとしないでください。

 

*第三者の商標は各社の所有物です。

インテルが書面で同意した場合を除き、本通知またはインテルまたはインテルのサプライヤーまたはライセンサーにより製品に組み込まれたその他の通知を削除または変更してはなりません。

 

 

ソフトウェア・アーキテクチャー仕様、およびこれに記載されているソフトウェアはライセンスに基づいて提供されるものであり、そのライセンスの許諾範囲内でのみ使用または複製できます。本文書内での情報は、あくまでも情報として提供するもので、予告なしに変更されることもあり、また、内容についても、インテルが責任を負うものではありません。本書の内容および本書に関連して提供されるソフトウェア製品のいかなる誤りまたは不正確な点に関して、インテルは一切の責任や義務を負いません。ライセンス契約で許可されている場合を除き、インテルからの書面での承諾なく、本書のいかなる部分も複製したり、情報検索システムに保持したり、他の形式や媒体によって転送したりすることは禁じられています。

 

*その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。

 

Copyright © 2012-2014, Intel Corporation.無断での引用、転載を禁じます。

 


目次

 

1.   はじめに. 7

1.1   用語. 7

2.   システム必要条件. 8

3.   インストールガイド. 9

4.   概要. 10

4.1   呼び出しおよびコマンドライン・オプション. 10

4.2   メニューオプションおよびナビゲーション. 11

4.2.1  カードメニュー. 11

4.2.2  詳細メニュー. 13

4.3   [エラー・ログ・アナライザー] ダイアログ. 15

4.3.1  [フィルター] ボタン. 15

4.3.2  [リセット] ボタン. 16

4.3.3  [更新] ボタン. 16

4.3.4  ログファイルの参照. 17

4.4   [詳細設定] ダイアログ. 18

4.4.1  カード設定. 19

4.4.1.1   カードごとの設定. 19

4.4.1.2   システムレベルの設定. 19

4.4.1.3   設定の適用. 19

4.4.1.4   設定の破棄. 20

4.4.1.5   使用可能な設定. 20

4.4.1.6   確認の変更. 20

4.4.1.7   ECC モードの変更. 23

4.4.1.8   電源設定の変更. 23

4.4.1.9   ターボモード. 23

4.4.1.10  LED モードの変更. 24

4.4.2  カードの接続. 25

4.4.2.1   自動再接続. 26

4.4.2.2   手動による再接続. 26

4.4.2.3   すべてのカードを再起動. 26

4.4.3  ログファイル. 27

4.4.4  [詳細設定] ダイアログを閉じる方法. 27

4.5   [カード情報] ダイアログ. 28

4.6   [エラー・ログ・アラート] ボタン. 29

4.7   [接続が切断されたカードアラート] ボタン. 30

4.8   「デバイスが切断されました!」メッセージ. 31

4.9   サマリーフィールド. 31

5.   コントロール・パネルのビュー. 33

5.1   平均使用率ビュー. 33

5.1.1  コアの平均使用率. 34

5.1.2  コアの平均温度. 34

5.1.3  メモリー使用量合計. 35

5.1.4  電力使用量合計. 35

5.2   カードビュー. 36

5.2.1  カードの使用率ビュー. 38

5.2.1.1   コアの使用率. 39

5.2.1.2   プロセッサー・コアの温度. 40

5.2.1.3   メモリー使用率. 42

5.2.1.4   電力使用量. 43

5.2.2  コア・ヒストグラム・ビュー. 45

5.2.3  使用率履歴ビュー. 46

5.2.4  混合表示. 47

6.   コマンドライン・インターフェイス (CLI) 49

7.   バグレポート送信プロセス. 53

8.   確認されている問題点. 54

8.1   ルート SUSE* プラットフォームとしての X11 アプリケーションの実行. 54

 


 

図表目次

 

図 1:コントロール・パネルの起動エラー. 12

図 2:[カード (C)] メニューを表示したコントロール・パネル. 13

図 3:1 つのカードビューが含まれるコントロール・パネル. 13

図 4:[詳細 (A)] メニューを表示したコントロール・パネル. 14

図 5:[バージョン情報] ダイアログ. 15

図 6:[エラー・ログ・アナライザー] ダイアログ. 16

図 7:フィルターをかけた [エラー・ログ・アナライザー] ダイアログ. 17

図 8:[詳細設定] ダイアログ. 19

図 9:[カードの再起動 設定適用の確認] ダイアログ. 22

図 10:[再起動なし 設定適用の確認] ダイアログ. 22

図 11:Linux [プロセスモニター] ダイアログ. 23

図 12:Windows [プロセスモニター] ダイアログ. 24

図 13:カードの接続の失敗. 26

図 14:[すべてのカードを再起動] ダイアログ. 27

図 15:[カード情報] ダイアログ. 29

図 16:[エラー・ログ・アラート] ボタン. 31

図 17:[接続が切断されたカードアラート] ボタン. 31

図 18:接続が切断されたカードのメッセージ. 32

図 19:サマリーフィールド. 33

図 20:平均使用率ビュー. 34

図 21:コアの平均使用率. 35

図 22:コアの平均温度. 36

図 23:メモリー使用量合計. 36

図 24:電力使用量合計. 37

図 25:インテル® Xeon Phi™ コプロセッサー・カード・ビュー. 38

図 26:カードビューのタイトル. 39

図 27:カードビューのナビゲーション・ボタン. 39

図 28:カードの使用率ビュー. 40

図 29:コアの使用率フィールド. 41

図 30:プロセッサー・コアの温度. 41

図 31:プロセッサー・コア限界温度インジケーター. 43

図 32:メモリー使用率. 44

図 33:電力使用量. 45

図 34:限界電力使用量アラート・インジケーター. 46

図 35:コア・ヒストグラム・ビュー. 47

図 36:使用率履歴ビュー. 48

図 37:混合カード・ビュー・タイプ. 49

図 38:コマンドライン・インターフェイス (1/3) 51

図 39:コマンドライン・インターフェイス (2/3) 52

図 40:コマンドライン・インターフェイス (3/3) 53


 

 改訂履歴

改訂番号

日付

コメント

作成者

0.1

2011年8月15日

初版ドラフト作成

John Potts

0.2

2011年8月16日

ドラフトレビュー反映

John Potts

0.3

2011年8月18日

最終ドラフト提出

John Potts

0.4

2011年11月9日

リリース前更新

John Potts

0.5

2012年1月11日

アプリケーションの見た目と操作感に対するレビューによる変更を反映するために更新。

John Potts

0.6

2012年7月12日

最新の見た目と操作感と機能変更を更新。

John Potts

0.7

2012年7月16日

V0.6 からのレビューコメントを反映し、現在のアプリケーション UI を表示するためすべての新しい図を追加。

John Potts

0.8

2012年7月23日

レビューコメントを反映し、新しいセクション、[情報] ダイアログを追加。クロスレファレンスと改定目次を掲載。

John Potts

0.9

2012年7月23日

これまでユーザーガイドに掲載されていなかった追加されたダイアログとビューの記載を掲載。また文書書式を改善し、いくつかのケースを明確化。

John Potts

1.0

2008年8月20日

追加レビューコメントの掲載。新しいカードごとの設定と新しい「接続が切断されたカード」と LED 機能に関する記載を追加。

John Potts

1.1

2012年9月17日

カスタマーリリースまでの最終変更による表とテキストの更新

John Potts

1.2

2013年8月26日

カスタマーリリース MPSS 3.1 までの最終変更による表とテキストの更新

John Potts

1.3

2014/03/03

アプリケーション更新 URL を反映するために「詳細メニュー」セクションを更新。

Han Timmerman

1.4

2014/04/28

インテル® Xeon Phi™ コプロセッサー・プラットフォーム・ステータス・パネルからインテル® Xeon Phi™ コプロセッサー・プラットフォーム・コントロール・パネルへの製品名の変更。新しいユーザー・インターフェイス要素を反映するためにドキュメントを更新。

Han Timmerman

 

 

作成者:

John Potts

 

協力者:

TCG MIC SW システム・ツールおよびライブラリー・チーム

 

1.  はじめに

 

本資料はインテル® Xeon Phi™ コプロセッサー付属のインテル® Xeon Phi™ コプロセッサー・プラットフォーム・コントロール・パネル・ソフトウェア (「コントロール・パネル」) に関するものです。ユーザーはコントロール・パネルを使用して、カードステータスおよび設定のグラフィカル・モニタリングができます。コントロール・パネルの使用方法の詳細は以下のセクションに記載されています。

1.1  用語

このセクションは本資料の読者にあまり馴染みがないと思われる用語の定義を記載しています。標準 PLC、業界およびインテルの略語は含まれておりません。

用語

説明

GUI

グラフィカル・ユーザー・インターフェイス

MIC

メニー・インテグレーテッド・コア

SDP

サードパーティー・ベンダーが独自にアプリケーションを開発できるようにするソフトウェア開発プラットフォーム

SMC

システム管理および構成

UI

ユーザー・インターフェイス - 人がユーザーとしてコンピューター・システムやコンピューティング・デバイスとやり取りする方法

uOS

MIC のエンベデッド・ソフトウェアの基盤である Linux ベースのコプロセッサー・オペレーティング・システム

 

 

 

2.  システム必要条件

オペレーティング・システム:Linux 64 ビット・エディション 又は Microsoft® Windows®

メモリー:システム RAM 512 Mb を推奨

ハードウェア:1 つまたは複数のインテル® Xeon Phi™ コプロセッサー

ソフトウェア:MPSS スタック、バージョン 3.3 以上

3.  インストールガイド

インストール・メディアは、インテル・プレミア・サポート・サイト (URL:https://software.intel.com/en-us/articles/intel-manycore-platform-software-stack-mpss) で入手できます。


4.  概要

このセクションではコントロール・パネル・アプリケーションの概要を説明します。コントロール・パネルはシステム管理のためのホスト側ユーザー・インターフェイスです。コントロール・パネルは大規模なクラスター設定というよりは、ワークステーション環境などの、より小規模な設定における使用を意図しており、こうした設定に効果的に使用できます。コントロール・パネルは以下を行います。

·    インテル® Xeon Phi™ コプロセッサーのステータス/パラメーター、電力、温度などのモニタリング。

·    コアの使用率などシステム・パフォーマンスと重要なシステム・パラメーターのモニタリング。

4.1  呼び出しおよびコマンドライン・オプション

シェルコマンド検索パスがコントロール・パネルのインストール・ディレクトリーを指定するように初期化したら、引数を指定しないで micsmc コマンドを使用することで、コントロール・パネルのグラフィカル・ユーザー・インターフェイスを呼び出すことができます。

$ micsmc

micsmc コマンドは、コントロール・パネルの GUI と同じ情報と設定にアクセス、管理でき、しかも直接コマンドラインから操作できる、複数のコマンドライン・オプションをサポートします。以下のコマンドを使用していつでもこれらのオプションとその説明を表示できます。

$ micsmc -–help

これらのコマンドライン・オプションは本資料の後にある 6 セクションに記載されています。

micsmc GUI アプリケーションを実行するには、その前に MPSS スタックをインストールしている必要があります。また、ホストシステムのデバイスドライバーがロードされ、正常に初期化されている必要があります。micsmc GUI の起動時に、これらの前提条件が満たされているかどうかが確認されます。前提条件が満たされていない場合は、ダイアログボックスが表示され、問題に関する情報が示されます。[OK] ボタンをクリックすると、GUI アプリケーションは終了し、問題を修正することができます。1 のダイアログボックスには、「MIC デバイスドライバーがロードされていません」というエラーメッセージが表示されています。これ以外に表示される可能性のあるエラーメッセージとして、「MIC ドライバーが初期化されていません」、「API の初期化に失敗しました」があります。後者の場合は API エラーコードも表示されます。

1:コントロール・パネルの起動エラー

4.2  メニューオプションおよびナビゲーション

コントロール・パネルの GUI は、メイン・アプリケーション・ウィンドウ・フレームによって構成されています。メイン・アプリケーション・ウィンドウ・フレームにはメニューバーがあり、[カード (C)] と [詳細 (A)] というトップレベル・メニューが表示されます。また、アプリケーション・ウィンドウ・フレームに加えて、ウィンドウ・フレームの右上に標準のアイコン (ウィンドウの最小化/最大化、アプリケーションの終了) が用意されています。このセクションに記載されているメニューの選択肢とオプションすべてにおいて、オプション名の下線付き文字 (例:[カード (C)]) はキーボード・ショートカットを示しています。ほとんどのグラフィカル・インターフェイスで、下線は Alt キーを押しながら C キーを押すことを意味しています。例えば [カード (C)] メニューでは、マウスで [カード (C)] メニューをクリックするのと同じ結果になります。カードが 1 つだけある場合、[カード (C)] メニューラベルは[カード (C)] になることにご注意ください。

4.2.1  カードメニュー

[カード (C)] メニューをクリックする (または Alt キーを押しながら C キーを押す) と、2 つのセクションと最低 3 つの選択肢があるメニューが表示されます。区切り線の上にある [カード (C)] メニューの最初のセクションには、システムのインテル® Xeon Phi™ コプロセッサーを ID によって識別するためのリストが含まれています (mic0、mic1 など)。この内容は利用可能なカードの数に応じて異なります。区切り線の下にある第 2 の [カード (C)] メニューセクションには、[すべて表示 (S)] と [すべて非表示 (H)] という 2 つの固定項目があります。2 は [カード (C)] メニューを示しています。

2:[カード (C)] メニューを表示したコントロール・パネル

上部の [カード (C)] メニューセクションのカード・ナンバー・メニューを 1 つ選択すると、アプリケーション・フレームが拡大され、選択したカードのカードの使用率ビューが表示されます。カード・ナンバー・メニューはトグル (切り替え) スイッチとして機能します。最初にクリックすると選択したデバイスに対してカードの使用率ビューが表示され、クリックしたカード・ナンバー・メニューの隣にチェックマークが表示されます。2 回目にクリックすると、デバイスに対するカードのカードの使用率ビューが非表示になります。3 は 1 つのカードビューを表示したコントロール・パネルを示しています。

3:1 つのカードビューが含まれるコントロール・パネル

コントロール・パネルのカードビュー (デフォルト表示はカードの使用率ビュー) の詳細については以下のセクション 5.2 を参照してください。

[カード (C)] メニューの下のセクションに [すべて表示 (S)] と [すべて非表示 (H)] という 2 つの項目があります。これらの項目によって、システムのすべてのカードの使用率ビューを表示/非表示にします。[すべて表示 (S)] と [すべて非表示 (H)] の両方に下線付き文字があり、キーボードのショートカットが使用可能であることにご注意ください。例えば、[すべて表示 (S)] を実行するには [カード (C)] メニューをクリックしてから [すべて表示 (S)] メニューをクリックするか、または Alt を押しながら C を押し、次に Alt を押したままで S を押します。

4.2.2  詳細メニュー

[詳細 (A)] メニューをクリックする (または Alt を押しながら A を押す) と、[エラーログ (E)]、[設定 (S)]、[アプリケーションのアップデート (U)]、[情報 (I)]、[バージョン情報 (A)] の 5 つの項目を含むメニューが表示されます。4 はコントロール・パネルの [詳細 (A)] メニューで、メニュー機能は以下に記載されています。

4:[詳細 (A)] メニューを表示したコントロール・パネル

·    [エラーログ] – このメニューはアプリケーションのエラーログのコンテンツを含む [エラー・ログ・アナライザー] ダイアログを表示します。[エラー・ログ・アナライザー] ダイアログの詳細については、下のセクション 4.3 を参照してください。

·    [設定] – このメニューはシステムのカード設定を制御する [設定] ダイアログを表示します。このダイアログについては下のセクション 4.4 で説明します。

·    [アプリケーションのアップデート] – このメニューはデフォルトのブラウザーでインテル開発 Web サイト (http://software.intel.com/en-us/articles/intel-manycore-platform-software-stack-mpss) を立ち上げます。この Web サイトには認証が必要です。

·    [情報] – このメニューはシステムにインストールされたインテル® Xeon Phi™ コプロセッサーについての詳細情報を提供する [カード情報] ダイアログを表示します。[カード情報] ダイアログについては下のセクション 4.5 で説明します。

·    [バージョン情報] – このメニューはアプリケーションのバージョン情報を含む [バージョン情報] ダイアログウィンドウを表示します。[バージョン情報] ダイアログは下の 5 に表示されています。

5:[バージョン情報] ダイアログ

4.3  [エラー・ログ・アナライザー] ダイアログ

コントロール・パネルの [エラー・ログ・アナライザー] ダイアログは下の 6 に表示されています。上記のとおり、[詳細 (A)] メニューからアクセスできます。

[エラー・ログ・アナライザー] ダイアログにはメッセージ・ログ・ファイルのコンテンツを表示するメッセージリスト、表示されるメッセージのタイプと重大度を指定する複数のフィルターボタン、メッセージリストを削除し、ログファイルからリストを更新し、別のログファイルを指定して表示する追加ボタンがあります。

表示されたコンテンツが使用可能なメッセージの幅または高さを超えた場合に、必要に応じてメッセージリストを縦方向または横方向にスクロールできます。スクロールの手間を減らす、または省くために、[エラー・ログ・アナライザー] ダイアログのサイズを変更してメッセージリストの大きさを拡大することもできます。

ダイアログの右下にある [閉じる (L)] ボタンを押すと、ダイアログを閉じて、コントロール・パネル・アプリケーションに戻ることができます。

4.3.1  [フィルター] ボタン

6 には、メッセージリストの内容をフィルターするためのチェックボックスである、[致命的 (F)]、[重大 (C)]、[警告 (W)]、[情報 (I)]、[RAS フィルター (A)] が示されています。各チェックボックスは、コントロール・パネルのエラー・ログの重大度レベルに対応しています。デフォルトではすべてのチェックボックスが選択されており、すべてのメッセージが表示されます。

6:[エラー・ログ・アナライザー] ダイアログ

いずれかのフィルター・チェックボックスの選択を解除すると、メッセージリストがフィルターされ、選択した重大度のメッセージが削除されます。また、そのタイプのメッセージが表示されなくなったことを示すため、そのボタンが強調表示されます。例えば、[情報 (I)] チェックボックスの選択を解除する (または Alt キーを押しながら I キーを押す) と、メッセージリストがフィルターされ、すべての情報メッセージが削除されます。

7 は情報メッセージを非表示にするようフィルターをかけた [エラー・ログ・アナライザー] ダイアログの例で、この場合警告メッセージだけが表示されています。

7フィルターをかけた [エラー・ログ・アナライザー] ダイアログ

4.3.2  [リセット] ボタン

[リセット (R)] ボタンはすべてのフィルター・チェックボックスをリセット (チェック) するため、メッセージリストで再びすべてのエラーログが表示されるようになります。上記の例で [リセット (R)] ボタンをクリックすると、[情報] チェックボックスが再び選択 (チェック) され、情報メッセージがある場合はメッセージリストに再び表示されます。

4.3.3  [更新] ボタン

[更新 (H)] ボタンは新しいエントリーをアクティブなエラー・ログ・ファイルから取得し、表示情報を更新します。[リセット (R)] ボタンと同様に、[更新] ボタンもフィルター・チェックボックスをリセットしてアクティブなフィルターを解除するため、ログファイルのすべてのメッセージが表示されます。

4.3.4  ログファイルの参照

ダイアログの下のパスフィールドに新しいログ・ファイル・パスを入力するか、[参照 (B)] ボタンをクリックして、ブラウザーを開き、既存のログファイルを選択するか、または新しいログファイルを作成することで、アクティブなログファイルを変更することができます。

4.4  [詳細設定] ダイアログ

8 にコントロール・パネルの [詳細設定] ダイアログが表示されています。上記のとおり、このダイアログは [詳細 (A) ] メニューからアクセスできます。[詳細設定] ダイアログは機能グループごとに区分されていて、ダイアログウィンドウの右下に [戻る(R)] ボタンがあります。グループには、[カード設定]、[カードの接続]、[ログファイル] があります。

8:[詳細設定] ダイアログ

 

4.4.1  カード設定

[カード設定] グループにはチェックボックスがグリッド状に並び、一覧されたカードと機能の現在の設定が示されます。これらのチェックボックスを使用して、すべてのカードまたは個々のカードの設定を変更する (有効化または無効化する) ことができます。有効化または無効化できる設定には、ターボモードECC モードLED モード、および 4 つの電源状態 (p1、pc3、pc6、co6) があります。[カード設定] グループには [適用] ボタンと [破棄] ボタンがあります。これらのボタンを使用して、ユーザーが変更した選択内容を適用したり、それらの変更内容を破棄して現在値の表示に戻したりすることができます。

[カード設定] テーブルには、それぞれのチェックボックスが有効または無効にする設定に基づいてグループ化されたチェックボックスの列があります。[すべて] というラベルが付いたチェックボックスの最初の行は、システムのすべてのカードに対する該当設定を有効化または無効化します。そして残りの行は、システムの個々のカードに対して設定を有効化または無効化します。

4.4.1.1  カードごとの設定

特定のカードの設定を有効化するには、行でそのカードを選択し、列で設定を選択し、対応するチェックボックスをクリックして設定を有効化します。設定が有効化されると、ボックスにチェックマークが表示されます。例えば 8 では、mic2 カードの LEC モードが有効化されています。

特定のカードの設定を無効化するには、行でそのカードを選択し、列で設定を選択し、対応するチェックボックスをクリックして設定を無効化します。設定が無効化されると、ボックスのチェックマークが削除されます。例えば 8 では、mic3 カードの ターボモードが無効化されています。

4.4.1.2  システムレベルの設定

システムのすべてのカードの設定を有効化するには、その設定の [すべて] 行にあるチェックボックスを探し、そのチェックボックスをクリックして選択します。設定が有効化されると、ボックスにチェックマークが表示されます。[すべて] のチェックボックスを選択すると、その列のすべてのカードのチェックボックスも選択されます。例えば 8では電源状態 p1 がシステムのすべてのカードに対して有効化されています。

すべてのカードの設定を無効化するには、その設定の [すべて] 行にあるチェックボックスを探し、そのチェックボックスをクリックして選択を解除します。設定が無効化されると、ボックスのチェックマークが削除されます。[すべて] チェックボックスの選択を解除すると、その列のすべてのカードのチェックボックスの選択も解除されます。例えば 8では、システムのすべてのカードで電源状態 p3 が無効化されています。

4.4.1.3  設定の適用

[カード設定] グループ内では、有効化または無効化された設定は [適用] ボタンをクリックするまで実際に適用されません。[適用] ボタンをクリックして変更を適用する場合には、それらの変更を確認する必要があります。詳細については、下のセクション 4.4.1.6 を参照してください。

4.4.1.4  設定の破棄

[カード設定] グループ内では、[破棄] ボタンをクリックして、現在の変更 (前回 [適用] ボタンをクリックした後に行った変更) を破棄できます。この操作を行うと、[カード設定] テーブルが復元され、システムにあるカードの現在の設定状態が反映されます。これらの変更は一度破棄すると、元に戻すことができないため、これらを復元したい場合は、マウスを使って設定を再度選択する必要があります。

4.4.1.5  使用可能な設定

一部のインテル® Xeon Phi™ コプロセッサー・ベースのシステムでは特定の設定を使用できません。それらのシステムでは、一部のチェックボックスが無効になり、使用できません。また、特定のシステムにおいては、ターボモードの設定は現在の電源状態設定に依存する場合があります。さらに、[カード設定] グループでサポートされているすべてのモードと電源状態を有効化/無効化するために、ルートユーザーとしてログインする必要があります。ルートユーザー以外でこのアプリケーションを実行すると、アプリケーションは読み取り専用の状態になります。この場合、[カード設定] グループのすべてのチェックボックスは無効になり、選択状態を変更することはできません。この場合、テーブルには現在のシステム設定とカードごとの設定の有効化/無効化状態が表示されますが、変更することはできません。

4.4.1.6  確認の変更

[カード設定] を変更する場合は必ず示された変更を適用する前に確認する必要があります。この確認を行うために使用できるダイアログフォームは 2 つあります。1 つは ECC モードと電源状態の変更のためのダイアログでカードの再起動を必要とし、もう 1 つはターボモードまたは LED モード設定の変更のためのダイアログでカードの再起動を必要としません。

4.4.1.6.1  ECC モードまたは [電源状態] の設定の変更の確認

ECC モードまたは電源状態の設定を変更する場合には、変更を有効にするために対象となるカードをリセットし、再起動する必要があります。1 つまたは複数のカード設定を変更し、[適用] ボタンをクリックした場合、[カードの再起動 設定適用の確認] ダイアログが下の 9 のように表示されます。

このダイアログで、変更を適用する場合は [OK] を、また変更を適用しない場合は [キャンセル] のどちらかを選択する必要があります。[キャンセル] を選択すると、[ 詳細設定 ダイアログにコントロールが戻ります。[カード設定] グループの前回の選択は変更されないままになります。

 

9:[カードの再起動 設定適用の確認] ダイアログ

4.4.1.6.2  ターボモードまたは LED モード設定の変更の確認

ターボモードまたは LED モードの設定を変更する場合は、カードを再起動する必要はありません。1 つまたは複数のカード設定を変更し、[適用] ボタンをクリックした場合、[再起動なし 設定適用の確認] ダイアログが下の 10 のように表示されます。

このダイアログで、変更を適用する場合は [OK] を、また変更を適用しない場合は [キャンセル] のどちらかを選択する必要があります。[キャンセル] を選択すると、[ 詳細設定 ダイアログにコントロールが戻ります。[カード設定] グループの前回の選択は変更されないままになります。

 

10:[再起動なし 設定適用の確認] ダイアログ

 

4.4.1.6.3  混在モードの変更の確認

ターボモード、ECC モード、LED モード、または電源の設定変更を組み合わせて選択し、[適用] ボタンをクリックした場合は、常に [カードの再起動 設定の適用] ダイアログ (9 を参照) が使用されます。これは、ECC モードまたは電源状態の変更が指定されたためです。カードの再起動の確認を必要とするアクションは、常に [ 再起動なし 設定適用の確認] ダイアログより優先されます。どちらの確認ダイアログが表示されても、[ OK] をクリックすると、選択されたすべての変更が適用されます。

 

4.4.1.6.4  プロセスモニター

カードの再起動が必要な場合、[プロセスモニター] ダイアログが表示され、カードのリセットと起動を含むカードの再起動の進行状況を示します。これは、[カードの再起動 設定適用の確認] のダイアログの [ OK] ボタンをクリックすると、常に [ プロセスモニター] ダイアログが表示されることを意味します。

[プロセスモニター] ダイアログには、Linux バージョン (11 を参照) と Windows バージョン (12 を参照) の 2 つのバージョンがあります。[プロセスモニター] ダイアログは、ユーザーへの情報提供のみを意図しています。プロセスが完了すると、[プロセスモニター] ダイアログは自動的に閉じます。[プロセスモニター] ダイアログはユーザーの操作を必要としませんが、便宜上 [OK] ボタンが備わっています。[OK] ボタンをクリックすると [プロセスモニター] ダイアログが閉じますが、リセット/再起動のプロセスは完了するまで続行されます。

 

11:Linux [プロセスモニター] ダイアログ

 

12:Windows [プロセスモニター] ダイアログ

4.4.1.7  ECC モードの変更

1 つ以上のカードで ECC モードを変更し、[カードの再起動 設定適用の確認] ダイアログ (9 を参照) で [OK] ボタンをクリックすると、影響を受ける各インテル® Xeon Phi™ コプロセッサーがメンテナンス・モードになり、モード変更がカードに適用され、モード変更が完了するとカードが再起動されます。要求したモード変更が正常に完了した場合、新しい ECC モード設定の新しい有効化/無効化状態を示すようにチェックボックスがアップデートされます。モード変更操作中にエラーが発生した場合は、エラー状態の詳細を示す [エラー] ダイアログが表示されます。

上記のセクション 4.3 で説明されているように、すべてのエラーはコントロール・パネルのエラーログに記載され、[エラー・ログ・アナライザー] で表示できます。エラーが発生した場合、通常の操作状態に戻るために、インテル® Xeon Phi™ コプロセッサー、コントロール・パネル・アプリケーション、そしてホストシステムを再起動する必要がある場合があります。

4.4.1.8  電源設定の変更

ECC モードと同様に、カードがサポートするさまざまな電源状態を有効化/無効化するチェックボックスがあります。これには P ステート (p1)パッケージステート C3 (pc3)、パッケージステート C6 (pc6)およびコアステート C6 (co6) があります。これらの電源状態が有効化されると、対象となるすべてのインテル® Xeon Phi™ コプロセッサーの電源管理方法に影響を与えます。

[適用] ボタンをクリックして電源状態の変更を適用すると、変更の確認のために [カードの再起動 設定適用の確認] ダイアログ (9 を参照) が表示されます。ECC モード変更と同様に、電源状態の変更を適用する場合には [OK] ボタンをクリックし、該当するすべてのカードを再起動します。変更を適用しない場合には、[キャンセル] ボタンをクリックして [詳細設定] ダイアログに戻ります。

ダイアログで変更を承認した場合は、システムの対象カードが新しい電源状態で再設定され、再起動されます。使用可能な電源状態の設定詳細については、セクション 4.4.1.5 を参照してください。

4.4.1.9  ターボモード

その他のカード設定と同様に、ターボモードを有効化/無効化するチェックボックスがあります。ただし、カードによってはターボモードをサポートしていないものもあります。要求されたモードをサポートしていないカードがアプリケーションによって検出されると、対応する [ターボモード] チェックボックスが無効になり、選択できません。また、ターボモード機能がカードによって通常サポートされている場合でも、現在の電源状態ターボモードをサポートしていない場合には、[ターボモード] チェックボックスは無効になります。

ターボモードがサポートされている場合には、その他のカード設定と同様に、ターボモードを有効化/無効化するチェックボックスがあります。[適用] ボタンをクリックしてターボモードの変更を適用すると、変更を確認するために 9 と同じダイアログが表示されます。ターボモード変更を適用する場合には [OK] ボタンをクリックし、変更を適用しない場合には [キャンセル] ボタンをクリックして [詳細設定] ダイアログに戻ります。

ECC モード電源状態の変更とは異なり、ターボモードの変更ではカードの再起動は不要です。

4.4.1.10  LED モードの変更

他のカード設定と同様に、LED モードを有効化/無効化するチェックボックスがあります。[適用] ボタンをクリックして LED モードの変更を適用すると、変更を確認するために 9 と同じダイアログが表示されます。LED モード変更を適用する場合には [OK] ボタンをクリックし、変更を適用しない場合には [キャンセル] ボタンをクリックして [詳細設定] ダイアログに戻ります。

LED モードでは、有効化されたインテル® Xeon Phi™ コプロセッサーの 2 つの LED が 2 秒ごとに点滅します。このモードでは、コントロール・パネルのカードを選択し、LED モードを点滅させ、システムの対応する物理的なカードを目で確認することができます。

ECC モード電源状態の変更とは異なり、LED モードの変更ではカードの再起動は不要です。

13:カードの接続の失敗

4.4.2  カードの接続

[カードの接続] グループには、システム内で検出された各インテル® Xeon Phi™ コプロセッサーのボタンと、[すべてのカードを再接続] ボタンおよび [すべてのカードを再起動] ボタンがあります。それぞれのカードボタンに「micN」とラベルが付いていて、「N」がカードナンバー (0-N) となります。

[カード] ボタンの色は対応するカードの状態に応じて変化します。カードがオンラインの場合は、カードがオフラインまたは再起動中の場合はになります。8 に示されている [詳細設定] ダイアログでは、8 つのカードすべてが利用可能であり応答しているため、すべてのカードのボタンはです。13 の [カードの接続] グループでは、2 つの接続が失敗していることが示されています。

4.4.2.1  自動再接続

コントロール・パネル・アプリケーションは、カードのエラー、リセット、または再起動のためにアプリケーションから切断されていたカードの自動再接続をサポートしています。カードがオンライン状態に戻ると、アプリケーションは自動的にカードに再接続し、対応するカードのボタンを緑色に戻し、通常通りカードデータのモニタリングを継続します。

4.4.2.2  手動による再接続

稀なケースですが、再起動されオンライン状態にあるカードに、アプリケーションが正常に再接続できない場合があります。この場合、[カード] ボタンをクリックすると、それに関連付けられたインテル® Xeon Phi™ コプロセッサーの手動再接続がコントロール・パネルによって開始されます。[すべてのカードを再接続] をクリックすると、システムのすべてのインテル® Xeon Phi™ コプロセッサーに対して、アプリケーションの再接続が試行されます。

4.4.2.3  すべてのカードを再起動

[すべてのカードを再起動] ボタンをクリックすると、システムのすべてのインテル® Xeon Phi™ コプロセッサーに対して、手動での再起動が試行されます。この場合、再起動する前に 14 に示す確認ダイアログが表示されます。[OK] ボタンをクリックして再起動を続行するか、[キャンセル] ボタンをクリックして再起動をキャンセルします。システムのルート権限がない場合は、ルートユーザーにカードを再起動するように要求し、次に [すべてのカードを再接続] を使用して、コントロール・パネル・アプリケーションとシステムのインテル® Xeon Phi™ コプロセッサーの間の接続を回復することができます。 

14:[すべてのカードを再起動] ダイアログ

4.4.3  ログファイル

[ログファイル] グループには、[循環スケジュール] ドロップダウン・メニューと [タイムスタンプで循環] ボタンがあります。[循環スケジュール] ドロップダウン・メニューには、ログファイルの循環頻度を選択するオプションがあります。オプションは、[毎日]、[毎週]、[毎月]、[循環させない] です。[タイムスタンプで循環] ボタンは現在のタイムスタンプがついた現在のログファイルを直ちに循環します。[参照 (B)] ボタンをクリックしてファイル・システム・ブラウザーを開き、既存のログファイルを選択したり、[ファイル名] フィールドに名前を入力して新しいログファイルを作成したりすることができます。また、このファイル・システム・ブラウザーでは、新しいログファイルを格納するフォルダーを選択することもできます。

4.4.4  [詳細設定] ダイアログを閉じる方法

ダイアログの右下にある [戻る (R)] ボタンを押すと、ダイアログを閉じて、コントロール・パネル・アプリケーションに戻ることができます。

4.5  [カード情報] ダイアログ

[カード情報] ダイアログは [詳細 (A)] メニューからアクセスできます。に [カード情報] ダイアログの例が示されています。15

15:[カード情報] ダイアログ

この例では 2 枚のカードがある [カード情報] ダイアログを表示しています。このダイアログはシステムにインストールされた各カードについて以下の情報を表示します。

·    [デバイスシリーズ] – インテル® Xeon Phi™ コプロセッサー x100 ファミリー

·    [ステッピング] – カードの「ステッピング」値

·    [サブステッピング] – カードの「サブステッピング」値

·    [uOS] – カード搭載のコプロセッサー OS バージョン

·    [Flash] – Flash バージョン情報

·    [ホストドライバー] – ホストドライバー名とバージョン情報

[カード情報] ダイアログは [設定] ダイアログと同様にモードレスです。つまり、ダイアログが開かれていてもメイン・アプリケーション・ウィンドウの操作はブロックされないため、このダイアログを表示させたまま、コントロール・パネルを操作することができます。ダイアログの右下の [戻る (R)] ボタンをクリックするといつでもダイアログを閉じることができます。または、コントロール・パネル・アプリケーションを閉じると自動的にダイアログが閉じます。

 

[カード情報] ダイアログのテキストフィールドは個々に選択することができます。そしてテキストはご利用のシステムの標準のコピー・アンド・ペースト・ショートカット (通常 Ctrl キーを押しながら C キーを押す、そして Ctrl キーを押しながら V キーを押す) を使用して、他のウィンドウにコピー・アンド・ペーストすることができます。またダイアログの複数のフィールドを選択することもできますが、コピー・アンド・ペーストはグループで最後に選択したテキストフィールドにしか適用されません。

4.6  [エラー・ログ・アラート] ボタン

[エラー・ログ・アラート] ボタンはアプリケーションに「重大」または「致命的」なエラーが発生したことを示し、それに関連したエラーメッセージが [エラー・ログ・アナライザー] ダイアログに表示されます。(詳細はセクション 4.3 を参照してください。)[エラー・ログ・アラート] ボタンはデフォルトでは表示されませんが、エラーが発生し、[エラー・ログ・アナライザー] の内容が更新されてエラーメッセージが表示されると、[エラー・ログ・アラート] ボタンがアプリケーションのメニューバーに表示されます。このボタンは、ユーザーがボタンをクリックして [エラー・ログ・アナライザー] ダイアログを開くまで赤色で点滅し続けます。[エラー・ログ・アナライザー] ダイアログがすでに開かれ、表示されている場合は、このようなボタンの変化は発生しません。

[エラー・ログ・アナライザー] ダイアログを表示すると、[エラー・ログ・アラート] ボタンがメニューバーから削除され、適切な重大度の新しいエラーが発生するまで非表示になります。また [詳細-エラーログ] メニューを選択して [エラー・ログ・アナライザー] ダイアログを表示し、表示されている [エラー・ログ・アラート] ボタンを削除することもできます。16 は、赤色で強調された [エラー・ログ・アラート] ボタンを示しています。

16:[エラー・ログ・アラート] ボタン

4.7  [接続が切断されたカードアラート] ボタン

[接続が切断されたカードアラート] ボタンは、コントロール・パネルがシステムの 1 つまたは複数のインテル® Xeon Phi™ コプロセッサーとの接続を失った場合に使用されます。[接続が切断されたカードアラート] ボタンはデフォルトでは非表示ですが、カードの接続が切断されていることが検出されるとアプリケーションのメニューバーに表示されます。このボタンは、ユーザーがボタンをクリックして [詳細設定] ダイアログを開くまで赤色に点滅し続けます。[詳細設定] ダイアログがすでに開かれ、表示されている場合は、このようなボタンの変化は発生しません。

また[詳細設定] メニューを選択して [詳細設定] ダイアログを表示し、表示されている [接続が切断されたカードアラート] ボタンを削除することもできます。17 は、赤色で強調された [接続が切断されたカードアラート] ボタンを示しています。

17:[接続が切断されたカードアラート] ボタン

根本的な接続問題が解決されると (例:カードが再起動されるなど)、切断されたカードの接続を回復するボタンが [詳細設定] ダイアログに表示されます。[詳細設定] ダイアログと切断された接続の回復の詳細については、セクション 4.4 を参照してください。

接続が切断されたノードがホストシステム/ノードで有効化され (Linux プラットフォームでは sysfs、Windows プラットフォームでは WMI を使用)、「自動再起動」システム構成パラメーターが有効化された場合には、インテル® Xeon Phi™ コプロセッサーが再起動し、ユーザーによる操作を必要とせずにコントロール・パネルが自動的に再接続します。この段落に記載されている設定は、MPSS インストールのデフォルト設定です。

4.8  「デバイスが切断されました!」メッセージ

カード接続が切断されると、[接続が切断されたカードアラート] ボタンが表示されるだけでなく、さらにコントロール・パネルはカードの接続が切断されたことを示すメッセージを表示し、それぞれのカードビューを強調します。「デバイスが切断されました!」というメッセージが、対応するカードビューの上部中央に表示されます。18 は「デバイスが切断されました!」メッセージが表示されているカードビューの例を示しています。5.2 セクションに、カードビューの詳細が記載されています。接続が切断されたカードの接続を回復する詳細については、 セクション 4.4 を参照してください。

18:接続が切断されたカードのメッセージ

4.9  サマリーフィールド

サマリーフィールドはアプリケーションのメニューバーの右側にある情報フィールドで、システムのインテル® Xeon Phi™ コプロセッサーについてのサマリ-情報を掲載しています。

·    [カード] – このフィールドはシステムにインストールされているインテル® Xeon Phi™ コプロセッサーの数を表示します。

·    [メモリー] – このフィールドはシステムのすべてのカードの最大使用可能メモリーを表示します。

·    [コア数] – このフィールドはシステムにインストールされているインテル® Xeon Phi™ コプロセッサー全体で使用可能なプロセッサー・コアの数を表示します。

19 は赤い四角で強調したアプリケーション・ウィンドウのサマリーエリアを示しています。

 

19:サマリーフィールド

5.  コントロール・パネルのビュー

コントロール・パネル・アプリケーション・ウィンドウの中では、システムの 2 つのプライマリー・ビューが使用可能です。それぞれの詳細についてはこのセクションの後で説明します。2 つのプライマリ-・ビューは次のとおりです。

1.  平均使用率ビュー – これはシステム全体を一目で眺めることができるシングルビューです。

2.  カードビュー – システムの中にある各インテル® Xeon Phi™ コプロセッサーに対して 3 つのカードビューがあります。

a.  カードの使用率ビュー – カードの現在のコアの使用率、温度、メモリー使用率、電力使用量を表示します。これは、カードビューが最初に開かれたときのデフォルトの表示です。

b.  コア・ヒストグラム・ビュー – カードの各コアの個別の使用率を表示するヒストグラム・チャートを含みます。

c.  使用率履歴ビュー – カードのコアの使用率、温度、メモリー使用率、電力使用量の履歴を表示します。

5.1  平均使用率ビュー

下の図 20 にあるように、平均使用率ビューはコントロール・パネル・アプリケーションの起動時に表示されるデフォルトの表示で、インテル® Xeon Phi™ コプロセッサーの全体的なシステムの状態をグラフィカルに表示したプライマリー・コントロール・パネル・ビューです。4 つの GUI コンポーネントによりモニターされるパフォーマンス・パラメーターは次の通りです。モニターされるパラメーターを含む各コンポーネントについては、次のセクションで説明します。

1.  コアの平均使用率

2.  平均温度

3.  メモリー使用量合計

4.  電力使用量合計

20:平均使用率ビュー

5.1.1  コアの平均使用率

[コアの平均使用率] フィールドは、下の 21赤い四角に囲まれて表示されています。

コアの平均使用率グラフはシステム/ノードにおけるすべてのオペレーション上でアクティブなコアの平均使用率を表示します。パーセントの使用率で測定された、表示されている計算されたアクティビティーは、システムのそれぞれのインテル® Xeon Phi™ コプロセッサーの各コアの現在の使用率を平均して算定されたものです。青色ユーザーの CPU 使用率を、赤色システムの CPU 使用率を示します。

グラフの左の 2 つのボタンは、「System [%]」と「User [%]」のラベルが付けられており、それぞれの表示と一致するように色分けされています。どちらかのボタンをクリックすると、ボタンの選択を解除し、関連したグラフ追跡を終了します。

コアの平均使用率の有効範囲は 0% から 100% です。現在の CPU 活動はグラフの最も右側に表示され、履歴の値は左に、所定の時間に対して最高 1 分間 (60 秒) 表示されます。

 

21:コアの平均使用率

 

5.1.2  コアの平均温度

[コアの平均温度] フィールドは、下の 22 で赤い四角に囲まれて表示されています。[コアの平均温度] フィールドは、システム/ノード内のすべてのインテル® Xeon Phi™ コプロセッサーのコア/シリコンの平均温度 (摂氏) を表示します。デジタル LED スタイル・ウィジェットは現在の平均値を簡単に明確に表しています。コアの平均温度の有効範囲は 0℃ から 150℃ です。

 -

22:コアの平均温度

5.1.3  メモリー使用量合計

[メモリー使用量合計] フィールドは、下の 23 で赤い四角に囲まれて表示されています。図では、現在のメモリー使用量合計は 1.228 ギガバイトで、数値と棒グラフ形式の両方で表示されています。表示されている値はシステム/ノードのすべてのインテル® Xeon Phi™ コプロセッサーにより報告されるメモリー使用量の合計を常に算出したものです。メモリー使用量合計の有効範囲は 0 からシステムのインテル® Xeon Phi™ コプロセッサーにインストールされた物理的メモリーの累積量になります。

23:メモリー使用量合計

                                       

5.1.4  電力使用量合計

[電力使用量合計] フィールドは、下の 24 で赤い四角に囲まれて表示されています。この図では、このプログレスバー・スタイル GUI コンポーネントにおける電力使用量合計の現在値は 670 ワットです。表示されている値はシステム/ノードのすべてのインテル® Xeon Phi™ コプロセッサーにより報告されるメモリ-使用量の合計を常に算出したものです。電力使用量合計の有効範囲は 0 からシステムのすべてのインテル® Xeon Phi™ コプロセッサーで使用可能な最大電力使用量の数学的な合計です。

 

24:電力使用量合計

5.2  カードビュー

上記の通り、平均使用率ビューで、インテル® Xeon Phi™ コプロセッサー・プラットフォームの状態の概要を表示します。各インテル® Xeon Phi™ コプロセッサーに対するパフォーマンスとステータス・インジケーターはコントロール・パネルのカードビューによりモニターおよび表示されます。カードビューはシステムのカードごとに個別に選択することができます。このセクションで説明するカードビューは次の通りです。

1.  使用率ビュー

2.  コア・ヒストグラム・ビュー

3.  使用率履歴ビュー

25 (下図) は 2 つのインテル® Xeon Phi™ コプロセッサーのためのコントロール・パネルを表示しており、両方のカードビューは上記のセクション 4.1 に記載されたように、アプリケーションの [カード (C)] プルダウンメニューを使用して見ることができます。デフォルトとして、各カードの使用率ビューが表示されています。

25:インテル® Xeon Phi™ コプロセッサー・カード・ビュー

 

26(下図) は、カードビューのタイトルを赤い四角で囲んで強調しています。タイトルが表示されているカードナンバーとカード・ビュー・タイプ (使用率、コア・ヒストグラム、または例で示されている使用率履歴) の両方を示しています。

27カードビュー間をナビゲーションするために使用されるカードビューのナビゲーション・ボタンを示したものです。

表示セレクション・ボタンで、現在の表示から、他に使用可能な 2 つの表示の 1 つに切り替えることができます。例えば現在の表示が使用率ビューであれば、使用可能なボタンにより、コア・ヒストグラム・ビューまたは使用率履歴ビューのどちらかに切り替えることができます。

 

26:カードビューのタイトル

27:カードビューのナビゲーション・ボタン

5.2.1  カードの使用率ビュー

カードの使用率ビューは、左上の「カード n:使用率ビュー」というタイトルによって識別されます。上記のセクション 5.1 で記載された 平均使用率ビューのデザインと機能がほとんど同じです。デザインに関する微妙な違いは、データ表示フィールドに関連したラベルにあり、機能的にも違いがあります。

カードの使用率ビューは、1 つのインテル® Xeon Phi™ コプロセッサーにより報告されたコアの使用率、プロセッサー・コアの温度、メモリー使用率、電力使用量を示しています。28 はカードの使用率ビューの例です。

28:カードの使用率ビュー

5.2.1.1  コアの使用率

上記のセクション 5.1 で説明された平均使用率ビューと同じように、カードの使用率ビューの最初のフィールドはコアの使用率で、下の 29赤い四角で囲まれているものです。

コアの使用率グラフは 1 つのインテル® Xeon Phi™ コプロセッサーに対するすべてのオペレーション上アクティブなコアの使用率と使用率パーセントで計測される計算アクティビティーを表示しています。青色ユーザーの CPU 使用率を、赤色システムの CPU 使用率を示します。

上記のセクション 5.1 で説明された平均使用率ビューと同じように、「システム [%]」と「ユーザー [%]」としてラベルが付けられたグラフの左の 2 つのボタンは、それぞれの表示と一致するように色分けされています。どちらかのボタンをクリックすると、ボタンの選択を解除し、関連したグラフ追跡を終了します。

コアの使用率の有効範囲は 0% から 100% で、現在の CPU 活動はグラフの最も右側に表示され、履歴の値は左に、所定の時間に対して最高 1 分間 (60 秒) 表示されます。

29:コアの使用率フィールド

5.2.1.2  プロセッサー・コアの温度

上記のセクション 5.1 で説明された平均使用率ビューと同じように、カードの使用率ビューの第 2 のフィールドはプロセッサー・コアの温度で、下の 30 で赤い四角で囲まれているものです。プロセッサー・コアの温度フィールドは、表示されている 1 つのインテル® Xeon Phi™ コプロセッサーの平均コアの平均温度 (摂氏) を表示します。 デジタル LED スタイル・ウィジェットは現在の平均値を簡単に明確に表しています。 プロセッサー・コアの温度の有効範囲は 0℃ から 150℃ です。

30:プロセッサー・コアの温度

 

さらにインテル® Xeon Phi™ コプロセッサー・デバイスが限界温度に近づく、または超えると、特別のイベントが起動されます。 関連した限界値と表示されるビジュアル・アラート・インジケーターについては次のセクションで説明します。

5.2.1.2.1  プロセッサー・コアの限界温度アラート・インジケーター

下の  31 で示すように、カードの使用率ビューは温度値の色を変化することで、限界温度アラートを表示します。 この例では、警告アラート・インジケーター (テキストの色が黄色) が表示されています。

3 つのレベルのプロセッサー・コアの限界温度アラート・インジケーターが現在サポートされています。

1.  警告:  黄色い表示

2.  注:    オレンジ色の表示

3.  重大:  赤い表示

インテル® Xeon Phi™ コプロセッサーには 3 つの限界温度値とアクティブ温度管理があります。 インテル® Xeon Phi™ コプロセッサーが最終限界値を超えた場合、デバイスがサーマル・シャットダウンに近づいていると表示されます。 インテル® Xeon Phi™ コプロセッサーの限界温度は次の通りです。

1.  プロセッサー・コア下限温度

a.  限界温度警告 (黄色) アラートを起動

2.  プロセッサー・コア上限温度

a.  限界温度注意 (オレンジ) アラートを起動

3.  最終限界値:

a.  電力限界重大 (赤) アラート・インジケーターを起動し、デバイスがプロセッサー・コア・サーマル・シャットダウンに近づいていて、しきい値を超えデバイス・シャットダウンになる恐れがあることを表示します。

b.  電力使用量がシャットダウン限界値の 10% 以内になると、ただちにシャットダウンする恐れがあることを通知するために重大アラート・インジケーターが表示されます。

31:プロセッサー・コア限界温度インジケーター

5.2.1.3  メモリー使用率

上記のセクション 5.1 で説明された平均使用率ビューと同じように、カードの使用率ビューの第 3 のフィールドはメモリー使用率で、下の 32 で赤い四角で囲み表示されているものです。

この図では、このプログレスバー・スタイル UI コンポーネントにおけるメモリー使用率の現在値は 209.6 MB です。 [メモリー使用率] フィールドは表示されている 1 つのインテル® Xeon Phi™ コプロセッサーにより報告されている現在のメモリー使用率をメガバイト (MB) でダイナミック表示します。

これが平均使用率ビューとは唯一計測単位が異なるケースであることに注意してください。平均使用率ビューでは、ギガバイト (GB) 表示ですが、カードの使用率ビューではメガバイト (MB) 表示です。

メモリー使用率ウィジェットの有効範囲は 0 から表示されているインテル® Xeon Phi™ コプロセッサーにインストールされた物理的メモリーの量になります。

32:メモリー使用率

5.2.1.4  電力使用量

上記のセクション5.1 で説明された 平均使用率ビューと同じように、カードの使用率ビューの第 4 のフィールドは電力使用量で、下の 33 で赤い四角で囲み表示されているものです。

この図では、このプログレスバー・スタイル GUI コンポーネントにおける現在の電力使用量は 105 ワットです。 [メモリー使用率] フィールドは表示されている 1 つのインテル® Xeon Phi™ コプロセッサーにより報告されている現在のメモリー使用率をメガバイト (MB) でダイナミック表示します。

[電力使用量] フィールドの有効範囲は 0 ワットから 350 ワットです。

さらにインテル® Xeon Phi™ コプロセッサー・デバイスが限界温度に近づく、または超えると、特定のイベントが開始され、コントロール・パネルのビジュアル・アラート・インジケーターにも変化が生じます。 関連した限界値と表示されるビジュアル・アラート・インジケーターについては次のセクションで説明します。

33:電力使用量

5.2.1.4.1  限界電力使用量アラート・インジケーター

下の 34 で示すように、カードの使用率ビュー電力使用量棒グラフに適切なアラート表示色を重ねることで、限界電力使用量アラートを表示します。 この例では、警告アラート・インジケーター (黄色) が表示されています。

3 つのレベルの電力使用量リミット・アラート・インジケーターが現在サポートされています。

4.  警告:  黄色い表示

5.  注:    オレンジ色の表示

6.  重大:  赤い表示

インテル® Xeon Phi™ コプロセッサーには 3 つの限界温度値とアクティブ温度管理があります。 それぞれの限界値を超えた場合、デバイスの電力管理イベントを起動し、カードの使用率ビューの電力使用量フィールドで、限界電力アラート・インジケーターを表示します。

4.  下限:

a.  限界電力警告 (黄色) アラート・インジケーターとファンスピード加速 (電力管理による) を開始する

5.  上限:

a.  限界電力注意 (オレンジ) アラート・インジケーターと以下を含むアクティブ電力管理を起動する

                         i.   プロセッサー・アクティビティーのスロットリング

                       ii.   最大のファン稼働

6.  シャットダウン限界:

a.  限界電力重大 (赤) アラート・インジケーターとデバイス・シャットダウンを起動する

b.  電力使用量がシャットダウン限界値の 5% 以内になると、ただちにシャットダウンする恐れがあることを通知するために重大アラート・インジケーターが表示されます。

34:限界電力使用量アラート・インジケーター

5.2.2  コア・ヒストグラム・ビュー

現在のカードの使用率ビューで [コア・ヒストグラム・ビュー] ボタンをクリックすると、第 2 のカードビューであるコア・ヒストグラム・ビューが表示されます。 コア・ヒストグラム・ビューは関連したインテル® Xeon Phi™ コプロセッサーのそれぞれのアクティブコアの現在のユーザーシステム CPU 使用率をヒストグラム表示します。

コア・ヒストグラム・ビューは下の 35 に表示されています。 このビューでは、特定のインテル® Xeon Phi™ コプロセッサーに対するコアあたりの CPU 使用率のヒストグラム・ビューが含まれます。赤、または青い棒は、選択したカードのそれぞれのアクティブコアを示しています。 他のコア使用率ビューと同様に、青はユーザーの使用率を、赤はシステムの使用率を表しています。 ユーザーシステム両方のコア使用率がある場合は、2 本の棒が重ねて表示されます (青いユーザー使用率が上)。

さらに、表示の左側の 2 つのレジェンドラベルはクリックできます。 下の例では、システムユーザーの両方が選択されており、そのため両方の値が表示されています。 この機能ではユーザーはシステム使用率だけ、ユーザーコア使用率だけ、または両方 (例を参照) を選択することができます。

35:コア・ヒストグラム・ビュー

5.2.3  使用率履歴ビュー

現在のカードの使用率ビューで [使用率履歴ビュー] ボタンをクリックすると、第 3 のカードビューである使用率履歴ビューが表示されます。 使用率履歴ビューは、関連するインテル® Xeon Phi™ コプロセッサーの使用率、温度、メモリー、電力値の履歴のグラフを示します。

使用率履歴ビューは下の 36 に表示されています。 この表示には 4 色の異なる色の線と 4 つの関連したレジェンドボタンがある 1 つのグラフを含んでいます。 各レジェンドは直感的にグラフで使用される各線のデータソースを示すラベルです。 上記のセクションで説明されたコア・ヒストグラム・ビューと同じように、各レジェンドは、関連するデータのグラフへの追加を有効化/無効化するために使用されるボタンともなっています。 例では、4 つすべてのレジェンドが選択された位置にあり、そのため 4 本すべての線を見ることができ、アクティブになっています。

使用率履歴ビューの有効範囲は次の 4 つのデータソースと一致しています。

·    [使用率] – 使用されているパーセントで計測され、0 から 100 のスケールで、グラフの左側に表示されます。

·    [温度] – 摂氏で計測され、0 から 400 のスケールでグラフの右側に表示されます。

·    [メモリー] – これも使用されているパーセントで計測され、0 から 100 のスケールで、グラフの左側に表示されます。

·    [電力] – ワットで計測され、0 ワットから 400 ワットのスケールで、グラフの右側に表示されます。

すべてのデータソースは継続的に報告を受け、最新のアクティビティーはグラフの右端に、履歴は左側に表示されています。表示されるアクティビティーの範囲は所定の時間の最高 1 分 (60 秒) です。

36:使用率履歴ビュー

5.2.4  混合表示

セクション 4.2.1 で説明したように、システムの 1 枚または複数のカードのカードビューを [カード (C)] プルダウンメニューを使用して表示することができます。 さらに、セクション 5.227 で示したように、カード・ビュー・ナビゲーション・ボタンを使用して、別のカード・ビュー・タイプに切り替えることができます。 これらのボタンはすべてのカードビューに設置されているため、同時にシステムの別のカードを、異なるカード・ビュー・タイプで参照することができます。

37 は、mic3 のコア・ヒストグラム・ビューと、mic5 の使用率履歴ビューが含まれるコントロール・パネル・アプリケーションの例を示しています。

37:混合カード・ビュー・タイプ

 

6.  コマンドライン・インターフェイス (CLI)

インテル® Xeon Phi™ コプロセッサー・プラットフォーム・コントロール・パネルは、コマンドライン・インターフェイス (CLI) もサポートしています。CLI はグラフィカル・ユーザー・インターフェイス (GUI) と同じ情報を提供するものですが、テキスト形式を使用するもので、そのため直接実行する場合やスクリプトに便利です。 CLI の使用情報に関しては下の 38に記載されています。ここでは ‘micsmc -h’ (ショートフォーム) と ‘micsmc --help’ (ロングフォーム) の CLI オプションを記載しています。

Text Box: Intel(R) Xeon Phi(TM) Coprocessor Platform Control Panel
VERSION: 3.3+git1+3d2261a202-0.1
Copyright 2011-2014 Intel Corporation All Rights Reserved. 
Developed by Intel Corporation. Intel, Xeon, and Intel Xeon Phi are trademarks
of Intel Corporation in the U.S and/or other countries.

This application monitors device performance, including driver info,
temperatures, core usage, etc.

The Control Panel User Guide is available in all supported languages, in PDF and HTML formats, at:

   "/usr/share/doc/micmgmt/"

USAGE:
======
   -a, --all [[device] <device_list>]
         Displays all/selected device status data. Equivalent to: -i -t -f -m
         -c.
   -c, --cores [[device] <device_list>]
         Displays the average and per core utilization levels for all/selected
         devices.
   -f, --freq [[device] <device_list>]
         Displays the clock frequency and power levels for all/selected
         devices.
   -i, --info [[device] <device_list>]
         Displays general system information for all/selected devices.
   -l, --lost
         Displays all Intel(R) Xeon Phi(TM) Coprocessors in the system and
         whether they are currently in the Lost Node condition.
   --online
         Displays all Intel(R) Xeon Phi(TM) Coprocessors in the system that are
         currently online.
   --offline
         Displays all Intel(R) Xeon Phi(TM) Coprocessors in the system that are
         currently offline, lost, or otherwise unavailable.
   -m, --mem [[device] <device_list>]
         Displays the memory utilization data for all/selected devices.
   -t, --temp [[device] <device_list>]
         Displays the temperature levels for all/selected devices.

38:コマンドライン・インターフェイス (1/3)

 

Text Box:    --ecc [status | enable | disable] [[device] <device_list>]
         Optional arguments:
            enable  - enables ECC Mode
            disable - disables ECC Mode
            status  - displays the ECC Mode
         Enables, disables or displays the ECC Mode for all/selected devices.
         NOTE: If no arguments are provided, status is displayed.
   --turbo [status | enable | disable] [[device] <device_list>]
         Optional arguments:
            enable  - enables Turbo Mode
            disable - disables Turbo Mode
            status  - displays Turbo Mode status
         Enables, disables or displays the Turbo Mode for all/selected devices.
         NOTE: If no arguments are provided, status is displayed.
   --led [status | enable | disable] [[device] <device_list>]
         Optional arguments:
            enable  - enables LED Alert
            disable - disables LED Alert
            status  - displays LED Alert status
         Enables, disables or displays the LED Alert for all/selected devices.
         NOTE: If no arguments are provided, status is displayed.
   --pthrottle [[device] <device_list>]
         Displays the Power Throttle State for all/selected devices.
   --tthrottle [[device] <device_list>]
         Displays the Thermal Throttle State for all/selected devices.
   --pwrenable [cpufreq | corec6 | pc3 | pc6 | all] [[device] <device_list>]
         Optional arguments:
            cpufreq - enables the cpufreq power management feature
            corec6  - enables the corec6 power management feature
            pc3     - enables the pc3 power management feature
            pc6     - enables the pc6 power management feature
            all     - enables all four power management features
         Enables/disables the Power Management Features for all/selected
         devices.
         NOTE: Each feature not specified will automatically be disabled. If no
         features are specified, then all Power Management Features are
         disabled.
   --pwrstatus [[device] <device_list>]
         Displays the Power Management Feature status for all/selected devices.
   --timeout <value>
         Required argument:
            value - integer timeout value in seconds.
         Sets the sub-process timeout value for the current invocation. Affects
         only command option(s) requiring sub-process execution.
   --verbose
         Request verbose output.
         NOTE: At the moment this only applies to the --ecc option.
   -h, --help [<options_list>]
         Displays full/selected usage information and then exits.
   -v, --version
         Displays the tool version and then exits.

39:コマンドライン・インターフェイス (2/3)

 

Text Box: =======================================
Common Argument: [[device] device_list]
   Specifies the device name arguments for a given command option. The
   'device_list' specifies one or more 'micN' values where 'N' is the device
   number: 'mic2 mic5 ...' When no device names are specified, the option
   operates on all devices in the system.

40:コマンドライン・インターフェイス (3/3)

7.  バグレポート送信プロセス

インテル担当者に問題を報告してください。

8.  確認されている問題点

8.1  ルート SUSE* プラットフォームとしての X11 アプリケーションの実行

ターミナルプロンプトからインテル® Xeon Phi™ コプロセッサー・プラットフォーム・コントロール・パネルを通常のユーザーまたはルートユーザーとして実行する場合、以下のエラーメッセージが表示されます。

·    mic@linux:~> sudo /opt/intel/mic/bin/micsmc

·    micsmc: cannot connect to X server (X サーバーに接続できません)

上記に記載された問題はデフォルトの SUSE* 動作です。 根本的な問題は、XServer と X アプリケーションを実行するユーザーが異なることにあります (XServer はユーザーログイン、X アプリケーションはルートユーザーによる実行)。

2 種類のオプションがあります。

1.  この目的用に SUSE* により提供されている xdg-su ユーティリティーを使用する。

a.  :xdg-su -u root -c /opt/intel/mic/bin/micsmc

2.  最初に ‘'xhost +' をユーザーとして実行し、次に micsmc をルートユーザーとして実行する。

a.  '+' 引数がある xhost コマンドが、ユーザーとして実行している XServer に他のユーザーからの接続を承認するように命令します。

b.  これは基本的な XServer セキュリティー・プロトコルです。  これは X のセキュリティーのファーストレベルの解決方法とはみなされていません。