SUSE SLES12セキュリティ更新プログラム:slurm_20_11 / pdsh(SUSE-SU-2021:0773-1)

critical Nessus プラグイン ID 147801

Language:

概要

リモートのSUSEホストに1つ以上のセキュリティ更新がありません。

説明

pdsh用のこの更新プログラムでは、以下の問題が修正されています:

Slurm 20.11用のpdshを準備します(jsc#ECO-2412)

複雑な状態を簡素化します。

slurm用のこの更新では、以下の問題が修正されています:

unpackmem()の使用による潜在的なバッファオーバーフローを修正します。CVE-2020-27745(bsc#1178890)

xauthコマンドに対する引数として送信された場合の、マジッククッキーの潜在的な漏洩を修正します。CVE-2020-27746(bsc#1178891)

Leap/SLE 15.0/1 に対してもopenPMIxのサポートを追加します(bsc#1173805)。

CVE-2020-12693を修正する20.02.3に更新されました(bsc#1172004)。

slurmプラグインがlibpmixだけでなくpmixも必要とするようになりました(bsc#1164326)

SLE-11-SP4ビルドで機能しない自動パッチを削除しました。

%armビルドがサポートされなくなったため、これを無効にします。

develパッケージに関する依存関係がなくなるように、pmixはlibpmix.so.2も検索するようになりました(bsc#1164386)

バージョン20.02.0に更新します(jsc#SLE-8491)

- reconfigのslurmdにおけるマイナーなメモリリークを修正します。

- データベース内のデータをロールアップする際の無効なptrリファレンスを修正します。

- RHEL8サポートのためにpython3を必要とするようにshtml2html.pyを変更し、man2html.pyと一致させます。

- slurm.spec - 「hardening」リンカーフラグをオーバーライドして、RHEL8が適した方法で構築されるようにします。

- perl APIでの型の不一致を修正します。

- 初期化されていないslurmctld_diag_statsの使用を防止します。

- さまざまなCoverityの問題を修正します。

- デーモンにおけるルートレスのトポロジーについての警告のみを表示します。

- IGNORE_JOVS予約のジョブのアカウンティングを修正します。

- 19.05からアップグレードする際にバッチステップの状態が正しくロードされない問題を修正します。

- SchedulerParametersのmax_depend_depthを廃止し、DependencyParametersに移動します。

- フェデレーション状態をロードする際のslurmctldアップグレードに関する誤ったエラーを抑制します。

- slurmctldハングの原因となる、tresリクエストごとに不適切なタスクを処理するcons_tresの無限ループを強制終了します。

- 適切な数のGPUがジョブに割り当てられるように、--gpus-per-taskの処理を改善します。

- --spread-jobをリクエストする際のcons_resのセグメンテーション違反を修正します。

SLE-11-SP4以外のすべてについてpython3に移動します

- SLE-11-SP4については、python3スクリプト(python2.7準拠)を処理するための回避策を追加します。

- sbatch - バーストバッファファイルの末尾に改行がない場合のセグメンテーション違反を修正します。

- -tオプションの照合時にジョブのベース状態のみをチェックするようにscancelを変更します。

- 状態ファイルのジョブ依存関係リストを保存します。

- cons_tres - root-lessトポロジーのシステムでジョブを実行できるようにします。

- 20.02pre1より前のPrologSlurmctld同期化の動作を復元して、さまざまな競合状態を回避し、適切なバッチジョブ起動を保証します。

- Slurm REST APIを実装する新しいslurmrestdコマンド/デーモンを追加します。

標準のslurm.confがすべてのビルドターゲットでSlurmctldHostも使用するようになりました(bsc#1162377)

mariadbの後にslurmdbdを開始します(bsc#1161716)

バージョン19.05.5に更新します(jsc#SLE-8491)

- セキュリティ修正が含まれています CVE-2019-19727、CVE-2019-19728、CVE-2019-12838。

- i586ビルドがサポートされなくなったため、これを無効にします。

- slurmstepdを通じたユーザーおよびグループの解決をサポートするためのlibnss_slurmパッケージを作成します。

CVE-2019-19728を修正するためにv18.08.9に更新します(bsc#1159692)。

- sys/sysctl.hが廃止予定になった後、LinuxでSlurmをコンパイルします。

- slurmdbd.conf.exampleを0600パーミッションでインストールし、安全な使用を促します。CVE-2019-19727。

- srun - --uidが失敗した場合にジョブ起動を続行しません。
CVE-2019-19728。

pmixサポートが追加されました jsc#SLE-10800

libslurmを使用してslurmバイナリを構築するために--with-shared-libslurmを使用します。

libslurmをslurm-configに依存させます。

新しいインストールとアップグレード上の/var/spool/slurmの所有権を修正します(bsc#1158696)。

slurmdbd.confの権限を修正します(bsc#1155784、CVE-2019-19727)。

追加された改行に対処するために、%posttransマクロ_res_updateを修正します(bsc#1153259)。

出荷されたバージョンのドキュメントを提供するためにWebサーバーを設定するパッケージslurm-webdocを追加します。

srunを「slurm」から「slurm-node」に移動します:sbatchが機能するためには、srunもノード上に必要です。「slurm-node」は、「slurm」がインストールされている場合の要件です(bsc#1153095)。

修正のために18.08.8に更新されました(CVE-2019-12838、bsc#1140709、jsc#SLE-7341、jsc#SLE-7342)

- 他のxauthコマンドと同じ10000msタイムアウトを使用するように「xauth list」を更新します。

- 0のgres cntを処理するgresコードの問題を修正します。

- バックフィルが実行中の場合にジョブをパージしません。

- 検証ジョブが追加を保留中または発生時間を削除中です。

- ジョブがデータベースに到達する前に削除された関連付けがジョブにない場合は、中止しません。

- select_nodes()がQOSまたはアカウントのジョブで失敗した場合にstate_reasonを設定します。

- valid_qosビットマップなしの参照関連付けでのseg_faultを回避します。

- 保留中のジョブで関連付け/QOSが削除された場合に、そのジョブを不適格として設定します。

- ジョブのアカウント/QOSを変更するときは常に古い制限を削除するようにします。

- QOSまたはアカウントが変更されるまで、FAIL_QOSまたはFAIL_ACCOUNTのジョブの理由をリセットしません。

- 「sreport -T ALL」機能を復元します。

- apiを介して送信される信号を正しく型変換します。

- Slurm全体で構造体を適切に初期化します。

- ジョブおよびステップの「numtask」squeueフォーマットオプションを「numtasks」に同期させます。

- ジョブ開始前のCAを回避するためにsacct -PDを修正します。

- バックアップslurmctldでの潜在的なデッドロックを修正します。

- 依存関係が満たされた後にsacctにジョブが表示されない問題を修正しました。

- -sではなく-jで確認する場合に非対象ジョブが表示される問題を修正します。

- 先頭ジョブでない場合に配列のタスクをスケジュールするバックフィルスケジューラの問題を修正します。

- accounting_storage/mysql - アーカイブロードロジックのSIGABRTを修正します。

- accounting_storage/mysql - アーカイブロードロジックのメモリリークを修正します。

- アーカイブされたデータをロードする際に、単一のSQLステートメントごとにレコードを制限します。

- ジョブ送信プラグインの不必要なリロードを修正します。

- 再構成でジョブ送信プラグインのオン/オフを切り替えられるようにします。

- Luaジョブ送信プラグインを複数回ロード/アンロードする際のセグメンテーション違反を修正します。

- ジョブ送信プラグインによって拒否されたジョブの重複エラーメッセージの出力を修正します。

- パックIDのないhetジョブのジョブ送信プラグインメッセージの出力を修正します。

- group_cache.cのメモリリークを修正します

-フェデレーションで再キューイングする際のFedJobLockからのジョブのスタックを修正します

- 異なる関連付けのあるクラスターのフェデレーションでのジョブの再キューイングを修正します

- sacctmgr - 「sacctmgr show runaway」で終了する前にメモリを解放します。

- steps tresメモリ使用率が0の場合にseffがメモリオーバーフローを示す問題を修正します。

- アーカイブファイル名の競合が発生した際に、古いアーカイブファイルに上書きせずに新しいアーカイブファイルを作成して、記録の消失を防ぎます。

- 大規模なデータベースのアーカイブが成功するように、アーカイブファイルをファイルごとに50000レコードに制限します。

- SPANKプラグインのエラーメッセージにある不要な改行を削除します。

- アーカイブロードイベントを修正します。

- select/cons_resにおいて:--overcommitおよび--nodelistオプションのノードごとに1つのCPUのみを割り当てます。

- メインスケジューラがキュー全体を通過しない可能性がある問題を修正します。

- cons_res/job_test - ジョブがノードメモリを過剰に割り当てないようにします。

- cons_res/job_test - ジョブのメモリリクエストをテストする際にノードに現在割り当てられているメモリを考慮するように修正します。

- クラウドノード上のマルチノードジョブステップが、(ステップの終了ではなく)ジョブの終了までクリーンアップを完了しない問題を修正します。

- 18.08デーモンへの17.11 sbcast呼び出しの問題を修正します。

- Job_DEPENDENTの新しいジョブbit_flagsを追加します。

- 依存関係のあるジョブがAccrueTimeをリセットし、AccrueTimeの制限に対してカウントされないようにします。

- 予約およびtresに対するsacctmgr --parsable2の出力を修正します。

- job_start_data()がジョブの完了を呼び出した後のslurmctldによる潜在的なセグメンテーション違反を防止します。

- 「scontrol reboot asap」でジョブがノードに到着する問題を修正します。

- ノードの再起動イベントをデータベースに記録します。

- イベントテーブルに送られるノード再起動失敗メッセージを修正します。

- イベント理由が存在しない場合に、イベントテーブルに「(null)」を書き込みません。

- ランナウェイジョブを消去する際のマイナーなメモリリークを修正します。

- プロローグ完了RPCエラーが発生する際のslurmctldフラッディングおよびロギングを回避します。

- GCC 9コンパイラ警告を修正します。

- seffの、メガバイト未満の値に対する人が読み取れるメモリ文字列を修正します。

- 拒否された異種ジョブのダンプ/ロードを修正します。

- 異種ジョブの場合に、各コンポーネントをQOSまたは関連付けジョブの制限に対して複数回カウントしません。

- slurmdbd - より新しいフラグを使用することで予約フラグの列の破損を回避し、代わりにsmallintフィールドに収まる古いフラグフィールドを保存して残りを破棄します。

- slurmdbd内の文字列を常にエスケープすることで、アーカイブファイルロード時のaccounting_storage/mysqlプラグインのセキュリティ問題を修正します。CVE-2019-12838。

- 衰退スレッドを終了させるアンダーフローを修正します。

- ジョブキューを構築する際にメインスケジューラがhetjobを考慮しない問題を修正します。

- 開始時刻なしで古いジョブを表示するためのsacctの回帰を修正します。

- gresトポロジービットの正しい数の設定を修正します。

- 必要に応じて、hetjobの保留状態の理由を更新します。

- accounting_storage/filetxtのTRESの認識を修正します。

- 制限を強制しない場合の発生時間を設定します。

- test_execまたはbcastオプションでhetjobをリクエストする際のsrunのセグメンテーション違反を修正します。

- 優先度デバッグフラグの背後にあるマルチパートの優先度ログメッセージを非表示にします。

- sched/backfill - hetjobをbf_max_job_startに対応させます。

- ジョブのパーティションポインターNULLデリファレンスによるslurmctldのセグメンテーション違反を修正します。

- OR設定されたジョブの依存関係の問題を修正します。

- 新しいジョブのINVALID_DEPENDのbit_flagsを追加し、無効でパージされた依存関係が1つ以上ある場合に、ジョブの依存関係文字列が再構築されるのを防ぎます。

- フェデレーションの非同期の同種のログメッセージをデバッグから情報に昇格します。

- burst_buffer/cray - 不正な読み取り/書き込みによるslurmctld SIGABRTを修正します。

- burst_buffer/cray - ジョブスクリプトのコンテンツを解放していないことによるメモリリークを修正します。

- node_features/knl_cray - script_argvのUse-After-Freeを修正します。

- burst_buffer/cray - script_argvのUse-After-Freeを修正します。

- 非NULL終端文字列読み取りによる、サイズ1の無効な読み取りを修正します。

- BadConstraints理由が設定された理由を特定するためのdebug2ログをさらに追加します。

利用できない場合はhdf5サポートをビルドしません。

SLEでのバージョン更新のサポートを追加します:SLEで元々サポートされていたバージョンより新しいバージョンにパッケージを更新すると、パッケージ名にバージョン文字列が付きます。

hdf5ジョブデータ収集プラグインが追加されました

SLE-11 SP4との後方互換性を追加します

バージョン 18.08.05 に更新してください:

- 32ビットシステムにおけるxmallocの潜在的なヒープオーバーフローの緩和策を追加します。(CVE-2019-6438、bsc#1123304)

CVE-2019-6438の750cc23edからのフォールアウトを修正します。

18.08.04への更新(次のハイライトを含む)

- ジョブがプリエンプトされている場合にtime limitの代わりにpreemptedが表示されるように、ユーザーに送信されるメッセージを修正します。

- ノードgres構成の処理で障害が発生したときのメモリリークを修正します。

- ノードgres構成の処理で失敗が発生したときのエラーメッセージを改善します。

- scontrol保留のジョブをスキップしません。

- --cpu-bind=verboseをSLURM_HINT環境変数で使用できるようにします。

- ランナウェイジョブの処理を強化します

- cons_res:cores/cpusが計算され、配布されるまで、cr_job_testの終了を遅延させます。

- 「none」に設定され、SLURM_TEST_EXECが使用されている場合、srun --prologまたは--epilog実行可能ファイルの存在をチェックしません。

- ジョブおよびステップのtres仕様に「P」サフィックスのサポートを追加します。

- 1つのノードで複数のタスクが開始されたときにjobacct_gather/cgroupが正しく動作するように修正します。

- salloc - 対応するコマンドラインオプションが使用される場合に、環境内でSLURM_NTASKS_PER_COREとSLURM_NTASKS_PER_SOCKETを設定します。

- slurmd - 代替の構成ファイルの場所を指定するための-fフラグの処理を修正します。

- bf_ignore_newly_avail_nodesのSchedulerParametersオプションを追加して、bf_continueが有効な場合にバックフィルスケジューリングサイクル中に利用可能になる優先度の低いジョブのスケジューリングを回避します。

- job_submit/lua:いくつかのslurmctldリターンコードを追加し、ユーザー/グループ情報を追加します

- salloc/sbatch/srun - 相互排他オプション

(--memと--mem-per-cpuの両方)が設定されている場合に警告を出力します。

有効な場合にのみ更新時にサービスを再起動します

ログのローテーションを追加しました

pamモジュールpam_slurm_adoptを強化するバックポートされたパッチを追加しました。
(BOO#1116758)

config manページを別のパッケージに移動しました:これで、これらは計算ノードにインストールされなくなります。

perlバインディングの正しいリンクフラグを追加しました(bsc#1108671)

- perl:slurmトルクラッパーにスイッチが必要です

slurm-configとslurm-nodeのRequires(pre)とRequires(post)を修正します。
これは、最初のシステムインストール時にインストールされるときの、slurmユーザー作成の失敗に関する問題を修正します。(bsc#1109373)

リモート共有のStateSaveLocationを使用する場合、リモートのファイルシステムが利用可能になった後にslurmctldを起動する必要があります。slurmctld.serviceの「After =」ディレクティブに「remote-fs.target」を追加します(bsc#1103561)。

17.11.8への更新

- 不完全なRESPONSE_[RESOURCE|JOB_PACK]_ALLOCATIONビルドパスを修正します。

- ノードがResumeTimeoutで応答しないことが原因で、マークダウンされたノードを割り当てません。

- task/cray plugin - ファイル「cpuset.mems」で「mems」cgroup情報を検索してからファイル「mems」にフォールバックします。

- ipmiプロファイルデバッグの初期化されない変数の問題を修正します。

- PMIx:ダイレクト接続のインラインメッセージ送信を修正しました。

- MYSQL:アーカイブダンプをロードする際に一部のフィールドが処理されない問題を修正します。

- job_submit_plugin_modify()中に、job_submitプラグインがadmin_commentフィールドを変更できるようにします。

- job_submit/lua - 予約テーブルへのアクセスを修正します。

- MySQL - 読み取りをロックするアーカイブロジックによって引き起こされるデッドロックを防止します。

- 特定のジョブをリクエストする際に、MaxQueryTimeRangeを強制しません。

- 複数のパーティションに送信されたジョブを適切にサポートするように--test-onlyロジックを変更します。

- 存在しないqosをdef_qos_idとして設定しようとしたときにslurmctldが中断しないようにします。

- 新しいジョブ依存関係タイプ「afterburstbuffer」を追加します。保留中のジョブは、最初のジョブの実行が完了し、そのバーストバッファのステージアウトが完了するまで遅延されます。

- slurmstepd内のproctrack/taskプラグインロードをslurmdのそれと一致するように並べ替え、proctrackが導入される前にタスクを呼び出す競合状態を回避します。

- 非アクティブな機能をリクエストする際にビジーなKNLノードを再起動しないようにします。

- 17.11.7で導入されたCPU/ノードごとのメモリリクエスト時の動作を以前のものに戻します。

- 複数パーティションのリクエストでジョブメモリを検証するときに、以前に調整されたジョブメンバーを元の値に再初期化するように修正します。

- _step_signal()が常にSLURM_SUCCESSを返すのを修正します。

- パフォーマンスの理由から、アクティブで利用可能なノードの機能変更ログをノードごとに1行ではなく1行にまとめます。

- たまにフリーザーcgroupが漏洩することを防ぎます。

- mpi/pmi2プラグインを閉じる際の潜在的なセグメンテーション違反を修正します。

- プリエンプションで、またはジョブがホストの特定のリストをリクエストするときに正しく動作するように、--exclusive=[user|mcs]に関する問題を修正します。

- hdf5 1.10.2以上でコードをコンパイルします

- mpi/pmix:一括キャンセルが修正されました。

- SlurmDBD:アーカイブのロードエラーにおけるエラーメッセージ処理を改善します。

- 予約削除時の不適切なロックを修正します。

- 省電力モジュールを設定する際の不適切なロックを修正します。

- 配列ジョブを表示する際のsqueueに対するフォーマット出力長の設定を修正します。

- xstrstr関数を追加します。

- sbatch、sallocの次での--hintオプションからの出力を修正します
--help。

- 次でのゼロ除算の可能性を防ぎます
_validate_time_limit()。

- Delegate=yesをslurmd.serviceファイルに追加し、systemdがジョブのcgroup階層に干渉しないようにします。

- srun内のlisten() syscallに対するバックログ引数を4096に変更し、コード内の他の場所でも一致させて、大規模な通信問題を回避します。

フェイルオーバー後にノード上の割り当てを適切にクリーンアップすることを妨げる、slurmctldバックアップコントローラーの競合を修正します(bsc#1084917)。%licenseを後方互換性のある方法で処理しました。

「Recommends: slurm-munge」をslurm-slurmdbdに追加しました。

スクリプトスニペット間のコメントを %{!?nil:...} で保護し、スクリプトとして解釈されないようにします - この場合、更新レベルが引数として渡されます(「共有ライブラリ」の章を参照してください:
https://en.opensuse.org/openSUSE:Packaging_scriptlet_snippets)(bsc#1100850)。

17.11.5から17.11.7への更新

17.11.5から17.11.7への更新を暗黙的に意味した、ユーザー名とgidフィールドの処理におけるセキュリティの問題を修正します(CVE-2018-10995とbsc#1095508)。 17.11.6のハイライト:

- CRAY - contribs/cray dirにslurmsmwdを追加します

- PMIX - 直接接続認証を追加しました。

- バックアップslurmctldが乗っ取り時にアクティブ/利用可能なノード機能のリストを失わないようにします。

- power_save状態の場合でも、クラウドノードのpower_downを強制できるようにします。

- クラウドノードが帯域外で起動されたときにSlurmで認識できるようにします。

- 多数の修正 - 「NEWS」ファイルをチェックしてください。17.11.7のハイライト:

- killできないstepdが終了するときにsrunとctldに通知します。

- 多数の修正 - 「NEWS」ファイルをチェックしてください。

- 新しく導入されたslurmsmwdデーモンのデーモン化を修正します。

Rename:

- そのファイルを導入したコミットメッセージと同期された情報を保ちます

instsysでの実行中にpretransスクリプトが実行されないようにします:まだあまりインストールされていない可能性があります。pretransコードはluaで行われる必要があり、これにより、rpm内部luaインタプリターによって実行され、このスクリプトレットの実行時に存在しない可能性のあるシェルには渡されません(bsc#1090292)。

slurm-sqlのrequiresをslurmdbdパッケージに追加します。

pamおよびpam_slurm_adoptのREADMEをまとめます。

COPYINGファイルに対して新しい%%licenseディレクティブを使用します。systemdとの相互作用を修正します:systemdは、デーモンのPIDが設定されたPIDファイルが書き込まれるまで、デーモン化プロセスが終了しないことを想定します(bsc#1084125)。

systemdサービスが再起動するのは、「update」トランザクションの途中ではなく、すべてのパッケージが一貫した状態の場合のみとなるようにします(bsc#1088693)。updateで実行する%postunスクリプトは古いパッケージのものであるため、変更できません - このため、再起動による破損を回避します。

slurmdbd.confの間違ったログファイルの場所を修正し、slurmdbdのpidの場所を修正し、dir /var/run/slurmを提供するslurm構成にslurm-slurmdbdを依存させました(bsc#1086859)。

コメントを追加しました(bsc#1085606)

- slurmdbd内の文字列を常にエスケープすることで、accounting_storage/mysqlプラグインのセキュリティ問題を修正します。CVE-2018-7033(bsc#1085240)。

v17.11.5へのslurmの更新(FATE#325451)。 17.11のハイライト :

- 一連のクラスター全体で単一のワークフローを管理するためのフェデレーションクラスターをサポートします。

- 異種ジョブの割り当てをサポートします(ジョブコンポーネント別の各種プロセッサタイプ、メモリサイズなど)。
単一のMPI_COMM_WORLD内の異種ジョブステップのサポートは、ほとんどの構成でまだサポートされていません。

- X11のサポートは、メインのSlurmコードと完全に統合されています。plugstack.confファイルで構成されているX11プラグインを削除して、競合するオプションに関するエラーがログに記録されることを回避します。

- 「flex」の新しい事前予約フラグを追加しました。これにより、予約をリクエストするジョブは、予約の開始時刻より前に開始し、予約の内外でリソースを使用することができます。一般的なユースケースでは、予約をリクエストしているジョブに予約された時間内にこれらのリソースを使用するように強制するのではなく、予約を明示的にリクエストしていないジョブがそれらの予約したリソースを使用しないようにします。

- sprioコマンドが変更され、ジョブが送信されたすべてのパーティションのジョブの優先度情報をレポートするようになりました。

- すべての計算ノードでの検索を回避するために、ジョブ送信時に実行されるID検索をグループ化します。PrologFlags=SendGIDs構成パラメーターで有効にします。

- Slurmのコマンドおよびデーモンは、静的にリンクするのではなく、libslurmfull.soに動的にリンクします。これにより、Slurmのフットプリントが大幅に削減されます。

- スイッチプラグインで、プラグインにplugin_id記号を追加し、異なるスイッチタイプのクラスター間でスイッチ情報を受け渡すために、インターフェイス呼び出しのdynamic_plugin_data_tでswitch_jobinfo_tをラップしました。

- デフォルトのProctrackTypeをcgroupに変更しました。

- デフォルトのsched_min_intervalを0から2マイクロ秒に変更しました。

- ジョブのバッチスクリプトをフェッチするための新しい「scontrol write patch_script」コマンドを追加しました。「scontrol -dd show job」コマンドの一部としてスクリプトを表示する機能が削除されました。

- 新しい「billing」TRESを追加します。これにより、ジョブのパーティションのTRESBillingWeightsによって計算されたジョブの請求可能TRESに基づいて、ジョブを制限できます。

- 「scontrol top」コマンドの通常のユーザー使用は現在無効になっています。構成パラメーター「SchedulerParameters=enable_user_top」を使用して、その機能を有効にします。構成パラメーター「SchedulerParameters=disable_user_top」は、警告なしに無視されます。

- 予約がなくなってジョブが保留状態に置かれた後、保留中のジョブが予約外で実行されるようにデフォルトを変更します。以前のデフォルトを使用するためにNO_HOLD_JOBS_AFTER_END予約フラグを追加しました。PMIx v2.0およびUCXのサポートをサポートします。

- 旧式のMPIスタックのプラグインを削除します:

- lam

- mpich1_p4

- mpich1_shmem

- mvapich

- 多数の修正 - 「NEWS」ファイルをチェックしてください。sedスクリプトに置き換えられました。

いくつかのrpmlintの警告を修正します。

構成ファイルをslurm-configパッケージに移動しました(FATE#324574)。

slurmdの依存関係のため、slurmstepdとmanページをslurm-nodeに移動しました

構成ファイルをslurm-nodeに移動しました

slurmd rcスクリプトをslurm-nodeに移動しました

slurm-mungeがslurm自体ではなくslurm-pluginsを必要とするようにしました

-slurm-nodeによりslurm-mungeが提示されました。これにより、slurm全体がインストールされました。slurmプラグインはより基本的なクラスのようです(FATE#324574)。

ノードに配備するための軽量のslurm-nodeパッケージを分割します(FATE#324574)。

バージョン化されたlibを個別にパッケージ化します。libslurmはより頻繁に変更されることが予想されているため、libpmiとは別にパッケージ化されます。

CVE-2017-15566の修正のために17.02.9に更新されました(bsc#1065697)。17.0.9の変更点

- 電源が落ちたノードを再開する場合は、ResumeTimeoutに達した直後にDOWNノードのマークを付けます(以前のロジックでは約1分長く待機します)。

- sreportがTRESカウントの完全な列名を表示しない問題を修正します。

- ジョブが変更された予約にまたがっていた場合に、slurmdb_reservations_get()が誤った使用率データを提供する問題を修正します。

- sreport予約使用率レポートが不適切なデータを表示する問題を修正します。

- デフォルトで、sreport予約使用率レポートの予約のTRESをすべて表示します。

- sacctmgr表示予約処理の「end」パラメーターを修正します。

- sysmacros.hおよびgcc7 / glibc 2.25に関する問題に対処します。

- ブール値の設定のみを許可するようにレイアウトコードを修正します。

- sbatch --waitを修正し、メッセージタイムアウトが発生した場合でも待機し続けるようにします。

- CRAY - NodeFeatures=knl_crayで構成されており、機能を含まない非KNLノードがある場合、このパッチがないとstrtok_r(NULL)を試行する際にslurmctldが中止します。

- 子プロセスではなくslurmstepdの一部としてspank_task_privilegedを実行する17.02.7の回帰を修正します。

- すべてのユーザー設定の環境変数の先頭に常にSPANK_を追加することで、PrologとEpilogのセキュリティ問題を修正します。
CVE-2017-15566。17.0.8 での変更:

- 「slurmdbd: 」をアカウンティングプラグインに追加して、メッセージがローカルではなくdbdからであることを通知します。

- mpi/mvapich - バッファが部分的にのみクリアされます。障害は確認されていません。

- dragonflyネットワークのジョブの--switchオプションを修正します。

- --uidオプションのあるsallocで、UIDを変更する前に補助グループをドロップします。

- jobcomp/elasticsearch - JobCompLocから末尾のスラッシュを取り除きます。

- jobcomp elasticsearch - 生成されたバッファを転送する際のメモリリークを修正します。

- gres.conf CPUを解析する際のslurmstepd ABRTを防止します。

- sbatch --signal を修正し、ノード0のMPI順位だけでなく、ステップ内のすべてのMPI順位を通知します。

- 以前は送信時にのみチェックされていたジョブをスケジュールする際に、複数のパーティション制限をチェックします。

- Cray:外部ジョブステップでアプリケーション/ステップのノードヘルスチェックを実行しないようにします。

- パーティションベースのジョブプリエンプションの最適化の強化。

- GCC 7.1からのいくつかのビルド警告、および/procにアクセスできない場合に発生する可能性のある1つのメモリリークに対処します。

- リモートクラスターのscontrol/sviewでコアベースの予約を作成/変更する場合に、選択タイプを正しく決定します。

- clang使用時のlibcurlのautoconfテストを修正します。

- cgroup_allowed_devices_file.confのデフォルトの場所を修正して、正しいデフォルトパスを使用するようにします。

- sacctmgrのNewNameオプションを文書化します。

- 2番目のPMI2_Init呼び出しを単一ステップ内で拒否して、slurmstepdがハングアップしないようにします。

- リクエストされたメモリに対してデータベースに保存された古い32ビット値をsacctで正しく処理します。

- デバイスを制約する際のtask/cgroupプラグインでのメモリリークを修正します。

- デバイス制約時にtask/cgroupプラグインで非常に詳細な情報メッセージをdebug2メッセージにします。

- GRESに「type」はあるがファイルが定義されていない場合に、/dev/nullへのstepdアクセスを拒否する問題を修正します。

- gresがslurm.confにはリストされていないがgres.confには一部がリストされている場合、slurmstepdがジョブの起動で失敗する問題を修正します。

- さまざまな時間形式を正しく検証するために、時間仕様の検証を修正します。

- scontrolがジョブ更新タイムリミット[+|-]=で正しく動作するようにします。

- 次における多数の警告の表示を減らします
_part_access_check。

- 更新コマンドに関連付け名が指定されていない場合にsacctmgrでセグメンテーション違反が発生しないようにします。

- Cray UP05ソフトウェアリリースの変更で動作するように修正されたburst_buffer/crayプラグイン。

- 関連付けのMaxTRESPerNode制限に違反しているジョブのジョブ理由を修正します。

- 17.02デーモンで16.05 slurm_credを解凍する際のセグメンテーション違反を修正します。

- 大文字小文字を区別しないTRES名によるTRES制限の設定を修正します。

- xstrncmp()のエイリアスを追加します -- slurm_xstrncmp()。

- xstrcasecmp()を使用する際の大文字小文字を区別しない文字列のソートを修正します。

- プロセスの終了時に/procを読み取る際に、競合状態を慎重に処理します。

- コアスペシャライゼーションのCray重複セットアップのエラーを回避します。

- pbsnodesの未定義(Slurmでは非表示)ノードをスキップします。

- perl apiの非表示ノード用のslurm_load_node()に空のハッシュを追加します。

- CRAY - alpscomm libsで動作するようにrpathロジックを追加します。

- 管理者によるTimeLimit拡張の修正(ジョブの理由および制限時間のリセット)。

- select/linearを実行しているシステムでのgres選択を修正します。

- sview:全システムの最大化、最小化、閉じるボタンのウィンドウデコレータを追加しました。

- squeue:負の長さの書式指定子を、値をスペースで区切るリクエストとして解釈します。

- 型が正しく設定されたgresフィールドを解析するようにtorque pbsnodesラッパースクリプトを修正します。

libslurmのABIバージョンを修正しました。

説明の冗長な表現を削除します。

slurm 17-02-7-1に更新されました

- BuildRequiresとしてpythonを追加しました

- sched-wikiパッケージを削除しました

- slurmdb-directパッケージを削除しました

- sched-wikiおよびslurmdb-directパッケージを廃止しました

- Cray固有のファイルの削除

- /etc/slurm/layout.dファイルを追加しました(このバージョンの新規)

- パッケージから/etc/slurm/cgroupファイルを削除します

- lib/slurm/mcs_account.soを追加しました

- lib/slurm/jobacct_gather_aix.soを削除しました

- lib/slurm/job_submit_cnode.soを削除しました

slurm-sqlパッケージを作成しました

slurm-pluginsからslurm-torqueパッケージにファイルを移動しました

/usr/lib/tmpfiles.d/slurm.confの作成をslurm.specに移動しました

- tmpfiles.d-slurm.confを削除しました

slurmデーモンの/var/runパスを/var/run/slurmに変更しました(FATE#324026)。

tmpfiles_createをインストール後マクロSLE12 SP2またはそれ以降にしました

SLE12 SP2より前用のsystemd-tmpfiles --createの直接呼び出し

OpenSUSE Factoryビルドも可能にします

プロジェクトから未使用の.serviceファイルを削除します

起動時作成のために/usr/lib/tmpfiles.dに/var/run/slurmを追加します

- /var/run/slurmパスを可能にするために、上流の.serviceファイルにパッチを適用します

- /var/run/slurmパスを可能にするようにslurm.confを修正します

競合を回避するために、slrum-torqueが提供するラッパースクリプトmpiexecをmpiexec.slurmに移動します。このファイルは通常、MPI実装によって提供されます(bsc#1041706)。

残りの${RPM_BUILD_ROOT}を置き換えます。

説明を改良します。

変更ログを修正します。

仕様ファイル:「Requires: slurm-perlapi」を「Requires: perl-slurm = %{version}」で置き換えます(bsc#1031872)。

説明の冗長な部分を削除します。RPMグループを修正します。

不要な%__マクロ間接参照を置換します。履歴の $RPM_*変数をマクロで置換します。

一貫性のためにslurmユーザー/グループを追加する際に、仕様ファイルの先頭で定義されている%slurm_uおよび%slurm_gマクロを使用します。

非systemdでは、これらのマクロをdaemon,rootに定義します。

Leap 42.1またはSLE-12-SP1より新しいものについては、OpenHPC互換をビルドします。

16.05.8.1に更新済み

- debug2レベルでslurmdbdログに印刷されないようにStoragePassを外します。

- slurmstepdで起動するまで、タスクプログラムのPATH検索を遅延させます。

- 回帰テスト1.89を変更して、残留ジョブを放置しないようにします。ロギングを削減し、Expectバッファオーバーフローの可能性も低減します。

- LaunchParamters= test_execが有効な場合、mult-prog起動のPATH検索を行いません。

- ジョブのntasks_per_coreまたはソケットの仕様を満たす際の、select/cons_resプラグインでの無限ループの可能性を修正します。

- ジョブが不適切な制約のために保持される場合、一度更新された後そのジョブがJobAdminHeldにならないようにします。

- sched/backfill - 起動するためにノードの再起動(つまり、KNLモードの変更)が必要なジョブ用にリソースを予約するように、ロジックを修正します。

- 状態からノードまたはfront_endレコードをアンパックする際にプロトコルバージョンがminバージョンよりも下位の場合は、これをminに設定します。

- 予約のノードを更新する際のpart_ptrの冗長検索を削除します。

- slurmdデーモンのsbcastロジックにおけるメモリおよびファイル記述子の漏洩を修正します。

- 次を使用するジョブに特殊化したコアを割り当てません
--exclusive オプション。

- 「PrologFlags=contain」または「PrologFlags=alloc」の構成でPrologが失敗した場合に、対話型ジョブをキャンセルします。
必要に応じて、新しいエラーのプロローグ失敗メッセージをsallocまたはsrunコマンドに送信します。

- 無効な#! 行でのslurmstepdの領域外読み取りの可能性を防止します。

- 複数のディレクトリで動作するようにslurmctld内のPluginDirのチェックを修正します。

- 起動中のsrun/sallocプロセスへの通信エラー時に対話型ジョブを自動的にキャンセルします。

- Prologスクリプトの失敗によって引き起こされる安全でないファイルパス処理が原因のセキュリティ問題を修正します。これを悪用するには、ユーザーが自分のジョブでPrologの失敗を予測または引き起こす必要があります。CVE-2016-10030(bsc#1018371)。

グループ/ユーザー追加マクロを関数呼び出しで置き換えます。

配列の初期化を修正し、文字列が次において常にNULLで終了するようにします

pam_slurm.c(bsc#1007053)。

netlocサポートによる構築を無効にします:netloc APIは、hwlocのdevelブランチの一部です。このdevelブランチは誤って含まれた後、元に戻されているため、当面の間はこれを無効にする必要があります。

非x86アーキテクチャをより適切にサポートするための、条件付きにされたアーキテクチャ固有の部分。

削除:不要な「BuildRequires: python」

追加:BuildRequire:freeipmi-devel BuildRequires: libibmad-devel BuildRequires: libibumad-devel。これによりslurmビルドでこれらがピックアップされるようになります。

openHPCプロジェクトからの変更を有効にします。

lua APIパッケージビルドを有効にします。

slurm-mungeに対する推奨をslurmパッケージに追加します:これにより、munge authメソッドが利用可能になり、slurmはそのまま使用できます。

StateSaveLocationディレクトリとして/var/lib/slurmを作成します。/tmpは危険です。

プレインストールスクリプトにslurmユーザー/グループを作成します。

SUSEで%{_libdir}/libpmi*および%{_libdir}/mpi_pmi2*を維持します。

OHCP_BUILD定義ありおよびなしのビルドを修正します。

systemdおよび非systemdのビルドを修正します。

16-05-5に更新されました - OpenHPC1.2と同等です。

- ジョブのサイズ変更と制限が正しく追跡されない問題を修正します。

- BGQ - job_read_lockの再宣言を削除します。

- BGQ - ノード/ケーブルの状態が変化したときに、構造体をより厳密にロックします。

- scontrolでCPUsPerTaskを変更できるようにします。

- scontrol更新部分のqos=がパーティションQOSをパーティションから取り除くようにします。

- バックフィルスケジューリングが、Cray Node Health Checkと適切に同期されます。以前のロジックにより、優先度が最高のジョブが不適切に延期される可能性があります。

- デーモンもTopologyParam=NoInAddrAnyをサポートするようにします。

- scancelが多数のジョブで動作していて、slurmctldデーモンからのRPC応答が遅い場合、slurmctldの負荷を軽減するために、scancelからのジョブキャンセルリクエストの送信に遅延を導入します。

- ジョブのタスクカウントを更新する際の冗長ロジックを削除します。

- MySQL - idがロールした際の予約を伴うジョブのクエリを修正します。

- Perl - slurm_job_step_get_pidsの初期化されていない変数の使用を修正します。

- 起動完了後に--rebootを要求するバッチジョブを起動します。

- slurmctldデーモンが状態なしで再起動する場合、応答したことがないノードの電源を切断しないようにします。

- 無効なユーザーIDで起こり得るslurmstepdのセグメンテーション違反を修正します。

- MySQL - 複数のクラスターを同時にアーカイブする際に起こり得る競合状態を修正します。

- slurmstepdがvalgrindで起動できるように、ロジックを追加します。

- /proc/*/statファイルを読み込むためにバッファサイズを増やします。

- 「assoc_limit_continue」のSchedulerParametersオプションを削除し、デフォルト値にします。「assoc_limit_stop」のオプションを追加します。「assoc_limit_stop」が設定されており、関連付け制限によりジョブを開始できない場合、そのパーティションで優先度の低いジョブを開始しようとしません。これを設定すると、システムのスループットと利用率は低下しますが、無期限に起動しないようにすることで、大きなジョブを枯渇させる可能性を回避できます。

- ノードの起動後に必要に応じてノードのソケットとソケットカウントごとのコアを更新し、KNLプロセッサで発生する可能性のある構成変更を反映させます。ノードの合計コアカウントは変更されません。さまざまなソケットカウントにコアが分散されるだけです(KNL NUMAノードはSlurmによりソケットとして扱われます)。

- パーティション構成の名前を「Shared」から「OverSubscribe」に変更します。salloc、sbatch、srunオプションの名前を「--shared」から「--oversubscribe」に変更します。古いオプションは引き続き機能します。scontrol、sinfo、squeue、sviewでは出力フィールド名も変更されました。

- SLURM_UMASK環境変数をユーザージョブに追加します。

- knl_conf:CapmcPollFreqの新しい構成パラメーターを追加しました。

- 2つのマイナーなCoverity警告をクリーンアップします。

- ジョブの書式付き文字列のtres単位が、1つのステップにあるように変換されるようにします。

- ノードが複数のパーティションで共有される場合、パーティションのMaxCPUsPerNode強制を修正します。

- node_feature/knl_cray - 「hbm」参照に関するslurmctld GRESエラーを防止します。

- スレッドIDの代わりにスレッド名を表示し、「thread_id」LogTimeFormatに対するstderrロギングのプロセス名を削除します。

- 不正な受信メッセージのIPアドレスをslurmctldに記録します。

- ユーザーがタスクをリクエストした場合、ノードとntasks-per-nodeおよびtasks-per-node/nodes !=タスクは警告を出力し、ntasks-per-nodeを無視します。

- CPU「owner」ファイルロックをリリースします。

- seffを更新してncpusの警告を修正し、specファイルでslurm-perlapiの依存関係を一覧表示します。

- EnforcePartLimitsがall/anyに設定されている場合、QOSの制限時間がパーティションの制限時間をオーバーライドできるようにします。

- qsubが、出力ファイルとエラーファイルのラップされたコマンドで「basename」を実行するようにします。

- slurmstepdがvalgrindで起動できるように、ロジックを追加します。

- /proc/*/statファイルを読み込むためにバッファサイズを増やします。

- PrologSlurmctldの実行中にslurmctldデーモンが再起動する場合に、ジョブが構成状態でスタックするのを防ぎます。また、必要に応じてburst_buffer/pre-loadオペレーションを再発行します。

- スケジュールロジックの後半にあるBurstBufferResourcesとBurstBufferStageInのジョブ待機理由値のテストを移動します。

- どのsrunオプションがジョブのみ、ステップのみ、またはジョブとステップの割り当てに適用されるかをドキュメント化します。

- スレッド名を取得するために、より互換性のある関数を使用します(2.6.11以上)。

- クリーンアップ時にexternステップがリバースツリーを使用するようにします。

- externステップがproctrackプラグインに追加されない場合に、スリープがkillされていることを確認します。

- Slurm Diamond Collectors(Harvard Universityから)およびcollectd(EDFから)へのWebリンクを追加します。

- 「reboot」フィールドにjob_submitプラグインを追加します。

- さらにいくつかのSlurm定数(INFINITE、NO_VAL64など)をjob_submit/luaプラグインで利用できるようにします。

- taskidの-1をextern_stepのspank_task_post_forkに送信します。

- MYSQL - ジョブ完了が終了時間0で発生した場合のロジックを少し改善します。

- task/cgroupプラグインがConstrainRAMSpace=yesで構成され、その後、割り当てられたメモリ制限にソフトメモリ制限が設定されます(以前はソフト制限が設定されていませんでした)。

- バッチスクリプトのメッセージアグリゲーションでの実行が完了するときにschedule()が呼び出されるタイミングを効率化します。

- slurmdb_job_rec_tでderivec_ecを[アン]パックするときの不適切なキャストを修正します。

- 永続的なバーストバッファがsallocまたはsrun --bbオプションを使用して作成または破壊できないことをドキュメント化します。

- sallocコマンドに対して設定されるSLURM_job_ACCOUNT、SLURM_JOB_QOS、およびSLURM_JOB_RESERVAIONの設定に対するサポートを追加します。salloc、sbatch、srunコマンドの同じ環境変数についてmanページにドキュメント化します。

- sacctmgrがcluster.cfgをロードしても、パーティションがある関連付けがロードされない問題を修正します。

- デフォルトでsstatからのexternステップを返しません。

- sstatで、externステップに対して4294967295の代わりに「extern」を出力します。

- コアスペシャライゼーションで、事前予約が適切に機能するようにします。

- 起動時に関連するすべてのプラグインをプリロードし、変更されたプラグインが後でAPIまたはデータ構造の不整合とslurmstepdの失敗をもたらす可能性を回避するように、slurmstepdが変更されました。

- libslurm.soのparse_time.cから関数をエクスポートします。

- libslurm.soのslurm_protocol_api.cからユニット変換関数をエクスポートします。

- ジョブからの複数のステップを一度にキャンセルできるようにscancelを修正します。

- アップグレードガイドを更新および拡張します(クイックスタート管理者Webページ)。

- burst_buffer/cray:リキューしますが、pre_run操作で失敗するジョブは保留しません。

- 保留中のジョブの期待されるジョブ開始時間が過去の時間ではないことを報告するようにします。

- PMIx v2のサポートを追加します。FATE#316379に必須です。

「download_files」サービスをmode='localonly'に設定し、ソースtarballを追加します。(Factoryに必須)。

バージョン15.08.7.1

- バッチスクリプトの行での1024文字の制限を削除します。タスク/アフィニティ:利用可能なコアよりも多くのCPUが必要な場合は、コアレベルのタスクバインディングを無効にします。

- プリエンプション/ギャングスケジューリング:ジョブがslurmctldの再起動時または再構成時に一時停止される場合、再開+一時停止ではなく一時停止のままにします。

- トポロジー/ツリーが使用されるときに、ジョブ割り当てに対してより重みの低いノードを使用しません。

- ユーザー指定の予約名が、通常の予約シーケンス番号付けスキームを混乱させないようにします。

- ジョブ配列用のスクリプト/環境ファイルのハードリンク/コピーを回避します。ジョブ配列のすべてのタスクに対してマスタージョブレコードファイルを使用します。注:slurmctldデーモンがSlurmの以前のバージョンにダウングレードされると、Slurmバージョン15.08.6またはそれ以降に送信されたジョブ配列が失敗します。

- slurmctldログファイルに、slurmdが検出した重複ジョブIDを記録します。以前は、prolog/epilogの失敗として記録されていました。

- 起動中のプロセスでジョブが再キューイングされる場合、2回目に起動されたときに重複ジョブIDエラーが生成されないようにするために、アクティブなジョブのslurmdの記録からジョブIDを削除します(ノードがドレインされます)。

- 古いディレクトリ構造フォーマットのジョブスクリプトおよび環境変数を処理する際のメッセージをクリーンアップします。

- PreemptType=partition_prioおよびPreemptMode=suspend,gangで構成されている場合、パーティション内でギャングスケジューリングがトリガーされないようにします。

- 大量のジョブをキャンセルする際のサービス拒否を防ぐために、ジョブキャンセルリクエストの並列処理を削減します。

- すべてのエフェメラルポートが使用されている場合に、他のポート番号を使用してみます。

- 「scontrol update job」がすでに終了しているジョブを更新しないようにします。

- ジョブが保留中の場合、リクエストされたTRESを「squeue -O tres」で表示します。

- バックフィルスケジューラ:保留中のジョブのリソースを予約する前に、関連付けとQOSノードの制限をテストします。

- 多数のバグ修正。

ソースサービスを使用してパッケージをダウンロードします。

hwloc-2.0の新しいAPIのコードを修正します。

利用可能な場合はnetloc_to_topologyをパッケージ化します。

ドキュメントをパッケージ化します。

バージョン15.08.3

- 多数の新しい機能およびバグ修正。NEWSファイルを参照してください

ファイルリストを適宜に更新

一部のファイルの誤った行末を修正

バージョン14.11.8

- 多数のバグ修正。NEWSファイルを参照してください

ファイルリストを適宜に更新

欠落していたsystemd要件を追加

欠落していたrclinkを追加

バージョン14.03.9

- 多数のバグ修正。NEWSファイルを参照してください

systemdサポートを追加

バージョン14.03.6

- Crayシステム(ALPSなし)のネイティブSlurm操作のサポートを追加しました。

- パーティション構成パラメーターAllowAccounts、AllowQOS、DenyAccounts、およびDenyQOSを追加し、使用の制御を強化しました。

- ロードベースのスケジューリングを実行する機能を追加しました。
CPUがアイドルの場合に、番号が最大のノードのジョブにリソースを割り当てます。

- システムサービス用の計算ノードでコアを予約するためのサポートを追加しました(コアスペシャライゼーション)

- srun、salloc、またはsbatchのエラーメッセージをstderrに生成するために、job_submitプラグインのメカニズムを追加しました。

- Postgresデータベースのサポートは古くて問題があるため、完全に削除されました。
使用したい場合、コードはまだ2.6以下に存在しますが、このバージョンと将来のバージョンのコードには含まれません。

- サーバーリソースとクラスターリソースの両方に対する新しい構造およびサポートを追加しました。

- 特にジョブ配列サポートに関する大幅なパフォーマンス改善。

ファイルリストの更新

バージョン 2.6.7 への更新

- ジョブ配列のサポート。これにより、類似ジョブのセットのパフォーマンスと使いやすさが向上します。

- ユーザーが構成できる周期で各タスクの多様なジョブ特性を記録するジョブプロファイリング機能が追加されました。現在利用可能なデータには、CPU使用、メモリ使用、エネルギー使用、Infinibandネットワーク使用、Lustreファイルシステム使用などがあります。

- はるかに高いスケーラビリティを備えた、PMI2通信インターフェイスを使用するMPICH2のサポート。

- 事前予約のプロローグおよびエピローグのサポート。

- 次を使用したジョブステップ実行のスループットの大幅な向上
--exclusive オプション。定期的なポーリングではなく、リソースが利用可能になったときにsrunプロセスに通知されます。

- Intel MIC(Many Integrated Core)プロセッサのサポートが改善されました。

- ホスト名とコアカウントによる事前予約が、非対称の予約をサポートするようになりました(例:各ノードに特定の異なるコアカウント)。

- 電力消費、温度などを記録するために外部センサープラグインインフラストラクチャが追加されました。

- ハイスループットコンピューティングのパフォーマンスが改善されました。

- MapReduce+のサポート(起動が約1000倍、実行が約10倍速くなります)

- 「MaxCPUsPerNode」パーティション構成パラメーターを追加しました。これは、GPUをスケジュールする場合に特に便利です。たとえば、ノードを2つのSlurmパーティション(例:「cpu」および「gpu」)に関連付け、パーティション/キュー「cpu」をノードのCPUのサブセットのみに制限し、1つ以上のCPUを「gpu」パーティション/キューのジョブに使用できるようにすることが可能です。

バージョン2.5.7

- 未定義の変数に関する警告を発しないようにselect/crayプラグインへのリンクを修正します。

- 欠落している記号をxlator.hに追加します

- 保留中のジョブを、バックフィルスケジューラと事前予約との相互作用によるAdminHold状態にしないようにします。

- アカウンティング - CPUではなくタスクで平均化します。

- POE - poeオプション「-euidevice sn_all」および「-euidevice sn_single」をサポートするためにロジックを修正します。

- アカウンティング - マイナーな初期化エラーを修正します。

- POE - POEでsrunネットワークインスタンスカウントをサポートするためにロジックを修正します。

- POE - srun --launch-cmdオプションで、次を指定せずに--cpus-per-taskオプションが使用されている場合に適切なタスクカウントを報告します

--ntasks オプション。

- POE - タスクをCPUにバインドするロジックを修正します。

- sview - 気付かないうちに新しい情報がノードタブを通過してしまう可能性がある競合状態を修正します。

- アカウンティング - slurmctldが開始ジョブに関するデータをslurmdbdに送信する際の無効なメモリ読み取りを修正します。

- プロローグまたはエピローグの失敗が発生した場合は、ノードを停止してそのジョブのすべてをkillするのではなく、ノードをドレインします。

- 優先度/マルチファクタ - 半減期の計算でアンダーフローを回避します。

- POE - ファンアウトを可能にするために不足していた変数をパックします(32個を超えるノード)

- 保留中のジョブの理由フィールドを消去しないようにします。このバグはv2.5.5で導入されました(「Reject job at submit time ...」を参照)。

- BGQ - ジョブが、必要なジョブだけでなく、ミッドプレーン上のすべてのプリエンプト可能なジョブを強制終了する、サブブロックジョブでのプリエンプションの問題を修正します。

- switch/nrt - 動的ウィンドウ割り当てサイズを検証します。

- BGQ - --geoがリクエストされた場合にデフォルトのconn_typesを強要しないようにします。

- RebootNodeロジック - 予約内のノードでジョブが実行されている場合に再起動リクエストを(忘れるのではなく)遅延させます。

- switch/nrt - network_id使用ロジックを修正します。ユーザーsn_allおよびsn_singleオプションのサポートを修正します。

- sched/backfill - 高負荷のオーバーヘッドを削減するようにロジックを変更します。

- --exclusiveおよび--hostlistオプションによるジョブステップ割り当てを修正します。

- Select/cons_res - エラー「cons_res: sync loop not progressing, holding job #」になるバグを修正します

- checkpoint/blcr - ジョブの再起動時にmax_nodesをゼロからNO_VALにリセットします。

- launch/poe - ホスト名が繰り返されるホストリストファイルのサポートを修正します。

- priority/multifactor2 - ゼロ除算の可能性を防ぎます。

- srun - --test-onlyフラグが使用されている場合に実行可能ファイルをチェックしません。

- energy - 単一のノードで、エネルギーの収集に最後のタスクのみを使用します。現在、タスクごとのエネルギー使用量は追跡していないためです(ステップごとのみ)。そうしないと、エネルギーが二重に取得されます。

バージョン2.5.4

- Intel® Many Integrated Core(MIC)プロセッサをサポートします。

- 各ジョブステップのCPU周波数に対するユーザー制御。

- 各ジョブの消費電力情報の記録。

- ノード全体ではなくコアの事前予約。

- POE(パラレルオペレーティング環境)およびNRT(ネットワークリソーステーブル)APIを含む、IBMパラレル環境との統合。

- 新しい「select/serial」プラグインにおけるシリアルジョブの高度に最適化されたスループット。

- CPU負荷は利用可能な情報です

- 各SLURMパーティションのジョブが利用できるCPUの構成可能な数。これにより、GPUで使用するためにCPUを予約するメカニズムが提供されます。

patch1により、initスクリプトから実行レベル4を削除

slurm-mungeパッケージの自己廃止を修正

fdupesを使用して重複を削除

specファイルの再フォーマット

インストールセクション内のperlマクロを改善

x86_64 archでのみnumaを有効化

numaおよびhwlocのサポートを追加

perlモジュールファイルリストを修正

perlファイルのクリーンアップにperl_process_packlistマクロを使用

一部のサマリーの長さを修正

cgoupsディレクトリとサンプルのcgroup.release_commonファイルを追加

specファイルのクリーンアップ

最初のパッケージ

注意:Tenable Network Securityは、前述の記述ブロックをSUSEセキュリティアドバイザリから直接抽出しています。Tenableでは、そこに新しい問題を追加することはせずに、できる限り自動的に整理と書式設定をするようにしています。

ソリューション

このSUSEセキュリティ更新プログラムをインストールするには、YaSTのonline_updateや「zypper patch」など、SUSEが推奨するインストール方法を使用してください。

別の方法として、製品にリストされているコマンドを実行することができます:

SUSE Linux Enterprise Module for HPC 12:

zypper in -t patch SUSE-SLE-Module-HPC-12-2021-773=1

参考資料

https://www.suse.com/security/cve/CVE-2016-10030/

https://bugzilla.suse.com/show_bug.cgi?id=1018371

https://www.suse.com/security/cve/CVE-2019-12838/

https://bugzilla.suse.com/show_bug.cgi?id=1065697

https://bugzilla.suse.com/show_bug.cgi?id=1085240

https://bugzilla.suse.com/show_bug.cgi?id=1095508

https://bugzilla.suse.com/show_bug.cgi?id=1123304

https://bugzilla.suse.com/show_bug.cgi?id=1140709

https://bugzilla.suse.com/show_bug.cgi?id=1155784

https://bugzilla.suse.com/show_bug.cgi?id=1159692

https://bugzilla.suse.com/show_bug.cgi?id=1172004

https://bugzilla.suse.com/show_bug.cgi?id=1178890

https://bugzilla.suse.com/show_bug.cgi?id=1178891

https://en.opensuse.org/openSUSE:Packaging_scriptlet_snippets

https://www.suse.com/security/cve/CVE-2017-15566/

https://www.suse.com/security/cve/CVE-2018-10995/

https://www.suse.com/security/cve/CVE-2018-7033/

https://www.suse.com/security/cve/CVE-2019-19727/

https://www.suse.com/security/cve/CVE-2019-19728/

https://www.suse.com/security/cve/CVE-2019-6438/

https://www.suse.com/security/cve/CVE-2020-12693/

https://www.suse.com/security/cve/CVE-2020-27745/

https://www.suse.com/security/cve/CVE-2020-27746/

http://www.nessus.org/u?18cd535c

プラグインの詳細

深刻度: Critical

ID: 147801

ファイル名: suse_SU-2021-0773-1.nasl

バージョン: 1.3

タイプ: local

エージェント: unix

公開日: 2021/3/15

更新日: 2022/5/10

サポートされているセンサー: Agentless Assessment, Frictionless Assessment Agent, Frictionless Assessment AWS, Frictionless Assessment Azure, Nessus Agent, Nessus

リスク情報

VPR

リスクファクター: Medium

スコア: 6.7

CVSS v2

リスクファクター: High

基本値: 7.6

現状値: 5.6

ベクトル: CVSS2#AV:N/AC:H/Au:N/C:C/I:C/A:C

CVSS スコアのソース: CVE-2016-10030

CVSS v3

リスクファクター: Critical

基本値: 9.8

現状値: 8.5

ベクトル: CVSS:3.0/AV:N/AC:L/PR:N/UI:N/S:U/C:H/I:H/A:H

現状ベクトル: CVSS:3.0/E:U/RL:O/RC:C

CVSS スコアのソース: CVE-2020-27745

脆弱性情報

CPE: p-cpe:/a:novell:suse_linux:pdsh-genders-debuginfo, p-cpe:/a:novell:suse_linux:pdsh-machines, p-cpe:/a:novell:suse_linux:pdsh-machines-debuginfo, p-cpe:/a:novell:suse_linux:pdsh-netgroup, p-cpe:/a:novell:suse_linux:pdsh-netgroup-debuginfo, p-cpe:/a:novell:suse_linux:pdsh-slurm, p-cpe:/a:novell:suse_linux:pdsh-slurm-debuginfo, p-cpe:/a:novell:suse_linux:pdsh-slurm_18_08, p-cpe:/a:novell:suse_linux:pdsh-slurm_18_08-debuginfo, p-cpe:/a:novell:suse_linux:pdsh-slurm_20_02, p-cpe:/a:novell:suse_linux:pdsh-slurm_20_02-debuginfo, p-cpe:/a:novell:suse_linux:pdsh-slurm_20_11, p-cpe:/a:novell:suse_linux:slurm_20_11-devel, p-cpe:/a:novell:suse_linux:slurm_20_11-doc, p-cpe:/a:novell:suse_linux:slurm_20_11-lua, p-cpe:/a:novell:suse_linux:slurm_20_11-lua-debuginfo, p-cpe:/a:novell:suse_linux:slurm_20_11-munge, p-cpe:/a:novell:suse_linux:slurm_20_11-munge-debuginfo, p-cpe:/a:novell:suse_linux:slurm_20_11-node, p-cpe:/a:novell:suse_linux:slurm_20_11-node-debuginfo, p-cpe:/a:novell:suse_linux:slurm_20_11-pam_slurm, p-cpe:/a:novell:suse_linux:slurm_20_11-pam_slurm-debuginfo, p-cpe:/a:novell:suse_linux:slurm_20_11-plugins, p-cpe:/a:novell:suse_linux:slurm_20_11-plugins-debuginfo, p-cpe:/a:novell:suse_linux:slurm_20_11-slurmdbd, p-cpe:/a:novell:suse_linux:slurm_20_11-slurmdbd-debuginfo, p-cpe:/a:novell:suse_linux:slurm_20_11-sql, p-cpe:/a:novell:suse_linux:slurm_20_11-sql-debuginfo, p-cpe:/a:novell:suse_linux:slurm_20_11-sview, p-cpe:/a:novell:suse_linux:slurm_20_11-sview-debuginfo, p-cpe:/a:novell:suse_linux:slurm_20_11-torque, p-cpe:/a:novell:suse_linux:slurm_20_11-torque-debuginfo, p-cpe:/a:novell:suse_linux:slurm_20_11-webdoc, cpe:/o:novell:suse_linux:12, p-cpe:/a:novell:suse_linux:pdsh-slurm_20_11-debuginfo, p-cpe:/a:novell:suse_linux:pdsh_slurm_18_08-debugsource, p-cpe:/a:novell:suse_linux:pdsh_slurm_20_02-debugsource, p-cpe:/a:novell:suse_linux:pdsh_slurm_20_11-debugsource, p-cpe:/a:novell:suse_linux:perl-slurm_20_11, p-cpe:/a:novell:suse_linux:perl-slurm_20_11-debuginfo, p-cpe:/a:novell:suse_linux:slurm_20_11, p-cpe:/a:novell:suse_linux:slurm_20_11-auth-none, p-cpe:/a:novell:suse_linux:slurm_20_11-auth-none-debuginfo, p-cpe:/a:novell:suse_linux:slurm_20_11-config, p-cpe:/a:novell:suse_linux:slurm_20_11-config-man, p-cpe:/a:novell:suse_linux:slurm_20_11-debuginfo, p-cpe:/a:novell:suse_linux:slurm_20_11-debugsource, p-cpe:/a:novell:suse_linux:libnss_slurm2_20_11, p-cpe:/a:novell:suse_linux:libnss_slurm2_20_11-debuginfo, p-cpe:/a:novell:suse_linux:libpmi0_20_11, p-cpe:/a:novell:suse_linux:libpmi0_20_11-debuginfo, p-cpe:/a:novell:suse_linux:libslurm36, p-cpe:/a:novell:suse_linux:libslurm36-debuginfo, p-cpe:/a:novell:suse_linux:pdsh, p-cpe:/a:novell:suse_linux:pdsh-debuginfo, p-cpe:/a:novell:suse_linux:pdsh-debugsource, p-cpe:/a:novell:suse_linux:pdsh-dshgroup, p-cpe:/a:novell:suse_linux:pdsh-dshgroup-debuginfo, p-cpe:/a:novell:suse_linux:pdsh-genders

必要な KB アイテム: Host/local_checks_enabled, Host/cpu, Host/SuSE/release, Host/SuSE/rpm-list

エクスプロイトの容易さ: No known exploits are available

パッチ公開日: 2021/3/12

脆弱性公開日: 2017/1/5

参照情報

CVE: CVE-2016-10030, CVE-2017-15566, CVE-2018-10995, CVE-2018-7033, CVE-2019-12838, CVE-2019-19727, CVE-2019-19728, CVE-2019-6438, CVE-2020-12693, CVE-2020-27745, CVE-2020-27746