はじめに #
AWSの基礎力をつけるためにAWS What’s Newを毎日目を通す事を始めました。 最初は日本語訳されたものを見ていたのですが、1週間ほど遅れて訳されるようなので、英語の情報を訳して整理することにしました。
本情報が役立つ人もいるかなと思い公開します。 個人的な理解なので、実際の情報は原典をあたってください。
¥3,520 Amazonで見る
AWS運用入門 改訂第2版 押さえておきたいAWSの基本と運用ノウハウ [AWS深掘りガイド] 単行本(ソフトカバー) – 2025/7/11
Amazon EC2 Capacity Managerの発表 #
投稿日: 2025年10月17日
何ができるようになったのか #
Amazon EC2 Capacity Managerが一般利用可能になりました。これは、すべてのアカウントとリージョンにわたるEC2キャパシティを単一のインターフェースから監視、分析、管理できるようにすることで、リソース管理を簡素化するように設計された新しい機能です。
主な機能は次のとおりです。
- オンデマンド、スポット、およびキャパシティ予約の使用状況の包括的なビュー。
- 特定の詳細にドリルダウンする機能を備えた高レベルの洞察を提供するダッシュボードとチャート。
- キャパシティのパターンを理解し、最適化の機会を特定するための過去の使用状況の傾向。
- 洞察の実装をガイドするワークフロー。
- 既存のシステムとの統合のためのデータエクスポート機能。
何が嬉しいのか #
EC2 Capacity Managerは、追加費用なしでデフォルトで有効になっているすべての商用AWSリージョンで利用できます。
これまでとどう変わるのか #
- これまで
- 複数のアカウントやリージョンにまたがるEC2キャパシティの管理は、個別のコンソールやAPIを介して行う必要があり、全体像を把握するのが困難でした。
- これから
- 単一のインターフェースから、すべてのアカウントとリージョンにわたるEC2キャパシティを集中管理できるようになります。
具体的なユースケース #
- 大規模なAWS環境を持つ企業が、コストを最適化し、キャパシティの可用性を確保するために使用します。
AWS Parallel Computing Service (PCS) が Slurm v25.05 をサポート #
投稿日: 2025年10月17日
何ができるようになったのか #
AWS Parallel Computing Service (PCS) が Slurm v25.05 をサポートし、ユーザーはこの新しいバージョンを実行する AWS PCS クラスターを作成できるようになりました。
主な機能と改善点は次のとおりです。
- 強化されたマルチクラスター sackd 設定: ログインノードは、sackd の再設定や再起動を必要とせずに複数のクラスターを制御できるようになり、管理者はユーザーのために複数のクラスターへのアクセスを事前に設定できます。
- インスタンス起動失敗時の再キュー動作の改善: この新しい動作は、キャパシティ不足時のインスタンス起動失敗を自動的に再試行し、より回復力のあるジョブスケジューリングとクラスター全体の信頼性向上につながります。
何が嬉しいのか #
AWS PCS は、Slurm を使用して AWS 上でハイパフォーマンスコンピューティング (HPC) ワークロードの実行とスケーリングを簡素化するように設計されたマネージドサービスです。
これまでとどう変わるのか #
- これまで
- 以前のバージョンのSlurmでは、複数のクラスターを管理するためにsackdの再設定や再起動が必要でした。また、インスタンスの起動に失敗した場合、手動での再試行が必要でした。
- これから
- ログインノードから複数のクラスターをシームレスに管理できるようになり、インスタンス起動失敗時の自動再試行により、ジョブの実行がより堅牢になります。
具体的なユースケース #
- 計算量の多い科学技術計算や、大規模な機械学習モデルのトレーニングなど、ハイパフォーマンスコンピューティング(HPC)を必要とするワークロードを実行する際に、より効率的で信頼性の高いクラスター管理が可能になります。