メインコンテンツへスキップ

【AWSデイリーアップデート】RedshiftがMDDLで爆速化!IoT SiteWiseもMCPでモデリング簡素化

· loading · loading ·
kiitosu
著者
kiitosu
画像処理やデバイスドライバ、データ基盤構築からWebバックエンドまで、多様な領域に携わってきました。地図解析や地図アプリケーションの仕組みにも経験があり、幅広い技術を活かした開発に取り組んでいます。休日は草野球とランニングを楽しんでいます。
目次

はじめに
#

AWSの基礎力をつけるためにAWS What’s Newを毎日目を通す事を始めました。 最初は日本語訳されたものを見ていたのですが、1週間ほど遅れて訳されるようなので、英語の情報を訳して整理することにしました。

本情報が役立つ人もいるかなと思い公開します。 個人的な理解なので、実際の情報は原典をあたってください。

まとめと気づき
#

「Amazon Redshift、多次元データレイアウトの一般提供を発表」でRedshiftが動的にソートするMulti Dimensional Data Layout を自動的に適応し、クエリパフォーマンスが上がるそうです。 自動でやってくれるのは嬉しいですが、Redshift自体が高価なサービスなのでどれくらいコストがかかるのか気になります。結局製品ワークロードでは適切なソートキーを設定しないといけないのではないかという気がします。


Amazon RDS for MySQL、Amazon RDSデータベースプレビュー環境でイノベーションリリース9.4を発表
#

投稿日: 2025年09月19日

何ができるようになったのか
#

Amazon RDS for MySQLが、Amazon RDSデータベースプレビュー環境でコミュニティ版MySQLイノベーションリリース9.4をサポートするようになりました。これにより、Amazon RDS for MySQL上で最新のイノベーションリリースを評価できるようになります。MySQL 9.4をフルマネージドデータベースの利点を享受できるプレビュー環境にデプロイし、データベースのセットアップ、運用、監視をより簡単に行うことができます。

何が嬉しいのか
#

フルマネージド環境の恩恵により、データベースのセットアップ、運用、監視が簡素化されます。また、MySQLイノベーションリリース9.4に含まれる最新のバグ修正、セキュリティパッチ、新機能に早期にアクセスし、本番環境に導入する前に評価・検証することが可能になります。

これまでとどう変わるのか
#

  • これまで
    • 最新のMySQLイノベーションリリース(例:9.4)をフルマネージドのRDS環境で簡単に評価することはできませんでした。新しい機能の早期テストには、LTSリリースを待つか、自己管理型のインスタンスを構築する必要がありました。
  • これから
    • Amazon RDSデータベースプレビュー環境でMySQLイノベーションリリース9.4を評価できるようになり、新しい機能や改善点に早期にアクセスし、フルマネージド環境で検証することが可能になります。

具体的なユースケース
#

  • MySQL 9.4の新機能を一般提供開始前にテストしたい開発者やDBA。
  • 将来的に新しいMySQLバージョンへの移行を計画しており、互換性やパフォーマンスを事前に評価したい組織。
  • 最新のMySQLイノベーションを、低リスクで隔離されたフルマネージド環境で試したい場合。

AWSが簡素化されたモデリングのためのSiteWise Model Context Protocol (MCP) サーバーをリリース
#

投稿日: 2025年09月19日

何ができるようになったのか
#

AWS IoT SiteWise向けのModel Context Protocol (MCP) サーバーがAWS Labs MCPオープンソースリポジトリで利用可能になりました。これにより、組み込みのドメイン検証と自動モデリング機能が提供され、広範なAPI知識なしで産業データモデリングを簡素化できるようになりました。また、既存のAWS IoT SiteWise機能を使い慣れたツールでサポートしつつ、強化されたユーザーインタラクションのための新しい会話型インターフェースが追加されました。

何が嬉しいのか
#

産業モデルが最初から本番環境に対応できるようになり、複数の反復や修正に費やされていた貴重な時間とリソースを節約できます。組み込みの産業知識とベストプラクティスにより、適切な単位、データ型、品質指標が自動的に適用されます。これにより、異常検知や合理化されたアセットオンボーディングのような高度な機能を容易に実装でき、既存の産業システムとのシームレスな統合も可能になります。

これまでとどう変わるのか
#

  • これまで
    • 産業データモデリングには広範なAPI知識が必要でした。
    • 単位、データ型、品質指標の手動適用が必要で、多くの反復と修正が発生していました。
    • 高度な機能の実装や既存システムとの統合には、より多くの労力と専門知識が必要でした。
  • これから
    • 組み込みのドメイン検証と自動モデリング機能により、API知識が少なくてもモデリングが簡素化されます。
    • 自動的なベストプラクティス適用により、産業モデルが最初から本番環境に対応します。
    • 異常検知や合理化されたアセットオンボーディングなどの高度な機能の実装が容易になり、既存の産業システムとのシームレスな統合が可能になります。

具体的なユースケース
#

  • 広範なAPI知識を持たないユーザーが産業データモデリングを簡素化する。
  • 産業モデルを最初から本番環境に対応させ、開発時間とリソースを節約する。
  • 異常検知のような高度な機能を容易に実装する。
  • アセットのオンボーディングプロセスを合理化する。
  • 既存の産業システムとAWS IoT SiteWiseをシームレスに統合する。

AWS IoT SiteWiseは、産業機器からのデータを大規模に収集、モデル化、分析、可視化するマネージドサービスです。

主な特徴は以下の通りです。

  • データの収集と整理: 産業用ゲートウェイ(AWS IoT SiteWise Edge)やAPIを通じて、オンプレミスの機器、データサーバー、または時系列データストアからデータを収集し、アセット(資産)としてモデル化します。
  • リアルタイムな計算: 収集したデータから、数式や関数を用いてリアルタイムでパフォーマンスメトリクス(例: OEE - 設備総合効率)やカスタム指標を計算できます。
  • 可視化と監視: SiteWise Monitorという機能を使って、コーディングなしでウェブアプリケーションを作成し、アセットデータや計算済みメトリクスをリアルタイムで可視化・監視できます。
  • 他のAWSサービスとの連携: 収集・処理したデータは、Amazon S3やAmazon Timestreamにエクスポートしたり、AWS Lambdaでさらに処理したり、Amazon QuickSightで高度な分析を行うなど、他のAWSサービスとシームレスに連携できます。

これにより、製造ラインの効率改善、予知保全、リモートでの設備監視など、産業分野におけるDX(デジタルトランスフォーメーション)を加速させることができます。


AWS Organizations がサービスコントロールポリシー (SCP) で完全な IAM ポリシー言語をサポート
#

投稿日: 2025年09月19日

何ができるようになったのか
#

AWS Organizations のサービスコントロールポリシー (SCP) で、IAM マネージドポリシーと同じ柔軟性を持つ完全な IAM ポリシー言語がサポートされるようになりました。これにより、SCP で条件、個別のリソース ARN、および Allow ステートメントでの NotAction 要素の使用が可能になります。さらに、Action 要素の文字列の先頭または途中でワイルドカードを使用したり、NotResource 要素を使用したりできるようになりました。

何が嬉しいのか
#

これらのポリシー言語の強化により、より簡潔で正確なポリシーを作成し、組織全体で高度なアクセス許可のガードレールを実装できるようになります。既存の SCP との下位互換性が維持されるため、現在のポリシーに変更を加える必要はありません。

これまでとどう変わるのか
#

  • これまで
    • SCP は IAM ポリシー言語のサポートが限定的で、条件、個別のリソース ARN、Allow ステートメントでの NotAction 要素、および Action/NotResource 要素での柔軟なワイルドカードの使用ができませんでした。
  • これから
    • SCP は完全な IAM ポリシー言語をサポートし、条件、個別のリソース ARN、Allow ステートメントでの NotAction 要素、および Action/NotResource 要素でのワイルドカードが使用できるようになります。これにより、よりきめ細かく正確なアクセス制御が可能になります。

具体的なユースケース
#

  • 条件ステートメントを使用して、特定の AWS リソースへのアクセスを制限する。
  • 組織全体で、より高度で精密なアクセス許可のガードレールを実装する。

Amazon OpenSearch Ingestion がクロスアカウントでの取り込みをサポート
#

投稿日: 2025年09月19日

何ができるようになったのか
#

Amazon OpenSearch Ingestion が、HTTPやOpenTelemetry (OTel) のようなプッシュベースのソースに対するクロスアカウントでの取り込みをサポートするようになりました。これにより、VPCピアリングやAWS Transit Gatewayのような追加設定に頼ることなく、AWSアカウント間でOpenSearch Ingestionパイプラインを簡単に共有できるようになりました。

何が嬉しいのか
#

複数のアカウントを持つ組織が、オブザーバビリティおよび分析ワークフローを一元化することがより簡単になります。また、アカウント間で取り込みパイプラインを共有する際の運用上のオーバーヘッドが削減され、コストも低減されます。

これまでとどう変わるのか
#

  • これまで
    • AWSアカウント間でOpenSearch Ingestionパイプラインを共有するには、VPCピアリングやAWS Transit Gatewayなどの追加設定が必要でした。
  • これから
    • 追加設定なしで、AWSアカウント間でOpenSearch Ingestionパイプラインを簡単に共有できるようになります。

具体的なユースケース
#

  • 中央のログチームが取り込みパイプラインを作成し、異なるアカウントの開発チームにアクセス権を付与することで、開発チームはログ、メトリクス、トレースをOpenSearchドメインまたはOpenSearch Serverlessコレクションに直接取り込むことができます。

Amazon Redshift、多次元データレイアウトの一般提供を発表
#

投稿日: 2025年09月19日

何ができるようになったのか
#

Amazon Redshiftで、実際のクエリフィルターに基づいてデータを動的にソートし、クエリパフォーマンスを最大10倍向上させる多次元データレイアウト(MDDL)が一般提供されました。

何が嬉しいのか
#

  • クエリフィルター(例: 米国での売上)に基づいてデータを動的にソートすることで、クエリパフォーマンスが大幅に向上します。
  • 繰り返し実行されるクエリフィルターを含むワークロードにおいて、エンドツーエンドのパフォーマンスが最大10倍改善される可能性があります。
  • 明示的なソートキーがないテーブル(デフォルトでAUTOソートキーが設定されているテーブル)の場合、Redshiftがクエリ履歴を分析し、ワークロードの潜在的なパフォーマンス改善に基づいて、単一列ソートキーまたはMDDLを自動的に選択します。
  • MDDLは、既存の複合ソートキーやインターリーブソートキーをより表現力豊かに一般化したもので、テーブルスキャンのパフォーマンスを大幅に向上させます。

これまでとどう変わるのか
#

  • これまで
    • データは固定された列に基づいてソートされるか、手動で定義されたソートキーを使用していました。
    • クエリフィルターに合わせた動的なソートは行われず、特定のクエリパターンに対するパフォーマンス最適化には限界がありました。
  • これから
    • Redshiftがクエリフィルターに基づいてデータを動的にソートするMDDLを自動的に適用できるようになります。
    • AUTOソートキーが設定されたテーブルでは、Redshiftがワークロードに応じてMDDLまたは単一列ソートキーを自動で選択・管理します。
    • 既存の手動で定義されたソートキーを持つテーブルも、ソートキーをAUTOに変更することでMDDLの恩恵を受けられます。

具体的なユースケース
#

  • 繰り返し実行される特定のクエリフィルター(例: 特定の地域、期間、製品カテゴリなど)を含む分析ワークロード。
  • データウェアハウスで、頻繁に実行されるレポートやダッシュボードのクエリパフォーマンスを最適化したい場合。
  • 手動でのソートキー管理の手間を減らし、Redshiftに最適なソート戦略を自動で選択させたい場合。

AWS Neuron SDK 2.26.0を発表
#

投稿日: 2025年09月19日

何ができるようになったのか
#

AWS Neuron SDK 2.26.0が一般提供され、AWS InferentiaおよびTrainiumベースのインスタンスにおける深層学習ワークロードの改善が実現しました。このリリースにより、以下のことが可能になりました。

  • PyTorch 2.8およびJAX 0.6.2のサポートが導入されました。
  • Trainium2 (Trn2) インスタンスでの推論機能が強化されました。
  • Trn2インスタンスでFLUX.1-dev画像生成モデル、Llama 4 ScoutおよびMaverickバリアント(ベータ版)を展開できるようになりました。
  • 複数のNeuronCoreにわたるMixture-of-Experts (MoE) モデルの効率的な分散を可能にするエキスパート並列処理(ベータ版)がサポートされました。
  • 新しいNeuron Kernel Interface (NKI) APIを通じて新機能が追加されました。
  • 更新されたNeuron Profilerにより、分散ワークロード向けのシステムプロファイルグループ化を含む機能が改善されました。

何が嬉しいのか
#

  • 最新の深層学習フレームワーク(PyTorch 2.8、JAX 0.6.2)を活用できるようになります。
  • モデルのデプロイの柔軟性が向上し、パフォーマンスが最適化されます。
  • 大規模な言語モデルや画像生成モデルなど、より多様な最新のモデルをTrainium2インスタンスで効率的に実行できます。
  • Mixture-of-Experts (MoE) モデルのような複雑なモデルを、より効率的に分散処理できるようになり、大規模なAIモデルのトレーニングと推論のコスト効率と速度が向上します。
  • 深層学習ワークロードのパフォーマンスと監視機能が強化され、開発者はより詳細な洞察を得て最適化を進めることができます。

これまでとどう変わるのか
#

  • これまで
    • PyTorchやJAXの古いバージョンに限定され、最新のフレームワークの機能を利用できませんでした。
    • Trainium2インスタンスでの推論機能が限定的でした。
    • FLUX.1-dev、Llama 4 Scout、Maverickなどの特定の最新モデルをTrn2インスタンスにデプロイすることが困難でした。
    • Mixture-of-Experts (MoE) モデルの効率的な分散処理のためのエキスパート並列処理のサポートがありませんでした。
    • Neuron Profilerの機能が現在のバージョンほど高度ではありませんでした。
  • これから
    • PyTorch 2.8およびJAX 0.6.2のサポートにより、最新の深層学習技術と改善を活用できます。
    • Trainium2インスタンスでの推論性能が向上し、より高速で効率的なモデル実行が可能になります。
    • FLUX.1-dev画像生成モデルやLlama 4 Scout、Maverickバリアント(ベータ版)をTrn2インスタンスにデプロイできるようになり、最先端のAIアプリケーション開発が加速します。
    • エキスパート並列処理のサポートにより、大規模なMoEモデルを複数のNeuronCoreに効率的に分散し、トレーニングと推論の効率を大幅に向上させることができます。
    • 強化されたNeuron Profilerにより、分散ワークロードの監視と最適化がより容易になります。

具体的なユースケース
#

  • 大規模言語モデルのデプロイ: Llama 4 ScoutやMaverickバリアント(ベータ版)などの大規模言語モデルをTrainium2インスタンスにデプロイし、高性能な推論サービスを提供します。
  • 画像生成AIの実行: FLUX.1-dev画像生成モデルを利用して、高品質な画像を効率的に生成するアプリケーションを開発・運用します。
  • 最新フレームワークでの深層学習開発: PyTorch 2.8やJAX 0.6.2を使用する最新の深層学習モデルのトレーニングと推論を、AWS Neuronインスタンス上で最適化されたパフォーマンスで実行します。
  • Mixture-of-Experts (MoE) モデルの効率的なトレーニング: エキスパート並列処理を活用して、非常に大規模で複雑なMoEモデルを複数のNeuronCoreに分散させ、トレーニング時間を短縮し、リソース利用効率を最大化します。
  • 分散深層学習ワークロードの監視と最適化: 更新されたNeuron Profilerを使用して、分散環境で実行される深層学習モデルのパフォーマンスを詳細に監視し、ボトルネックを特定して最適化を行います。

Amazon Keyspaces (for Apache Cassandra) が SELECT 句での now()、uuid() 関数と Duration データ型をサポート
#

投稿日: 2025年09月08日

何ができるようになったのか
#

Amazon Keyspaces (Apache Cassandra 向け) で、now() および uuid() 関数を SELECT 句で使用できるようになりました。また、Duration データ型がサポートされました。

何が嬉しいのか
#

  • Apache Cassandra との互換性が向上し、アプリケーションで時間ベースの操作や一意の識別子をより簡単に扱えるようになります。
  • now() 関数により、データが取得された時刻を直接追跡したり、クエリ内で時間ベースの計算を実行したりすることが容易になります。
  • uuid() 関数により、データ取得操作中に参照値や一時的な識別子を作成するための一意の識別子を生成できます。
  • Duration データ型により、2つのタイムスタンプ間の経過時間を表現できるようになり、時間間隔を文字列やバイトとして保存し、手動で解析する手間がなくなります。

これまでとどう変わるのか
#

  • これまで
    • now() および uuid() 関数は WHEREINSERTUPDATE 句でのみサポートされていました。
    • 時間間隔を追跡するには、文字列やバイトとして保存し、アプリケーションで手動で解析する必要がありました。
  • これから
    • now() および uuid() 関数を SELECT 句でも使用できるようになり、より柔軟な時間ベースの操作と一意の識別子の生成が可能になります。
    • Duration データ型が導入されたことで、時間間隔の管理が簡素化され、手動解析の負担がなくなります。

具体的なユースケース
#

  • データ取得時のタイムスタンプを直接生成し、データの鮮度を追跡する。
  • クエリ内で時間ベースの計算(例:特定の期間内のイベント数)を実行する。
  • データ取得操作中に、一時的なセッションIDや参照IDとして一意の識別子を生成する。
  • タスクの完了時間やコードの実行間隔をDurationデータ型で正確に追跡し、パフォーマンス分析に役立てる。

Amazon Keyspaces (for Apache Cassandra) の概要

Amazon Keyspacesは、オープンソースのNoSQLデータベースであるApache Cassandraと互換性のある、スケーラブルで可用性の高い、フルマネージドのデータベースサービスです。

主な特徴は以下の通りです。

  • サーバーレス: サーバーのプロビジョニング、パッチ適用、クラスタの管理といった運用タスクが不要です。トラフィックに応じて自動的にスケールアップ・ダウンします。
  • Cassandra互換: 既存のCassandraアプリケーション、ドライバ、およびツールを、コードをほとんど変更することなく使用できます。Cassandra Query Language (CQL) をサポートしています。
  • 高い可用性と耐久性: AWSグローバルインフラストラクチャを活用し、データを複数のアベイラビリティゾーンに自動的に3回レプリケートすることで、99.99%の可用性を実現します。
  • パフォーマンス: 数ミリ秒台の応答時間で、一貫したパフォーマンスを提供します。オンデマンドまたはプロビジョンドのキャパシティモードを選択できます。
  • セキュリティ: 保存時および転送中のデータを暗号化し、IAMと統合してアクセスを制御します。

これにより、開発者はCassandraの運用・管理の負担から解放され、アプリケーション開発に集中しながら、Cassandraの柔軟なデータモデルとスケーラビリティの恩恵を受けることができます。

Amazon KeyspacesとDynamoDBの比較

Amazon KeyspacesとAmazon DynamoDBは、どちらもAWSが提供するフルマネージドのNoSQLデータベースですが、その出自と特性には大きな違いがあります。

特徴 Amazon Keyspaces (for Apache Cassandra) Amazon DynamoDB
基本技術とAPI Apache Cassandra互換 AWS独自の技術
Cassandra Query Language (CQL) を使用します。既存のCassandraアプリケーションやツールをほぼそのまま利用できます。 DynamoDB独自のAPI(GetItem, PutItemなど)を使用します。
データモデル ワイドカラムストア キーバリュー型 & ドキュメント型
Cassandraと同じく、行キー、カラムキー、値のタプルでデータを格納する柔軟なスキーマ設計が可能です。 シンプルなキーバリュー、またはJSONのような柔軟なドキュメント構造をサポートします。
エコシステムとロックイン オープンソース互換による移植性 AWSエコシステムに最適化
オープンソースのCassandraと互換性があるため、将来的にセルフホストのCassandraや他の互換サービスへの移行が比較的容易です。 AWSの各サービスと最も緊密に統合されていますが、AWS独自のサービスであるため、他のクラウドへの移行は困難になる可能性があります。
一貫性 調整可能(LOCAL_QUORUMなど) 調整可能(強整合性 or 結果整合性)
CQLクエリごとに一貫性レベル(LOCAL_ONE, LOCAL_QUORUMなど)を指定します。Cassandraと同様の調整が可能です。 読み込み操作ごとに、1秒以内に反映される「強い整合性」か、最終的に整合性がとれる「結果整合性」を選択できます。

使い分けのポイント
#

  • Amazon Keyspacesを選ぶ場合:

    • 既存のApache Cassandraワークロードをクラウドに移行したい。
    • CassandraのデータモデルやCQLの知識・経験を持つチームがいる。
    • 将来的なベンダーロックインを避け、移植性を重視したい。
  • DynamoDBを選ぶ場合:

    • 新規にAWS上でアプリケーションを構築する。
    • AWSの他サービスとの連携を最大限に活用したい。
    • シンプルなキーバリューまたはドキュメントモデルで要件を満たせる。

簡単に言うと、**Keyspacesは「Cassandraの運用から解放される」**ことが最大のメリットであり、**DynamoDBは「AWSネイティブ開発の俊敏性とシンプルさ」**が最大のメリットです。

Reply by Email

関連記事

【AWSデイリーアップデート】Step Functions分散マップ強化!Bedrockに新AIモデル続々登場
· loading · loading
【AWSデイリーアップデート】CloudWatchでログ一元化!Lambdaもクロスアカウントコンテナ対応
· loading · loading
【AWSデイリーアップデート】S3条件付き削除でデータ保護強化!AppStream 2.0が分数GPU対応
· loading · loading