2026/6/12 9:00:00 ~ 2026/6/15 9:00:00 (JST)

最近の発表

SageMaker AI now supports serverless fine-tuning for Nvidia Nemotron models

Amazon SageMaker AI は、教師付き微調整 (SFT) と強化微調整 (RFT) を使用した Nvidia Nemotron 3 Nano モデルのサーバーレスモデルカスタマイズをサポートするようになりました。これは Nvidia の人気のオープンウェイトモデルで、合計パラメータ数は 30 B です。このモデルを SageMaker AI にデプロイするだけでなく、特定のドメインやワークフローにも適用できるようになりました。\n モデルのカスタマイズにより、ドメイン固有のタスクの精度を向上させたり、アウトプットを組織のトーンに合わせたり、ラベル付けされたデータを使用して新しいタスクのパフォーマンスを向上させたりするなど、独自のデータに合わせてこれらの基盤モデルを調整できます。サーバーレスのカスタマイズでは、SageMaker AI がインフラストラクチャのプロビジョニングとトレーニングのオーケストレーションをすべて処理するため、ユーザーはクラスター管理ではなくデータと評価に集中でき、支払いは使用した分だけになります。 SageMaker AI 上の Nvidia Nemotron 3 Nano のサーバーレスモデルのカスタマイズは、米国東部 (バージニア北部)、米国西部 (オレゴン)、アジア太平洋 (東京)、およびヨーロッパ (アイルランド) でご利用いただけます。開始するには、Amazon SageMaker Studio の「モデル」ページに移動してカスタマイズジョブを開始するか、SageMaker Python SDK を使用してプログラムからアクセスしてください。詳細については、Amazon SageMaker AI モデルのカスタマイズドキュメントを参照してください。

Amazon EC2 I7i instances now available in AWS Europe (Paris) Region

AWSは、ストレージに最適化された高性能Amazon EC2 i7iインスタンスがAWSヨーロッパ(パリ)リージョンで利用できるようになったことを発表します。これらの新しいインスタンスは、3.2 GHz のオールコアターボ周波数の第 5 世代 Intel Xeon プロセッサを搭載し、前世代の i4i インスタンスと比較してコンピューティングパフォーマンスが最大 23% 向上し、価格パフォーマンスが 10% 以上向上しています。第 3 世代 AWS Nitro SSD を搭載した i7i インスタンスは、最大 45 TB の NVMe ストレージを提供し、i4i インスタンスと比較して、リアルタイムストレージパフォーマンスが最大 50% 向上し、ストレージ I/O レイテンシーが最大 50% 低くなり、ストレージ I/O レイテンシーの変動が最大 60% 低くなります。\n i7i インスタンスは、Amazon EC2 の x86 ベースのストレージ最適化インスタンスにコンピューティングとストレージのパフォーマンスを提供し、小規模から中サイズのデータセットにアクセスするためにリアルタイムのレイテンシーを伴う非常に高いランダム IOPS パフォーマンスを必要とする、I/O 集約型でレイテンシーの影響を受けやすいワークロードに最適です。さらに、破れた書き込み防止機能は最大 16 KB のブロックサイズをサポートしているため、お客様はデータベースパフォーマンスのボトルネックを解消できます。 i7i インスタンスには 11 種類のサイズ (最大 48xlarge の 9 つの仮想サイズ、2 つのベアメタルサイズ) があり、最大 100 Gbps のネットワーク帯域幅と 60 Gbps の Amazon Elastic Block Store (EBS) 帯域幅を実現します。詳細については、i7i インスタンスページをご覧ください。

Amazon EC2 Capacity Blocks for ML is now available in AWS GovCloud (US) Regions

ML 用 Amazon EC2 キャパシティブロックが AWS GovCloud (米国西部) と AWS GovCloud (米国東部) で利用できるようになりました。これにより、政府および規制対象業界のお客様は、機械学習ワークロード用に GPU 容量を予約できるようになりました。\n EC2 Capacity Blocks for ML では、GPU インスタンスを一定期間事前に予約できるため、短期間の事前トレーニング、微調整、ラピッドプロトタイピング、推論需要の急増に備えて、高速コンピューティングに確実にアクセスできます。キャパシティブロックは Amazon EC2 UltraCluster のコロケーションを通じて、低レイテンシーで高スループットの接続を実現します。

1 ~ 64 インスタンスのクラスターサイズで、最長 6 か月間、最大 8 週間前から容量を予約できます。キャパシティブロックは AWS Resource Access Manager (RAM) を使用して複数のアカウントで共有することもできるため、組織は ML インフラストラクチャへの投資を調整し、リザーブドキャパシティーをワークロード全体で継続的に使用し続けることができます。

AWS GovCloud (米国) では、ML 用 EC2 キャパシティブロックは AWS GovCloud (米国西部) の P6-B200 インスタンス、および AWS GovCloud (米国東部) の P6-B200 および P6-B300 インスタンスで利用できます。開始するには、EC2 キャパシティブロックのドキュメントをご覧ください。

AWS Blogs

Amazon Web Services ブログ (日本語)

AWS Startup ブログ (日本語)

AWS Cloud Operations Blog

AWS Big Data Blog

AWS for Industries

Artificial Intelligence

AWS for M&E Blog

AWS Storage Blog

Open Source Project

AWS CLI

AWS CDK

Amplify for JavaScript