- Lambdaマネージドインスタンスはre:Invent 2025で発表された新機能 — EC2の性能をLambdaの手軽さで利用可能
- 15分制限の撤廃・GPU対応・高メモリ構成で、従来Lambdaでは対応できなかったワークロードに対応
- SES案件ではAI/ML推論・バッチ処理の経験がアピールポイントになる
AWS re:Invent 2025で発表されたLambdaマネージドインスタンスは、サーバーレスの概念を大きく拡張する新機能です。従来のLambdaの15分実行時間制限やメモリ制約を超え、EC2インスタンスのコンピューティング能力をLambdaのプログラミングモデルで利用できるようになりました。
この記事では、Lambdaマネージドインスタンスの仕組みからSES案件での活用ポイントまで解説します。
- Lambdaマネージドインスタンスの特徴と従来Lambdaとの違い
- 主要なユースケースと適用シーン
- SAM/CDKでのデプロイ手順
- コスト最適化戦略
- SES案件でアピールする方法
Lambda マネージドインスタンスとは
従来のLambdaとの違い
Lambdaマネージドインスタンスは、従来のLambdaと以下の点で異なります。
| 比較項目 | 従来のLambda | マネージドインスタンス |
|---|---|---|
| 最大実行時間 | 15分 | 無制限(設定可能) |
| メモリ | 最大10GB | 最大256GB |
| vCPU | 最大6 | 最大96 |
| GPU | 非対応 | NVIDIA T4/A10G対応 |
| ストレージ | /tmp 10GB | EBS マウント可能 |
| 課金単位 | 1ms単位 | 秒単位(インスタンスタイプ) |
| コールドスタート | あり | 最小インスタンス数で回避可能 |
プログラミングモデル(ハンドラー関数の書き方)は従来のLambdaと同じなので、既存のLambda関数からの移行が容易です。
EC2コンピューティング上でのサーバーレス体験
マネージドインスタンスの内部では、AWSが管理するEC2インスタンス上でLambdaランタイムが動作します。エンジニアはOS管理やパッチ適用を意識する必要がなく、純粋にアプリケーションコードに集中できます。
AWS公式ブログ(AWS Compute Blog)では、「サーバーレスとサーバーフルの境界を解消する」と表現されています。
ユースケースと適用シーン
長時間実行ワークロード
従来のLambdaでは15分の実行時間制限がありましたが、マネージドインスタンスではこの制限がなくなります。
- ETLパイプライン: 大量データの変換・ロード処理
- 動画エンコーディング: 長尺動画のトランスコーディング
- データマイグレーション: DB間のデータ移行処理
- レポート生成: 複雑な集計を伴う定期レポート
GPUを必要とするAI/ML推論
GPU対応により、機械学習の推論ワークロードをサーバーレスで実行できるようになりました。
import torch
from transformers import pipeline
def handler(event, context):
# GPU上でモデル推論を実行
classifier = pipeline("sentiment-analysis", device="cuda")
result = classifier(event["text"])
return {"statusCode": 200, "body": result}
対応GPUインスタンスは以下の通りです。
- ml.g4dn(NVIDIA T4): コスト重視の推論
- ml.g5(NVIDIA A10G): 高性能推論
- ml.p4d(NVIDIA A100): 大規模モデルの推論
高メモリ・高CPUバッチ処理
データ分析やシミュレーションなど、メモリ集約型のワークロードにも対応します。
- 大規模CSVファイルのインメモリ処理
- 金融シミュレーション(モンテカルロ法など)
- 画像・音声の一括処理

アーキテクチャと仕組み
インスタンスタイプの選択
マネージドインスタンスでは、Lambda関数にEC2インスタンスタイプを指定します。
# SAM テンプレート
Resources:
MyFunction:
Type: AWS::Serverless::Function
Properties:
Handler: app.handler
Runtime: python3.13
ManagedInstance:
InstanceType: ml.g4dn.xlarge
MinInstances: 1
MaxInstances: 10
スケーリングポリシーの設定
従来のLambdaの同時実行数に相当する、インスタンス数ベースのスケーリングを設定できます。
ScalingPolicy:
MinInstances: 1 # 常時1台は起動(コールドスタート回避)
MaxInstances: 10 # 最大10台までスケール
TargetUtilization: 70 # CPU使用率70%でスケールアウト
ScaleInCooldown: 300 # スケールイン待機5分
既存Lambda関数からの移行パス
既存のLambda関数をマネージドインスタンスに移行する手順は以下の通りです。
- 互換性確認: ハンドラー関数の構造はそのまま使用可能
- 設定追加:
ManagedInstanceセクションをSAMテンプレートに追加 - テスト: ローカルでの動作確認(
sam local invoke) - デプロイ: 段階的にトラフィックを移行
ハンズオン — マネージドインスタンスのデプロイ
SAM / CDKでのテンプレート例
AWS SAMの場合:
AWSTemplateFormatVersion: '2010-09-09'
Transform: AWS::Serverless-2016-10-31
Resources:
MLInferenceFunction:
Type: AWS::Serverless::Function
Properties:
Handler: inference.handler
Runtime: python3.13
Timeout: 900
ManagedInstance:
InstanceType: ml.g4dn.xlarge
MinInstances: 0
MaxInstances: 5
Events:
ApiEvent:
Type: Api
Properties:
Path: /predict
Method: post
AWS CDKの場合:
import * as lambda from 'aws-cdk-lib/aws-lambda';
const inferenceFunction = new lambda.Function(this, 'MLInference', {
runtime: lambda.Runtime.PYTHON_3_13,
handler: 'inference.handler',
code: lambda.Code.fromAsset('lambda'),
managedInstance: {
instanceType: 'ml.g4dn.xlarge',
minInstances: 0,
maxInstances: 5,
},
});
モニタリングとCloudWatchメトリクス
マネージドインスタンス固有のメトリクスが追加されています。
| メトリクス | 説明 |
|---|---|
| ManagedInstanceCount | 現在のインスタンス数 |
| InstanceCPUUtilization | インスタンスのCPU使用率 |
| InstanceMemoryUtilization | メモリ使用率 |
| GPUUtilization | GPU使用率(GPU対応時) |
| InstanceBootTime | インスタンス起動時間 |
AWS Lambda完全ガイドで、従来のLambdaの基礎も確認しましょう。
コスト最適化戦略
標準Lambda vs マネージドインスタンスのコスト比較
どちらが安いかは、ワークロードのパターンによって異なります。
| シナリオ | 標準Lambda | マネージドインスタンス | 推奨 |
|---|---|---|---|
| 短時間・低頻度(1日100回×1秒) | $0.02/日 | $2.40/日 | 標準Lambda |
| 短時間・高頻度(1日10万回×1秒) | $20/日 | $2.40/日 | マネージドインスタンス |
| 長時間バッチ(1日5回×30分) | 不可(15分制限) | $3.00/日 | マネージドインスタンス |
| GPU推論(1日1000回×5秒) | 不可 | $8.00/日 | マネージドインスタンス |
Savings Plansとの組み合わせ
マネージドインスタンスはCompute Savings Plansの対象であり、1年または3年のコミットメントで最大40%の割引が適用されます。
AWSサーバーレス入門で、サーバーレスアーキテクチャ全体のコスト最適化を解説しています。
SES案件での活用ポイント
面談でアピールできる技術要素
Lambdaマネージドインスタンスの経験は、以下の案件で特にアピールポイントになります。
- AI/MLプラットフォーム構築案件: GPU推論環境の設計・構築
- データエンジニアリング案件: 大規模ETLパイプラインの最適化
- モダナイゼーション案件: EC2ワークロードのサーバーレス移行
- コスト最適化案件: 既存インフラのコスト削減提案
面談での説明例: 「従来EC2で実行していたML推論ワークロードをLambdaマネージドインスタンスに移行し、インフラ管理コストを削減しつつスケーラビリティを向上させた経験があります」
関連するAWS資格と学習ロードマップ
マネージドインスタンスの知識は、以下のAWS資格の取得にも役立ちます。
- AWS Solutions Architect Associate(SAA): アーキテクチャ設計の基礎
- AWS Developer Associate(DVA): Lambda関数の開発・デプロイ
- AWS Machine Learning Specialty: GPU推論の設計・最適化
- AWS DevOps Professional: CI/CDパイプラインとの統合
AWS Lambda Durable Functionsで、Lambdaの応用パターンも確認してください。
まとめ — サーバーレスの次のステージへ
Lambdaマネージドインスタンスは、サーバーレスとサーバーフルの良いところを組み合わせた画期的な機能です。
ポイントを整理します。
- ✅ 15分の実行時間制限がなくなり、長時間ワークロードに対応
- ✅ GPU対応でAI/ML推論をサーバーレスで実行可能
- ✅ EC2と同じハンドラー関数のプログラミングモデルで移行が容易
- ✅ Savings Plansでコスト最適化が可能
- ✅ SES案件でのアピールポイントとして高い訴求力
まずはSAMテンプレートでデプロイを試し、既存のLambdaワークロードで移行候補を探してみてください。