AWS Lambdaマネージドインスタンスの活用法【SES案件対応】

⚡ 3秒でわかる！この記事のポイント

Lambdaマネージドインスタンスはre:Invent 2025で発表された新機能 — EC2の性能をLambdaの手軽さで利用可能
15分制限の撤廃・GPU対応・高メモリ構成で、従来Lambdaでは対応できなかったワークロードに対応
SES案件ではAI/ML推論・バッチ処理の経験がアピールポイントになる

AWS re:Invent 2025で発表されたLambdaマネージドインスタンスは、サーバーレスの概念を大きく拡張する新機能です。従来のLambdaの15分実行時間制限やメモリ制約を超え、EC2インスタンスのコンピューティング能力をLambdaのプログラミングモデルで利用できるようになりました。

この記事では、Lambdaマネージドインスタンスの仕組みからSES案件での活用ポイントまで解説します。

この記事でわかること

Lambdaマネージドインスタンスの特徴と従来Lambdaとの違い
主要なユースケースと適用シーン
SAM/CDKでのデプロイ手順
コスト最適化戦略
SES案件でアピールする方法

Lambda マネージドインスタンスとは

従来のLambdaとの違い

Lambdaマネージドインスタンスは、従来のLambdaと以下の点で異なります。

比較項目	従来のLambda	マネージドインスタンス
最大実行時間	15分	無制限（設定可能）
メモリ	最大10GB	最大256GB
vCPU	最大6	最大96
GPU	非対応	NVIDIA T4/A10G対応
ストレージ	/tmp 10GB	EBS マウント可能
課金単位	1ms単位	秒単位（インスタンスタイプ）
コールドスタート	あり	最小インスタンス数で回避可能

プログラミングモデル（ハンドラー関数の書き方）は従来のLambdaと同じなので、既存のLambda関数からの移行が容易です。

EC2コンピューティング上でのサーバーレス体験

マネージドインスタンスの内部では、AWSが管理するEC2インスタンス上でLambdaランタイムが動作します。エンジニアはOS管理やパッチ適用を意識する必要がなく、純粋にアプリケーションコードに集中できます。

AWS公式ブログ（AWS Compute Blog）では、「サーバーレスとサーバーフルの境界を解消する」と表現されています。

ユースケースと適用シーン

長時間実行ワークロード

従来のLambdaでは15分の実行時間制限がありましたが、マネージドインスタンスではこの制限がなくなります。

ETLパイプライン: 大量データの変換・ロード処理
動画エンコーディング: 長尺動画のトランスコーディング
データマイグレーション: DB間のデータ移行処理
レポート生成: 複雑な集計を伴う定期レポート

GPUを必要とするAI/ML推論

GPU対応により、機械学習の推論ワークロードをサーバーレスで実行できるようになりました。

import torch
from transformers import pipeline

def handler(event, context):
    # GPU上でモデル推論を実行
    classifier = pipeline("sentiment-analysis", device="cuda")
    result = classifier(event["text"])
    return {"statusCode": 200, "body": result}

対応GPUインスタンスは以下の通りです。

ml.g4dn（NVIDIA T4）: コスト重視の推論
ml.g5（NVIDIA A10G）: 高性能推論
ml.p4d（NVIDIA A100）: 大規模モデルの推論

高メモリ・高CPUバッチ処理

データ分析やシミュレーションなど、メモリ集約型のワークロードにも対応します。

大規模CSVファイルのインメモリ処理
金融シミュレーション（モンテカルロ法など）
画像・音声の一括処理

Lambdaマネージドインスタンスのアーキテクチャ

アーキテクチャと仕組み

インスタンスタイプの選択

マネージドインスタンスでは、Lambda関数にEC2インスタンスタイプを指定します。

# SAM テンプレート
Resources:
  MyFunction:
    Type: AWS::Serverless::Function
    Properties:
      Handler: app.handler
      Runtime: python3.13
      ManagedInstance:
        InstanceType: ml.g4dn.xlarge
        MinInstances: 1
        MaxInstances: 10

スケーリングポリシーの設定

従来のLambdaの同時実行数に相当する、インスタンス数ベースのスケーリングを設定できます。

ScalingPolicy:
  MinInstances: 1         # 常時1台は起動（コールドスタート回避）
  MaxInstances: 10        # 最大10台までスケール
  TargetUtilization: 70   # CPU使用率70%でスケールアウト
  ScaleInCooldown: 300    # スケールイン待機5分

既存Lambda関数からの移行パス

既存のLambda関数をマネージドインスタンスに移行する手順は以下の通りです。

互換性確認: ハンドラー関数の構造はそのまま使用可能
設定追加: ManagedInstanceセクションをSAMテンプレートに追加
テスト: ローカルでの動作確認（sam local invoke）
デプロイ: 段階的にトラフィックを移行

ハンズオン — マネージドインスタンスのデプロイ

SAM / CDKでのテンプレート例

AWS SAMの場合:

AWSTemplateFormatVersion: '2010-09-09'
Transform: AWS::Serverless-2016-10-31

Resources:
  MLInferenceFunction:
    Type: AWS::Serverless::Function
    Properties:
      Handler: inference.handler
      Runtime: python3.13
      Timeout: 900
      ManagedInstance:
        InstanceType: ml.g4dn.xlarge
        MinInstances: 0
        MaxInstances: 5
      Events:
        ApiEvent:
          Type: Api
          Properties:
            Path: /predict
            Method: post

AWS CDKの場合:

import * as lambda from 'aws-cdk-lib/aws-lambda';

const inferenceFunction = new lambda.Function(this, 'MLInference', {
  runtime: lambda.Runtime.PYTHON_3_13,
  handler: 'inference.handler',
  code: lambda.Code.fromAsset('lambda'),
  managedInstance: {
    instanceType: 'ml.g4dn.xlarge',
    minInstances: 0,
    maxInstances: 5,
  },
});

モニタリングとCloudWatchメトリクス

マネージドインスタンス固有のメトリクスが追加されています。

メトリクス	説明
ManagedInstanceCount	現在のインスタンス数
InstanceCPUUtilization	インスタンスのCPU使用率
InstanceMemoryUtilization	メモリ使用率
GPUUtilization	GPU使用率（GPU対応時）
InstanceBootTime	インスタンス起動時間

AWS Lambda完全ガイドで、従来のLambdaの基礎も確認しましょう。

コスト最適化戦略

標準Lambda vs マネージドインスタンスのコスト比較

どちらが安いかは、ワークロードのパターンによって異なります。

シナリオ	標準Lambda	マネージドインスタンス	推奨
短時間・低頻度（1日100回×1秒）	$0.02/日	$2.40/日	標準Lambda
短時間・高頻度（1日10万回×1秒）	$20/日	$2.40/日	マネージドインスタンス
長時間バッチ（1日5回×30分）	不可（15分制限）	$3.00/日	マネージドインスタンス
GPU推論（1日1000回×5秒）	不可	$8.00/日	マネージドインスタンス

Savings Plansとの組み合わせ

マネージドインスタンスはCompute Savings Plansの対象であり、1年または3年のコミットメントで最大40%の割引が適用されます。

AWSサーバーレス入門で、サーバーレスアーキテクチャ全体のコスト最適化を解説しています。

SES案件での活用ポイント

面談でアピールできる技術要素

Lambdaマネージドインスタンスの経験は、以下の案件で特にアピールポイントになります。

AI/MLプラットフォーム構築案件: GPU推論環境の設計・構築
データエンジニアリング案件: 大規模ETLパイプラインの最適化
モダナイゼーション案件: EC2ワークロードのサーバーレス移行
コスト最適化案件: 既存インフラのコスト削減提案

面談での説明例: 「従来EC2で実行していたML推論ワークロードをLambdaマネージドインスタンスに移行し、インフラ管理コストを削減しつつスケーラビリティを向上させた経験があります」

まとめ — サーバーレスの次のステージへ

Lambdaマネージドインスタンスは、サーバーレスとサーバーフルの良いところを組み合わせた画期的な機能です。

ポイントを整理します。

✅ 15分の実行時間制限がなくなり、長時間ワークロードに対応
✅ GPU対応でAI/ML推論をサーバーレスで実行可能
✅ EC2と同じハンドラー関数のプログラミングモデルで移行が容易
✅ Savings Plansでコスト最適化が可能
✅ SES案件でのアピールポイントとして高い訴求力

まずはSAMテンプレートでデプロイを試し、既存のLambdaワークロードで移行候補を探してみてください。

AWS完全攻略シリーズをもっと読む

AWSの各サービスをSESエンジニア向けに体系的に学びたい方は、完全攻略シリーズの他のエピソードもチェックしてください。

シリーズ一覧を見る →

AWS Lambdaマネージドインスタンスの活用法【SES案件対応】

Lambda マネージドインスタンスとは

従来のLambdaとの違い

EC2コンピューティング上でのサーバーレス体験

ユースケースと適用シーン

長時間実行ワークロード

GPUを必要とするAI/ML推論

高メモリ・高CPUバッチ処理

アーキテクチャと仕組み

インスタンスタイプの選択

スケーリングポリシーの設定

既存Lambda関数からの移行パス

ハンズオン — マネージドインスタンスのデプロイ

SAM / CDKでのテンプレート例

モニタリングとCloudWatchメトリクス

コスト最適化戦略

標準Lambda vs マネージドインスタンスのコスト比較

Savings Plansとの組み合わせ

SES案件での活用ポイント

面談でアピールできる技術要素

関連するAWS資格と学習ロードマップ

まとめ — サーバーレスの次のステージへ

SES BASE 編集長

AWS Lambdaマネージドインスタンスの活用法【SES案件対応】

Lambda マネージドインスタンスとは

従来のLambdaとの違い

EC2コンピューティング上でのサーバーレス体験

ユースケースと適用シーン

長時間実行ワークロード

GPUを必要とするAI/ML推論

高メモリ・高CPUバッチ処理

アーキテクチャと仕組み

インスタンスタイプの選択

スケーリングポリシーの設定

既存Lambda関数からの移行パス

ハンズオン — マネージドインスタンスのデプロイ

SAM / CDKでのテンプレート例

モニタリングとCloudWatchメトリクス

コスト最適化戦略

標準Lambda vs マネージドインスタンスのコスト比較

Savings Plansとの組み合わせ

SES案件での活用ポイント

面談でアピールできる技術要素

関連するAWS資格と学習ロードマップ

まとめ — サーバーレスの次のステージへ

SES BASE 編集長

関連記事