Gemini 3.5 Flash 徹底検証 2026-05-26

## 情報源
- URL: https://www.youtube.com/watch?v=Nl5TksP7AJA
- チャンネル: AI is in Wonderland
- 投稿日: 2026-05-26
- スコア: 85/100

## 主要な発見

### エージェント能力特化型モデルへの進化
- **MCP Atlas Benchでエージェントツール利用能力世界1位（83.6%）**: Claude Opus 4.7（77.3%）・GPT-5.5を上回る
- **出力速度約4倍**: 他フロンティアモデル比。フロントエンド開発の反復が極めて高速
- **AntiGravity 2.0でのマルチエージェント実行に特化**して設計・訓練
- **thinking_levelパラメーター**: Minimal/Low/Medium/Highの4段階で思考深度を調整可能

### コスト構造の変化（「Flash=安い」の常識崩壊）
- 入力価格: 前モデル(Gemini 2.5 Flash)比**5倍**に値上げ
- 出力価格: **3.6倍**
- **thinking_level=Highにすると実効コストがGemini 3.1 Proを超える罠**
- デフォルト設定（thinking_level未指定）では高速・見た目コスト低→実際は思考トークンで膨張

### コーディング能力の評価
- タワーディフェンスゲーム3モデル同時対決: GPT-5.5が高品質、Gemini 3.5 Flashは**最速**
- ケアレスミスあり（URLスラッシュ重複など）→**複雑デバッグはClaude Opus 4.6/4.7に委譲が有効**
- 単純なコード生成・反復修正は圧倒的速度優位

### ハルシネーション傾向
- 長いコンテキストで会話履歴に引きずられる「媚びた回答」が出やすい
- テキスト圧縮・要約タスクでは情報精度が低下する場合あり

## 使い分けガイドライン

| 用途 | 推奨モデル |
|------|-----------|
| マルチエージェントオーケストレーター | **Gemini 3.5 Flash** |
| 複雑推論・アーキテクチャ設計 | Claude Opus 4.7 |
| 単純チャット・分類 | Claude Haiku 4.5 / Grok 4.3 |
| 超低コストバッチ | Gemini 3.1 Flash Lite |

## コスト注意事項
- `thinking_level=high` は避けるか意図的に使用する（コスト3.1 Pro超え）
- API利用者はサブスク（Gemini AI Pro 月額2,900円）の方がコスト予測しやすい場合あり

## アクションアイテム
- vvv-botsのマルチエージェントパイプラインにGemini 3.5 Flash（Vertex AI経由）の採用検討
- thinking_levelパラメーター設定ガイドをllm-cost-model.mdに追記
- AntiGravity 2.0でGemini Flash連携検証（orc役割割当）

yt-learn gemini gemini-3.5-flash multi-agent cost 2026-05-26