## 情報源
- URL: https://www.youtube.com/watch?v=Nl5TksP7AJA
- チャンネル: AI is in Wonderland
- 投稿日: 2026-05-26
- スコア: 85/100
## 主要な発見
### エージェント能力特化型モデルへの進化
- **MCP Atlas Benchでエージェントツール利用能力世界1位(83.6%)**: Claude Opus 4.7(77.3%)・GPT-5.5を上回る
- **出力速度約4倍**: 他フロンティアモデル比。フロントエンド開発の反復が極めて高速
- **AntiGravity 2.0でのマルチエージェント実行に特化**して設計・訓練
- **thinking_levelパラメーター**: Minimal/Low/Medium/Highの4段階で思考深度を調整可能
### コスト構造の変化(「Flash=安い」の常識崩壊)
- 入力価格: 前モデル(Gemini 2.5 Flash)比**5倍**に値上げ
- 出力価格: **3.6倍**
- **thinking_level=Highにすると実効コストがGemini 3.1 Proを超える罠**
- デフォルト設定(thinking_level未指定)では高速・見た目コスト低→実際は思考トークンで膨張
### コーディング能力の評価
- タワーディフェンスゲーム3モデル同時対決: GPT-5.5が高品質、Gemini 3.5 Flashは**最速**
- ケアレスミスあり(URLスラッシュ重複など)→**複雑デバッグはClaude Opus 4.6/4.7に委譲が有効**
- 単純なコード生成・反復修正は圧倒的速度優位
### ハルシネーション傾向
- 長いコンテキストで会話履歴に引きずられる「媚びた回答」が出やすい
- テキスト圧縮・要約タスクでは情報精度が低下する場合あり
## 使い分けガイドライン
| 用途 | 推奨モデル |
|------|-----------|
| マルチエージェント オーケストレーター | **Gemini 3.5 Flash** |
| 複雑推論・アーキテクチャ設計 | Claude Opus 4.7 |
| 単純チャット・分類 | Claude Haiku 4.5 / Grok 4.3 |
| 超低コストバッチ | Gemini 3.1 Flash Lite |
## コスト注意事項
- `thinking_level=high` は避けるか意図的に使用する(コスト3.1 Pro超え)
- API利用者はサブスク(Gemini AI Pro 月額2,900円)の方がコスト予測しやすい場合あり
## アクションアイテム
- vvv-botsのマルチエージェントパイプラインにGemini 3.5 Flash(Vertex AI経由)の採用検討
- thinking_levelパラメーター設定ガイドをllm-cost-model.mdに追記
- AntiGravity 2.0でGemini Flash連携検証(orc役割割当)
Gemini 3.5 Flash 徹底検証 2026-05-26