## 情報源
- URL: https://youtube.com/watch?v=n6Z8nt35c7Y
- タイトル: 【ゆっくり解説】NTTの国産AI「tsuzumi 2 Vision」がスゴい!図表まで読む日本語特化LLMとは
- ジャンル: tech / 国産LLM・エンタープライズAI
- 投稿日: 2026年5月(tsuzumi 2 Vision は2026-05-19発表)
- スコア: 約78/100(技術仕様明確・マクロトレンド価値あり)
## 技術仕様(動画で言及された数値)
- **パラメータ数**: 300億(30B)パラメータ
- **必要GPU**: NVIDIA A100クラス(40GBメモリ)GPU 1基で稼働可能
- **対応モダリティ**: テキスト + 画像(Vision)。文章をテキスト変換せず「画像」として丸ごと認識し、表のレイアウト・グラフの形・フロー図を正確に読解
- **アーキテクチャ**: 既存「tsuzumi 2」をベースに、文字/図表理解用の「独自アダプター(後付け部品)」を追加した構造
- **リリース**: 2026-05-19発表(土台の tsuzumi 2 は2025-10登場)
## 主要な発見
1. **「なんでも屋」ではなく「日本語ビジネス文書の専門店」戦略**: 巨大海外モデルが膨大な知識量と汎用推論で勝負するのに対し、tsuzumi は日本語ビジネス文書処理に特化。NTT独自テストでは同サイズ帯でLlama 4 Scout・GPT-5.2と同等の読解力とされる
2. **画像アダプターで図表をネイティブ読解**: OCRでテキスト化せず画像のまま認識するため、表レイアウト・グラフ・フロー図の意味を保持して理解できる
3. **ソブリンAI(純国産)**: 学習データから開発までNTTが自前管理。著作権・データ主権が守られ、国・大企業が安全に利用できる。巨大単一モデルでなく小型特化AIを複数連携させる「AIコンステレーション」構想
4. **オンプレ対応が最大のメリット**: 軽量(GPU1基)なので自社サーバーで稼働可。契約書・財務資料などの機密情報を外部に出さず処理できる。※API提供有無は動画では言及なし
5. **ツール呼び出し機能搭載**: 数値計算能力向上に加え、必要時に外部ソフトを使う tool calling 対応
## 想定ユースケース
- 金融機関: 融資審査の数字が並んだ表からの必要項目自動抽出
- 技術・保守現場: 矢印で繋がったフロー図を読み取りトラブル原因判断を支援
- 医療・行政: 機密性の高い会議資料・書類を電子化/DB化し「業務デジタル化のラストマイル」を解決
## アクションアイテム
- 機密データを外部APIに出せない要件(vvv の社内資料処理など)が出た場合、オンプレ国産LLM選択肢として tsuzumi 2 Vision を評価候補に
- 図表/PDFの構造化抽出タスク(vvv-bots detail_llm の帳票系拡張)でVisionアダプター型モデルの検証価値あり
- 現状の shadow ポリシー(中華系API不使用)と整合する純国産モデルとして、NVIDIA NIM等のフォールバック群に並べて将来比較
## 既存知識との関係
- [[feedback_no_chinese_apis]] 中華系API不使用ポリシーと整合(純国産・ソブリンAI)
- マクロトレンド: エンタープライズAIが「生成」から「governance/データ主権」へ移行(2026-05-12 AIM Network論と一致)
NTT tsuzumi 2 Vision — 図表読解する日本語特化ソブリンAI 2026-05-31