Research Signal
アーカイブ
公開済みレポートを日付順に一覧化しています。
アーカイブ
アーカイブ
公開済みレポートを日付順に一覧化しています。
MCP、A2A、AG-UI が AI エージェントの接続層を分け始めた
2026年3月末までの OpenAI、Anthropic、Google、Microsoft、AWS、MCP、A2A、AG-UI の一次情報を並べると、AI エージェントの接続面は 1 つの巨大な製品面ではなく、MCP によるツールとデータ接続、A2A によるエージェント間委任、AG-UI による人間向けの状態表示と承認導線へ分かれ始めていることが見えてくる。今週の変化は、これが概念論ではなく、各社のランタイム、フレームワーク、プラットフォーム docs に実装面として現れ始めた点にある。
動画生成AIはどこまで実用品になったのか、主要5製品の最新状況と技術の流れを整理する
OpenAI、Google、Adobe、Runway、Luma の公式資料と動画生成の主要論文を重ねると、動画生成AIは「何でもできる魔法の1本」ではなく、音声付きの短尺、商用安全性、参照画像による一貫性、編集連携、低コスト試作といった軸で製品が分化してきたことが見えてくる。本稿は主要5製品の最新リリース状況を整理しつつ、diffusion、時間的一貫性、参照制御、world model 的な発想がなぜ使いやすさを押し上げたのかを非技術者向けに平易に説明し、用途別の向き不向きと導入時の注意点をまとめる。
AI エージェントの ID 管理は認証認可の統制基盤になり始めた
Microsoft Entra Agent ID、Microsoft Purview、Amazon Bedrock AgentCore Identity / Policy、Amazon Bedrock Guardrails、Google Cloud Agent Identity、AI Protection、NVIDIA NeMo Guardrails、MCP/A2A、Okta/Auth0 の一次情報を横断すると、AI エージェントは単なるサービス アカウントではなく、固有 ID、ユーザー委任、プロトコル認証、統制を束ねた基盤として扱われ始めている。本稿はその収束点を整理し、各サービスがどの方向に属するか、対向サービスがどのように権限を与えるか、そしてプラットフォーム別にどのような導入像が現れているかを比較する。
Cowork は、職場AIが長時間動くエージェントの仕組みへ広がり始めたというシグナル
Anthropic の Cowork と Microsoft の Copilot Cowork を起点に、Google Gemini Enterprise、Slack Agentforce、OpenAI の deep research / ChatGPT agent / Codex を並べると、職場AIは単一の実行機能へ移るというより、推論・実行・管理を束ねた、長時間動くエージェントの仕組みへ広がっていることが見えてくる。公開資料と主要論文をもとに、各社の役割分担、ユースケース、戦略差、実務上の制約まで整理する。
なぜ生成AIアプリはチャットUIに収束するのか、そしてなぜチャットだけでは終わらないのか
OpenAI、Microsoft、Google、Anthropic、Claude Cowork の公式発表と HCI 系の論文を重ねると、生成AIアプリがまずチャットUIに寄る理由は、自然言語が最も安い汎用入力だからである一方、実務化が進むほど状態表示、承認、進捗監督、成果物編集のための画面を周辺に必要とすることが見えてくる。チャットUIが消えるのではなく、対話を起点にした操作基盤へ複合化していく流れを整理する。
AI agent の競争軸に security gate が入り始めた
2026年3月前半の OpenAI、Anthropic、Microsoft、AWS、Google Cloud の一次情報を横断すると、agent の競争軸は精度や orchestration だけではなく、prompt injection 耐性、tool policy、red teaming、approval、sandboxing をどこまで製品面に組み込めるかへ広がっている。公開資料から読み取れる収束点を整理し、secure code review、社内データ活用、ブラウザ操作、approval-heavy workflow の現実的な導入シナリオまで落とし込む。
AI エージェント導入の焦点は、単体性能競争から運用基盤設計へ
ReAct、Toolformer、AgentBench、WebArena、SWE-bench、OSWorld などの研究と、OpenAI、Anthropic、Google、Microsoft、AWS の公式ドキュメントを通して、企業導入の焦点が単体性能競争から、ツール接続、評価、安全性、監督を備えた運用基盤設計へ移っていることを整理し、ソフトウェア開発、ブラウザ操作、社内ナレッジ活用、FinOps などの具体ユースケースまで落とし込む。
agent architecture は model novelty よりも重要な比較軸になっていく
2025年を通して積み上がった公式発表と研究ベンチマークから、protocol、SDK、runtime、evals、approval を束ねた architecture が agent 導入の主論点になっている。
control plane と eval discipline が、agent 導入の速度を決め始める
Anthropic の evals 記事まで含めると、agent を supervised worker として扱う発想がよりはっきりし、control plane と regression evaluation の有無が rollout 速度を左右している。
2025年を通して見えてきたのは、operational boundary の明確化だ
2025 年を通して見ると、agent stack の主戦場は model novelty より、control plane、protocol、evaluation、approval を含む operational boundary に移っている。
multi-agent workflow そのものが product surface になり始める
Foundry Agent Service の multi-agent workflows preview により、visual builder、YAML definition、templates、variables、observability、evaluators を備えた workflow 自体が product surface として見え始めている。
workflow tooling が agent の複雑さに追いつき始める
OpenAI AgentKit、Microsoft Agent Framework、Claude Agent SDK、GPT-5 for developers がそろい、agent graph、connector、chat UI、trace grading、workflow orchestration をまとめて扱う tooling layer が実体を持ち始めている。
agent SDK は coding 補助の外へ広がり、汎用 workflow の部品になり始める
Claude Agent SDK、Looker MCP Server、Firestore 対応 MCP Toolbox、Agent Factory、Microsoft Agent Framework により、agent SDK は code helper 専用ではなく、データ接続・権限設計・control plane を含む汎用 application layer として見られ始めている。
coding と research をまたぐ agent が、より広い業務へ踏み出し始める
GPT-5 for developers と Looker MCP Server の発表により、coding agent と data-connected analyst の境界が薄れ、コード・データ・文書を横断する assistant の像が濃くなっている。
AgentOps は補助機能ではなく control layer として扱われ始める
Foundry・OpenAI・Google の発表を通じて、agent stack の競争は trace、review、observability、tool governance といった control layer へ移っている。
相互運用性は roadmap 上の理想論ではなく、接続設計の前提になり始める
Google の A2A donation と MCP integrations、Microsoft Foundry の A2A / MCP / OpenAPI、OpenAI Responses API の remote MCP support により、agent 間接続やデータ接続は current architecture の一部になっている。
multi-agent 設計は、概念図ではなく運用モデルとして扱われ始める
Foundry Agent Service GA、Developer Essentials、OpenAI Responses API の更新、Semantic Kernel の orchestration 発表が重なり、multi-agent をどう分担・評価・監査するかが現実の設計課題になっている。
open runtime と managed platform が、同じ設計図の上で接続され始める
OpenAI の agent building 基盤、AWS の multi-agent collaboration GA と human confirmation、Google の multi-system agents と A2A、Anthropic の Code with Claude、Microsoft の Semantic Kernel Agents GA が重なり、open protocol・hosted execution・承認設計を分けて考える見方が強まっている。
managed agent の基本プリミティブが、複数ベンダーで一気に出そろい始める
OpenAI の new tools for building agents と AWS の multi-agent collaboration GA により、agent runtime、tooling、multi-agent coordination は製品レイヤーの比較対象になっている。
AI エージェント評価は、あとから足す項目ではなく導入ゲートになっていく
研究ベンチマークの増加と各社発表の流れにより、prototype agent と production candidate を分ける軸は、派手さよりも評価・再現性・監督へ移っている。
ブラウザ操作系エージェントが、研究テーマから製品ロードマップへ入ってくる
Operator、AutoGen v0.4、computer use 系の研究と発表が重なり、ブラウザ操作や durable orchestration は近未来の話ではなく、製品計画の中で扱うテーマになっている。
AI エージェントは、派手なデモから測定可能なシステム設計へ
ReAct から BrowserGym までの研究と、Anthropic・AWS・Google の公式発表を合わせて読むと、関心は prompt 実験から、ツール接続、環境操作、評価可能なシステム設計へ移っている。