Research Signal

AI Agents

AI agent の実装、運用、評価、ガバナンス、プロトコルの変化を束ねる主要テーマです。

テーマハブ

AI Agents

AI agent の実装、運用、評価、ガバナンス、プロトコルの変化を束ねる主要テーマです。

記事数 28

最新更新 2026年7月11日

GovernanceWorkflowEvaluationMCPRuntimeMulti-Agent

このテーマの最新ブリーフィング

このテーマで直近に公開したレポートの要点を、読む前に短く確認できます。

AI Agents 2026年7月11日

AIエージェントの評価は、回答だけでなく実行経路を測る段階に入った

最終回答、ツール実行、本番運用を分けて測る、AIエージェント評価の新しい設計を整理する。

AI AgentEvaluationObservabilityTool UseGovernance

根拠数

トピック一覧へレポートを開く

このテーマの公開レポート

同じテーマに属する公開済みレポートを新しい順に一覧しています。

AI Agents 2026年5月7日

今週のAIエージェントは、「作る・動かす・統制する基盤」が製品カテゴリとして立ち上がった週だ

AIエージェントを選ぶ基準が、モデル単体ではなく作成・統制・評価を束ねた基盤へ移る理由を短く読む。

AI AgentGovernanceRuntimeEvaluationEnterprise AIMCP

根拠数: 31 レポートを開く

AI Agents 2026年4月27日

AIエージェントの導入判断は、モデル比較より「どこで見つかり、誰が許可するか」で決まる

アプリストアやマーケットプレイスが、発見・承認・権限制御をどう束ね始めたかを短く読む。

AI AgentAppsMarketplaceGovernanceMCPA2A

根拠数: 26 レポートを開く

AI Agents 2026年4月20日

AIエージェントを比べる軸は、「一度うまく答えるか」ではなく「仕事を持ち越せるか」になった

継続タスクを持ち越せるか、状態を残せるか、運用中に観測できるかという比較軸をまとめる。

AI AgentAutomationSessionsObservabilityWorkflowBackground Work

根拠数: 24 レポートを開く

AI Agents 2026年4月13日

コーディングAIエージェントの主戦場は、補助UIではなく監督付き実行基盤にある

計画レビュー、隔離実行、権限制御、ログ、再開性がコーディングAIの比較軸になる理由を読む。

AI AgentCoding AgentSoftware EngineeringRuntimeWorkflowDevOps

根拠数: 39 レポートを開く

AI Agents 2026年4月8日

AIエージェントの記憶は、ベクトル検索から層別システムへ移っている

短期状態、長期記憶、共有記憶、更新ポリシーに分かれる新しいメモリ設計の要点をまとめる。

AI AgentMemoryLong-Term MemoryMulti-AgentRAGWorkflow

根拠数: 34 レポートを開く

AI Agents 2026年4月6日

音声AIエージェントは、デモ機能から運用システムへ移り始めた

speech-to-speech と chained 設計、割り込み、電話接続、テスト自動化まで含む比較軸をまとめる。

Voice AIRealtimeSpeech-to-SpeechContact CenterAI AgentGenerative AI

根拠数: 26 レポートを開く

AI Agents 2026年3月30日

subagents は、実務向けAIの現実的な実装単位になり始めた

どの判断を強いモデルに残し、どの作業を専門subagentへ分けるかという設計論点を読む。

AI AgentSubagentsMulti-AgentWorkflowOrchestrationLLM

根拠数: 27 レポートを開く

AI Agents 2026年3月28日

MCP、A2A、AG-UI が AI エージェントの接続層を分け始めた

ツール接続、エージェント間委任、人間向け承認UIが別レイヤーになり始めた構図を短く読む。

AI AgentMCPA2AAG-UIInteroperabilityProtocol

根拠数: 27 レポートを開く

AI Agents 2026年3月26日

AI エージェントの ID 管理は認証認可の統制基盤になり始めた

固有ID、ユーザー委任、プロトコル認証、統制を束ねる agent identity の新しい役割を整理する。

AI AgentIdentityAuthenticationAuthorizationGovernanceOAuth

根拠数: 36 レポートを開く

AI Agents 2026年3月25日

Cowork は、職場AIが長時間動くエージェントの仕組みへ広がり始めたというシグナル

Cowork を手がかりに、職場AIが推論・実行・管理を束ねる長時間エージェントへ広がる流れを読む。

AI AgentCoworkEnterprise AIWorkflowProductivityGovernance

根拠数: 43 レポートを開く

AI Agents 2026年3月23日

AI agent の競争軸に security gate が入り始めた

prompt injection 耐性、tool policy、approval、sandboxing が security gate になる流れを整理する。

AI AgentSecurityGuardrailsGovernancePrompt InjectionRoundup

根拠数: 26 レポートを開く

AI Agents 2026年3月21日

AI エージェント導入の焦点は、単体性能競争から運用基盤設計へ

企業導入の焦点が、単体性能ではなくツール接続・評価・安全性・監督へ移る流れを読む。

LLMAI AgentBenchmarkOrchestrationUse CaseGovernance

根拠数: 33 レポートを開く

AI Agents 2026年3月1日

agent architecture は model novelty よりも重要な比較軸になっていく

protocol、SDK、runtime、evals、approval を束ねた architecture が比較軸になる流れをまとめる。

AI AgentRoundupArchitectureGovernance

根拠数: 8 レポートを開く

AI Agents 2026年2月1日

control plane と eval discipline が、agent 導入の速度を決め始める

control plane と regression evaluation の有無が rollout 速度を左右する理由を短く整理する。

AI AgentRoundupEvaluationControl Plane

根拠数: 8 レポートを開く

AI Agents 2026年1月1日

2025年を通して見えてきたのは、operational boundary の明確化だ

2025年を通じて、agent stack の主戦場が operational boundary へ移った流れを振り返る。

AI AgentRoundupOperationsStrategy

根拠数: 8 レポートを開く

AI Agents 2025年12月1日

multi-agent workflow そのものが product surface になり始める

visual builder、YAML、observability、evaluators を備えた workflow 自体の product surface 化を整理する。

AI AgentRoundupMulti-AgentWorkflowGovernance

根拠数: 9 レポートを開く

AI Agents 2025年11月1日

workflow tooling が agent の複雑さに追いつき始める

agent graph、connector、chat UI、trace grading を束ねる tooling layer の立ち上がりを読む。

AI AgentRoundupWorkflowRuntimeEvaluation

根拠数: 10 レポートを開く

AI Agents 2025年10月1日

agent SDK は coding 補助の外へ広がり、汎用 workflow の部品になり始める

agent SDK が code helper から、データ接続や権限設計を含む汎用部品へ広がる流れを整理する。

AI AgentRoundupSDKMCPWorkflow

根拠数: 11 レポートを開く

AI Agents 2025年9月1日

coding と research をまたぐ agent が、より広い業務へ踏み出し始める

coding agent と analyst assistant の境界が薄れ、コード・データ・文書を横断する流れを読む。

AI AgentRoundupCoding AgentData Access

根拠数: 7 レポートを開く

AI Agents 2025年8月1日

AgentOps は補助機能ではなく control layer として扱われ始める

trace、review、observability、tool governance が control layer になる動きを整理する。

AI AgentRoundupAgentOpsObservability

根拠数: 8 レポートを開く

AI Agents 2025年7月1日

相互運用性は roadmap 上の理想論ではなく、接続設計の前提になり始める

A2A、MCP、OpenAPI が接続設計の前提になり始めた流れをまとめる。

AI AgentRoundupProtocolMCPInteroperability

根拠数: 10 レポートを開く

AI Agents 2025年6月1日

multi-agent 設計は、概念図ではなく運用モデルとして扱われ始める

multi-agent をどう分担し、評価し、監査するかという実務設計の論点を短く整理する。

AI AgentRoundupOrchestrationEvaluation

根拠数: 8 レポートを開く

AI Agents 2025年5月1日

open runtime と managed platform が、同じ設計図の上で接続され始める

open protocol、hosted execution、承認設計を分けて考える新しい設計図を整理する。

AI AgentRoundupInteroperabilityRuntimeApproval

根拠数: 11 レポートを開く

AI Agents 2025年4月1日

managed agent の基本プリミティブが、複数ベンダーで一気に出そろい始める

runtime、tooling、multi-agent coordination が製品比較の項目になる転換点をまとめる。

AI AgentRoundupPlatformMulti-Agent

根拠数: 8 レポートを開く

AI Agents 2025年3月1日

AI エージェント評価は、あとから足す項目ではなく導入ゲートになっていく

prototype と production を分ける軸が、派手さより評価・再現性・監督へ移る流れを短く読む。

AI AgentRoundupEvaluationGovernance

根拠数: 10 レポートを開く

AI Agents 2025年2月1日

ブラウザ操作系エージェントが、研究テーマから製品ロードマップへ入ってくる

Operator や AutoGen v0.4 を起点に、ブラウザ操作と durable orchestration が製品計画へ入る流れを整理する。

AI AgentRoundupComputer UseEvaluation

根拠数: 10 レポートを開く

AI Agents 2025年1月1日

AI エージェントは、派手なデモから測定可能なシステム設計へ

研究と公式発表を通じて、関心が prompt 実験から評価可能なシステム設計へ移る流れを読む。

AI AgentRoundupBenchmarkTool Use

根拠数: 10 レポートを開く