要点

Cowork は、職場AIが「長時間動くエージェントの仕組み」へ広がり始めたことを示す

公開資料を見ると、Cowork という名称を正面から打ち出しているのは、現時点では Anthropic と Microsoft が中心である。 ただし、実際の変化は名称より広い。Google Gemini Enterprise、Slack の Agentforce、OpenAI の deep research、ChatGPT agent、Codex まで含めると、 市場は一問一答の対話画面から、推論・実行・管理をまとめて扱う「長時間動くエージェントの仕組み」へ広がり始めている。

2社

Cowork を明示する企業

Anthropic と Microsoft が Cowork を前面に出し、他社は別名で近い方向の製品を展開している。

3役割

推論・実行・管理

今回の論点は単なる実行機能ではなく、どの役割を軸に製品を組み立てているかにある。

5群

近づきつつ違う製品群

Anthropic、Microsoft、Google、Slack / Salesforce、OpenAI は似た方向へ進みつつ、強みの置き所はかなり違う。

1変化

一問一答から継続処理へ

差が付き始めているのは、答えの巧さだけでなく、長時間の作業を安全に前へ進められるかどうかである。

構造整理

実態は「一つの実行面」ではなく、複数の役割の組み合わせである

Cowork は一つの製品名として分かりやすいが、実装の中身は一枚岩ではない。役割ごとに分けて見ると、各社の違いもかなり読みやすくなる。

調査・推論の役割

長時間の調査、推論、要約、統合を担う部分であり、OpenAI の deep research はここに最も近い。仕事を最後まで進める力はあるが、業務システムを直接更新する機能とは分けて考えた方が分かりやすい。

実務を動かす役割

実際のシステム操作、ファイル更新、チケット起票、コード修正、テスト実行を担う部分である。Copilot Cowork、Slack Agentforce、OpenAI の Codex / Codex app はこの役割を色濃く持っている。

両方をまたぐ役割

調査と実行を一体で扱う部分であり、ChatGPT agent が代表例である。Anthropic Cowork や Google Agentspace の一部の体験も、この中間的な位置にかかっている。

管理と統制の役割

権限管理、監査、情報漏えい対策、ワークスペース制御、安全境界を担う部分である。Microsoft Agent 365 と Frontier Suite はここを強く押し出し、Anthropic は逆に不足している点を明示している。

各社の違い

向かう先は近いが、何を軸に据えるかは各社でかなり違う

共通しているのは、長時間の作業、社内文脈への接続、アプリ操作、承認や監視を一つの製品体験に寄せようとしている点である。 ただし、どこを強みの中心に置くかは企業ごとに大きく異なる。

Anthropic

  • Cowork は Claude Code の構成を Claude Desktop に広げた研究プレビューであり、手元の PC で作業を進める感覚を強く押し出している。
  • 作業計画、細かな作業分解、仮想環境、並列処理、ファイルへの直接反映まで扱える一方、監査ログや Compliance API に載らないことも明示している。
  • つまり Anthropic は、まず作業能力の拡張を前に出し、その後に企業向けの管理機能を詰めている。

Microsoft

  • Copilot Cowork は Word、Excel、PowerPoint、Outlook、Copilot Chat の中で文書や表を直接更新し、Work IQ で文脈への接続を担保している。
  • 同時に Agent 365 と Frontier Suite を並べ、権限、登録、監査、情報保護、セキュリティ状態を管理基盤として一体化している。
  • Microsoft の軸は、単なる作業能力そのものよりも、企業システムと管理の厚みにある。

Google

  • Google Agentspace / Gemini Enterprise は、検索と社内知識への接続を起点に組み立て、assistant actions と各種コネクタで実行へ伸ばしている。
  • 重心は「最も自律的なエージェント」より、「どれだけ企業内の知識に根ざして動けるか」にある。
  • そのため Google の強みは、単独の実行機能というより、知識基盤としての厚みにある。

Slack / Salesforce

  • Agentforce は DM、チャンネルへのメンション、ワークフロー起動の中に入り込み、業務の流れに溶け込む相棒として設計されている。
  • Slack Actions と Slack Data により、会話からそのまま更新や通知へつなぐ導線が明確である。
  • ここでの強みは、汎用基盤そのものより、実際の仕事の流れにどれだけ近いかにある。

OpenAI

  • OpenAI は Cowork 型の単一製品でこの領域を覆うのではなく、複数の役割を別々の製品で受け持っている。
  • deep research は調査・推論寄り、ChatGPT agent は調査と実行をまたぐ役割、Codex / Codex app はコード探索、修正、実行、テストを担う開発向けの実行役に近い。
  • そのため OpenAI は、一つの職場向けエージェントというより、複数製品の組み合わせで幅広い作業をカバーしていると見る方が正確である。

戦略差

  • 収束しているのは「長時間動くエージェントの仕組みを製品化する」という方向であり、競争が単一の実行機能に集約しているわけではない。
  • 実際の差は、管理基盤を軸にするか、知識基盤を軸にするか、業務フローへの埋め込みを軸にするか、作業能力そのものを軸にするかで分かれている。

ユースケース

向いている仕事も、どの役割を使うかでかなり変わる

実務へ落とすと、調査中心、実行中心、その両方をまたぐものとで向く仕事が変わる。ここを分けないと、導入設計も運用設計も粗くなりやすい。

1. 開発作業の実行

  • OpenAI の Codex / Codex app は、リポジトリ探索、コード修正、コマンド実行、テスト実行、複数エージェントによる並列作業を一体で扱う。
  • これは職場全体の知的業務というより、ソフトウェア開発に特化した実行役として見るのが自然である。

2. 会議準備と営業ブリーフ

  • Google Agentspace は社内データや外部情報を横断して下調べをまとめる用途が強く、Slack でも営業向けの要約や受注計画が前面に出ている。
  • この領域は調査と情報整理が中心で、必要な範囲だけ次の操作につなぐ設計が向く。

3. 調査メモ、表計算、資料作成

  • Copilot Cowork や ChatGPT agent は、調査だけで終わらず、Word、Excel、PowerPoint、各種ファイルを直接更新できる点が強い。
  • ここは調査と実行の両方が必要になるため、中間的な役割の価値が出やすい。

4. メール、予定、軽い業務調整

  • 会議設定、メール下書き、予定調整のような仕事は、複数アプリをまたぐ軽い操作と進捗の見えやすさが重要になる。
  • ここでは答えの巧さより、依頼を最後まで片づけられるかどうかが体験の中心になる。

5. IT 対応と障害の初動整理

  • Slack Agentforce は会話文脈を使って障害を検知し、チケットを起こし、適切な相手へ通知し、報告をまとめるような業務に向く。
  • 高リスクの操作を人に残しつつ、最初の情報集約と引き継ぎを自動化する設計が現実的である。

6. 社内ナレッジ検索と次の操作

  • Google のコネクタ、Anthropic のプラグイン、OpenAI のアプリ連携は、社内情報を探すだけでなく、そのまま次の操作へつなぐことを前提にしている。
  • この系統は検索単体ではなく、下書き、更新、引き継ぎまでを一つの依頼として束ねる設計に向く。

背景

背景にあるのは、AI研究が「会話」より「完遂」と「統合」を重く見始めたことだ

Cowork 的な製品面は突然現れたわけではない。研究の焦点は一貫して、モデルが現実の環境でどこまで仕事をやり切れるかへ移ってきた。 そこへ企業向けの接続、権限制御、評価、監査要件が重なり、ようやく製品として見える形になってきた。

2022

ReAct

推論と行動を往復させる構成が広まり、LLM を単なる回答器ではなく、外部環境に働きかける主体として捉える見方が広がった。

2023

Toolformer / WebArena

ツール利用と現実に近いウェブ操作課題が中心論点になり、一回の指示への応答品質より、ツールを使った完遂率の重要性が上がった。

2024

WebVoyager / SWE-bench / GAIA / OSWorld / tau-bench

ブラウザ、コード、PC 操作、利用者とツールをまたぐやり取りまで評価対象が広がり、エージェントは複数の役割を束ねる仕組みとして測られ始めた。

2025

deep research / Operator / Agentforce / Agentspace

調査、ブラウザ操作、業務実行、エージェント一覧、各種コネクタが製品面に現れ、調査と実行の統合が進み始めた。

2026

Cowork / Agent 365 / Codex app

今見えているのは、単独の実行機能の競争というより、調査、実行、管理をどこまで一つの仕組みにまとめられるかの競争である。

この根拠から読み取れること

AI の進化は、単純に会話から実行へ移ったのではなく、複数の役割をまとめて動かす、長時間のエージェントの仕組みへ広がっていると見る方が正確である。

実務への示唆

実務では「全部同じAI」と見なさず、どの役割を設計対象にするかを先に分ける必要がある

方向性は近づいているが、導入時の論点はベンダーごとに同じではない。調査を主に使うのか、実際の操作を主に使うのか、管理機能をどの基盤に乗せるのかで設計が変わる。

1. 役割を混同しない

deep research を実行機能の代表例にすると、業務システム更新の設計論点がぼやける。推論、実行、管理は分けて評価した方がよい。

2. 何を軸にする企業かで選ぶ

Microsoft は管理、Google は知識基盤、Slack は業務フローへの埋め込み、OpenAI は作業能力、Anthropic はデスクトップ拡張が強い。同じ表で横並びにするだけでは足りない。

3. Deep research は前段として使う

deep research は長時間の調査をやり切るが、業務システムを直接更新する機能ではない。実務では「次の操作につながる前段の調査役」として扱う方が設計しやすい。

4. 開発向けの実行は別カテゴリで見る

Codex / Codex app は明確に実行役だが、その対象はソフトウェア開発である。一般的な知的業務と一緒にすると、必要な権限や評価軸がずれやすい。

5. 管理機能は能力と同格で見る

Agent 365、Frontier Suite、workspace controls、Anthropic の安全制約は、エージェント導入がモデル選定だけでは終わらないことを示している。

6. 狭い業務から始める

会議準備、障害要約、コード修正、営業ブリーフのように、成果物と確認点が明確な業務から始めると、どの役割が効いているかを切り分けやすい。

導入上の制約

難しさは能力そのものより、運用の重さにもある

コスト

長時間実行、ツール呼び出し、ブラウザ操作、外部 API 利用が増えるほど、利用コストは膨らむ。推論時間の長さはそのまま費用対効果の論点になる。

信頼性

複数段階の実行では、早い段階の誤りが後ろへ伝わりやすい。最終結果だけでなく、途中段階の監視ややり直し方針を別で設計する必要がある。

操作性

長時間動くエージェントでは、進捗の見える化、中断、再指示、分岐、引き継ぎが重要になる。会話画面だけでは足りない場面が増える。

運用

監視、人の確認、承認、障害対応、保存期間、コンプライアンスは、能力とは別の実装課題である。ここを軽視すると本番導入が止まりやすい。

結論

結論

Cowork は、単なる新しい実行機能の名前ではない。より正確には、職場AIが推論・実行・管理をまとめて扱う、長時間動くエージェントの仕組みへ広がり始めたことを示すシグナルである。 Cowork という名称そのものはまだ一部の企業に限られるが、背景にある方向性は広く共有されている。これからの比較軸は「誰が最も賢いか」だけでなく、「どの役割を軸にし、どう安全にまとめ上げるか」になる。