Hermes Agent v0.4.0：AIエージェントが“個人ツール”から“外部システムに接続できる基盤”へ広がった

2026年3月23日2026年5月8日

この更新を実務でどう見るか

Hermes Agent v0.4.0 は、AIエージェントを自分の端末だけで使う段階から、外部アプリ、メッセージング、API、MCP、複数モデルへ接続する段階に進めたリリースです。公式リリースでは「platform expansion release」と説明され、OpenAI互換APIサーバー、6つの新しいメッセージングアダプター、4つの新しい推論プロバイダー、MCP server management CLI、@file / @url のコンテキスト参照、Gateway prompt caching、デフォルトのストリーミング、200以上のバグ修正が入っています。

私がこのリリースで重視しているのは、Hermes Agent が「操作するAI」から「接続されるAI」へ変わり始めていることです。

AIエージェントは、ローカルでファイルを読んだり、ターミナルを操作したりするだけでも便利です。でも業務に本格導入するなら、他のシステムから呼べること、メッセージングに入れること、APIとして扱えること、外部ツールを管理できることが重要になります。v0.4.0 は、その接続面を大きく広げています。

今回のHermes Agent更新で何が変わったか

一番分かりやすい変化は、OpenAI互換APIサーバーです。Hermes を /v1/chat/completions endpoint として公開できるようになり、cron job management のための /api/jobs REST API も追加されました。入力制限、フィールドホワイトリスト、SQLiteベースのレスポンス永続化、CORS origin protection などの安全対策も含まれています。

これはかなり大きいです。OpenAI互換APIとして扱えるということは、既存のツールやワークフローから Hermes Agent を呼び出しやすくなるということです。多くのAI関連ツールはOpenAI互換APIを前提に作られています。そこにHermesを差し込めると、単なるチャットではなく、自社のAI処理バックエンドとして使える可能性が出てきます。

次に、メッセージングアダプターの拡張です。Signal、DingTalk、SMS、Mattermost、Matrix、Webhookが加わり、Telegram、Discord、WhatsAppなどと合わせて、かなり広い入口を持つようになりました。中小企業では、会社ごとに使っている連絡手段が違います。Slackの会社もあれば、LINEに近い運用の会社もあり、SMSやメールがまだ強い業界もあります。入口が広いことは、実務導入では大きな意味を持ちます。

さらに、@file / @url のコンテキスト参照が入りました。これはClaude Codeに近い操作感で、会話の中にファイルやURLを明示的に差し込めます。AIに「これを読んで」と言うとき、対象を曖昧にせず指定できるのは、業務ではかなり大事です。

公式リリースの要点

v0.4.0 の主要ポイントは、次のように整理できます。

1つ目は、OpenAI-compatible API serverです。/v1/chat/completions endpoint と /api/jobs REST API が入りました。入力制限、フィールドホワイトリスト、SQLite応答永続化、CORS protection も含まれます。

2つ目は、6つの新しいmessaging platform adaptersです。Signal、DingTalk、SMS（Twilio）、Mattermost、Matrix、Webhook が追加され、Gatewayは失敗したplatformへ指数バックオフで自動再接続するようになっています。

3つ目は、@ context references です。CLIで @file や @url をタブ補完しながら挿入できるようになりました。

4つ目は、新しい推論プロバイダーです。GitHub Copilot、Alibaba Cloud / DashScope、Kilo Code、OpenCode Zen / Go が追加されました。

5つ目は、MCP server management CLIです。hermes mcp commands によって、MCP serverのインストール、設定、OAuth 2.1 PKCEを含む認証管理が扱えるようになりました。

6つ目は、Gateway prompt cachingです。sessionごとにAIAgent instanceをキャッシュし、Anthropic prompt cache をターン間で維持することで、長い会話のコストを下げる方向が入りました。

7つ目は、Context compression overhaulです。構造化サマリー、逐次更新、token-budget tail protection、summary endpointの設定、fallback model support が入りました。

8つ目は、Streaming enabled by defaultです。CLIストリーミングが標準になり、spinnerやtool progress表示も改善されました。

実務で効くポイント

v0.4.0 は、AIエージェントを「自分が使う便利ツール」から「業務システムに組み込める部品」へ近づけています。

たとえば、Webhook adapter があると、外部サービスで何かが起きたときにAI処理を走らせる設計がしやすくなります。問い合わせフォームが送信されたら、内容を分類して、返信案を作り、担当者に通知します。RSSやGitHubの更新を拾って、要点と影響をまとめる。定期的なcron jobの結果をAPI経由で管理します。こういう使い方が見えてきます。

OpenAI互換APIサーバーも同じです。既存のAI連携ツールや自作スクリプトから、Hermes Agentを呼べるようになります。単にモデルにプロンプトを投げるのではなく、Hermesが持つツール、スキル、セッション、ワークフローを経由して処理できる可能性があります。

@file / @url も、実務ではかなり効きます。AIに資料を読ませるとき、「どの資料を見たのか」が曖昧だと、後で検証できません。明示的にファイルやURLを参照する形になれば、成果物の根拠を追いやすくなります。

Gateway prompt caching と context compression は、長く使うほど重要になります。AIエージェントを社内で常用すると、会話はすぐ長くなります。毎回全部を読み直すとコストも遅延も増えますし、圧縮が雑だと重要な前提が落ちます。v0.4.0 がここに手を入れているのは、実務利用の痛点をよく見ています。

日本で使いこなす人が少ない理由

v0.4.0 の機能は強力ですが、日本の中小企業でそのまま導入できる会社は多くないと思います。

理由は、API、Webhook、MCP、OAuth、CORS、prompt caching、context compression など、非エンジニアには見えにくい概念が多いからです。表面上は「AIがSlackやTelegramで使える」ように見えても、裏側ではかなり多くの接続設計が必要になります。

また、入口が増えるほど、情報管理の難易度も上がります。SMSから来た依頼、Webhookで来たイベント、Slackのスレッド、CLIでの作業、API経由の処理。これらをどう同じ業務文脈にまとめるか。どの情報は保存するか。どの情報は外部モデルに送らないか。失敗時は誰に通知するか。ここを決めないと、AI導入は便利さより混乱が勝ちます。

だから、v0.4.0 は「誰でも簡単に使えるようになった」リリースではなく、「設計できる人にはかなり広い土台が渡された」リリースだと見た方が正確です。

実務で見ると、ここが大きい

私が見ると、v0.4.0 の本質は「AIエージェントを業務OSの一部として扱える可能性が見えた」ことです。

中小企業の現場では、業務はひとつのSaaSに閉じていません。メール、チャット、スプレッドシート、ECモール、会計、顧客管理、ファイル共有、Webフォームが混在しています。AIが本当に役に立つには、この分散した入口から情報を受け、必要な文脈を読み、社内ルールに沿って処理し、人間が確認できる形で返す必要があります。

Hermes Agent v0.4.0 は、まさにその接続面を広げています。APIとして呼べる。Webhookで受けられる。MCPを管理できます。複数メッセージングに対応します。@file / @url で根拠を指定できます。長いセッションをキャッシュと圧縮で扱える。

これは、単なるAIチャットの改善ではありません。AIを会社の運用に差し込むための配管工事です。配管工事は地味ですが、実務ではここが一番大事です。

導入・運用時の注意点

v0.4.0 の機能を使う場合、まず決めるべきは「入口を増やしすぎない」ことです。

Signal、SMS、Mattermost、Matrix、Webhook、API。全部つなげることはできます。でも最初から全部つなぐと、運用が追いつきません。まずは1つの入口に絞る。たとえばTelegramかSlack、またはWebhookひとつ。そこで、依頼の受け方、成果物の保存先、失敗時の通知、表示確認のルールを固める。

次に、APIやWebhook経由でAIに渡す情報を最小化します。顧客情報、個人情報、契約情報を丸ごと投げるのではなく、必要な項目だけを渡す。AIが参照したソースを残す。自動送信ではなく、最初は下書きまでにします。

最後に、長い会話や定期運用では、prompt caching と context compression の挙動を確認します。コスト削減は大事ですが、圧縮で重要前提が落ちると実務では事故になります。

v0.4.0 は、AIエージェントを外部システムへ広げるための強いリリースです。ただし、広げるほど運用設計が必要になります。ここを分かった上で使えば、中小企業でもかなり大きな省人化の土台になります。

参考にした情報：公式サイト・公式リリース・関連ドキュメントを確認し、実務での見方として整理しています。

シェアはこちらから

URLをコピーしました！