Human-in-the-Loop MCP サーバー:開発者向け完全ガイド
Model Context Protocol (MCP) は、AI エージェントが外部サービスとやり取りする方法を根本的に変えました。カスタム HTTP クライアントの作成、JSON レスポンスの解析、認証フローの処理を行う代わりに、開発者は機能を AI エージェントが直接呼び出すネイティブツールとして公開できるようになりました。Human-in-the-loop ワークフローにとって、この変化は革新的です。HumanOps MCP サーバーを使用すると、AI エージェントは検証済みのヒューマンオペレーターへのタスクの投稿、見積もりの承認、結果の取得、検証ステータスの確認をすべて、エージェントのツールキットにある他の関数と同じくらい自然なネイティブツール呼び出しを通じて行うことができます。
このガイドでは、HumanOps MCP サーバーを AI エージェントに統合するために必要なすべての知識を説明します。MCP とは何か、なぜ重要なのか、なぜ AI エージェントに Human-in-the-loop 機能が必要なのか、MCP サーバーを3行で設定する方法、エージェントが利用できる4つのコアツール、一般的なユースケースの実用的なコード例、および本番環境へのデプロイに関するベストプラクティスについて説明します。初めての AI エージェントを構築している場合でも、既存のシステムに物理世界の機能を追加している場合でも、このガイドを使用すれば、1時間以内にゼロから動作する Human-in-the-loop 統合を構築できます。
技術的な詳細に入る前に、Human-in-the-loop に対する MCP アプローチが他の代替手段よりもはるかに優れている理由を理解しておく価値があります。従来の HITL 実装では、エージェント開発者が HTTP クライアントを構築し、認証トークンを管理し、ネットワークエラーを処理し、レスポンススキーマを解析し、ポーリングまたは Webhook リスナーを実装する必要がありました。これらの各ステップはバグの原因となる可能性があり、結果として得られるコードは特定の API バージョンに密接に結合されます。MCP サーバーアプローチは、これらすべての配管作業を排除します。エージェントは単にツールを呼び出すだけで、MCP ランタイムがそれ以外のすべてを処理します。
Model Context Protocol (MCP) とは?
Model Context Protocol は、Anthropic によって作成されたオープン標準であり、AI エージェントが外部ツールやデータソースをどのように発見、接続、使用するかを定義します。これは、AI エージェントと、それらが対話する必要のあるサービスとの間のユニバーサルアダプターと考えてください。MCP が登場する前は、すべての統合にカスタムコードが必要でした。Slack の統合には1つの HTTP クライアント、GitHub の統合には別のクライアント、データベース接続にはさらに別のクライアントが必要でした。MCP はこれを単一のプロトコルに標準化し、サービスは型指定された入力と出力を持つツールとして機能を公開し、エージェントは一貫したインターフェースを通じてそれらを利用します。
MCP サーバーは、一連のツールを公開する軽量なプロセスです。各ツールには名前、エージェントがいつ使用すべきかを理解するのに役立つ説明、およびその入出力を定義するスキーマがあります。AI エージェントがツールを使用する必要がある場合、MCP サーバーにリクエストを送信し、サーバーが操作を実行して結果を返します。エージェントは実装の詳細を知る必要はありません。ツールが REST API を呼び出すのか、データベースをクエリするのか、ローカルで計算を実行するのかは完全に抽象化されています。
MCP は現在、Claude、Cursor、Windsurf、Cline、および成長を続ける AI エージェントと開発環境のエコシステムによってサポートされています。これは、単一の MCP サーバー統合により、サービスがこれらすべてのプラットフォームと即座に互換性を持つようになることを意味します。HumanOps にとって、これは MCP 互換の AI エージェントであれば、HTTP クライアントコードを1行も書かずに、現実世界のタスクを検証済みのヒューマンオペレーターに派遣できることを意味します。
このプロトコルは、ローカルプロセス用の標準入出力 (stdio)、リモート接続用のサーバー送信イベント (SSE)、ステートレスな対話用の HTTP など、複数のトランスポートメカニズムをサポートしています。HumanOps MCP サーバーはデフォルトで stdio トランスポートを使用します。つまり、エージェントと一緒にローカルプロセスとして実行され、標準ストリームを介して通信します。これは、開発環境において最もシンプルで一般的な構成です。
なぜ AI エージェントに Human-in-the-Loop が必要なのか
AI エージェントはデジタル領域において驚くほど有能になりました。コードの記述とデバッグ、複雑なデータセットの分析、レポートの生成、メールワークフローの管理、洗練された意思決定を行うことができます。しかし、モデルの改善だけでは対処できない根本的なカテゴリのタスクが存在します。それは、人間が現実世界に物理的に存在することを必要とするタスクです。
日常のビジネス運営で発生するシナリオを考えてみましょう。不動産管理 AI は、オンラインに掲載するために賃貸ユニットの写真が必要です。物流エージェントは、配送が正しい住所に行われたことを誰かに確認してもらう必要があります。保険 AI は、現場の検査官に物件の損害を記録してもらう必要があります。小売運営エージェントは、店舗で販促資料が正しく展示されているか誰かにチェックしてもらう必要があります。これらはニッチな要件ではありません。物理的な存在が交渉の余地のない、膨大なカテゴリの仕事を表しています。
物理的なタスク以外にも、人間の判断がかけがえのない価値をもたらす仕事のカテゴリがあります。文化的背景を必要とするコンテンツモデレーションの決定。真の共感を必要とする顧客との対話。主観的な人間の経験に依存する品質評価。アルゴリズムが人間の好みを完全に置き換えることができない創造的な評価。これらすべての場合において、最適なシステムは、AI が規模、論理、オーケストレーションを処理し、人間が AI にはできない判断、存在、物理的能力を提供するシステムです。
Human-in-the-loop MCP サーバーモデルは、このコラボレーションをシームレスにします。AI エージェントは何をすべきかを推論し、タスク要件を策定し、適切な MCP ツールを呼び出します。検証済みのヒューマンオペレーターがタスクを受け取り、現実世界でそれを完了し、証拠を提出します。AI エージェントは検証済みの結果を受け取り、ワークフローを続行します。エージェントの視点からは、人間にタスクを依頼することは、他のツールを呼び出すことと何ら変わりません。それはツールキットにあるもう1つの機能にすぎません。
HumanOps MCP サーバーの設定
HumanOps MCP サーバーをセットアップするには、MCP クライアントの設定ファイルに構成ブロックを追加する必要があります。このファイルの正確な場所はプラットフォームによって異なります。Claude Desktop の場合は claude_desktop_config.json ファイル、Cursor の場合はワークスペース構成の MCP 設定です。他の MCP クライアントについては、MCP サーバー構成パスに関するドキュメントを参照してください。
設定は最小限です。サーバーコマンド (npx @humanops/mcp-server) を指定し、環境変数として HumanOps API キーを提供する必要があります。それだけです。3行の意味のある設定で、エージェントは HumanOps の Human-in-the-loop ツールのフルスイートにアクセスできるようになります。
{
"mcpServers": {
"humanops": {
"command": "npx",
"args": ["@humanops/mcp-server"],
"env": {
"HUMANOPS_API_KEY": "your-api-key-here"
}
}
}
}API キーを取得するには、humanops.io でサインアップし、開発者コンソールに移動します。プラットフォームは、タスクが模擬オペレーターによって即座に解決される無料のテストモードを提供しているため、お金をかけたり本物のオペレーターを待ったりすることなく、統合を検証できます。本番環境に移行する準備ができたら、本番用 API キーを生成して設定を更新するだけです。
サーバーが設定され、MCP クライアントが再起動されると、HumanOps ツールがエージェントの利用可能なツールリストに自動的に表示されます。インストールする SDK も、管理する依存関係も、記述するクライアントコードもありません。MCP ランタイムがプロセスのライフサイクル、通信、エラーリカバリを透過的に処理します。
利用可能な MCP ツール
post_task
post_task ツールは、HumanOps マーケットプレイスに新しいタスクを作成します。実行すべき内容の説明、タスクを完了すべき場所(物理的なタスクの場合)、報酬額(USDC)、およびオプションの期限を指定します。ツールは、ライフサイクルを通じてタスクを追跡するために使用するタスク ID を返します。エージェントが post_task を呼び出すと、報酬額は即座にエスクローに預けられ、作業を完了したオペレーターに資金が確実に支払われるようになります。
エージェントは次のように呼び出すかもしれません:post_task(説明:「ビジネスの看板と入り口を含む、123 Main Street の店頭を撮影してください」、場所:「123 Main Street, Austin, TX 78701」、報酬:15.00、期限:「2026-02-12T18:00:00Z」)。ツールはタスク ID と、15.00 USDC がエスクローに預けられたことの確認を返します。
approve_estimate
オペレーターがタスクをリクエストすると、タスクにかかると予想される時間を示す見積もりを提出します。approve_estimate ツールを使用すると、エージェントはこの見積もりを確認して承認し、オペレーターに作業の開始を許可できます。エージェントはオペレーターの信頼ティア、完了評価、および推定時間を受け取り、情報に基づいた承認決定を行うためのコンテキストを得ることができます。自動化されたワークフローの場合、多くの開発者は、特定の信頼ティア以上のオペレーターからの見積もりを自動承認するようにエージェントを構成しています。
get_task_result
get_task_result ツールは、タスクの現在のステータスと結果を取得します。タスクがまだ保留中または進行中の場合は、現在のステータスを返します。タスクが完了し検証されている場合は、証明データ、AI Guardian の検証スコア、およびオペレーターによって提出されたメタデータを返します。このツールは、ポーリング(定期的に呼び出してステータスを確認する)をサポートしており、イベント駆動型のワークフローのために Webhook 通知と組み合わせることもできます。
check_verification_status
check_verification_status ツールは、完了したタスクの AI Guardian 検証ステータスを照会します。信頼スコア(0〜100)、検証決定(承認、拒否、または保留中のレビュー)、および AI Guardian がチェックした内容の詳細を返します。このツールは、スコアが特定のしきい値を下回った場合に再提出を要求するなど、証明の品質や信頼レベルに基づいてエージェントが決定を下す必要がある場合に役立ちます。
実世界のユースケース
不動産管理の自動化
不動産管理 AI エージェントは、MCP サーバーを使用して入退去時の検査を自動化できます。リースが終了すると、エージェントは物件の状態(各部屋、損傷箇所、外観、周辺エリア)の写真を要求するタスクを投稿します。検証済みのオペレーターが物件を訪問し、必要な写真を撮影して HumanOps を通じて提出します。AI Guardian は、写真が正しい物件のものであり、要求されたすべてのエリアをカバーしていることを検証します。エージェントは検証済みの写真を受け取り、それらを使用して検査レポートを生成し、入居時の写真と比較し、敷金の控除額を計算します。検査のスケジュールからレポートの生成まで、ワークフロー全体が自動化されます。唯一の人間による関与は、物件を訪問して写真を撮るという物理的な行為だけです。
配送の検証
物流および e コマースの AI エージェントは、GPS 追跡だけでは不十分な地域での配送を検証するために HumanOps を使用できます。エージェントは、荷物が正しい住所に届けられたことを示す写真(住所が見える状態で玄関に置かれた荷物)による確認を要求するタスクを投稿します。配送場所の近くにいるオペレーターが検証を完了し、証拠を提出します。これは、高額な配送、複雑な受け取り手順がある商業住所への配送、または配送追跡インフラが限られている地域において特に価値があります。
小売コンプライアンス監査
複数の店舗を管理する小売運営 AI エージェントは、ブランド基準の遵守、販促展示、価格の正確性、店舗の状態を検証するためにオペレーターを派遣できます。フルタイムのミステリーショッパーを雇ったり、店長の自己報告に頼ったりする代わりに、エージェントは特定の日の特定の場所でのターゲットを絞ったチェックを依頼できます。検証済みの写真証拠は、コンプライアンス基準が満たされているという客観的な証拠を提供し、検証によって問題が明らかになった場合、エージェントは自動的に問題をエスカレーションできます。
金融サービスのフィールド検証
金融サービス AI エージェントは、ローン申請、保険金請求、またはビジネス検証を処理する際に、フィールド検証を行うためにオペレーターを派遣できます。このビジネスは実際にこの住所に存在するか? この物件は申請書に記載された通りの状態か? この建設プロジェクトは融資のために提出された計画と一致しているか? これらは回答するために物理的な存在を必要とする質問であり、HumanOps を通じて提供される検証済みの証拠は、AI エージェントが意思決定プロセスに取り入れるための客観的な証拠となります。
本番環境のベストプラクティス
テストモードから始めてください。HumanOps のテスト環境は本番環境を正確に反映していますが、タスクは模擬オペレーターと模擬検証結果によって即座に解決されます。本番環境に切り替える前に、テストモードを使用してワークフロー全体をエンドツーエンドで検証してください。これには、タスクが誰にもリクエストされずに期限切れになった場合、オペレーターの証明が拒否された場合、または検証で境界線上の信頼スコアが生成された場合などのエラー処理パスのテストが含まれます。
適切な期限を設定してください。期限のないタスクは無期限にオープンのままになり、オペレーターマーケットプレイスが古いタスクで乱雑になる可能性があります。タスクの実際の緊急性を反映した期限を設定してください。時間に敏感なタスクの場合、期限を短くし報酬を高く設定すると、オペレーターをより早く引きつけることができます。日常的なタスクの場合、期限を長くし報酬を適度に設定する方が費用対効果が高くなります。
approve_estimate からの信頼ティア情報を使用して、情報に基づいた決定を下してください。高い信頼ティア(T3 および T4)のオペレーターは、成功した完了の実績を通じて信頼性を示しています。高価値または機密性の高いタスクの場合は、T2 以上のオペレーターからの見積もりだけを承認するようにエージェントを構成することを検討してください。日常的なリスクの低いタスクの場合、T1 オペレーターは完全に適しており、多くの場合より早くタスクをリクエストします。
べき等なタスク作成を実装してください。タイムアウトやネットワークエラーによりエージェントのワークフローがタスク作成を再試行する可能性がある場合は、重複タスクを防ぐためにタスクの説明に一意のクライアント側参照 ID を含めてください。新しいタスクを作成する前に、同じ参照を持つ既存のタスクがないか確認してください。
AI Guardian の検証スコアを長期的に監視してください。特定の種類のタスクで境界線上のスコアがパターンとして見られる場合、許容可能な証明を構成するものについてタスクの説明をより具体的にする必要があることを示している可能性があります。明確で詳細なタスク説明は、より高品質な提出物とより高い検証スコアにつながります。
今すぐ始める
HumanOps MCP サーバーは現在、npm で @humanops/mcp-server として利用可能です。5分以内に最初の Human-in-the-loop 統合を実行できます。humanops.io でサインアップして API キーを取得し、MCP クライアントに3行の設定を追加して、タスクの投稿を開始してください。セットアップガイドの全文については、開発者ドキュメントを確認してください。
詳細な API ドキュメント、複数の言語でのコード例、および高度な設定オプションについては、HumanOps 開発者ドキュメントをご覧ください。ドキュメントには、テストモードで直接実行できるインタラクティブな例、一般的な統合パターンのステップバイステップのチュートリアル、およびすべての API エンドポイントと MCP ツールのリファレンスドキュメントが含まれています。
物理世界と対話する必要がある AI エージェントを構築している場合、MCP サーバーはコンセプトから動作する統合への最短経路です。3行の設定。4つの強力なツール。AI エージェントのための無制限の現実世界の機能。