1 min read

MCP 是什么

mcp简介

今年以来,大公司在模型本身的更新迭代上放慢了脚步,转而将部分资源投入到AI应用生态上。各种概念层出不穷,虽然我合理怀疑这些概念中的绝大部分在一年后可能鲜有提及,但是为了赶潮流,还是学习一些必要的概念。MCP应该是其中绕不开的话题。

为了让大模型的能力不止于chat,必须让大模型具备调用外部工具的能力。由于工具和大模型的厂商非常多,他们的对接就需要一个统一的协议,也就是MCP。MCP的三大组成部分:Host,Server,Client。假设你正在使用 Claude Desktop (Host) 询问:“我桌面上有哪些文档?”

  1. Host:Claude Desktop 作为 Host,负责接收你的提问并与 Claude 模型交互。Host是Client的宿主机。
  2. Client:当 Claude 模型决定需要访问你的文件系统时,Host 中内置的 MCP Client 会被激活。这个 Client 负责与适当的 MCP Server 建立连接。
  3. Server:在这个例子中,文件系统 MCP Server 会被调用。它负责执行实际的文件扫描操作,访问你的桌面目录,并返回找到的文档列表。
ℹ️

Host和Client都是大模型厂商开发和集成在一起的。开发者只要实现Server。

ℹ️

Server和Client不一定在一台机器上。比如,查找本机文件的Server肯定用户本地机器,而在12306查票买票场景,Server就放在12306机器上。

MCP的工作原理是什么?当用户提出一个问题时:

  1. 客户端(Claude Desktop / Cursor)将你的问题发送给 Claude。
  2. Claude 分析可用的工具,并决定使用哪一个(或多个)。
  3. 客户端通过 MCP Server 执行所选的工具。
  4. 工具的执行结果被送回给 Claude。
  5. Claude 结合执行结果构造最终的 prompt 并生成自然语言的回应。
  6. 回应最终展示给用户!

image

参考:


Jason Lee
Hi, I'm Jason Lee

I hope I can still be curious about the world when I turn 60 years old.

Enjoy!

Contact me:

Email | GitHub


Content licenced under CC BY-NC-ND 4.0