Claude Agent SDK 和 Claude API 有什么区别？

Claude API 是底层接口——每次请求发消息拿回复，状态需要自己管。Agent SDK 是在 API 之上的高层封装——内置 Subagent 编排、Skills 加载、Session 状态管理、工具权限控制。简单工作流用 API 足够，多 Agent 协作用 Agent SDK 更省事。

研究型 Agent 和 Deep Research 功能有什么不同？

Deep Research 是 Anthropic/OpenAI 提供的端到端产品，用户看不到内部编排。你用 Agent SDK 自己搭研究型 Agent 的好处：完全可控（能指定数据源优先级、输出格式、质量标准）、可嵌入到自己的产品、可以用私有数据源。

Subagent 之间怎么通信？

通过主 Agent 中转。每个 Subagent 完成任务后返回结构化结果给主 Agent，主 Agent 汇总后决定下一步（继续调度、合并、输出）。Subagent 彼此不直接通信——这个隔离性是 Subagent 相对于多 Agent 框架的核心设计选择。

这个研究 Skill 能不能复用到其他主题？

能，而且这正是 Skills 设计目的。Skill 里的研究方法论（问题分解、多源交叉验证、引用规范、输出结构）是通用的，只要换输入主题。Claude 会根据新主题调整具体搜索词，但方法论框架保持一致。

生产环境用 Agent SDK 要注意什么？

三点：1) Subagent 会放大 token 消耗（并行 × 每个独立上下文），预算要重估；2) 错误传播——某个 Subagent 失败要有降级策略而不是整体失败；3) 输出可重现性低于单 Agent，需要在 Skill 里写清结构化输出约束。

Skills 与 Agent SDK：研究型 Agent 实战

本文独立分析声明：本文基于吴恩达与 Anthropic 合作课程 Agent Skills with Anthropic L8 章节独立撰写。内容包含课程未覆盖的独立扩展：Agent SDK 与 Claude API 的使用场景分野、Subagent 通信模式、生产环境 token 预算与错误处理。推荐先观看原课程。

最后一课，我们用 Claude Agent SDK 构建一个研究型 Agent。它使用 Skill 指导研究方法论，调度三个 Subagents 分别从文档、GitHub 仓库和网络搜索中提取信息，最终合成一份完整的学习指南。

Claude Agent SDK 简介

Claude Agent SDK 是一种程序化构建 Agentic 应用的方式，使用的底层 Harness 与 Claude Code 相同。区别在于你完全控制 Agent 的定义、工具权限和运行环境。

系统架构

Main Agent（编排器）
├── docs_researcher     → 分析官方文档
├── repo_analyzer       → 克隆并分析 GitHub 仓库
├── web_researcher      → 搜索文章、视频、社区内容
└── Notion MCP Server   → 将结果写入 Notion

Main Agent 负责编排：调度 Subagents、收集结果、按 Skill 指令合成输出。

三个 Subagents 各有专职：

Subagent	工具	职责
docs_researcher	WebSearch, WebFetch	定位并提取官方文档内容
repo_analyzer	WebSearch, Bash, Read, Glob, Grep	克隆仓库，分析代码结构
web_researcher	WebSearch, WebFetch	搜索教程、视频、社区资源

每个 Subagent 的 Prompt 中定义了：处理流程、输入格式、执行指南和输出格式。

Skill：learning-a-tool

这个 Skill 不是给 Subagents 使用的，而是指导 Main Agent 的研究方法论和输出结构：

研究阶段：为每个 Subagent 指定具体要寻找的信息——官方文档要提取什么、仓库要分析什么、社区资源要搜索什么。

组织阶段：使用渐进式披露加载 progressive-learning.md，定义学习路径的分级结构：

Overview & Motivation — 工具解决什么问题
Installation & Setup — 安装和核心概念
Practical Patterns — 实际使用模式
Where to Go Next — 进阶资源

输出阶段：指定精确的目录结构和文件格式——README、resources、learning path、code examples。

Skill 确保无论研究什么工具，输出格式都是一致且可预测的。

搭建 Agent

基础结构

import asyncio
from dotenv import load_dotenv
from claude_agent_sdk import Agent

load_dotenv()

async def main():
    agent = Agent(
        system_prompt="You are a helpful assistant.",
        allowed_tools=[]
    )

    while True:
        user_input = input("You: ")
        response = await agent.run(user_input)
        print(response)

asyncio.run(main())

添加工具权限

Read、Grep、Glob 等只读工具默认可用。需要显式添加的工具：

allowed_tools=[
    "Write",        # 写文件
    "Bash",         # 执行命令（git clone 等）
    "WebSearch",    # 搜索网络
    "WebFetch",     # 获取网页内容
    "mcp_notion_*", # Notion MCP 所有工具
    "Task",         # 调度 Subagents
    "Skill",        # 读取和使用 Skills
]

重要：allowed_tools 必须包含 Main Agent 和所有 Subagents 需要的工具。即使你在 Subagent 定义中指定了工具，如果 allowed_tools 中没有，Subagent 也无法使用。

连接 MCP Server

import os

agent = Agent(
    system_prompt=main_agent_prompt,
    allowed_tools=allowed_tools,
    mcp_servers={
        "notion": {
            "command": "npx",
            "args": ["-y", "@notionhq/notion-mcp-server"],
            "env": {"NOTION_TOKEN": os.getenv("NOTION_TOKEN")}
        }
    }
)

MCP 工具通过 mcp_<server>_<tool> 格式引用。mcp_notion_* 表示使用 Notion 提供的所有工具。

定义 Subagents

from claude_agent_sdk import AgentDefinition

agents = {
    "docs_researcher": AgentDefinition(
        description="Researches official documentation for a tool",
        prompt=docs_researcher_prompt,
        tools=["WebSearch", "WebFetch"]
    ),
    "repo_analyzer": AgentDefinition(
        description="Analyzes GitHub repositories",
        prompt=repo_analyzer_prompt,
        tools=["WebSearch", "Bash", "Read", "Glob", "Grep"]
    ),
    "web_researcher": AgentDefinition(
        description="Searches for tutorials, articles, and community content",
        prompt=web_researcher_prompt,
        tools=["WebSearch", "WebFetch"]
    )
}

加载 Skills

需要两个配置：

在 allowed_tools 中添加 "Skill" 工具
通过 setting_sources 指定 Skills 搜索路径

agent = Agent(
    system_prompt=main_agent_prompt,
    allowed_tools=allowed_tools,
    agents=agents,
    mcp_servers=mcp_servers,
    setting_sources=["user", "project"]  # 搜索 ~/.claude/skills/ 和 .claude/skills/
)

Skills 的存放位置与 Claude Code 一致：.claude/skills/<skill-name>/SKILL.md。

实战：为 MinerU 生成学习指南

MinerU 是一个开源 PDF 提取库——Claude 训练数据中可能了解不多，非常适合测试研究型 Agent。

步骤 1：展示计划

Help me get started with MinerU. Create a learning guide. Show me your plan first.

Agent 识别到 learning-a-tool Skill，生成研究计划：

并行调度三个 Subagents
按 Skill 定义的结构组织内容
输出预期的目录结构

步骤 2：执行研究

确认计划后，三个 Subagents 并行执行：

docs_researcher → 前往官方文档站
repo_analyzer → 克隆 GitHub 仓库，分析代码结构
web_researcher → 搜索教程、YouTube 视频、社区资源

步骤 3：合成输出

Subagents 完成后，Main Agent 按 Skill 定义的结构合成：

learning-mineru/
├── README.md              # 学习指南总览、时间估算
├── resources.md           # 文档、教程、视频、社区链接
├── learning-path.md       # 分级学习路径
└── code-examples/
    ├── 01-hello-world/    # 安装、首次提取
    ├── 02-core-concepts/  # 核心概念、后端对比
    └── 03-patterns/       # 生产级使用模式

步骤 4：写入 Notion（可选）

Write ./learning-mineru/resources.md to the "Resources" subpage
under Learning in Notion. Use rich formatting.

Agent 通过 Notion MCP Server 将 Markdown 内容转换为 Notion blocks，写入指定页面。

Main Agent Prompt 设计要点

Main Agent 的 Prompt 中需要处理 Skill 可能存在或不存在的情况：

If a skill is provided and matches the user's request,
follow that skill's instructions precisely.

因为这是一个通用研究 Agent，不是所有请求都会匹配到 Skill。有 Skill 时按 Skill 流程走，没有时按通用研究方法执行。

安全注意事项

课程中为了简化演示，Write 和 Bash 等工具无需用户确认即可执行。生产环境中应该：

构建权限确认界面，类似 Claude Code 的工具审批机制
添加 Interrupt 机制，允许用户中断 Agent 和 Subagent 执行
对 Bash 工具执行的命令做安全审查

关键要点

Agent SDK 使用与 Claude Code 相同的底层 Harness
Skills 存放在 .claude/skills/，通过 setting_sources 指定搜索路径
allowed_tools 必须包含所有 Agent 和 Subagents 需要的工具
Subagents 通过 AgentDefinition 定义，用 Task 工具调度
MCP Server 通过 mcp_servers 参数配置，工具用 mcp_<server>_* 引用
Skill 可以指导 Main Agent 的编排策略，不一定要给 Subagents
三个 Subagents 并行执行，大幅提升研究效率