第 1 章：5 分钟跑起来

目标：安装 nanobot，配置 API Key，完成第一次对话。

如果你还没确认本机是不是已经具备最小前置条件，先看附录：环境预检。先把 Python、venv、API Key 和模型名这些问题排掉，再开始安装，第一次成功率会高很多。

1.1 安装

第一次跟做时，建议只用下面这一种。先跑通，再考虑换安装方式。

# 推荐做法：在虚拟环境里安装
python3 -m venv .venv
. .venv/bin/activate
python -m pip install -U pip
python -m pip install nanobot-ai

验证安装：

1 2	`nanobot --version # 输出类似：🐈 nanobot v0.x.y`

如果命令不存在，先检查两件事：

你是否把安装目录加入了 PATH
你当前使用的 python / pip / uv 是否属于同一个环境

如果你已经很熟悉 Python 环境，当然也可以：

# 方式 B：从源码安装（方便顺手看代码）
git clone https://github.com/HKUDS/nanobot.git
cd nanobot
pip install -e .

# 方式 C：用 uv 安装（你本机已经装好 uv 时更省事）
uv tool install nanobot-ai

1.2 初始化

1	`nanobot onboard`

如果你更想跟着菜单一步步配置，也可以用交互式向导：

1	`nanobot onboard --wizard`

这条命令做了三件事：

在 ~/.nanobot/config.json 生成默认配置
在 ~/.nanobot/workspace/ 创建工作区
从模板同步必要文件（SOUL.md、AGENTS.md 等）

运行后，你会看到：

✓ Created config at ~/.nanobot/config.json
✓ Created workspace at ~/.nanobot/workspace

🐈 nanobot is ready!

Next steps:
  1. Add your API key to ~/.nanobot/config.json
  2. Chat: nanobot agent -m "Hello!"

1.3 配置 API Key

编辑 ~/.nanobot/config.json，填入你的 API Key。以 OpenRouter 为例：

{
  "providers": {
    "openrouter": {
      "apiKey": "sk-or-v1-你的密钥"
    }
  },
  "agents": {
    "defaults": {
      "provider": "openrouter",
      "model": "your-provider-supported-model"
    }
  }
}

其他 Provider 也可以。 nanobot 支持多种 LLM 提供商（OpenAI、Anthropic、DeepSeek、Gemini、Hugging Face、Bedrock、Ollama / LM Studio 本地模型等）。只需在 providers 里填对应的 key，在 model 里写当前 provider 支持、且你账号可用的模型名即可。

第一次跟做 OpenRouter 路线时，尽量只改两处：apiKey 和 model，provider 先保持 openrouter。先不要一边换 provider，一边换安装方式，一边再改工作区路径。

如果你不确定该填什么，先抓住这条最小原则：

apiKey：填你已经验证可用的密钥
provider：填这把 key 属于哪个 provider；不确定时先显式写出来，少依赖自动识别
model：填当前 provider 控制台里能直接调用的聊天模型名

也就是说，这一章的目标不是“选到最优模型”，而是“先让一次请求成功发出去并返回结果”。

1.4 第一次对话

# 单条消息模式
nanobot agent -m "你好，请介绍一下你自己"

# 交互模式（推荐）
nanobot agent

交互模式下，输入 exit 或按 Ctrl+C 退出。

1.5 第一次成功时，你应该看到什么

第一次跑通后，至少要看到下面 3 类现象：

nanobot --version 能输出版本号
nanobot onboard 能创建 ~/.nanobot/config.json 和 ~/.nanobot/workspace/
nanobot agent -m "你好，请用一句话介绍你自己" 能返回一段正常文本，而不是配置错误或鉴权错误

一个最小的成功链路长这样：

$ nanobot --version
🐈 nanobot v0.x.y

$ nanobot onboard
✓ Created config at ~/.nanobot/config.json
✓ Created workspace at ~/.nanobot/workspace

$ nanobot agent -m "你好，请用一句话介绍你自己"
你好，我是你的 AI 助手……

你现在不需要追求回复“很聪明”或“很有个性”。只要能稳定返回一段正常文本，这一章就算成功。

1.6 验证与排障

完成前四步后，至少确认下面 4 项：

nanobot --version 能正常输出版本号
~/.nanobot/config.json 已存在，且 provider key 已填写
~/.nanobot/workspace/ 已创建，里面至少有 AGENTS.md 和 SOUL.md
运行 nanobot agent -m "你好" 时，不会报配置错误或鉴权错误

常见问题：

报命令不存在：先确认当前 shell 还在你刚才激活的虚拟环境里；不在的话，重新执行 . .venv/bin/activate
报 401 / Unauthorized：优先怀疑 API Key 是否填错，其次再怀疑 provider 与 model 是否不匹配
报模型不存在：先去 provider 控制台确认 model 名称是不是当前账号真能调用的格式
onboard 后没有工作区：检查当前用户对 ~/.nanobot/ 是否有写权限

如果你卡住了，不要来回乱改。按这个顺序排查最快：

先看 nanobot --version 是否成功
再看 nanobot onboard 是否成功创建配置和工作区
再看 config.json 里是不是只改了 apiKey、provider 和 model 这几个必要字段
最后才去怀疑 provider、模型权限或网络问题

1.7 这一章先不要做的事

为了提高第一次成功率，先不要做下面这些事：

先不要同时尝试三种安装方式
先不要一边改 provider，一边改模型，一边改工作区路径
先不要一上来就接 Telegram 或 Docker
先不要急着写 Skill

先把 CLI 的第一次回复拿到手，后面每一章都会轻松很多。

如果你已经卡在“到底是安装问题、provider 问题，还是配置问题”这种分层判断上，先看附录：常见坑与排障。

原理：nanobot 是怎么跑起来的？

当你执行 nanobot agent 时，背后发生了什么？可以用三段来概括：

1	`config.json ──→ Provider（连接 LLM）──→ AgentLoop（收发消息、调用工具）`

对应源码可以从 nanobot/cli/commands.py 中的 agent 命令入口开始看：

# 第一步：加载配置
config = _load_runtime_config(config, workspace)

# 第二步：创建 Provider（负责和 LLM API 通信）
provider = _make_provider(config)

# 第三步：创建 AgentLoop（核心处理引擎）
agent_loop = AgentLoop(
    bus=bus,
    provider=provider,
    workspace=config.workspace_path,
    model=config.agents.defaults.model,
    ...
)

Provider 是什么？

Provider 是 nanobot 和 LLM 之间的桥梁。它负责把你的消息发给 LLM，再把 LLM 的回复拿回来。

nanobot 现在通过 Provider 抽象来屏蔽不同 LLM API 的差异：Claude/Anthropic 走原生 Anthropic SDK；OpenAI、OpenRouter、DeepSeek 等 OpenAI-compatible 服务走 OpenAI SDK 兼容客户端；其他特殊后端由对应 Provider 处理。你主要需要配置好 provider、model、apiKey 和必要的 apiBase，Provider 会负责选择后端、转换消息 / 工具调用格式，并把响应整理成 AgentLoop 能处理的统一结构。

AgentLoop 是什么？

AgentLoop 是 nanobot 的"大脑"，它按照这个循环工作（可从 nanobot/agent/loop.py 中的主循环逻辑继续追）：

     ┌──────────────────────────────┐
     │  1. 组装上下文（System Prompt │
     │     + 历史消息 + 当前消息）    │
     │              ↓                │
     │  2. 调用 LLM                  │
     │              ↓                │
     │  3. LLM 返回了什么？           │
     │     ├── 纯文本 → 返回给用户    │
     │     └── 工具调用 → 执行工具    │
     │              ↓                │
     │  4. 把工具结果反馈给 LLM       │
     │              ↓                │
     │         回到第 2 步            │
     └──────────────────────────────┘

这就是经典的 ReAct 循环（Reasoning + Acting）：LLM 思考 → 调用工具 → 观察结果 → 再思考，直到给出最终回答。当前默认最多 200 次工具迭代（由 agents.defaults.maxToolIterations 控制）。

工作区 (Workspace) 是什么？

工作区是 Bot 的"家"，默认在 ~/.nanobot/workspace/。初始化后的结构：

workspace/
├── AGENTS.md     ← Bot 的行为指令
├── SOUL.md       ← Bot 的人格
├── USER.md       ← 用户画像
├── TOOLS.md      ← 工具使用说明
├── HEARTBEAT.md  ← 周期性任务
├── memory/
│   ├── MEMORY.md ← 长期记忆（每次对话都会读取）
│   └── history.jsonl ← 历史摘要归档（可搜索）
└── skills/       ← 自定义技能目录

这些文件会被注入到 LLM 的 System Prompt 中。修改它们就能改变 Bot 的行为——不需要写代码。

这里有一个理解上的简化：文档先讲主干机制，实际实现里还会附带运行时信息、平台策略、技能摘要和最近历史摘要等内容。HISTORY.md 是旧版本的历史日志格式；当前版本会使用 memory/history.jsonl，并在升级时尽量迁移旧文件。第一次阅读时先抓住主线就够了，后面章节再补细节。

下一章我们就来做这件事。