"知行合一,极致执行 —— 你的全栈数字员工。"
ZX CLI (全称 ZhiXing / 知行) 是一个基于 LangGraph 构建的企业级智能体终端。它的核心理念源自“知行合一”:不仅具备强大的 “知”(逻辑推理、知识检索与多模态理解),更具备极致的 “行”(办公自动化、文件操作与复杂任务执行)。它专为 复杂任务处理 设计,集成了 混合多模态架构、本地知识库 (RAG) 和 办公自动化 (Office Automation) 能力,能够胜任数据分析师、售前顾问和全栈开发者的工作。
系统创新性地采用了 "双脑" 协同模式,兼顾成本与能力:
- 大脑 (Brain):由 DeepSeek V3 (或任意高智商文本模型) 负责逻辑推理、任务拆解和代码生成。
- 眼睛 (Eyes):由 GPT-4o-mini (或兼容视觉模型) 负责图像理解。即使主模型不支持视觉,Agent 也能通过
describe_image工具“看懂”本地图片。 - 配置解耦:支持通过
.env分别配置主模型和视觉模型,灵活应对不同厂商接口。
我们重新定义了 CLI 处理办公文档的能力:
- Excel 自动化 (
excel_master):- 将 JSON/CSV 数据转换为带样式的专业 Excel 报表。
- 自动调整列宽、表头着色、多表单管理。
- 支持基础统计计算(求和、平均等)。
- PPT 智能生成 (
ppt_master):- 基于 Markdown 剧本一键生成企业级 PPT。
- 图文混排:支持识别 Markdown 中的
语法,将本地图片精准插入幻灯片。 - 演讲备注:自动提取 Speaker Notes,辅助演示。
- 全能文件 I/O:深度解析
.docx,.pdf,.pptx,.xlsx,支持大纲导航与全文搜索。
- 智能记忆 (Memory System):
- 保存记忆 (
save_memory):自动去重,持久化存储用户偏好与关键事实。 - 遗忘记忆 (
forget_memory):精准删除过时信息,解决传统 Agent "只能追加、无法抹除" 的痛点。
- 保存记忆 (
- 技能生命周期 (
manage_skill):- 动态激活 (Activate):按需加载专业领域的 System Prompt,让 Agent 变身领域专家。
- 上下文卸载 (Deactivate):任务完成后自动卸载技能,释放上下文空间,保持轻量高效。
- 私有 RAG (
knowledge_base):基于 LanceDB + BGE-M3 构建的本地向量引擎。- 语义检索 (
retrieve_knowledge):支持跨文档的语义搜索与情景记忆回溯。 - 全生命周期管理:支持文档入库、自动归档、版本溯源。
- 情景记忆:对话历史自动存入向量库,Agent 拥有“超长短期记忆”。
- 语义检索 (
系统基于 LangGraph 的有向无环图 (DAG) 架构,深度集成了 混合双脑模型 与 安全守卫:
---
config:
flowchart:
curve: linear
---
graph TD;
__start__([🚀 Start]):::first
subgraph Brain_Core [🧠 Hybrid Brain Core]
direction TB
DeepSeek(DeepSeek V3<br/>Logic & Reasoning)
Vision(GPT-4o-mini<br/>Visual Understanding)
Guardrail{🛡️ Guardrail<br/>Safety Check}
DeepSeek <--> Vision
DeepSeek --> Guardrail
end
subgraph Skill_Layer [🛠️ Skill Matrix]
direction TB
Office_Master(📊 Office Master<br/>Excel/PPT/Word)
Memex_RAG(📚 Project Memex<br/>LanceDB/Vector)
Atomic_IO(⚡ Atomic I/O<br/>Read/Write/Search)
Shell_Exec(🐚 Shell Execution)
end
State_Sync(🔄 State Sync<br/>Context Integration)
__end__([🏁 End]):::last
__start__ --> DeepSeek
Guardrail -->|Safe Call| Office_Master
Guardrail -->|Safe Call| Memex_RAG
Guardrail -->|Safe Call| Atomic_IO
Guardrail -->|Safe Call| Shell_Exec
Guardrail -.->|❌ Block| DeepSeek
Guardrail -->|✅ Done| __end__
Office_Master --> State_Sync
Memex_RAG --> State_Sync
Atomic_IO --> State_Sync
Shell_Exec --> State_Sync
State_Sync --> DeepSeek
classDef default fill:#f9f9f9,stroke:#333,stroke-width:1px;
classDef first fill:#e1f5fe,stroke:#01579b,color:white;
classDef last fill:#263238,stroke:#455a64,color:white;
# 克隆项目
git clone https://github.com/your-repo/zx-cli.git
cd zx-cli
# 安装依赖
./venv/bin/pip install -r requirements.txt推荐在项目根目录创建 .env 文件(已自动忽略):
# --- 大脑配置 (DeepSeek V3 / Claude / GPT-4) ---
LLM_BASE_URL=https://ark.cn-beijing.volces.com/api/v3
LLM_MODEL_NAME=ep-2025xxxx-xxxxx
LLM_API_KEY=your-deepseek-key
# --- 眼睛配置 (Vision Model, 推荐 gpt-4o-mini) ---
VISION_LLM_BASE_URL=https://api.openai.com/v1
VISION_LLM_MODEL_NAME=gpt-4o-mini
VISION_LLM_API_KEY=your-openai-key推荐使用内置脚本,自动处理虚拟环境:
./start.sh用户: "读取
sales_data.json生成一份 Excel 报表,然后基于报表数据写一个 PPT 汇报,把chart.png插进去。"
Agent 动作:
- 数据处理:激活
excel_master,清洗 JSON 数据,生成带样式的report.xlsx。 - 视觉分析:调用
describe_image查看chart.png,理解图表含义。 - PPT 制作:激活
ppt_master,撰写包含图表分析的 Markdown 剧本,并引用chart.png。 - 资源清理:任务完成后,调用
manage_skill(..., action='deactivate')卸载所有技能,释放上下文。 - 最终产出:生成图文并茂的
presentation.pptx。
用户: "我不喝咖啡了,以后给我推荐茶。顺便把之前关于咖啡的记忆忘掉。"
Agent 动作:
- 调用
forget_memory("喜欢喝咖啡"):物理删除旧记忆。 - 调用
save_memory("偏好:喜欢喝茶"):追加新偏好。 - 回复: "已为您更新偏好:删除咖啡,添加茶。"
本项目拥有完备的自动化测试体系:
# 1. 单元与功能测试 (Unit Tests)
# 覆盖工具链、记忆管理、文件 IO、Excel 生成等
python3 -m unittest discover tests -p "test_*.py"
# 2. 全量回归测试 (E2E Regression)
# 模拟真实业务流:Excel -> PPT (含图片) -> 结果验证
python3 tests/test_e2e_v3_full.py本项目深受开源社区的启发,特别致谢以下优秀项目:
- OpenClaw (openclaw_repo): 优秀的 Agent 架构设计与开源实践,为本项目提供了宝贵的参考。
- LangGraph: 提供了强大的状态机编排能力。
- Rich: 赋予了 CLI 极致的交互体验。
MIT License