本文档详述了如何搭建一个多智能体协作(Multi-Agent Collaboration)开发环境。该架构采用 Gemini 担任产品经理(Brain),VS Code Agent 担任全栈工程师(Hands),实现从模糊需求到落地代码的全自动流水线。
2M Token Context
需求分析 & 架构设计
生成 Blueprint
File System Access
Terminal Execution
Error Fixing
Markdown Docs
JSON Specs
Human-in-the-loop
1. 核心设计:脑手分离
在传统的 AI 辅助编程中,用户往往直接要求 AI "写一个贪吃蛇"。这种单步指令容易导致逻辑混乱。本架构引入了流水线机制:
- 上游 (Gemini PM): 负责规划。输入模糊需求,输出结构化的技术文档 (PRD/Blueprint) 和目录结构。不直接写代码。
- 下游 (VS Code Agent): 负责执行。读取上游生成的 Markdown 计划,通过工具调用 (Tool Use) 操作本地文件系统和终端。
2. 最佳实践方案 (Best Practice)
我们推荐使用 VS Code + Cline 插件 + Gemini 1.5 Pro 的零代码组合。Gemini 1.5 Pro 的超大上下文窗口使其能够“记住”整个项目库,完美胜任架构师角色。
2.1 注入“PM 灵魂” (System Prompt)
为了防止 AI 一上来就盲目编码,我们需要通过 System Prompt 强制执行 "Think First" 策略。以下配置需写入 Cline 的 Custom Instructions 或项目根目录的 .clinerules 文件:
# Role: Technical Product Manager & Lead Architect
You are an expert combination of a Product Manager and a Software Architect.
# Workflow Protocol (STRICTLY FOLLOW)
**Phase 1: Discovery & Architecture (NO CODE YET)**
When the user gives a requirement:
1. Analyze: Identify the core goal and key features.
2. Tech Stack: Choose the most modern stack (e.g., Vite/Vue3).
3. Draft Blueprint: Create a file named PROJECT_BLUEPRINT.md containing:
- User Stories
- File Structure (Tree view)
- Step-by-Step Implementation Plan
4. STOP & ASK: "Does this architecture look good to proceed?"
**Phase 2: Execution (The "Coder" Mode)**
ONLY after the user approves:
1. Initialize the project (npm create...).
2. Follow the plan in PROJECT_BLUEPRINT.md.
3. Verify each step with a test run.
3. 标准作业程序 (SOP)
在实际开发中,遵循以下交互流程可以获得最佳效果:
Step 1: 需求下达
用户:“我想做一个简单的网页版番茄钟,要有倒计时和统计功能,界面极简。”
Gemini (PM):分析需求,生成 PROJECT_BLUEPRINT.md,规划技术栈为 Vue3 + TailwindCSS。
Step 2: 架构确认
用户:查看 Markdown 计划,确认无误后回复:“确认,开始开发。”
注:此时可进行人工干预,例如要求更换数据库或调整 UI 风格。
Step 3: 自动化执行
Gemini (Coder):切换角色,自动执行终端命令:
npm create vite@latest -> npm install -> 创建组件文件。它会根据 Phase 1 的蓝图逐个落实文件。
4. 潜在挑战与方案
尽管该架构非常强大,但在复杂项目中仍需注意以下几点:
- 上下文丢失: 尽管 1.5 Pro 窗口很大,但对于超大型项目,建议定期让 Agent 生成
PROGRESS.md总结当前进度,并开启新会话 (New Task)。 - 幻觉代码: 在 Prompt 中强制要求 Agent 在引入第三方库前,必须先运行
npm install并验证库是否存在。 - 死循环: 设置最大重试次数。如果 Agent 陷入报错-修复的死循环,应及时暂停并人工介入。