Multi-Agent on Hypho - AI Agent 技术博客

LangAlpha：把 Claude Code 思维搬进金融投研，多智能体沙盒复利研究实战

Wed, 15 Apr 2026 10:00:00 +0800

真实案例引入：一位分析师的日常工作困境

张明（化名）是某私募的科技行业分析师。2025 年 Q4，他花了整整三周研究 NVIDIA 的数据中心业务护城河——从季报电话会记录、供应链文件、到 H100/H200 的产能分配逻辑，积累了大量笔记和 Excel 模型。

但问题来了：2026 年 2 月，DeepSeek-R2 发布后，客户开始问他"这对 NVIDIA 影响多大"。他打开笔记本，发现自己的分析框架已经支离破碎——三周前的笔记散落在不同文件，LLM 对话上下文早已丢失，要从头回忆当时的核心判断和假设前提。

他需要的是研究的复利：让 AI 在每次对话中记住之前的工作，持续累积洞察，而不是每次都从零开始。

这正是 LangAlpha 试图解决的核心问题——将 Claude Code/OpenManus 等代码 Agent 的"持久上下文 + 增量构建"模式，系统性引入金融投研场景。GitHub 已有 694 Stars，最新提交距今不到 24 小时，项目获得了 Gemini 3 Hackathon 奖项。

框架核心拆解

整体架构

LangAlpha 的后端基于 FastAPI，前端为 React 19 + Vite + Tailwind Web UI，消息推送采用 SSE（Server-Sent Events），状态持久化用 PostgreSQL 双池（应用数据 + LangGraph Checkpointer），Redis 承担事件缓冲和实时数据缓存。

%%{init: {'theme': 'neutral'}}%%
flowchart TB
    Web["Web UI
React 19 · Vite · Tailwind"] --> API
    Web --> WSP
    CLI["CLI / TUI"] --> API

    subgraph Server ["FastAPI Backend"]
        API["API Routers
Threads · Workspaces · Market Data"] --> ChatHandler
        ChatHandler["Chat Handler
LLM Resolution · Credit Check"] --> BTM
        BTM["Background Task Manager
asyncio.shield · Workflow Lifecycle"]
    end

    subgraph PostgreSQL ["PostgreSQL — Dual Pool"]
        AppPool["App Data
Users · Workspaces · Threads"] --> BTM
        CheckPool["LangGraph Checkpointer
Agent State · Checkpoints"] --> BTM
    end

    subgraph Redis ["Redis"]
        EventBuf["SSE Event Buffer"] --> BTM
        Steering["Steering Queue
User Messages Mid-workflow"] --> BTM
        DataCache["API Cache
Market Data"] --> API
    end

    BTM -. "Sandbox API" .-> Daytona["Daytona
Cloud Sandboxes"]
    API -. "REST" .-> FinAPIs["Financial APIs
FMP · SEC EDGAR"]
    WSP -. "WebSocket" .-> GData["ginlix-data
Polygon.io"]

核心设计理念：工作空间（Workspace）是研究的容器，线程（Thread）是会话的单元，Agent.md 是跨会话的持久记忆。

编程式工具调用（PTC）：Token 消耗降低一个数量级

传统 Agent 调用金融数据的典型方式：用户问"帮我查一下苹果最新的毛利率"，Agent 调用 get_financials("AAPL")，API 返回 200 行原始财务数据，全部塞入 LLM context 窗口。Token 消耗惊人，而且原始数据里大量字段 Agent 根本不需要。

LangAlpha 的 PTC（Programmatic Tool Calling）彻底翻转了这个范式：Agent 自己写 Python 代码，在云端沙盒执行，只把最终结果返回给 LLM。

%%{init: {'theme': 'neutral'}}%%
flowchart LR
    LLM["LLM
Writes Python"] --> EC["ExecuteCode Tool"]
    EC --> Run["Code Runner"]

    subgraph Sandbox ["Daytona Cloud Sandbox"]
        Run --> Wrappers["Generated Wrappers
One module per MCP server"]
        Wrappers --> MCP["MCP Servers
Subprocesses in sandbox"]
    end

    MCP --> APIs["Financial APIs
FMP · Yahoo · Polygon"]
    APIs --> MCP
    Run --> EC
    EC --> LLM

举例：用户请求"对比一下苹果、微软、谷歌过去 5 年的营业利润率，并画出趋势图"。Agent 的思考链不是"调用工具获取原始数据 → 塞入 context"，而是：

# Agent 生成的 PTC 代码示例（LangAlpha 实际生成的代码结构）
import yf_analysis as yf

tickers = ["AAPL", "MSFT", "GOOGL"]
years = range(2019, 2025)
results = {}

for ticker in tickers:
    bs = yf.get_balance_sheet(ticker)
    is_ = yf.get_income_statement(ticker)
    
    operating_margins = []
    for year in years:
        revenue = is_.loc["Total Revenue", year]
        operating_income = is_.loc["Operating Income", year]
        margin = operating_income / revenue
        operating_margins.append({"year": year, "margin": margin})
    
    results[ticker] = operating_margins

# 生成图表
import matplotlib.pyplot as plt
plt.figure(figsize=(12, 6))
for ticker, data in results.items():
    years = [d["year"] for d in data]
    margins = [d["margin"] * 100 for d in data]
    plt.plot(years, margins, marker="o", label=ticker)
plt.title("Operating Margin Trend (5Y)")
plt.legend()
plt.savefig("results/operating_margin_trend.png")
print("Chart saved to results/operating_margin_trend.png")

整个多年度数据拉取、跨公司横向比对、图表渲染，全部在沙盒内完成，LLM 只收到最终图表路径和关键数字，而不是几千行原始 JSON。

持久化工作空间：让 AI 每次都从记忆出发

每个 Workspace 对应一个 Daytona 云端沙盒，带有固定目录结构：

/workspace/
├── work/              # 每次任务的临时工作区
│   └── /
│       ├── data/      # 原始数据
│       ├── charts/   # 生成的图表
│       └── code/      # 执行的脚本
├── results/           # 最终交付物
├── data/              # 共享数据集
└── agent.md           # 跨会话持久记忆

agent.md 是 LangAlpha 最关键的设计之一——Agent 在每次会话结束时自动将当前进度、关键发现、待跟进问题写入 agent.md，下次会话时 middleware 自动将其注入 LLM 上下文。这意味着：

研究"Q2 数据中心需求深度分析"的 Workspace，第二周回来时 Agent 已经知道之前的核心假设：H100 产能约束、中国区需求占比、Grace-Hopper 供应链风险
不需要用户手动总结历史上下文
研究自然累积，像一个永不遗忘的分析师助理

23 个预置投研技能

LangAlpha 预装了 23 个金融研究技能（Skills），覆盖最常见的投研工作流，每个技能本质上是一个 SKILL.md 定义的工作流模板，可通过斜杠命令或自动意图检测激活：

技能	用途
`dcf-model`	现金流折现模型构建
`comps-analysis`	可比公司法分析
`earnings-analysis`	财报深度解读
`morning-note`	晨会简报生成
`initiating-coverage`	首次覆盖报告模板
`thesis-tracker`	核心投资论点追踪
`sector-overview`	行业全景扫描
`check-deck`	投资 Deck 质量检查

每个技能对应 MCP 服务器的特定工具子集，Agent 在激活技能时只暴露相关工具，避免过度工具化的上下文污染。

关键工程洞察

1. PTC 模式将 Token 成本从 O(n×数据量) 降为 O(结果)

在传统 JSON Tool Calling 模式下，分析 AAPL/MSFT/GOOGL 三年季度数据，Token 消耗约为 3 公司 × 4 季度 × 3 年 × 单季度数据量 ≈ 36× 单季度原始数据。

PTC 模式：Agent 生成 ~20 行 Python 代码（< 500 tokens），沙盒执行后返回一张图和 9 个数字（< 200 tokens）。整体 Token 减少 95% 以上，且分析精度更高（代码逻辑可审计、可复用）。

这对需要大规模量化筛选（扫描整个 S&P 500 财务数据找异常值）的场景尤为关键。

2. 数据供给链的三层降级设计是务实工程

LangAlpha 没有假设用户有彭博终端。它设计了数据 Provider 的三层降级链：

层级	数据源	费用	覆盖范围
Tier 1	ginlix-data（自建代理）	需要 API Key	实时 WebSocket、内盘数据、期权数据
Tier 2	FMP（Financial Modeling Prep）	免费/付费	高质量基本面、财务报表、宏观数据
Tier 3	Yahoo Finance（yfinance）	免费	价格历史、基本面、ESG、筛选器

系统自动降级：Tier 1 不可用 → Tier 2 → Tier 3。用户也可以用 make config 快速切换层级组合。

这对个人投资者和初创团队意义重大——零成本启动，随着研究规模升级到付费数据源，不需要换框架。

3. “Flash + PTC” 双模式设计是会话与深度分析的恰当分离

LangAlpha 将 Agent 行为分为两个模式：

Flash 模式：快速会话——行情速查、即时问答、Workspace 管理、轻量级图表分析。延迟低，Token 消耗小，适合"刚才 NVDA 涨了多少"这类问题。
PTC 模式：深度研究——多步骤财务建模、跨时期趋势分析、生成正式报告。启动沙盒有 ~2-5 秒冷启动开销，但分析质量远高于 Flash。

这解决了 AI 投研工具的一个经典矛盾：用户既需要"秒回"的快速查询，也需要"深度"的多步骤分析，传统 RAG + 单 Agent 架构无法同时兼顾。

信源

LangAlpha GitHub 仓库：https://github.com/ginlix-ai/langalpha
LangAlpha README（含架构图与技能列表）：https://github.com/ginlix-ai/langalpha#readme
LangAlpha API 文档：https://github.com/ginlix-ai/langalpha/tree/main/docs/api
Financial Modeling Prep（免费数据层）：https://site.financialmodelingprep.com/ （FMP 提供免费注册 API Key）
Daytona Sandboxes（云端代码执行）：https://www.daytona.io/
Agent Skills Spec（技能规范）：https://agentskills.io/specification

多 AI 协作的熵增困境：Forge 编排层设计复盘

Sat, 11 Apr 2026 09:00:00 +0800

引言：当多 AI 并行成为默认

2023 到 2025 年间，AI 编程工具完成了从自动补全引擎到自主 Agent 的进化。Claude Code 能阅读整个代码库、推理架构约束并实现多文件功能。Codex CLI 可以执行 Shell 命令、运行测试并根据失败信息迭代。Gemini CLI 能分析大型代码库并生成全面的重构计划。

每个工具单独使用都足够强大。但当两个或更多工具并发运行时——这在工程团队尝试跨特性分支并行化 AI 辅助开发时越来越常见——问题出现了：瓶颈从「AI 能否写代码」转移到了「多个 AI 能否在同一代码库上协同工作而不互相摧毁」。

答案在大多数团队中是「不能」。

本文以 NXTG.AI 开源的 Forge 项目¹为锚点，用熵增理论框架分析多 AI 协作的系统性困境：为什么三个 Agent 并发编辑同一个仓库会产生 merge 冲突、知识蒸发和架构漂移这三种必然的熵增现象，以及 Forge 的文件锁、知识飞轮和漂移检测三个核心机制如何构成一个逆向熵增的工程系统。

1. 多 AI 协作的三种熵增现象

热力学第二定律告诉我们：孤立系统的熵永不自发减少。多 AI 协作系统在并发运行时就是一个典型的孤立系统——多个自主 Agent 在没有协调层的情况下操作同一个共享资源（代码库），信息熵自发增大，表现为三种具体的系统故障。

1.1 Merge 冲突：信息位叠加的不可逆损耗

两个 Agent 同时编辑同一个文件，各自产出了一系列修改。当这些修改最终汇聚到 Git 时，产生了不可调和的冲突节点。这不是 Git 的缺陷，而是两个独立信息流在同一个时空中叠加后产生的熵——两个 Agent 在各自的上下文中做出了局部最优决策，这些决策在更高层次上却是互斥的。

从信息论角度，每个 Agent 的编辑可以看作一次信息压缩操作。在单 Agent 场景下，上下文窗口提供了足够的历史信息来保证压缩的一致性。在并发场景下，上下文窗口相互独立，信息压缩失去了共享参考系，熵增体现在合并时的信息损耗——必须丢弃一个 Agent 的部分或全部工作。

1.2 知识蒸发：跨会话信息的热力学逃逸

Agent A 在一次会话中发现了数据库迁移必须在 API 服务器启动前运行的约束条件。Agent B 运行在完全独立的上下文窗口中，对 Agent A 的发现毫无感知，按错误顺序部署了 API 服务器并花费 20 分钟调试由此产生的问题。

这对应热力学中的能量逃逸。在人类团队中，这个问题通过沟通机制解决：站会、Slack 频道、共享文档。在多 Agent 系统中，每个 Agent 的上下文是一个封闭系统，会话结束即系统「热寂」——所有积累的知识随上下文窗口销毁而消失。熵增体现在跨会话信息传递的失效。

1.3 架构漂移：局部最优导致的全局混沌

没有统一规划的情况下，每个 Agent 都在做局部优化。Agent A 重构了认证模块使用新设计模式。Agent B 对此毫不知情，用旧模式实现了新功能。Agent C 引入了它从训练数据中学到的第三种模式。代码库在无人察觉的情况下逐渐偏离预定架构，每次并发会话都在累积隐性的技术债务。

这类似于热力学中湍流的产生：系统各部分遵循局部规则运行，但由于缺乏全局协调，产生了宏观层面的无序结构。架构漂移的可怕之处在于它的渐进隐蔽性——每个 Agent 的行为单独看都合理，累积效果却是系统性的混乱。

graph TD
    A["多 Agent 并发运行
共享代码库"] --> B["Merge 冲突
信息位叠加损耗"]
    A --> C["知识蒸发
跨会话信息逃逸"]
    A --> D["架构漂移
局部最优 ≠ 全局有序"]
    
    B --> E["系统熵增
协作效率降低"]
    C --> E
    D --> E
    
    style B fill:#ff6b6b,color:#fff
    style C fill:#ffa94d,color:#fff
    style D fill:#ffd43b,color:#333
    style E fill:#e64980,color:#fff

2. Forge 的逆向熵增工程系统

Forge 是一个用 Rust 编写的编排层（3MB 单二进制文件，零运行时依赖），通过 MCP（Model Context Protocol）协议协调 Claude Code、Codex CLI 和 Gemini CLI¹。它提供了三个核心机制来对抗上文分析的三种熵增现象，构成一个逆向熵增的闭环工程系统。

2.1 文件级锁：解决 merge 冲突的结构性屏障

Forge 在 state.json 中维护一个 active_locks 表。当 Agent 通过 MCP 接口声称一个任务时，Forge 会检查目标文件是否已被其他任务锁定。如果存在锁冲突，任务声称被拒绝，并返回清晰的锁定信息（哪个 Agent 持有锁、在做哪个任务）。

这相当于在热力学系统中引入了一个麦克斯韦妖——在并发写入发生之前就进行仲裁，而不是事后检测冲突。从熵的角度，锁机制将原本不可控的信息叠加过程转化为一个有序的序列化过程，每次只有一个 Agent 能写入特定文件，系统的信息熵保持在受控范围内。

{
  "active_locks": {
    "src/auth/login.ts": {
      "agent": "claude-code-1",
      "task_id": "task-003",
      "acquired_at": "2026-02-08T14:30:00Z"
    },
    "src/auth/register.ts": {
      "agent": "claude-code-1",
      "task_id": "task-003",
      "acquired_at": "2026-02-08T14:30:00Z"
    }
  }
}

Agent 通过 forge_claim_task MCP 工具获取任务同时获得文件锁，完成后通过 forge_complete_task 释放锁。这是** cooperative lock**（合作锁）——绕过 MCP 接口的 Agent 仍可直写文件，但对于所有通过标准工具运行的 Agent，冲突在结构上已不可能发生。

2.2 知识飞轮：跨会话信息的持久化存储

Forge 在 .forge/knowledge/ 目录下维护一个结构化的知识语料库，存储决策、模式、踩坑记录和经验教训。任何 Agent 在任何会话中都可以调用 forge_capture_knowledge 存储新知识，调用 forge_get_knowledge 在做决策前查询历史积累。

这个机制对应热力学中的能量存储与转换。知识飞轮将原本在会话结束时「热寂」的信息保存到持久化存储中，使下一次会话能够从上一次会话的终点继续，而非从零开始。每次知识捕获都减少了未来会话的探索空间（降低不确定性），对应系统熵的主动降低。

知识飞轮的关键设计是跨 Agent 普适性——Claude Code 捕获的知识可以被 Codex CLI 查询使用。这意味着组织学习不再依赖个体（单个 Agent），而是沉淀为共享基础设施。

2.3 漂移检测：架构层的一致性监控

Forge 的 forge_check_drift 工具将当前代码变更和项目规范发送给配置的大脑引擎（支持免费的启发式 RuleBasedBrain 或 LLM 驱动的 OpenAIBrain），进行对齐评分。这个检查可以在任何时刻由 Agent 或人类调用，返回五维治理评分：测试覆盖、安全、文档、架构对齐和 Git 卫生。

漂移检测是一个负反馈控制器。当系统熵增导致架构漂移时，检测机制主动识别偏差并报告给操作者。在自动化场景下，这相当于给系统安装了一个「温度计」——熵增可测量、可报警、可干预。

配合五维健康检查（forge_get_health），Forge 提供了持续监控 + 主动检测的双重保障，使多 Agent 系统的架构熵始终处于可观测状态。

3. 三个机制的系统论视角

将 Forge 的三个核心机制放在一起看，它们构成了一个完整的逆向熵增系统：

graph LR
    subgraph 熵增源
        L1["并发写入
文件冲突"]
        L2["会话结束
知识蒸发"]
        L3["局部优化
架构漂移"]
    end
    
    subgraph Forge对策
        F1["文件锁
序列化写入"]
        F2["知识飞轮
持久化存储"]
        F3["漂移检测
负反馈控制"]
    end
    
    L1 -->|"结构性预防"| F1
    L2 -->|"信息持久化"| F2
    L3 -->|"主动监控"| F3
    
    F1 --> O["多 Agent 协作
信息熵受控"]
    F2 --> O
    F3 --> O
    
    style L1 fill:#ff6b6b,color:#fff
    style L2 fill:#ffa94d,color:#fff
    style L3 fill:#ffd43b,color:#333
    style F1 fill:#69db7c,color:#fff
    style F2 fill:#69db7c,color:#fff
    style F3 fill:#69db7c,color:#fff
    style O fill:#4dabf7,color:#fff

值得注意的是，Forge 的状态存储在 .forge/ 目录下的单个 JSON 文件中——人类可读、Git 可追踪、无运维开销。这意味着协调状态本身成为了项目知识的一部分，可以随代码库一起版本化、回滚和审查。

4. 对 AI 工程实践的启示

Forge 白皮书的核心命题值得所有正在引入 AI 辅助编程的团队思考：当 AI 从工具变成协作者时，工程系统的复杂度从「如何用 AI」变成了「如何让多个 AI 协同工作」。

文件锁机制提醒我们：在多 Agent 环境中，冲突预防优于冲突解决。Git 的 merge 冲突检测是事后补救，文件锁是事前预防。对于高频并发的 AI 工作流，这个优先级翻转是架构设计的关键。

知识飞轮机制揭示了一个更深层的转变：AI 编程的下一阶段不是更强大的单体 Agent，而是能够积累组织知识的 Agent 协作网络。单体 Agent 的上下文窗口是有限的，但跨 Agent 的知识持久化使学习能够复合增长。

漂移检测机制则将 AI 编程中的架构治理从隐性实践变成了显式工程：测试覆盖、安全扫描、文档完整性这些传统 DevOps 指标，现在需要与架构对齐一起纳入 AI 感知的治理框架。

这三个方向——冲突预防优先、知识复合积累、架构治理显式化——代表了 AI 工程化走向成熟的三个关键节点。

结语

多 AI 并发协作的困境，本质是一个信息热力学问题：多个自主信息处理单元在无协调的情况下操作共享资源时，系统熵必然自发增大。Forge 的贡献在于，它没有试图让每个 Agent 更聪明（这是模型厂商的工作），而是在 Agent 之上构建了一个协调基础设施，用文件锁、知识持久化和漂移检测三个工程机制对抗熵增的自然趋势。

开源地址：https://github.com/nxtg-ai/forge-orchestrator

NXTG.AI, “The Forge Whitepaper: Multi-AI Orchestration for Software Development”, 2026-02-10. https://nxtg.ai/insights/forge-whitepaper ↩︎ ↩︎