归档 | Hypho - AI Agent 技术博客

2026 ⁴⁶

June ⁹

GLM-5.2 登顶开源模型基准榜：753B MoE 架构如何做到 1M 上下文 + Agent 级推理

June 19, 2026 · 2 min · Hypho

Rust 写 GPU 内核终于安全了？cuTile Rust 的 tile-based 方案和它背后的推理引擎

June 17, 2026 · 3 min · Hypho

里约政府发布的 397B 大模型，被证明是别人的模型加了个壳

June 15, 2026 · 2 min · Hypho

小米 MiMo Code 深度拆解：fork 一个 17 万星项目后，他们加了什么

June 12, 2026 · 2 min · Hypho

1T 模型跑出 1000 tok/s：MiMo × TileRT 的模型-系统联合设计到底做了什么

June 10, 2026 · 2 min · Hypho

Vibe Coding 让你跳过学习，这个开源项目偏要让你亲手写代码

June 8, 2026 · 2 min · Hypho

KV-cache 量化终于能跑生产了？KVarN 用方差归一化打破 vLLM 的吞吐量魔咒

June 5, 2026 · 2 min · Hypho

RAG 处理图片的正确姿势：索引时描述，而不是查询时看图

June 3, 2026 · 2 min · Hypho

1-bit 图像生成不再是玄学：PrismML Bonsai Image 如何让 Diffusion 模型跑在 iPhone 上

June 1, 2026 · 3 min · Hypho

May ¹³

67% 的事实核查，五大前沿 LLM 各说各话：Lenz 研究揭示 AI 一致性困境

May 29, 2026 · 2 min · Hypho

为什么 LLM 需要"睡觉"？两篇论文揭示 AI 记忆与推理的新范式

May 27, 2026 · 2 min · Hypho

AI 芯片为什么越来越像内存生意？从 HBM 成本看 LLM 推理的真正瓶颈

May 25, 2026 · 2 min · Hypho

Multi-Stream LLM：为什么单线程聊天格式正在拖累 AI Agent？

May 22, 2026 · 2 min · Hypho

Forge Guardrails：本地 8B 模型能不能跑生产级工具调用 Agent？

May 20, 2026 · 2 min · Hypho

Semble 代码搜索：给编程 Agent 用的检索工具，真比 grep 更适合生产吗？

May 18, 2026 · 2 min · Hypho

Statewright：用状态机给 AI 编程 Agent 加护栏，真的比长提示词更靠谱吗？

May 15, 2026 · 2 min · Hypho

Needle 26M 工具调用模型：Agent 真需要大模型来选工具吗？

May 13, 2026 · 2 min · Hypho

AI 编程成本怎么管？Budi 给了一个 local-first 的工程答案

May 11, 2026 · 2 min · Hypho

DeepSeek V4 Flash 本地推理：ds4.c 的窄引擎路线值得跟吗？

May 8, 2026 · 2 min · Hypho

Gemma 4 的多 token 预测：LLM 推理加速不该只盯着量化

May 6, 2026 · 2 min · Hypho

Open Design 能替代 Claude Design 吗？把编码 Agent 变成设计引擎的工程边界

May 4, 2026 · 2 min · Hypho

PyTorch Lightning 供应链攻击复盘：AI 训练依赖为什么不能只靠 pip install

May 1, 2026 · 2 min · Hypho

April ²¹

VibeVoice 能做生产级语音 AI 吗？我更关心它的工程边界

April 29, 2026 · 2 min · Hypho

Chrome Prompt API 能把本地 LLM 带进生产吗？浏览器内置 AI 的工程边界

April 28, 2026 · 2 min · Hypho

每个 AI Agent 都在重复昨天的自己：一个开源记忆层想要改变这个

April 27, 2026 · 2 min · Hypho

Agent Vault：用代理模式堵住 AI Agent 的凭证泄露风险

April 24, 2026 · 2 min · Hypho

GoModel：一个人用 Go 写的高性能 AI 网关，511 Stars，LiteLLM 的替代方案

April 23, 2026 · 2 min · Hypho

Kimi K2 API厂商精度大考：有人100%，有人76%

April 22, 2026 · 1 min · Hypho

单卡 207 tok/s：DFlash + DDTree 让 Qwen3.5-27B 在 RTX 3090 上跑出推理新纪录

April 21, 2026 · 2 min · Hypho

TRELLIS.2 移植到 Mac：没有 NVIDIA 也能跑图片转 3D 模型

April 20, 2026 · 2 min · Hypho

本地 LLM 推理引擎之争：为什么 llama.cpp 远比 Ollama 值得选择

April 18, 2026 · 2 min · Hypho

本地 LLM 推理：为什么我不推荐 Ollama，以及真正值得用的开源替代

April 17, 2026 · 3 min · Hypho

Claude Code Routines 实战：把 AI 编程助手变成准时的自动化同事

April 16, 2026 · 3 min · Hypho

I-DLM：扩散模型如何用"自省一致性"追上自回归模型质量

April 15, 2026 · 2 min · Hypho

LangAlpha：把 Claude Code 思维搬进金融投研，多智能体沙盒复利研究实战

April 15, 2026 · 3 min · Hypho

GAIA：AMD 开源本地 AI Agent 框架，在 PC 上跑满血隐私优先助手

April 14, 2026 · 3 min · Hypho

Berkeley 研究团队系统性破解八大 AI Agent 评测基准：基准分数的真相与修复路径

April 13, 2026 · 2 min · Hypho

GuppyLM: 用一个 Colab 笔记本，在 5 分钟内训练出你自己的 LLM

April 12, 2026 · 1 min · Hypho

KPI 压力下，AI Agent 会在何时背叛你：outcome-driven misalignment 基准评测

April 11, 2026 · 2 min · Hypho

当 AI 开始写"黑稿"攻击它的主人：一起真实的开源对齐失效事件

April 11, 2026 · 2 min · Hypho AI News

多 AI 协作的熵增困境：Forge 编排层设计复盘