2026  46

June  9

GLM-5.2 登顶开源模型基准榜:753B MoE 架构如何做到 1M 上下文 + Agent 级推理

June 19, 2026 · 2 min · Hypho

Rust 写 GPU 内核终于安全了?cuTile Rust 的 tile-based 方案和它背后的推理引擎

June 17, 2026 · 3 min · Hypho

里约政府发布的 397B 大模型,被证明是别人的模型加了个壳

June 15, 2026 · 2 min · Hypho

小米 MiMo Code 深度拆解:fork 一个 17 万星项目后,他们加了什么

June 12, 2026 · 2 min · Hypho

1T 模型跑出 1000 tok/s:MiMo × TileRT 的模型-系统联合设计到底做了什么

June 10, 2026 · 2 min · Hypho

Vibe Coding 让你跳过学习,这个开源项目偏要让你亲手写代码

June 8, 2026 · 2 min · Hypho

KV-cache 量化终于能跑生产了?KVarN 用方差归一化打破 vLLM 的吞吐量魔咒

June 5, 2026 · 2 min · Hypho

RAG 处理图片的正确姿势:索引时描述,而不是查询时看图

June 3, 2026 · 2 min · Hypho

1-bit 图像生成不再是玄学:PrismML Bonsai Image 如何让 Diffusion 模型跑在 iPhone 上

June 1, 2026 · 3 min · Hypho

May  13

67% 的事实核查,五大前沿 LLM 各说各话:Lenz 研究揭示 AI 一致性困境

May 29, 2026 · 2 min · Hypho

为什么 LLM 需要"睡觉"?两篇论文揭示 AI 记忆与推理的新范式

May 27, 2026 · 2 min · Hypho

AI 芯片为什么越来越像内存生意?从 HBM 成本看 LLM 推理的真正瓶颈

May 25, 2026 · 2 min · Hypho

Multi-Stream LLM:为什么单线程聊天格式正在拖累 AI Agent?

May 22, 2026 · 2 min · Hypho

Forge Guardrails:本地 8B 模型能不能跑生产级工具调用 Agent?

May 20, 2026 · 2 min · Hypho

Semble 代码搜索:给编程 Agent 用的检索工具,真比 grep 更适合生产吗?

May 18, 2026 · 2 min · Hypho

Statewright:用状态机给 AI 编程 Agent 加护栏,真的比长提示词更靠谱吗?

May 15, 2026 · 2 min · Hypho

Needle 26M 工具调用模型:Agent 真需要大模型来选工具吗?

May 13, 2026 · 2 min · Hypho

AI 编程成本怎么管?Budi 给了一个 local-first 的工程答案

May 11, 2026 · 2 min · Hypho

DeepSeek V4 Flash 本地推理:ds4.c 的窄引擎路线值得跟吗?

May 8, 2026 · 2 min · Hypho

Gemma 4 的多 token 预测:LLM 推理加速不该只盯着量化

May 6, 2026 · 2 min · Hypho

Open Design 能替代 Claude Design 吗?把编码 Agent 变成设计引擎的工程边界

May 4, 2026 · 2 min · Hypho

PyTorch Lightning 供应链攻击复盘:AI 训练依赖为什么不能只靠 pip install

May 1, 2026 · 2 min · Hypho

April  21

VibeVoice 能做生产级语音 AI 吗?我更关心它的工程边界

April 29, 2026 · 2 min · Hypho

Chrome Prompt API 能把本地 LLM 带进生产吗?浏览器内置 AI 的工程边界

April 28, 2026 · 2 min · Hypho

每个 AI Agent 都在重复昨天的自己:一个开源记忆层想要改变这个

April 27, 2026 · 2 min · Hypho

Agent Vault:用代理模式堵住 AI Agent 的凭证泄露风险

April 24, 2026 · 2 min · Hypho

GoModel:一个人用 Go 写的高性能 AI 网关,511 Stars,LiteLLM 的替代方案

April 23, 2026 · 2 min · Hypho

Kimi K2 API厂商精度大考:有人100%,有人76%

April 22, 2026 · 1 min · Hypho

单卡 207 tok/s:DFlash + DDTree 让 Qwen3.5-27B 在 RTX 3090 上跑出推理新纪录

April 21, 2026 · 2 min · Hypho

TRELLIS.2 移植到 Mac:没有 NVIDIA 也能跑图片转 3D 模型

April 20, 2026 · 2 min · Hypho

本地 LLM 推理引擎之争:为什么 llama.cpp 远比 Ollama 值得选择

April 18, 2026 · 2 min · Hypho

本地 LLM 推理:为什么我不推荐 Ollama,以及真正值得用的开源替代

April 17, 2026 · 3 min · Hypho

Claude Code Routines 实战:把 AI 编程助手变成准时的自动化同事

April 16, 2026 · 3 min · Hypho

I-DLM:扩散模型如何用"自省一致性"追上自回归模型质量

April 15, 2026 · 2 min · Hypho

LangAlpha:把 Claude Code 思维搬进金融投研,多智能体沙盒复利研究实战

April 15, 2026 · 3 min · Hypho

GAIA:AMD 开源本地 AI Agent 框架,在 PC 上跑满血隐私优先助手

April 14, 2026 · 3 min · Hypho

Berkeley 研究团队系统性破解八大 AI Agent 评测基准:基准分数的真相与修复路径

April 13, 2026 · 2 min · Hypho

GuppyLM: 用一个 Colab 笔记本,在 5 分钟内训练出你自己的 LLM

April 12, 2026 · 1 min · Hypho

KPI 压力下,AI Agent 会在何时背叛你:outcome-driven misalignment 基准评测

April 11, 2026 · 2 min · Hypho

当 AI 开始写"黑稿"攻击它的主人:一起真实的开源对齐失效事件

April 11, 2026 · 2 min · Hypho AI News

多 AI 协作的熵增困境:Forge 编排层设计复盘

April 11, 2026 · 2 min · Hypho

当 AI 工作流不再靠"凑长度":Gambit 牌组模式对可靠 Agent 的启示

April 10, 2026 · 2 min · Hypho

给 AI Agent 穿上盔甲:拆解开源八层安全防线的设计逻辑

April 9, 2026 · 2 min · Hypho

March  3

从信息论角度重新理解 LLM 失控:ERA 熵减提示词架构的工程实践

March 19, 2026 · 3 min · Hypho

让 AI 打工人永不宕机:OpenClaw 离散状态机架构全解

March 19, 2026 · 2 min · Hypho

向量数据库已经很快了,为什么还要重排?RAG 系统中 Bi-Encoder 与 Cross-Encoder 的工程对决

March 19, 2026 · 2 min · Hypho