#LLM | LLMAPIS

May 17, 2026

δ mem：大模型长期记忆开始从“上下文拉长”转向“在线状态层” 核心解读今天 Hacker News 上最值得 llmapis.com 跟进的一篇 AI 研究，不是又一个更大的上下文窗口，也不是再做一层外置记忆胶水，而是这篇很克制、但方向非常对的工作： δ mem: Efficient Online Memory

AI LLM Memory Agent Architecture

May 11, 2026

omlx：Apple Silicon 本地推理从“能跑模型”走向“可持续服务化”的关键一跃

oMLX：Apple Silicon 本地推理从“能跑模型”走向“可持续服务化”的关键一跃今天 GitHub Trending 里最值得放进 llmapis.com 的 AI 项目，不是又一个通用 Agent 外壳，也不是一个换 prompt 包装出来的“开发效率神器”，而是一个更偏基础设施、却更接近真实使用门槛的问

AppleSilicon LocalAI Inference LLM AgentInfra

May 10, 2026

DELEGATE-52：大模型在委托式长流程工作中系统性腐蚀文档的实证研究

DELEGATE 52：当 AI 开始替你长流程干活，真正危险的不是答错，而是悄悄把文档改坏今天 Hacker News 上最值得做深读的一篇 AI 相关内容，不是又一篇“模型更强了”的体验帖，而是一篇更接近现实工作流底层问题的论文：《LLMs Corrupt Your Documents When You Del

AI LLM Agent Benchmark Reliability Delegation Research

March 24, 2026

iPhone 17 Pro 运行 400B LLM：端侧大模型进入系统工程竞争新阶段

iPhone 17 Pro 跑 400B LLM：端侧大模型正在从“技术炫技”走向“系统路线之争” 核心解读今天 Hacker News 上很容易吸引眼球的一条消息，是 iPhone 17 Pro 被演示运行 400B 参数级别的 LLM 。如果只看标题，这很像一条典型的“AI 硬件奇观”新闻：大模型、手机、本地运行

OnDeviceAI EdgeInference LLM iPhone SystemAI

March 24, 2026

Autoresearch 实践解析：42 轮实验背后的科研工作流重构

Autoresearch：当 AI 开始替你跑 42 轮实验，研究工作流正在从“提出假设”转向“编排搜索” 核心解读今天值得关注的，不只是 Karpathy 提出的 autoresearch 概念本身，而是有人真的把它拿到一个自己熟悉的研究问题上跑了一遍，并且给出了足够具体的实验记录。这篇 Autoresearch

Autoresearch ResearchAgent ClaudeCode AI4Science LLM

March 15, 2026

睡眠时代理：AI自动化的终极形态深度解读

"睡眠时代理"：AI 自动化的终极形态核心解读 "Agents that run while I sleep"（睡眠时代理）不仅是一个技术概念，更是对"工作"定义的重新思考。核心概念什么是睡眠时代理？用户睡觉时，代理继续工作 24/7 不间断的自动化工作流不需要人工干预的智能决策与传统自动化的区别：

AI Agent Automation Workflow LLM