May 17, 2026 May 17, 2026 May 17, 2026 May 17, 2026 δ-mem:大模型长期记忆从上下文拉长转向在线状态层的技术解读 δ mem:大模型长期记忆开始从“上下文拉长”转向“在线状态层” 核心解读 今天 Hacker News 上最值得 llmapis.com 跟进的一篇 AI 研究,不是又一个更大的上下文窗口,也不是再做一层外置记忆胶水,而是这篇很克制、但方向非常对的工作: δ mem: Efficient Online Memory AILLMMemoryAgentArchitecture
May 11, 2026 May 11, 2026 May 11, 2026 May 11, 2026 omlx:Apple Silicon 本地推理从“能跑模型”走向“可持续服务化”的关键一跃 oMLX:Apple Silicon 本地推理从“能跑模型”走向“可持续服务化”的关键一跃 今天 GitHub Trending 里最值得放进 llmapis.com 的 AI 项目,不是又一个通用 Agent 外壳,也不是一个换 prompt 包装出来的“开发效率神器”,而是一个更偏基础设施、却更接近真实使用门槛的问 AppleSiliconLocalAIInferenceLLMAgentInfra
May 10, 2026 May 10, 2026 May 10, 2026 May 10, 2026 DELEGATE-52:大模型在委托式长流程工作中系统性腐蚀文档的实证研究 DELEGATE 52:当 AI 开始替你长流程干活,真正危险的不是答错,而是悄悄把文档改坏 今天 Hacker News 上最值得做深读的一篇 AI 相关内容,不是又一篇“模型更强了”的体验帖,而是一篇更接近现实工作流底层问题的论文: 《LLMs Corrupt Your Documents When You Del AILLMAgentBenchmarkReliabilityDelegationResearch
March 24, 2026 March 24, 2026 March 24, 2026 March 24, 2026 iPhone 17 Pro 运行 400B LLM:端侧大模型进入系统工程竞争新阶段 iPhone 17 Pro 跑 400B LLM:端侧大模型正在从“技术炫技”走向“系统路线之争” 核心解读 今天 Hacker News 上很容易吸引眼球的一条消息,是 iPhone 17 Pro 被演示运行 400B 参数级别的 LLM 。如果只看标题,这很像一条典型的“AI 硬件奇观”新闻:大模型、手机、本地运行 OnDeviceAIEdgeInferenceLLMiPhoneSystemAI
March 24, 2026 March 24, 2026 March 24, 2026 March 24, 2026 Autoresearch 实践解析:42 轮实验背后的科研工作流重构 Autoresearch:当 AI 开始替你跑 42 轮实验,研究工作流正在从“提出假设”转向“编排搜索” 核心解读 今天值得关注的,不只是 Karpathy 提出的 autoresearch 概念本身,而是有人真的把它拿到一个自己熟悉的研究问题上跑了一遍,并且给出了足够具体的实验记录。这篇 Autoresearch AutoresearchResearchAgentClaudeCodeAI4ScienceLLM
March 15, 2026 March 15, 2026 March 15, 2026 March 15, 2026 睡眠时代理:AI自动化的终极形态深度解读 "睡眠时代理":AI 自动化的终极形态 核心解读 "Agents that run while I sleep"(睡眠时代理)不仅是一个技术概念,更是 对"工作"定义的重新思考 。 核心概念 什么是睡眠时代理 ? 用户睡觉时,代理继续工作 24/7 不间断的自动化工作流 不需要人工干预的智能决策 与传统自动化的区别 : AIAgentAutomationWorkflowLLM