Boyce/W

Boyce/W

@holdno

About

Backend engineer with 10 years of experience. 😎 Focused on server-side architecture and AI Agents. 💻 Currently a technical expert at an AI infrastructure company. Indie builder of Quka.AI, a lightweight RAG system turning AI agents’ outputs into data assets. 👍🏻 Creator of llmapis.com, connecting agent developers and teams building AI-powered products.

HangZhou, China
llmapis.com holdno
Joined January 2026

Posts

Boyce/W
Boyce/W · · AI

阿里平头哥官网上线高端AI芯片真武810E。这款芯片实现软硬件全自研,此前曾在媒体曝光中引发关注。这意味着由通义实验室、阿里云和平头哥组成的阿里AI黄金三角 “通云哥” 完整浮出水面。据平头哥官网介绍,真武PPU采用自研并行计算架构和片间互联技术,配合全栈自研软件栈,实现软硬件全自研。其内存为96G HBM2e,片间互联带宽达到700 GB/s,可应用于AI训练、AI推理和自动驾驶。从关键参数来看,“真武” 整体性能超过英伟达A800和主流国产GPU,与英伟达H20相当。另据外媒最新报道,升级版“真武”PPU的性能强于英伟达A100。 - [产品详情](https://www.t-head.cn/product?id=7)

Boyce/W
Boyce/W · · AI

发现一个非常有意思的库:Remotion ([https://www.remotion.dev/](https://www.remotion.dev/)) 🎥 它的核心理念是用 **React** 来编写视频。这意味着我们可以利用前端生态(CSS, Hooks, 组件化)来像写网页一样“写”视频,特别适合做自动化、数据驱动的视频内容。 不过实测下来: **我目前使用 claude code + remotion agent skill 还没办法直接产出丝滑酷炫的视频效果,可能还需要仔细学习一下,先mark。** 📝 感觉上限很高,但还需要更多的人工调优。前端想玩视频的同学可以关注一下。

Post media
Boyce/W
Boyce/W · · AI

OpenAI shows how they scaled a single-primary Azure PostgreSQL instance plus ~50 global read replicas to handle millions of mostly-read queries per second for 800M ChatGPT/API users. They aggressively offload and shard write-heavy workloads to systems like Cosmos DB, optimize expensive queries and ORMs, isolate noisy workloads, use PgBouncer and caching (with cache locking) to protect Postgres, carefully manage schema changes, and are working with Azure on cascading replication—achieving low double-digit ms p99 latency and 99.999% availability while postponing full Postgres sharding. source: [https://openai.com/index/scaling-postgresql](https://openai.com/index/scaling-postgresql)

Boyce/W
Boyce/W · · General

普华永道(PwC)调查了逾 4500 位 CEO,发现尽管在 AI 上投入了大量资金,但大部分 CEO 表示 AI 投资未带来收入增长或成本降低。 接受调查的 4454 位商界领袖中: - 只有 12% 同时实现了成本降低和收入增长 - 56% 既没有降低成本也没有增加收入 - 26% 实现了成本降低,但类似比例的人增加了成本 AI 的普及度仍然有限,即使在需求生成(22%)、支持服务(20%)和产品开发(19%)等热门应用场景中,只有少数企业广泛部署 AI。 从更宏观的角度,普华永道报告 CEO 们的信心跌至五年以来的最低点,仅 30% 的 CEO 对营收增长乐观(低于去年的 38%),表明地缘政治风险日益加剧,网络威胁升级,同时 AI 的利弊也存在不确定性。 来源:[https://slashdot.org/story/26/01/20/2133237/majority-of-ceos-report-zero-payoff-from-ai-splurge](https://slashdot.org/story/26/01/20/2133237/majority-of-ceos-report-zero-payoff-from-ai-splurge)