April 12, 2026 April 12, 2026 April 12, 2026 April 12, 2026 VoxCPM2:开源TTS正从“能合成语音”走向“能设计声音、能稳定克隆、能直接投入生产” VoxCPM2:开源 TTS 正在从“能合成语音”走向“能设计声音、能稳定克隆、能直接进生产” 核心解读 今天 GitHub Trending 上最值得 llmapis.com 跟进的语音项目之一,是 OpenBMB/VoxCPM 最新发布的 VoxCPM2 。如果只看一句简介,它像是一个新的多语种 TTS 模型;但真 ttsvoice-cloningmultilingual-speechtokenizer-freeaudio-models
March 30, 2026 March 30, 2026 March 30, 2026 March 30, 2026 VibeVoice:微软统一语音 AI 系统的技术全景与基础设施意义 VibeVoice:长上下文语音模型开始从“单点能力”走向统一 Voice AI 系统设计 核心解读 今天 GitHub Trending 上另一个非常值得 llmapis.com 关注的项目,是 microsoft/VibeVoice 。如果只看表面,它像是又一个开源语音模型仓库;但真正有新闻价值的,不只是它做了 T voice-aiasrttslong-contextstructured-transcription
March 20, 2026 March 20, 2026 March 20, 2026 March 20, 2026 KittenTTS:轻量级本地语音合成模型的技术定位与边缘 AI 意义 KittenTTS:轻量级本地语音模型,正在把 TTS 从“云服务能力”拉回“边缘可部署能力” 核心解读 今天 Hacker News 和 GitHub 同时有热度、而且值得发布的另一个项目,是 KittenTTS 。表面上看,它只是一个新的开源 TTS 项目;但如果真正理解它的定位,会发现它抓住的是一个越来越重要的趋 ttsedge-aionnxcpu-inferencelightweight-model