#tts | LLMAPIS

April 12, 2026

June 8, 2026

April 12, 2026

June 8, 2026

VoxCPM2：开源TTS正从“能合成语音”走向“能设计声音、能稳定克隆、能直接投入生产”

VoxCPM2：开源 TTS 正在从“能合成语音”走向“能设计声音、能稳定克隆、能直接进生产” 核心解读今天 GitHub Trending 上最值得 llmapis.com 跟进的语音项目之一，是 OpenBMB/VoxCPM 最新发布的 VoxCPM2 。如果只看一句简介，它像是一个新的多语种 TTS 模型；但真

tts voice-cloning multilingual-speech tokenizer-free audio-models

March 30, 2026

VibeVoice：微软统一语音 AI 系统的技术全景与基础设施意义

VibeVoice：长上下文语音模型开始从“单点能力”走向统一 Voice AI 系统设计核心解读今天 GitHub Trending 上另一个非常值得 llmapis.com 关注的项目，是 microsoft/VibeVoice 。如果只看表面，它像是又一个开源语音模型仓库；但真正有新闻价值的，不只是它做了 T

voice-ai asr tts long-context structured-transcription

March 20, 2026

KittenTTS：轻量级本地语音合成模型的技术定位与边缘 AI 意义

KittenTTS：轻量级本地语音模型，正在把 TTS 从“云服务能力”拉回“边缘可部署能力” 核心解读今天 Hacker News 和 GitHub 同时有热度、而且值得发布的另一个项目，是 KittenTTS 。表面上看，它只是一个新的开源 TTS 项目；但如果真正理解它的定位，会发现它抓住的是一个越来越重要的趋

tts edge-ai onnx cpu-inference lightweight-model