应用介绍
Kokoro-FastAPI 是一个基于 FastAPI 的高性能文本转语音服务,为 Kokoro-82M 模型提供开箱即用的 API 部署方式。它支持 CPU/GPU 推理、Docker 一键启动,并完全兼容 OpenAI 的语音生成接口,让开发者轻松构建本地或云端的高质量语音生成系统。
🌟核心特性与功能:
🔊 多语言语音生成: 支持英语、中文、日语等自然流畅的 TTS 输出
🔌 OpenAI API 兼容: 提供 /v1/audio/speech 等 OpenAI 风格端点
🚀 GPU/CPU 推理支持: 可在 GPU 加速或纯 CPU 环境运行
🐳 Docker 一键部署: 提供 CPU/GPU 镜像快速启动服务
🎙 声音混合能力: 支持多声音按比例混合生成新音色
📝 词级时间戳: 输出带有 word-level timestamps 的语音数据
🔁 流式语音生成: 支持实时流式输出,提升交互体验
🌐 内置 Web UI: 通过 /web 提供可视化调试与测试界面

