Kokoro-FastAPI

Web 应用语音视频
立即访问
应用介绍

Kokoro-FastAPI 是一个基于 FastAPI 的高性能文本转语音服务,为 Kokoro-82M 模型提供开箱即用的 API 部署方式。它支持 CPU/GPU 推理、Docker 一键启动,并完全兼容 OpenAI 的语音生成接口,让开发者轻松构建本地或云端的高质量语音生成系统。


🌟核心特性与功能:

🔊 多语言语音生成: 支持英语、中文、日语等自然流畅的 TTS 输出

🔌 OpenAI API 兼容: 提供 /v1/audio/speech 等 OpenAI 风格端点

🚀 GPU/CPU 推理支持: 可在 GPU 加速或纯 CPU 环境运行

🐳 Docker 一键部署: 提供 CPU/GPU 镜像快速启动服务

🎙 声音混合能力: 支持多声音按比例混合生成新音色

📝 词级时间戳: 输出带有 word-level timestamps 的语音数据

🔁 流式语音生成: 支持实时流式输出,提升交互体验

🌐 内置 Web UI: 通过 /web 提供可视化调试与测试界面

feedback