应用介绍
WhisperLiveKit 是一个开源的实时语音处理工具,结合前端浏览器与后端服务,支持本地运行。它能在超低延迟下完成语音转文字,并提供 多语言翻译、说话人识别、语音活动检测 等功能。
🎯 核心功能与特性
🎙 实时语音转文字:基于 Whisper 与 Simul-Whisper,实现超低延迟的实时转录
🌍 多语言翻译:支持 NLLW/NLLB,覆盖 200 种语言的双向翻译
🗣 说话人识别:集成 Sortformer 与 Diart,实现实时说话人分离与标注
🔊 语音活动检测:采用 Silero VAD,降低无声时的计算开销
⚡ 高性能架构:支持多用户并发,智能缓冲与增量处理,避免语音切割丢失上下文
💻 前后端一体化:提供 Python/FastAPI 后端与 HTML/JS 前端,开箱即用
🤖 AI 模型兼容:可选择 OpenAI API、Faster-Whisper、本地模型(如 MLX Whisper),灵活部署
🐳 Docker 部署:支持 GPU/CPU 容器化运行,方便生产环境集成
应用信息
- 开发者
同类推荐
SmartSage 智医灵枢
「智医灵枢」是一款面向医疗行业的全能型AI智能助手,专为医生与行政人员打造,深度融合人工智能与权威医学知识,全面覆盖临床诊疗与行政办公双重场景。
LUMI
LUMI 是一款接入30+AI工具的小说推文视频制作平台,一键生成爆款小说视频! 集改写、配音、图片生成等于一体,告别繁琐流程,轻松产出高质、吸睛的推文视频。专为小说推文从业者与副业创富者设计,让你真正用 AI 高效变现,掘金流量时代!
模力方舟
模力方舟官方应用,为您提供高效智能的 AI 助手服务。
BiuBiu
AI文生图神器,一键开启,让创意秒现!注册免费试用,支持多图融合和动漫、写实、插画、3D等200+艺术风格,零基础玩转电商设计、社交创作。现在体验,让你的灵感瞬间跃然屏幕!

