应用介绍
Real-Time AI Voice Chat 允许您仅使用语音与大型语言模型 (LLM) 聊天,并近乎实时地接收口头响应。将其视为您自己的数字对话伙伴。
🎯 主要特点
流畅的对话: 说话和听,就像真正的聊天一样。
实时反馈: 查看部分转录和 AI 响应。
低延迟对焦: 使用音频块流的优化架构。
智能轮流: 动态静音检测 (turndetect.py) 适应对话节奏。
灵活的人工智能大脑: 可插拔的 LLM 后端(Ollama 默认,通过 llm_module.py 支持 OpenAI)。
可定制的声音: 从不同的文本转语音引擎中进行选择(Kokoro、Coqui、Orpheus 通过 audio_module.py)。
Web 界面: 使用 Vanilla JS 和 Web Audio API 的干净简单的 UI。
Docker 化部署: 建议使用 Docker Compose 进行设置,以便于依赖项管理。

