noScribe

桌面应用语音视频
立即下载
应用介绍

noScribe 是一款免费开源、完全离线的 AI 语音转写桌面软件,专为采访、学术研究和需要隐私保护的场景设计。它基于 OpenAI Whisper、faster-whisper 和 Pyannote 技术,可将多语言音频或视频精准转换为文字,并提供内置编辑器方便校对。


🎯 核心功能

支持几乎所有音频和视频格式导入。

可自动检测或手动选择语言,支持约 60 种语言及多语音轨。

提供说话人识别、重叠讲话标记、暂停标记和时间戳等高级转写选项。

允许设置起止时间,只转写录音的部分片段。

输出格式多样:HTML(默认,可直接在内置编辑器或常见文字处理软件中打开)、VTT 字幕、纯文本。

内置独立编辑器,可边听边改,支持查找替换、快捷键和音频跟随。

运行全程在本地,自动保存并生成日志,可加载自定义模型与多语言界面。


🛠 软件下载与安装

版本:当前为 0.6.2(免费开源 GPL-3.0),所有安装包托管在瑞士大学的安全平台 SWITCHdrive。

Windows

  • 普通版:适合无 NVIDIA 显卡的电脑。

  • CUDA 加速版:适合拥有 ≥6GB 显存的 NVIDIA 显卡,需要安装最新版驱动和 CUDA 工具包。

  • 安装:运行下载的安装程序,若出现“未知开发者”提示需选择“仍然运行”。

macOS

  • Apple Silicon(M1–M4):下载 dmg 文件并拖入应用程序文件夹,需安装 Rosetta2。

  • Intel Mac:提供实验版 0.6.2 和稳定版 0.5;首次启动需在“隐私与安全”中允许来自未注册开发者的应用。

Linux

  • 提供 CPU 和 CUDA 版本,可直接解压运行,也可按说明从源码安装并创建 Python 虚拟环境。


    🧩 主要使用步骤

    1. 导入文件:支持几乎所有音频、视频格式。

    2. 输出设置:选择输出文件名及格式(默认 HTML,也可导出 VTT 字幕或 TXT 纯文本)。

    3. 时间范围:可设置开始与结束时间,仅转写指定片段。

    4. 语言:自动检测或手动选择,支持约 60 种语言,多语音轨为实验功能。

    5. 质量模式:Precise(高精度)或 Fast(快速)。

    6. 高级选项

      • 暂停标记、重叠讲话标记、口语词记录

      • 说话人识别,可自动或手动指定人数

      • 可启用时间戳(每位说话人变化或每 60 秒)

feedback