noScribe - 应用市场 - 模力方舟（Gitee AI）

模型广场HOT 算力市场模型微调应用市场文档

上架我的应用

2

noScribe

桌面应用语音视频

应用介绍

noScribe 是一款免费开源、完全离线的 AI 语音转写桌面软件，专为采访、学术研究和需要隐私保护的场景设计。它基于 OpenAI Whisper、faster-whisper 和 Pyannote 技术，可将多语言音频或视频精准转换为文字，并提供内置编辑器方便校对。

🎯 核心功能

支持几乎所有音频和视频格式导入。

可自动检测或手动选择语言，支持约 60 种语言及多语音轨。

提供说话人识别、重叠讲话标记、暂停标记和时间戳等高级转写选项。

允许设置起止时间，只转写录音的部分片段。

输出格式多样：HTML（默认，可直接在内置编辑器或常见文字处理软件中打开）、VTT 字幕、纯文本。

内置独立编辑器，可边听边改，支持查找替换、快捷键和音频跟随。

运行全程在本地，自动保存并生成日志，可加载自定义模型与多语言界面。

🛠 软件下载与安装

版本：当前为 0.6.2（免费开源 GPL-3.0），所有安装包托管在瑞士大学的安全平台 SWITCHdrive。

Windows

普通版：适合无 NVIDIA 显卡的电脑。
CUDA 加速版：适合拥有 ≥6GB 显存的 NVIDIA 显卡，需要安装最新版驱动和 CUDA 工具包。
安装：运行下载的安装程序，若出现“未知开发者”提示需选择“仍然运行”。

macOS

Apple Silicon（M1–M4）：下载 dmg 文件并拖入应用程序文件夹，需安装 Rosetta2。
Intel Mac：提供实验版 0.6.2 和稳定版 0.5；首次启动需在“隐私与安全”中允许来自未注册开发者的应用。

Linux

提供 CPU 和 CUDA 版本，可直接解压运行，也可按说明从源码安装并创建 Python 虚拟环境。
🧩 主要使用步骤
1. 导入文件：支持几乎所有音频、视频格式。
2. 输出设置：选择输出文件名及格式（默认 HTML，也可导出 VTT 字幕或 TXT 纯文本）。
3. 时间范围：可设置开始与结束时间，仅转写指定片段。
4. 语言：自动检测或手动选择，支持约 60 种语言，多语音轨为实验功能。
5. 质量模式：Precise（高精度）或 Fast（快速）。
6. 高级选项：
  - 暂停标记、重叠讲话标记、口语词记录
  - 说话人识别，可自动或手动指定人数
  - 可启用时间戳（每位说话人变化或每 60 秒）

应用信息

开发者
应用小助手应应用小助手

同类推荐

LUMI 是一款接入30+AI工具的小说推文视频制作平台，一键生成爆款小说视频！集改写、配音、图片生成等于一体，告别繁琐流程，轻松产出高质、吸睛的推文视频。专为小说推文从业者与副业创富者设计，让你真正用 AI 高效变现，掘金流量时代！