功能 · AI 字幕翻译
本地优先,25⁺ 主流语言,精细可控
不是黑盒一键工具,而是 4 步可组合的工序:抓取 → 转录 → 翻译 → 输出。每一步都开放参数。
- 平台原生字幕直抓(YouTube / B 站 等),零成本零延迟
- 本地 Whisper.cpp ASR 兜底,25⁺ 主流语言识别(zh / en / ja / ko / es / fr / de / ru / pt / it / nl / ar / hi / id / vi / th / tr / pl / sv / da / fi / no / cs / uk / el)
- 硬件加速识别:Apple Silicon CoreML / 各平台 GPU 探测 + 自动启用,模型自动下载(ModelScope + HF 镜像 + HF 三源兜底)
- 云端 ASR 备选 BYOK 自带钥匙:OpenAI / Groq / Azure OpenAI / Cloudflare AI 任选,大文件不受本地 25 MB 上限约束
- 硬字幕 OCR 识别(即将随 GA 开放):ffmpeg 抽帧 + 可视化 ROI 框选 + 纯 Rust/ONNX 本地引擎,没有内嵌字幕的视频也能把画面里的硬字幕提取为 SRT(本地推理,免费无网络)
- 说话人分离(即将随 GA 开放):sherpa-onnx 引擎,自动为每句字幕标注 SPEAKER_00 / 01… 区分不同发言人(本地推理,免费无网络)
- OpenSubtitles 第三方字幕库接通:moviehash / IMDb ID / TMDB ID / 关键词四源查询,公开影视字幕一键拉取
- 翻译 backend 可切:本地 ollama 免费兜底 / OpenAI 兼容 / 国产 6 家 provider(预填 baseURL + model preset 一键就位)
- BYOK 翻译质量评分:BLEU 自动算 + COMET 占位(支持 LLM-as-judge 评测)
- 双语字幕:仅译文 / 译文上 / 原文上 三模式可选
- 上下文感知:前后 2 段 / 前后 4 段 / 关闭
- 术语库 + 风格指南可组合,行业术语统一
- 字幕编辑器:导入 srt → 列表编辑(文本 + 时间 ±100ms/±1s)+ 全局 shift + 未保存离开确认 → 导出 srt 同名覆盖
详细演示与截图正在打磨中,1.0 GA 前会补齐。