自动翻译字幕文件 | 总结

"自动翻译字幕文件"具体是什么

一句话:减轻字幕翻译的打字疲劳。少打一些汉字。

具体情景

我是做字幕组的,平常翻译用 Aegisub 这个软件。

12344

做字幕打字其实也是非常累的一个活,哪怕有机械键盘我也觉得很烦。
(机械键盘打字会舒服一些。我在用Flico 67键+红轴+蓝牙)

我的需求就是先让机器自动翻译一遍,机器翻译质量的当然远远不够,
还需要人工之后逐行修改。但是现在工作量就大部分变成了删字/挪动词语,比打字爽很多。

花了20分钟做了个简单设计:
transl
sk

然后发条微博做下调查,看看其他人是否需要,我知道我自己肯定是要的。
https://weibo.com/2004104451/FA47KDboG?from=page_1005052004104451_profile&wvr=6&mod=weibotime
546787896y0

我直接上结论,节省你的时间

目前 2017 年市面上没有好用+好看的网站或桌面 App,
来做到拖入字幕文件 -> 翻译 -> 输出这么一件事情。

接近"好用"这个标准的,也就只有程序员自用的软件。

比如我之前用 Python + Google 来写。拖入字幕文件(.srt/.ass) 到 .py(Python文件)上,弹出一个黑窗口。黑窗口里弹出进展,完成后会保存一个
这是之前写的(2015年),现在也用不了了。因为我翻译字幕的频率下降了,就没有继续维护这个。
https://github.com/1c71/Program-Practice/tree/master/11. Translate-Subtitle
朋友2017年写了一个但是我现在找不到 Github 地址了。

翻译来源

调查了下,现在也就 Google/Microsoft/Yandex 提供翻译 API。
所有的翻译软件无非都是套一层皮,底层都是用它们的翻译服务。

查过的资料

https://www.neno-translate.com/en/blog/48-best-machine-translation-api

GitHub - matheuss/google-translate-api: A free and unlimited API for Google Translate

https://tech.yandex.com/translate/

https://cloud.google.com/translate/

https://www.microsoft.com/en-us/translator/translatorapi.aspx

Translation APIs — Google, Microsoft, Yandex – Vishwesh Shetty – Medium

Google 译者工具包
默认流程要付费,随便选了个文件,谷歌预估了个73美金。然后是跳转到第三方服务商。这里应该点取消。
回到上一层之后从文件列表里面选,点击进去,这里可以下载。
下载下来的文件只有中文,不能选中英双语或者其他选项。(中英双语之间用 \N 换行,或者中英单独两行)
参考这篇文就行了:Translate subtitles quickly with Google’s Translator Toolkit - gHacks Tech News
问题:还是嫌弃麻烦……点来点去。而且没什么选项。

Subtitle Edit 3.5.4
试了3次,每次都崩溃。(Windows 软件)

Subtitles Translator
可用,要从上往下滚动一遍,如果不滚动,整个文件不会翻译全。

SubTranslate - automatic online subtitle translator
用不了。无用网站。

http://www.srt-translator.com/
用不了。

Subs Edit | Translate Subs
还要复制粘贴文字内容进去,没试,嫌麻烦。

https://sourceforge.net/projects/translator-srt/
2016年的软件,不试了,八成不行。

Language Translation Tool for Subtitle Files
复制粘贴内容 或者 上传文件
试过,用不了。

总结

我会业余时间写。因为市面上没有好用的。
用 Electron 来做跨平台(Mac+Windows)
第一版用 Google 的翻译 API。Microsoft 的后面加不加再说。

Web 版看情况,可能也会做。
今天写这篇博客是2017年12月17号。
一边学 Electron 一边写,预计是2018年1月份内可以做好。

另外,上面的设计只是一个简单的,表达一下意思的版本。
到时候我还会加选项。
选项1,选择 from 和 to 语言(默认是英翻中)
选项2,提供换行选择的方式,有的字幕君喜欢 \N 换行,有的就喜欢2行分开。
选项3,保存新文件/替换原文件。

如果你有任何想法想沟通,欢迎邮件 guokrfans#gmail.com

(用@替换#,我是担心爬虫爬走邮件地址给我发垃圾邮件才这样写,v2ex 上甚至还有直接给 base64 编码的邮件地址)

那啥

这个玩意我从2017年12月拖延到现在2018年3月18号
其实大部分的东西都搞定了,就差打包
总是提不起精力去把最后的2%搞定。真是服了自己了

过阵子把这个事情搞定。