[点子#2] 文档翻译助手

翻译 .pdf 文件

[点子#2] 文档翻译助手

说明

我就简单写几句,不弄成以往的 "这篇文讲什么""这篇文对谁有用" 格式。
这点子就公开写出来,谁觉得有搞头可以自己搞。

我还没调研过可行性。
如果之后我调研过,觉得可以弄,我才会去开发。反正这文章写出来就交流一下。

想法:"文档翻译助手"(暂定名)

这个点子来自于用户的反馈。
"字幕组机翻小助手"的用户。

"字幕组机翻小助手"可以翻译 .srt .ass 文件。
可以配置9家API(谷歌,彩云,百度,腾讯,小牛,亚马逊,Azure, Yandex,搜狗)

然后

有用户提出"能不能支持 pdf 翻译"。也就是文档翻译。
我的第一反应是,"不是所有翻译服务商都支持文档翻译吗?"
这个问题应该已经解决了。

以下是各家翻译服务商,网页版工具里的"文档翻译"截图:

百度

搜狗

搜狗

有道

有道

谷歌

谷歌
谷歌的不能导出也是奇怪

彩云

腾讯

腾讯

Yandex

Yandex

小牛

小牛
小牛

彩云

微软

网易见外

我做了些调查

结论:

  1. 共10家翻译商,8家支持文档翻译。2家不支持。
  2. 就算支持文档翻译的。文件格式(pdf/doc),语言数量(中英日韩),文件大小(5mb),文件字数(10万字) 也有限制。

各家翻译服务商的简单总结

  1. 百度:只能翻译一半
  2. 谷歌:不能导出,而且要翻墙
  3. 搜狗:慢,经常失败
  4. 有道:贵
  5. 小牛:不支持 pdf 格式
  6. 微软:不支持 pdf 格式,只支持 docx 和 txt
  7. Yandex: 能用,看起来是免费的,不能导出
  8. 彩云: 能用,能导出,挺快,有免费额度

翻译服务商的结论:彩云最好
原因:

  1. 有一定免费额度
  2. 能导出

回到前面反馈需求的这位用户,简而言之他/她想要的是:

  1. 希望支持多家 API,可以自己配置。
  2. 支持 pdf 格式。

结论

看上去,好像可以做做看。
做一个支持9家翻译服务商 API 的,支持 pdf 格式的。
作为第一版 MVP。

  1. 产品可行性:可行。问题的确存在,需求也是有的。
  2. 商业可行性:未知,但起码这位用户说愿意付费30元。
  3. 技术可行性:未知,暂未调研。但难点只会是"文件格式的读取"和"格式处理"这两个。

总而言之

这文我就公开写出来了。谁觉得这个点子有搞头,做出来可以赚,那大可以自己试试。
郑重说明:本人不对读者做出的决策承担任何连带责任。如果你自己做出来了赚不了钱,不能怪我。

2020-1-31 更新

发现 IBM 有个文档翻译

试验结果:质量差。不推荐使用。

具体过程如下:

我们先来看看文档:

我拿了个 1.5mb 的小说测试英翻中

等了大概3-5分钟才翻译完成。
得到一个 15.4mb 的文件。

翻译质量很差

结论是: IBM 文档翻译目前质量还不行

翻译小说是不要想了。
其他类型:如论文或者技术性书籍。我没试过。

全文完

2020-2-5 更新

补充了网易见外的文档翻译截图