[点子#2] 文档翻译助手
翻译 .pdf 文件
说明
我就简单写几句,不弄成以往的 "这篇文讲什么""这篇文对谁有用" 格式。
这点子就公开写出来,谁觉得有搞头可以自己搞。
我还没调研过可行性。
如果之后我调研过,觉得可以弄,我才会去开发。反正这文章写出来就交流一下。
想法:"文档翻译助手"(暂定名)
这个点子来自于用户的反馈。
"字幕组机翻小助手"的用户。
"字幕组机翻小助手"可以翻译 .srt .ass 文件。
可以配置9家API(谷歌,彩云,百度,腾讯,小牛,亚马逊,Azure, Yandex,搜狗)
然后
有用户提出"能不能支持 pdf 翻译"。也就是文档翻译。
我的第一反应是,"不是所有翻译服务商都支持文档翻译吗?"
这个问题应该已经解决了。
以下是各家翻译服务商,网页版工具里的"文档翻译"截图:
百度
搜狗
有道
谷歌
彩云
腾讯
Yandex
小牛
彩云
微软
网易见外
我做了些调查
结论:
- 共10家翻译商,8家支持文档翻译。2家不支持。
- 就算支持文档翻译的。文件格式(pdf/doc),语言数量(中英日韩),文件大小(5mb),文件字数(10万字) 也有限制。
各家翻译服务商的简单总结
- 百度:只能翻译一半
- 谷歌:不能导出,而且要翻墙
- 搜狗:慢,经常失败
- 有道:贵
- 小牛:不支持 pdf 格式
- 微软:不支持 pdf 格式,只支持 docx 和 txt
- Yandex: 能用,看起来是免费的,不能导出
- 彩云: 能用,能导出,挺快,有免费额度
翻译服务商的结论:彩云最好
原因:
- 有一定免费额度
- 能导出
回到前面反馈需求的这位用户,简而言之他/她想要的是:
- 希望支持多家 API,可以自己配置。
- 支持 pdf 格式。
结论
看上去,好像可以做做看。
做一个支持9家翻译服务商 API 的,支持 pdf 格式的。
作为第一版 MVP。
- 产品可行性:可行。问题的确存在,需求也是有的。
- 商业可行性:未知,但起码这位用户说愿意付费30元。
- 技术可行性:未知,暂未调研。但难点只会是"文件格式的读取"和"格式处理"这两个。
总而言之
这文我就公开写出来了。谁觉得这个点子有搞头,做出来可以赚,那大可以自己试试。
郑重说明:本人不对读者做出的决策承担任何连带责任。如果你自己做出来了赚不了钱,不能怪我。
2020-1-31 更新
发现 IBM 有个文档翻译
试验结果:质量差。不推荐使用。
具体过程如下:
我们先来看看文档:
我拿了个 1.5mb 的小说测试英翻中
等了大概3-5分钟才翻译完成。
得到一个 15.4mb 的文件。
翻译质量很差
结论是: IBM 文档翻译目前质量还不行
翻译小说是不要想了。
其他类型:如论文或者技术性书籍。我没试过。
全文完
2020-2-5 更新
补充了网易见外的文档翻译截图