原标题:入驻腾讯 AI 加速器,「译马网」想要机器翻译逐渐替代人工
据中CSA2015年年调查显示,全球语言服务的市场规模接近380亿美元,同比增长6.4%,其中在中国从事翻译服务的注册机构达7万多家,从事翻译的职业人士在200万人左右。
过去,2B翻译是一个典型的劳动力密集型产业,一方面过渡依赖人力,无法规模化生产;与此同时,生产链条过长导致沟通成本过高,再加上翻译价格的持续下降,翻译行业的摩擦成本越来越高。
36氪近期接触到的译马网成立于2015年,其前身是一家成立于2006年的翻译公司。成立初期,译马网的定位是一家提供翻译项目管理的服务平台,致力于优化2B翻译行业的流程管理。提供协同翻译、译审同步与自动查错等功能模块。
创始人兼 CEO 张马成告诉36氪,以协同功能为例,过去当翻译公司接到用户需求后,会先交由项目经理审稿,项目经理依靠主观经验判断这篇稿件所属的专业领域与难易程度,根据这些信息项目经理需要去匹配符合的翻译员,这个过程还需要与翻译员沟通确定是否接单;沟通完翻译员之后,项目经理要再对接审校人员、排版人员等多达5~8个不同环节的工作人员。所有环节都是双向沟通,这也进一步限制了单个项目经理服务客户的上限。
译马网的价值相当于帮助项目经理提升单位时间的产能,比如平台会给每位翻译员贴上标签、梳理其擅长的领域以及翻译的水准,以便项目经理快速搜索到合适的译员。当文稿量巨大,涉及多个译员一齐翻译一篇文章时,为了解决不同译员的用词和翻译习惯的异同,平台会提供特定场景下的术语库,比如当A翻译员将Computer翻译为计算机,那么B/C/D译员翻译Computer时,系统会自动显示为计算机,而不是电脑等其他用词。与此同时,审校人也会同步译员做审稿,机器也会在翻译过程中自动查错纠错。
但是就算采用平台的方式提高了效率,只要是人工翻译,都会有犯错的时候。张马成表示,团队今年开始引入AI去提升工作效率与翻译的精准度,目前主要有以下两个应用方向:其一是代替项目经理去判断文本的领域,由机器快速识别文本并自动分配给相关领域的译员;另一个方向则是提供垂直细分的神经网络机器翻译,构建人机交互的编辑平台。
目前这种以机器翻译为主,人工翻译为辅的模式支持国际工程、机械制造与生物制药这三个领域,这也是译马网在过去很长时间积累了这3个领域大量的数据,并一直在这三个领域构建知识图谱。按照张马成的说法,机器翻译为主的翻译模式,将单个翻译人员4000字的日平均工作量提升到10000字,在这个场景下,翻译人员要做的事主要以调整句子结构及润色。
关于机器翻译目前存的局限性一直是学界以及商界应用的一大难题,其对语料规模的依赖度不高,但对语料质量的依赖度非常强。针对这类情况,译马网的做法是将行业类别进一步细分,把领域做到足够窄,持续对语料清洗,筛选出高质量的语料。而在算法层面上,依托于自身机器翻译研发人员不断地进行优化外,译马网也对外开展积极的合作,例如加入腾讯AI Lab,与其NLP团队开展合作,算法模型也在进一步优化。
由于译马网是一个2B翻译的项目管理平台,所以其主要商业模式是以SaaS的方式以年为单位收取服务费,每个账号为1000元人民币。不同类型的企业可根据自身情况购买相应的账号数,每个账户只限一人使用,无论他是翻译人员还是项目管理人员。除了SaaS的商业模式以外,译马网也会为大型客户、政府部门提供私有化部署及定制化服务。
译马网2017年的销售额较2016年相比实现了翻番,今年10月份后,成功实现正向现金流。译马网目前全职员工50人余人,有过3次融资经历,种子轮为赛创合伙,天使轮为德商资本,Pre-A轮为上海界石资本。
译马网目前正在寻求新一轮A轮融资,资金需求1500万人民币,主要用于引进高端AI人才并寻求外部合作。