来源:腾讯AI实验室
11月13日,深圳 - 腾讯AI Lab今日发布了一款AI辅助翻译产品 - “腾讯辅助翻译”(Transmart),可满足用户快速翻译的需求,用AI辅助人工翻译提高效率和质量。该产品采用业内领先的人机交互式机器翻译技术,融合神经网络机器翻译、统计机器翻译、输入法、语义理解、数据挖掘等多项前沿技术,配合亿级双语平行数据,为用户提供实时智能翻译辅助,帮助用户更好更快地完成翻译任务。产品旨在致敬人工翻译,辅助人工翻译更快、更好地完成任务,探索人工智能赋能翻译行业新思路。
Transmart 核心功能简介
“腾讯辅助翻译”目前专注于中英互译功能,这占国内翻译业务80%以上,希望将中英互译的用户体验极致化。目前产品全面开放,普通用户可登录网页,翻译行业合作伙伴可直接调用多个应用程序接口,包括交互式机器翻译、辅助翻译输入法、个性化机器翻译、定制化机器翻译等。产品同时提供私有化部署,可将全套系统安装到用户本地网络,保证业务数据安全。
近年来,随着神经网络机器翻译技术的快速发展,机器翻译译文质量不断提升,机器翻译取代人工翻译的论调也甚嚣尘上。腾讯辅助翻译团队认为,在实际操作中,现阶段的机器翻译译文经常错漏百出,在完全没有人工干预的情况下,机器翻译译文的准确率并不能达到具体应用领域的翻译要求,如商业合同、法律条文、专业书籍、学术文献、旅游文本等。一名合格的职业翻译不仅需要长期的专业刻苦训练,还要具备大量的实战经验,才有可能胜任具体专业领域的翻译工作。在实际的应用场景下,目前机器翻译译文的准确率还无法与专业人工翻译匹敌。
但是,因为计算能力增强、机器翻译模型创新、语料规模大幅提升,机器翻译译文质量较之前已有明显改善,翻译速度也远胜人工翻译。现阶段,机器翻译可提供译文参考,帮助人工翻译完成一部分相对机械的任务,让人工翻译从繁杂低效的打字、查词等体力劳动中解脱出来,将精力投入到更高层次的译文创作中。在机器翻译等人工智能技术辅助人工翻译过程中,人工翻译将获得个性化机器翻译结果。通过人工与机器之间的互动,进一步提升翻译效率和质量。机器翻译不能替代人工翻译,但将重构人工翻译过程,腾讯辅助翻译正是基于这种理念而开发出来的技术创新产品,旨在提升人工翻译效率和翻译质量,满足日益增长的翻译需求。
腾讯辅助翻译产品采用了团队自研的人机交互式机器翻译技术,是一款人工智能辅助翻译互联网落地产品。人机交互式机器翻译技术专门针对人工翻译过程,是人工智能辅助翻译系统的核心技术。与一般的机器翻译相比,人机交互式机器翻译的重要特征是允许用户实时干预译文生成,提供交互式机器翻译、翻译输入法、实时译文建议等高效交互手段以提高人工翻译效率。腾讯辅助翻译实现了两个“第一”:
1、内核是国内第一个公开的交互式机器翻译的互联网落地产品;
2、搭载了业内第一个公开的融合机器翻译的辅助翻译输入法。该产品融合了人工智能和传统辅助翻译技术,为用户提供更便捷、流畅的人工翻译体验。
腾讯辅助翻译具体功能亮点如下:
交互式机器翻译
首个公开的交互式机器翻译互联网落地产品,根据输入内容实时更新自动译文,显著提升翻译效率。
交互式机器翻译基于自主实现的约束翻译解码技术,在提升译文准确性的同时,解码速度也被优化到满足互联网环境中实时交互的要求。实时解码速度是影响交互式机器翻译产品落地的关键因素。结合已有积累,腾讯AI Lab设计并实现了专用于人机交互的神经机器翻译系统。与普通机器翻译不同,交互式机器翻译的挑战主要在于无法预测用户动作,从而难以通过对原文建立缓存等常规方法来加快响应速度。腾讯AI Lab不断攻克技术难关,并一直致力于创造用户体验更佳的交互式机器翻译产品。
辅助翻译输入法
首个融合机器翻译的辅助翻译输入法产品,比普通输入法更少的按键数,显著减少打字时间。更快捷的拼音转汉字、更准确的单词补全,让用户享受翻译过程。
普通输入法因为难以感知翻译场景中的上下文信息,在准确性和个性化方面还有较大的提升空间。与普通输入法相比,辅助翻译输入法可利用统计机器翻译和神经网络机器翻译的知识,极大提升自动组词和推荐短语的准确性,同时使输入预测更具个性化。
自主实现的输入法知识挖掘算法,持续从海量互联网数据、亿级双语句对中抽取片断翻译知识,以此作为辅助翻译输入法的基础。在翻译过程中,再实时融合当前句子的机器翻译上下文信息,辅助用户快速完成翻译任务。
比如翻译英文句子“Jane Zhang became the first Chinese singer to perform for Victoria's Secret, joining the ranks of Taylor Swift and Katy Perry.”时,自动机器翻译错误地把张靓颖的英文名“Jane Zhang”翻译成了“简·张”:
当用QQ拼音输入法时,需要输入“zhangliangy”共11个字母才能得到正确的“张靓颖”。
但是,采用辅助翻译输入法之后,因为有数据挖掘和机器翻译知识的支撑,只需要输入“zl”就可以得到期望的结果。
由此可见,辅助翻译输入法能够通过减少打字敲键数,提升人工翻译效率。
实时译文建议
基于自研的神经网络机器翻译引擎,提供灵活、准确的实时译文片断智能推荐,并可根据用户翻译历史和习惯不断学习,提供更贴合用户期待的个性化译文建议。
因目前阶段的机器翻译技术所限,机器译文的准确率并不高,因此提供的实时译文建议不能太长,否则会降低人工翻译效率。实时译文建议的难题就在于如何提供长度适中、准确率也比较高的短语或者子句。为此,腾讯 AI Lab 提出并实现了译文智能推荐算法,综合统计机器翻译、神经机器翻译等技术,尽量为用户提供最合适的译文建议。
比如,在翻译句子“首届中国国际进口博览会即将于11月5日开幕。”时,智能推荐算法发现机器译文将“开幕”一词翻译为“open”,但是在相对正式的文本中,翻译为“...be held”更恰当。智能推荐预测用户可能会在此处进行修改,就缩短了推荐片段,只推荐“...will”,方便用户直接采用。
千万级专业术语、亿级例句参照
与传统辅助翻译软件相比,智能译文建议的来源不再局限于用户导入的术语库,而是全面综合互联网海量数据。腾讯AI Lab从几百TB的互联网文本中挖掘了数千万的专业术语翻译和亿级双语例句提供给用户作为翻译参考信息。然后以句子为维度关联展示术语库、例句库等参考信息,满足用户多领域、多文体的翻译需求。
辅助翻译API与定制化服务
为合作伙伴开放交互式机器翻译、辅助翻译输入法、个性化机器翻译API、定制化机器翻译等多个应用程序接口,提供定制化服务。辅助翻译API与定制化服务相关事宜,可以联系transmart@tencent.com。
腾讯辅助翻译由腾讯AI Lab的内部团队历时一年完成。腾讯AI Lab是腾讯的企业级AI实验室,于2016年4月成立,目前在中国和美国有70位顶尖研究科学家及300位应用工程师。自然语言处理(Natural Language Processing,简称NLP)是四大主要研究领域之一。NLP团队致力于追踪和研究最前沿的自然语言文本理解和生成技术,并孵化下一代自然语言处理技术与商业应用场景。团队科学家已在前沿理论研究上取得诸多创造性成果,在应用探索方面,其文本理解、文本生成、对话和机器翻译等技术已应用于公司诸多产品,提升产品智能化以更好服务用户。
未来智能实验室是人工智能学家与科学院相关机构联合成立的人工智能,互联网和脑科学交叉研究机构。
未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)云脑研究计划,构建互联网(城市)云脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。
如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”