如何实现免费的文档翻译

文中有彩蛋,请一定要看完。

目录

文中有彩蛋,请一定要看完。

一、问题的提出

二、文档翻译现状

三、如何免费海量文档翻译

1. 采用CAT工具+机器翻译API法

2. 采用小牛文档翻译

四、学后反思


一、问题的提出

随着互联网和人工智能技术的飞速发展,在线翻译正在经历着革命性的变化。我们现在可以借助SDL Trados、 Memoq、译马CAT、YiCAT等计算机辅助翻译工具,有道、知云、GT4T等翻译软件,以及沉浸式翻译插件、彩云小译、有道灵动翻译,调用谷歌、Bing、小牛、有道等多个机器翻译API,辅以ChatGPT人工智能大模型来对译文进行评估和润色,帮助我们快速地获取流畅、准确的译文。

随着对外贸易需求不断加快,各国之间的经贸往来和人文交流日益频繁,语言服务行业也面临着各种挑战。当前,如何能够在确保翻译质量的前提下,降低使用门槛,减少支出预算,最大限度保留文件格式,高效快捷进行文档翻译已经成为校政行企等各级工作者日益增长的需求。

二、文档翻译现状

目前,文档翻译可以通过在线网站、CAT工具、翻译软件、Python调用机器翻译api来实现。

文档翻译

一般的在线翻译网站都会提供免费文档翻译,谷歌、Deepl、小牛、有道、搜狗、百度等平台都提供此项服务,收费情况也各不相同。国外的文档翻译受网络影响较大,而且收费较高,如Google的免费文档翻译提供10M以下,300页以内的文档翻译,文件仅限:.docx、.pdf、.pptx、.xlsx等格式。Deepl的入门级文档翻译收费高达8.74美元,免费白嫖难度大,而且像Deepl还会在翻译文档中放置难以根除的水印。

目前,小牛、有道、搜狗、百度等国内大厂都提供免费的文档翻译,有道、搜狗、百度的机翻质量还可以,但是其免费翻译额度有限,目前来看小牛翻译提供文档免费额度最多,每天提供100页的翻译额度,每月可享受3000页免费文档翻译额度,而且还开放了文档翻译的API,因此受到国内用户的青睐。

CAT工具是我们进行文档翻译的利器,但是前提是你必须安装价格高昂的CAT工具(如emoq每个单机授权高达5000RMB),熟练掌握Trados, Memoq或者Transmate等翻译CAT软件的基本使用方法,会使用CAT软件安装机器翻译的插件和相应的机器翻译api额度,如Trados和Memoq中内置常用的翻译插件,都可以调用免费的Bing翻译、阿里云和小牛机器翻译插件。这样方法虽然可行,但是有一定门槛,需要支付软件费用,学习CAT工具的使用方法,付出一定的学习成本,因此非专业译者一般不会采用这种方法。

Python软件也是我们调用机器翻译api进行文档翻译的重要工具。用户使用时需要有一定的Python编程语法基础,能够看懂并修改各大翻译提供商给出的样例代码,同时还得会使用python-docx, openpyxl, os等常见模块。此前我们就通过python来调用小牛机器翻译api实现快速翻译。

虽然Python是免费开源的编程软件,省去了购买CAT工具的麻烦,但是学习应用难度较大,普通的用户都会望而却步。以下是我整理个的Python调用各大机器翻译API的代码,大家可以参考使用。知云文献翻译8.0和Xtranslator两款翻译软件相互配合,则可以切换6个机器翻译引擎,进行高效的文档片段的翻译,软件是自动中英互译,不支持其他小语种,也不支持全文翻译。使用时,需要下载安装相应的翻译软件,初级用户在翻译额度上还有一定的限制。

三、如何免费海量文档翻译

如果我们要进行快速大量免费文档翻译,根据之前对文档翻译现状的分析,我们考虑尽可能地减少实现步骤,提升翻译效率和质量,降低预算。综合考量后,我们建议采用如下两种方法。由于搜狗、百度等平台有一定的页数限制,这里就不做详细介绍,主要介绍CAT工具法和小牛文档翻译两种。

1. 采用CAT工具+机器翻译API法

Trados, Memoq等国外CAT工具对计算机系统配置要求较高,运行速度慢,操作复杂,购买费用较高,因此我们采用国内免费的翻译CAT工具,如Transmate 7.3。这是一款本地安装版软件,内置百度翻译、有道翻译两款机器翻译api的调用接口,支持对于docx, xlsx, pptx等办公文件进行高效快速的翻译,还可以调用翻译记忆库和术语库,保留文件的格式。此方法的弊端是需要消耗机器翻译api的额度,百度高级认证版每月最多提供100万字符的免费翻译额度,而有道翻译目前新注册用户免费额度只有100万,用完就需要购买。

这种方法适用于懂一些翻译CAT工具的使用,追求译文高质量,希望译完进行译后编辑的中高级需求者使用。

2. 采用小牛文档翻译

小牛翻译云平台由小牛翻译团队(核心成员来自东北大学自然语言处理实验室)自主研发的国产机器翻译平台,具备稳定性和安全性的特点。

对于普通的用户,建议使用小牛的网页在线文档翻译,因为它上手容易、操作简单,不需要安装和学习CAT工具或者是学习软件,支持上百种语言的互译,而且每天提供20万字符、多达100页的免费文档翻译额度,还可以通过签到领流量的方法获取更多,足够满足我们日常的翻译需求。

小牛翻译网站界面

它的在线版支持格式:PDF、DOCX、DOC、PPT、PPTX、XLS、XLSX等文档格式,免费版可以上传大小为10M以下的文件,支持进行上百种语言之间的随意转换,是目前国内文档翻译中支持语言种数最多,提供免费的翻译额度最多的厂家之一。它支持后台自定义翻译术语库、记忆库,而且不限制条数,可以有效地对译文进行术语干预,进一步提升译文的质量。

小牛机器翻译提供清爽的翻译页面,使用者打开网站,导入文件,点击翻译就可以快速实现免费的在线文档翻译。我们可以通过以下步骤实现这一过程。

第一步,注册网站。我们需要注册小牛翻译网站,目前小牛支持手机号、邮箱和扫码注册。

注册小牛翻译

大家先进入以下网址,如果是第一次注册小牛,就可得到高达1212页免费文档翻译额度。

http://www.niutrans.com

第二步,打开网址。我们打开小牛文档翻译的网址。或者打开小牛官网,切换到文档翻译选项卡,进入档翻译界面,选择源语言和目标语言类型。

上传文件

第四步开始翻译。文件提交以后,就会出现在网页下方的文件列表当中,并且在它的右侧会一个蓝色的【翻译】按钮。点击翻译,就可以很快实现本地文档的在线翻译。由于文档上传是加密传输,不存在泄露的风险,而且整个翻译过程是在远程的服务器上进行的,因此速度相当快。

如果想进一步提升译文的质量,可以在小牛翻译的后台添加术语库和翻译记忆库,在翻译过程中启用。

文档翻译中应用术语库和翻译记忆库

第五步,下载译文。可以选择下载了。下载格式支持原文文件、译文文件和双语文件三种。

下载翻译后的文档

如果还想对译文进行简单的译后编辑,可以下载双语文件,如下图所示。

翻译后的文档

接下来,我们测试有格式的文档:我们把原文进行格式化处理,添加下划线,文字底色等,然后导入小牛翻译。以下是格式化后的原文:

带格式的原文

以下是翻译后的译文。

带格式的译文

二者对比,可以看出,在保证较高的翻译质量前提下,译文高质量地保留了原文的格式,用户不必对译文进行过多的格式调整,极大地减轻了工作量。

四、学后反思

1. 面对语言服务行业用户需求的不断提升,各大企业都在回应市场需求,不断完善自身产品,比如有道、百度都把AI技术放入了翻译工作流中,对于用户来说智能翻译、AI大模型翻译无疑更加吸引人。

2. 小牛的文档翻译的确不错,免费额度大、格式保留好、翻译质量高,但是我们也看到小牛翻译存在的一些不足,比如:界面不够大气,文字显示比较小,用户体验还需要进一步提升。尽管其自主研发了CAT插件、OFFICE插件、翻译APP,但是其翻译过程中目前还没有融入AI技术,也没有开发电脑端的翻译软件,因此未来还有进一步的提升空间。

3. 对于文档翻译的选择,建议专职译员还是用CAT工具,普通用户使用小牛、百度、Google的在线文档翻译,科研工作者阅读英文文献可以用知云和X-translator。如果想在Office中直接应用翻译,可以选择小牛翻译的office翻译插件。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/225042.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Kubernetes 容器编排(2)

可视化部署 官方Dashboard 部署Dashboard # kubectl apply -f https://raw.githubusercontent.com/kubernetes/dashboard/v2.4.0/aio/deploy/recommended.yaml # kubectl edit svc kubernetes-dashboard -n kubernetes-dashboard # 注意将 type: ClusterIP 改为 type: NodePo…

案例064:基于微信小程序的考研论坛设计与实现

文末获取源码 开发语言:Java 框架:SSM JDK版本:JDK1.8 数据库:mysql 5.7 开发软件:eclipse/myeclipse/idea Maven包:Maven3.5.4 小程序框架:uniapp 小程序开发软件:HBuilder X 小程序…

php入门、安装wampserver教程

php声称是全世界最好的语言,今天这篇文章就带大家入门学习php,php和python、javasript一样,是一种弱类型的脚本语言。 一、php开发环境搭建 作为初学者,学习php建议安装wampserver,wampserver是包含了apache、php和mys…

MFC逆向之CrackMe Level3 过反调试 + 写注册机

今天我来分享一下,过反调试的方法以及使用IDA还原代码 写注册机的过程 由于内容太多,我准备分为两个帖子写,这个帖子主要是写IDA还原代码,下一个帖子是写反调试的分析以及过反调试和异常 这个CrackMe Level3是一个朋友发我的,我也不知道他在哪里弄的,我感觉挺好玩的,对反调试…

VMP泄露编译的一些注意事项

VMP编译教程 鉴于VMP已经在GitHub上被大佬强制开源,特此出一期编译教程。各位熟悉的可以略过,不熟悉的可以参考一下。 环境(软件) Visual Studio 2015 - 2022 (建议使用VS2019,Qt插件只有这个版本及以上…

vscode的文件和文件夹的警告标志如何消去

由于平时用vscode写一些java的小demo, 但是这个vscode的警告和错误管理很奇怪, 这个警告信息会显示在这个侧边的文件和文件夹中, 我上网上找能不能把这个给去掉的办法, 找了半天没找到。 于是我就自己去查了一下这个vscode的设置, 真让我找到了这方面的开关, 把下面的这个关闭…

Linux学习笔记-Ubuntu下ssh服务器连接异常Connection reset

文章目录 一、问题问题现象1.1 连接重置无法访问的的问题1.2 查看服务器连接状态1.3 使用调试模式查看的信息 二、临时解决方法三、从根源解决问题3.1 问题分析3.2 服务器的ssh日志3.3 修改ssh配置禁止root登录3.4 配置允许所有ip访问3.5 修改认证方法 角色:百世经纶…

selenium+xpath爬取二手房标题

贝壳找房标题爬取需要注意的是,在页面中间有一个小广告 而他就在ul的li下面,当我们进行title所以输出时,会报错。 所以在进行页面解析之前必须把广告叉掉,不然也把广告那一部分的li给爬取下来了 所以,我们&#xff0…

软件测试职业规划

软件测试人员的发展误区【4】 公司开发的产品专业性较强,软件测试人员需要有很强的专业知识,现在软件测试人员发展出现了一种测试管理者不愿意看到的景象: 1、开发技术较强的软件测试人员转向了软件开发(非测试工具开发); 2、业务…

蓝桥杯专题-真题版含答案-【古代赌局】【古堡算式】【微生物增殖】【密码发生器】

Unity3D特效百例案例项目实战源码Android-Unity实战问题汇总游戏脚本-辅助自动化Android控件全解手册再战Android系列Scratch编程案例软考全系列Unity3D学习专栏蓝桥系列ChatGPT和AIGC 👉关于作者 专注于Android/Unity和各种游戏开发技巧,以及各种资源分…

C++报错:error C2238: 意外的标记位于“;”之前

报错信息如下: 编译遇见这样的错误信息主要有一下几种: 情况一: 多数情况下出现这种问题的原因是因为头文件重复包含:即头文件A包含了B,头文件B又包含了A,导致编译器在加载头文件时陷入死循环。 解决办法…

力扣题:数字与字符串间转换-12.16

力扣题-12.16 [力扣刷题攻略] Re:从零开始的力扣刷题生活 力扣题1:640. 求解方程 解题思想:首先将方程按照“”进行划分,然后分别记录x的因数和常数项,最后进行返回的判断即可 class Solution(object):def solveEqu…

万户 OA OfficeServer.jsp 任意文件上传漏洞复现

0x01 产品简介 万户OA是面向政府组织及企事业单位的FlexOffice自主安全协同办公平台。 0x02 漏洞概述 万户OA OfficeServer.jsp接口存在任意文件上传漏洞,攻击者可通过该漏洞上传任意文件从而控制整个服务器。 0x03 复现环境 FOFA: (banner="OASESSIONID" &a…

算法基础概念之数据结构

邻接表 每个点作为头节点接一条链表 链表中元素均为该头节点指向的点 优先队列 参数: ①储存元素类型 ②底层使用的存储结构(一般为vector) ③比较方式(默认小于)

ffmpeg可以做什么

用途 FFmpeg是一个功能强大的多媒体处理工具,可以处理音频和视频文件。它是一个开源项目,可在各种操作系统上运行,包括Linux、Windows和Mac OS X等。以下是FFmpeg可以做的一些主要任务: 转换媒体格式:可将一个媒体格式…

0基础学习VR全景平台篇第128篇:720VR全景拍摄设备推荐

上课!全体起立~ 大家好,欢迎观看蛙色官方系列全景摄影课程! 本篇教程,小编为大家推荐720VR全景拍摄所需要的设备器材。上节我们提到,理论上任意相机和镜头都能够拍摄全景,但为了标准化制作流程&#xff0…

CSS新手入门笔记整理:CSS常用属性表

字体样式 属性 属性值 说明 font-family 微软雅黑/苹方 字体类型 font-size 数值 字体大小 font-weight 数值/关键字 字体粗细(字重) font-style normal(正常(默认值))italic(斜体)oblique&am…

云原生向量计算引擎 PieCloudVector:为大模型提供独特记忆

拓数派大模型数据计算系统(PieDataComputingSystem,缩写:πDataCS)在10月24日程序员节「大模型数据计算系统」2023拓数派年度技术论坛正式发布。πDataCS 以云原生技术重构数据存储和计算,「一份存储,多引擎…

我的NPI项目之Android 安全系列 -- 先认识一下ST33Jxxx

目前接触过的高通平台都没有集成单独的SE,安全运行环境都是高通自家的TEE,又言Trustzone。高通Keystore功能也是依赖TEE来实现的。那么,如果另外集成SE,那么高通的Keystore如何集成?TEE部分要如何配置? 最近…

Ubuntu Shutdown while other user logged on

1. sudo vim /etc/systemd/logind.conf 修改代码KillUserProcessesyes 2. sudo touch /etc/polkit-1/localauthority/50-local.d/multi-user-inhibit-shutdown-restart.pkla 3. 打开修改配置文件 sudo vim /etc/polkit-1/localauthority/50-local.d/multi-user-inhibit-shut…