python version翻译_python实现在线翻译功能

对于需要大量翻译的数据,人工翻译太慢,此时需要使用软件进行批量翻译。

1.使用360的翻译

def fanyi_word_cn(string):

url="https://fanyi.so.com/index/search"

#db_path = './db/tasks.db'

Form_Data= {}

#这里输入要翻译的英文

Form_Data['query']= string

Form_Data['eng']= '1'

#用urlencode把字典变成字符串,#服务器不接受字典,只接受字符串和二进制

data= parse.urlencode(Form_Data).encode('utf-8')

#改成服务器可识别的数据后,请求,获取回应数据

response= request.urlopen(url, data)

html= response.read().decode("utf-8")#解码方式

#java中的对象(集合)和数组(元素为集合),loads可转Python字典

result= json.loads(html)

#字典调取键名data下的键名fanyi,获取其值

translate_result= result["data"]["fanyi"]

#print(translate_result)

return translate_result

2.使用Google自带的API来翻译

注意,需要安装API模块即可。

pip install translator

#google api, per 1000 words everyday

def translate_cn_api(content):

translator= Translator(to_lang="zh")

translation = translator.translate(content)

return translation

3.使用Google翻译来做,是由于Google提供的API有字节限制,每天只能翻译1000字。

备注:环境准备

3.1 java环境

3.2 安装execjs模块

pip install PyExecJS

3.3 两个实现模块

HandleJs.py

#coding=utf-8

import execjs

class Py4Js():

def __init__(self):

self.ctx = execjs.compile("""

function TL(a) {

var k = "";

var b = 406644;

var b1 = 3293161072;

var jd = ".";

var $b = "+-a^+6";

var Zb = "+-3^+b+-f";

for (var e = [], f = 0, g = 0; g < a.length; g++) {

var m = a.charCodeAt(g);

128 > m ? e[f++] = m : (2048 > m ? e[f++] = m >> 6 | 192 : (55296 == (m & 64512) && g + 1 < a.length && 56320 == (a.charCodeAt(g + 1) & 64512) ? (m = 65536 + ((m & 1023) << 10) + (a.charCodeAt(++g) & 1023),

e[f++] = m >> 18 | 240,

e[f++] = m >> 12 & 63 | 128) : e[f++] = m >> 12 | 224,

e[f++] = m >> 6 & 63 | 128),

e[f++] = m & 63 | 128)

}

a = b;

for (f = 0; f < e.length; f++) a += e[f],

a = RL(a, $b);

a = RL(a, Zb);

a ^= b1 || 0;

0 > a && (a = (a & 2147483647) + 2147483648);

a %= 1E6;

return a.toString() + jd + (a ^ b)

};

function RL(a, b) {

var t = "a";

var Yb = "+";

for (var c = 0; c < b.length - 2; c += 3) {

var d = b.charAt(c + 2),

d = d >= t ? d.charCodeAt(0) - 87 : Number(d),

d = b.charAt(c + 1) == Yb ? a >>> d: a << d;

a = b.charAt(c) == Yb ? a + d & 4294967295 : a ^ d

}

return a

}

""")

def getTk(self,text):

return self.ctx.call("TL",text)

main.py

#coding=utf-8

#import urllib.request

import urllib2

from HandleJs import Py4Js

from translate import Translator

import requests

# Example: find_last('aaaa', 'a') returns 3

# Make sure your procedure has a return statement.

def find_last(string,str):

last_position=-1

while True:

position=string.find(str,last_position+1)

if position==-1:

return last_position

last_position=position

def open_url(url):

headers = {'User-Agent':'Mozilla/5.0 (Windows NT 6.1; WOW64; rv:23.0) Gecko/20100101 Firefox/23.0'}

req = urllib2.Request(url = url,headers=headers)

response = urllib2.urlopen(req)

data = response.read().decode('utf-8')

return data

def translate_core(content,tk, language):

if len(content) > 4891:

print("too long byte >4891")

return

content = urllib2.quote(content)

if language == 'de':

url = "http://translate.google.cn/translate_a/single?client=t"+ "&sl=de&tl=zh-CN&hl=zh-CN&dt=at&dt=bd&dt=ex&dt=ld&dt=md&dt=qca"+"&dt=rw&dt=rm&dt=ss&dt=t&ie=UTF-8&oe=UTF-8&clearbtn=1&otf=1&pc=1"+"&srcrom=0&ssel=0&tsel=0&kc=2&tk=%s&q=%s"%(tk,content)

else:

url = "http://translate.google.cn/translate_a/single?client=t"+ "&sl=en&tl=zh-CN&hl=zh-CN&dt=at&dt=bd&dt=ex&dt=ld&dt=md&dt=qca"+"&dt=rw&dt=rm&dt=ss&dt=t&ie=UTF-8&oe=UTF-8&clearbtn=1&otf=1&pc=1"+"&srcrom=0&ssel=0&tsel=0&kc=2&tk=%s&q=%s"%(tk,content)

#result为json格式

result = open_url(url)

#print('results:' + result)

if len(content) < 10:

end = result.find("\",")

if end > 4:

return result[4:end]

else:

result_all = ''

if language == 'de':

result_all = result.split(',null,"de",null,null,')[0].replace('[[', '').replace(']]', ']')[1:]

else:

result_all = result.split(',null,"en",null,null,')[0].replace('[[', '').replace(']]', ']')[1:]

#print('result_all:' + result_all)

output_cn = ''

#解析中文字段并拼接

list = result_all.split('],[')

for i in range(len(list)-1):

end = list[i].find("\",")

tmp_buf = list[i][1:end]

output_cn = output_cn + tmp_buf

return output_cn

def translate_normal(content, language):

js = Py4Js()

tk = js.getTk(content)

#print('english:' + content)

cn_buf = translate_core(content,tk, language)

#print('Chinese:' + cn_buf)

return cn_buf

def translate_cn(content, language):

LEN_LIMIT = 4891

all_len = len(content)

print('en:' + content)

if all_len > LEN_LIMIT:

content_cn = ''

while True:

content_limit = content[0:LEN_LIMIT]

limit_end = find_last(content_limit, '.') + 1

#print('limit_end:' + str(limit_end))

if limit_end == 0:

limit_end = find_last(content_limit, ' ') + 1

if limit_end == 0:

limit_end = LEN_LIMIT

content_en = content[0:limit_end]

leave_len = all_len - limit_end

if content_en == '':

break;

#print('content_en:' + content_en)

content_cn = content_cn + translate_normal(content_en, language);

content = content[limit_end:]

return content_cn

else:

return translate_normal(content, language)

#google api, per 1000 words everyday

def translate_cn_api(content):

translator= Translator(to_lang="zh")

translation = translator.translate(content)

return translation

if __name__ == "__main__":

content = """Beautiful is better than ugly.

Explicit is better than implicit.

Simple is better than complex.

Complex is better than complicated.

Namespaces are one honking great idea -- let's do more of those!"""

#

content = """

IT-Grundschutz M5.131: Absicherung von IP-Protokollen unter Windows Server 2003."""

#content = 'High'

content = """Beautiful is better than ugly.

Explicit is better than implicit.

Simple is better than complex.

Complex is better than complicated.

Namespaces are one honking great idea -- let's do more of those!"""

language = 'en'

test = translate_cn(content.replace('\n', ''), language)

print('ok:' + test)

#content = 'Checks version'

此处实现了德语翻译成中文和英文翻译成中文。

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持我们。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/336005.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

java流写入数据库_Java 8:在2分钟内将智能流与数据库一起使用

java流写入数据库快速流媒体 当Java 8最终问世时&#xff0c;我和一些大学开始了一个开源项目&#xff0c;以利用Java 8的流库使整个Java / DB问题更进一步&#xff0c;以便将数据库表视为纯Java 8流。 速度诞生了&#xff01; 哇&#xff0c;现在我们可以做类型安全的数据库应…

【技术解决方案】RTP_UDP传输过程中数据丢失的解决方案

1. 从发送端解决(推荐) 适用条件: ①发送端是可以控制的.②微秒数量级的延迟可以接受 解决方法:发送时使用usleep(1)延迟1微秒发送,即发送频率不要过快,延迟1微妙发送,可以很好的解决这个问题.。 2.从接收端解决方法一 适用条件:①无法控制发送端发送数据的频率 解决方法:…

方法参数泛型_无参数泛型方法反模式

方法参数泛型最近&#xff0c;有关Java泛型的一个非常有趣的问题发布到Stack Overflow和reddit上。 请考虑以下方法&#xff1a; <X extends CharSequence> X getCharSequence() {return (X) "hello"; }尽管这种不安全的转换看起来有些古怪&#xff0c;并且您…

python文件读取写入实践_python文件写入实例分析

本文实例讲述了python文件写入的用法。分享给大家供大家参考。具体分析如下&#xff1a;Python中wirte()方法把字符串写入文件&#xff0c;writelines()方法可以把列表中存储的内容写入文件。ffile("hello.txt","w")li["hello world\n","he…

【H.264/AVC视频编解码技术】序章【编码的前世今生】

视频格式 关于视频格式的内容,在这里不进行赘述,详细学习可以参考视频格式 视频数据冗余 数据冗余的类型分为哪几种? 图像与视频在数字化过程,即模电转数电过程中会产生数据冗余。从数字信号的统计特征方面,一般将这些数据冗余分为空间冗余,时间冗余,信息熵冗余三大…

小米摄像头有onvif协议_监控摄像头完好但图像不行,肯定逃不过这10个问题

摄像头仅仅是视频监控系统的一部分&#xff0c;即使摄像头完好无损&#xff0c;监控画面也可能会出现不显示、卡顿、丢失等情况。想要彻底解决网络监控的问题&#xff0c;往往需要排查各个连接设备才可以判断。下面我们就总结了10个问题&#xff0c;彻底解决网络监控的问题。一…

java对话_您应该保持联系的十大高级Java对话

java对话在线讲座和视频是学习软件开发新事物的主要资源之一。 您可以找到Java专家与您分享他们的经验&#xff0c;而不必坐下来。 在下面的文章中&#xff0c;我们收集了10位我们最喜欢的演讲者和主题&#xff0c;我们相信每个Java开发人员都应该注意。 获取爆米花&#xff0…

【WebRTC---源码篇】(三)Windows/Linux音视频采集封装模块

视频采集相关类图 DeviceInfo接口提供了设备枚举相关功能。 NumberOfDevices枚举设备个数。 GetDeviceName获取某个设备名称。 GetCapability枚举某个设备所支持的所有能力(VideoCaptureCapability: 分辨率,最大帧率,颜色类型) VideoCaptureModule视频采集模块的基类: …

java设计单词英译汉小助手_拣单词|第八期第3天:第521528个单词宝藏

宝藏坚持每天拣单词积累你的词汇宝藏打好英语学习基本功怎么学&#xff1f;每天预留15分钟&#xff0c;积累你的词汇宝藏&#xff01;每周一、二、三&#xff0c;发布新单词每周四、五、六&#xff0c;乱序复习单词周日测试(仅限入群的学员)遇到新单词&#xff0c;你可以&#…

spring多个视图解析器_在Spring中配置多个View解析器

spring多个视图解析器1.简介 在Spring中&#xff0c;提供了View Resolver来使用模型中可用的数据来解析视图&#xff0c;而无需与JSP&#xff0c;Velocity或Thymeleaf等View技术紧密绑定。 Spring可以根据需要轻松灵活地配置一个或多个View Resolver 。 2. Spring MVC应用程序…

【技术解决方案】音视频同步策略分析并计算出当前音频播放的pts

音视频同步策略 1.参考时钟同步&#xff1a;音视频约定好经过周期音视频各自会seek到约定位置。 2.音频同步视频&#xff1a;视频是不能保证每秒是25帧的&#xff0c;存在精确度问题。 3.视频同步音频&#xff1a;音频使用正常速度播放&#xff0c;视频以音频为基准。音频需…

wxpython控件如何自动调整大小_wxpython:自动调整静态图像(staticbitmap)的大小以适应大小...

我的wxPython项目有一个框架,有多个嵌套的sizer.其中一个sizer包含一个wxStaticImage,其中一个位图是从文件中读取的.每次调整帧大小时,我都需要调整图像大小(增大/缩小),因此它适合它的sizer边界.(我想)我知道如何调整图像大小.我不知道的是如何&#xff1a;>如何获取图像容…

单选按钮:after_选择的按钮:将ToggleButtons用作单选按钮

单选按钮:after对于MQTT.fx&#xff0c;我想使用ToggleButtons例如选择MQTT消息或QoS级别的解码&#xff1a; 我发现在ToggleGroup的上下文中&#xff0c;ToggleButton在选择/取消选择方面的行为与RadioButtons不同&#xff1a;与RadioButtons不同&#xff0c;ToggleButtons仍…

【技术解决方案】Windows平台下摄像头采集方案

在Windows下对摄像头数据进行采集&#xff0c;有两种方法。一种使用DrectShow&#xff0c;另一种方法是使用WMF。我们可以通过将以上两种方法与FFmpeg中的avdevice来关联。使得他们成为一个整体。对于本机摄像头设备的枚举我推荐使用QT的多媒体库。 QCameraInfo curCameraInfo …

【技术解决方案】开发工具源码安装包大全

汇总下载链接 下载地址 QT下载以及安装 各版本QT下载地址 1.安装中根据不同的开发环境勾选相应的&#xff0c;如果使用VS编译请先安装VS和SDK然后再安装QT。 使用VS时CDB调试支持需要勾选 QTCreator断点调试需要下载SDK,Windows的SDK下载地址&#xff0c;只需要安装勾选如…

垃圾收集算法,垃圾收集器_确定活动的热点垃圾收集器

垃圾收集算法,垃圾收集器StackOverflow问题查找正在运行哪种类型的垃圾收集 器&#xff0c;jvm的默认垃圾收集器 &#xff0c; 如何通过查看gc日志来查看正在运行的垃圾收集器&#xff1f; &#xff0c;以及如何知道HotSpot jvm的当前GC策略&#xff1f; 以及博客文章如何以编程…

python哪个方向简单_现在学Python,哪个方向最简单?哪个方向最吃香 ?

“ 我想学Python&#xff0c;但是学完Python后都能干啥 &#xff1f;”“ 现在学Python&#xff0c;哪个方向最简单&#xff1f;哪个方向最吃香&#xff1f;”“ …… ”相信不少Python的初学者&#xff0c;都会遇到上面的这些问题。大家都知道Python很吃香&#xff0c;薪资高、…

树与堆的基本概念

当看到这里的时候&#xff0c;相信你的链表&#xff0c;队列&#xff0c;栈学的也差不多可以了&#xff0c;那么接下来让我们一起进入树的学习吧&#xff01; 一.树的概念以及一些知识记忆 树的定义&#xff1a; 树是一种 非线性 的数据结构&#xff0c;它是由 n &#xff08…

动态数据交换 python_如何用 Python 和 Streamlit 做交互式数据分析产品?

「本文参与少数派 2019 年度征文 效率有心得」不用学前端编程&#xff0c;你就能用 Python 简单高效写出漂亮的交互式 Web 应用&#xff0c;将你的数据分析成果立即展示给团队和客户。痛点从我开始折腾数据分析工具的那一天&#xff0c;就没有想明白一件事儿 —— 为什么我打算…

【技术解决方案】GitHub本地仓库管理与远程仓库管理

本地仓库管理 设置用户名 git config --global user.name CnYiXiaoNaiHe 设置邮箱 git config --global user.email 1969118063qq.com 该设置在Github仓库主页显示谁提交了该文件 创建新文件夹&#xff0c;打开&#xff0c;然后执行 git init 把文件从工作区提交到暂存…