AI应用开发相关目录
本专栏包括AI应用开发相关内容分享,包括不限于AI算法部署实施细节、AI应用后端分析服务相关概念及开发技巧、AI应用后端应用服务相关概念及开发技巧、AI应用前端实现路径及开发技巧
适用于具备一定算法及Python使用基础的人群
- AI应用开发流程概述
- Visual Studio Code及Remote Development插件远程开发
- git开源项目的一些问题及镜像解决办法
- python实现UDP报文通信
- python实现日志生成及定期清理
- Linux终端命令Screen常见用法
- python实现redis数据存储
- python字符串转字典
- python实现文本向量化及文本相似度计算
- python对MySQL数据的常见使用
- 一文总结python的异常数据处理示例
- 基于selenium和bs4的通用数据采集技术(附代码)
- 基于python的知识图谱技术
- 一文理清python学习路径
- Linux、Git、Docker常用指令
- linux和windows系统下的python环境迁移
- linux下python服务定时(自)启动
- windows下基于python语言的TTS开发
- python opencv实现图像分割
- python使用API实现word文档翻译
文章目录
- AI应用开发相关目录
- 需求概述
- 实现逻辑
- 代码
需求概述
最近公司涉及出口业务,需要将一些说明书、规格相关文件进行英文翻译,量大、难度大,人力远远不够。
实现逻辑
step1:word文本信息抽取
step2:对抽取的文本使用翻译模型或大模型进行语言转换,本文采用百度智能云翻译模型,实际上大模型效果可能更好。
step3:对文本进行格式调整,包括标题、字体、缩进、加粗等等细节;对表格、图片进行补充。该步骤为手动,虽然依旧耗时,但已经在人力所及范围内了。
代码
- step1:
from docx import Documentdef extract_text_from_docx(file_path):document = Document(file_path)text = []for paragraph in document.paragraphs:text.append(paragraph.text)print("文字提取完成!"