文章目录
- AI大模型开发工程师
- 005 OpenAI大模型案例实践
- 1 AI 翻译助手需求分析
- 项目起源
- 市场价格和市场前景
- 基于大模型的翻译软件
- 核心功能设计
- 2 AI 翻译助手架构设计
- 架构设计
- 代码结构设计
- 3 AI 翻译助手核心功能
- 文档解析
- 文档操作
- PDF文档操作
- 表格操作
- 图片操作
- Prompt封装
- 4 AI 翻译助手代码落地
- 5 AI 翻译助手项目总结
AI大模型开发工程师
005 OpenAI大模型案例实践
1 AI 翻译助手需求分析
项目起源
市场价格和市场前景
基于大模型的翻译软件
核心功能设计
2 AI 翻译助手架构设计
架构设计
代码结构设计
3 AI 翻译助手核心功能
文档解析
文档操作
## 导入操作word文档和PDF文档的依赖库
! pip install pdfplumber
PDF文档操作
- 读取文档
import pdfplumber
pdf = pdfplumber.open("测试文档/test1.pdf")
pages = pdf.pages# 读取所有页面的文本内容
with pdfplumber.open("测试文档/test1.pdf") as pdf:for page in pdf.pages:print(page.extract_text())# 获取单页文本(保留布局)
text = pages[0].extract_text(layout=True)
text
表格操作
table = pages[1].extract_table()
tableimport pandas as pddf = pd.DataFrame(table[1:], columns=table[0])print(df)
图片操作
pages[2].imagesimg = pages[2].images[0]
bbox = (img["x0"], img["top"], img["x1"], img["bottom"])
cropped_page = pages[2].crop(bbox)
cropped_page.to_image()
Prompt封装
- 方式一
- 方式二:使用 LangChain
4 AI 翻译助手代码落地
-
github开源代码实现:
- https://github.com/openai-translator/bob-plugin-openai-translator
- https://github.com/openai-translator/openai-translator
-
项目地址:https://github.com/shouwangyw/AIGC/tree/main/Code/005/ai-translator-helper