最近学习,很多东西都是视频,截图后,又想做成文档保存起来。
刚开始不多,打一下字就很快解决了。
随着时间的推移,现在越来越多的图了,管理起来确实不方便,打字有时也不能很快的解决。
所以就弄了个OCR。
1、首先 pip install baidu-aip
2、去注册个百度去帐号,然后那个OCR的API,获得APP ID,API KEY,API SECRET KEY
3,把程序里
APP_ID = 'YOUR APP ID'
API_KEY = 'YOUR API KEY'
SECRET_KEY = 'YOUR SECRET KEY'
修改成你在百度获得到APP ID,API KEY,API SECRET KEY,
相关百度的文字识别,请参考百度OCR网址:https://ai.baidu.com/ai-doc/OCR/fk3h7xune
4,修改path = "YOUR PATH" #YOUR PATH 如D:\picture\ocr_picture
# -*- coding:utf-8 -*-
import osdef get_image(path):"""这里可以取到文件夹下全部的jpg与png的图像"""path_name = pathfiles = os.listdir(path_name)file_name_with_path = []for file in files:if os.path.splitext(file)[1] == '.png' or '.jpg':file_name_with_path.append(os.path.join(path, file))
# print(os.path.join(path, file))return file_name_with_pathfrom aip import AipOcr
APP_ID = 'YOUR APP ID'
API_KEY = 'YOUR API KEY'
SECRET_KEY = 'YOUR SECRET KEY'client = AipOcr(APP_ID, API_KEY, SECRET_KEY)""" 读取图片 """
def get_file_content(filePath):with open(filePath, 'rb') as fp:return fp.read()def ocr_image(image_with_path):""" 调用通用文字识别, 图片参数为本地图片 """image = get_file_content(image_with_path)client.basicGeneral(image)""" 带参数调用通用文字识别, 图片参数为本地图片 """# ocr_result 返回的是jason格式,是一个字典ocr_result = client.basicGeneral(image,) # 解析识别的文字ocr_words = ocr_result["words_result"]for i in range(len(ocr_words)):print(ocr_words[i]['words'])path = "YOUR PATH" #YOUR PATH 如D:\picture\ocr_picture
images = get_image(path)
for image in images:ocr_image(image)
这是要识别的图像,
这是识别的结果,还不错。基本没有错的。