MouRyou's Space Station

Python调用百度AIP进行文字识别

字数统计: 389阅读时长: 1 min
2019/02/18 Share

前言

这是我以前参考百度官方文档写的,平时做课题报告遇到不好复制文献会用这个来进行文字识别(虽然没有别人写成软件的方便)。

正文

不多废话直接上代码

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
from aip import AipOcr

""" 你的 APPID AK SK """
APP_ID = ''
API_KEY = ''
SECRET_KEY = ''

client = AipOcr(APP_ID, API_KEY, SECRET_KEY)


def get_file_content(filePath):
""" 读取图片 """
with open(filePath, 'rb') as fp:
return fp.read()


image = get_file_content('') # 填入本地图片位置

""" 调用通用文字识别, 图片参数为本地图片 """
client.basicGeneral(image)

""" 如果有可选参数 """
options = {}
options["detect_direction"] = "true"
options["detect_language"] = "true"
options["probability"] = "true"

""" 带参数调用通用文字识别, 图片参数为本地图片 """
result = client.basicGeneral(image, options)
result = result["words_result"]
for x in result:
words = x["words"]
print(words)

# url = "https//www.x.com/sample.jpg"

""" 调用通用文字识别, 图片参数为远程url图片 """
# client.basicGeneralUrl(url)

# """ 如果有可选参数 """
# options = {}
# options["language_type"] = "CHN_ENG"
# options["detect_direction"] = "true"
# options["detect_language"] = "true"
# options["probability"] = "true"
#
# """ 带参数调用通用文字识别, 图片参数为远程url图片 """
# client.basicGeneralUrl(url, options)

识别准确率还是挺高的

小结

参考文档来写都不是很难,以前我还调用过百度云的人脸识别(爬虫接单爬了某家教网上近一千张正面照需要筛选,结果老板跑路了😒),阿里云的场景识别(阿里云的接口调用好费事的,需要来回编码什么的,我根本不懂啊😒)。什么时候我能自己搞文字识别,机器学习,人工智能,大数据处理······😒

CATALOG
  1. 1. 前言
  2. 2. 正文
  3. 3. 小结