第一句子网 > autojs之提取text中的红色文字（图片二值化+百度智能云-文字识别OCR-接口调用）

autojs之提取text中的红色文字（图片二值化+百度智能云-文字识别OCR-接口调用）

时间：2022-10-05 17:14:58

仅供参考

一、效果二、过程1.准备工作 - 截图 - 提取主色2.图片二值化3.文字识别1.注册账号-之前的文章里有2.获得API Key、Secret Key-之前的文章里有3.调用接口4.完整代码三、我的摸索过程1.二值化2.文字识别四、完整代码总结

一、效果

二、过程

1.准备工作 - 截图 - 提取主色

先手动截一张图片，然后通过在线网站/提取主色，如红色为#FD1111

2.图片二值化

有了主色后，通过autojs的 images.interval(img, “#C71718”, 70) 函数，将图片二值化

将图片二值化，在color-interval ~ color+interval范围以外的颜色都变成0，在范围以内的颜色都变成255。这里对color的加减是对每个通道而言的。

例如images.interval(img, “#888888”, 16)，每个通道的颜色值均为0x88，加减16后的范围是[0x78, 0x98]，因此这个代码将把#787878~#989898的颜色变成#FFFFFF，而把这个范围以外的变成#000000。

var img = images.read("/sdcard/Pictures/QQ/c.jpg");img=images.interval(img, "#FD1111", 120)// 60-90//后边这个值自己可以改一下看看images.save(img, "./邻域yyds.jpg", "jpg", 100);img.recycle();

3.文字识别

文字识别，我之前写过 python的百度智能云-文字识别

这里我们通过调用百度OCR文字识别接口来进行文字识别。

官方文档：/doc/OCR/s/Ek3h7xypm

1.注册账号-之前的文章里有

2.获得API Key、Secret Key-之前的文章里有

3.调用接口

/doc/OCR/s/Ck3h7y2ia

请求格式 - POST方式调用
返回格式 - JSON格式
请求限制 - 请求图片需经过base64编码及urlencode后传入
请求格式支持：PNG、JPG、JPEG、BMP、TIFF、PNM、WebP
图片编码后大小限额：base64编码urlencode后大小不超过4M，最短边至少15px，最长边最大4096px

var img64 = images.toBase64(img, "png", 100); //图片经base64编码

调用方式一：请求URL数据格式

向API服务地址使用POST发送请求，必须在URL中带上参数：access_token

注意：access_token的有效期为30天，需要每30天进行定期更换；

参考“Access Token获取”
向授权服务地址/oauth/2.0/token发送请求（推荐使用POST），并在URL中带上以下参数：
grant_type：必须参数，固定为client_credentials；
client_id：必须参数，应用的API Key；
client_secret：必须参数，应用的Secret Key；

var API_Key="输入自己的API_Key";var Secret_Key="输入自己的Secret_Key";//向授权服务地址发送请求var getTokenUrl="/oauth/2.0/token";var token_Res = http.post(getTokenUrl, {grant_type: "client_credentials",client_id: API_Key,client_secret: Secret_Key,});var access_token=token_Res.body.json().access_token;

服务器返回的JSON文本参数如下：
access_token：要获取的Access Token；
expires_in： Access Token的有效期(秒为单位，有效期30天)；
其他参数忽略，暂时不用;

以通用文字识别（高精度版）为例

/doc/OCR/s/1k3h7y3db

var ocrUrl = "/rest/2.0/ocr/v1/accurate_basic";var ocr_Res = http.post(ocrUrl, {headers: {"Content-Type": "application/x-www-form-urlencoded"},access_token: access_token,//之前获得的access_tokenimage: img64,//和 url/pdf_file 三选一，img64是传入的图片});var json = ocr_Res.body.json();

必要参数headers、access_token、image，其他参数查看文档

4.完整代码

//百度智能云文字识别OCR 接口调用function Baidu_ocr(img){log("调用百度ocr:");/**** 将图片编码 ******/var img64 = images.toBase64(img, "png", 100);/**** 获取access_token ******/var API_Key="输入自己的API_Key";var Secret_Key="输入自己的Secret_Key";//向授权服务地址发送请求var getTokenUrl="/oauth/2.0/token";var token_Res = http.post(getTokenUrl, {grant_type: "client_credentials",client_id: API_Key,client_secret: Secret_Key,});var access_token=token_Res.body.json().access_token;/**** 调用ocr ******///高精度文字识别var ocrUrl = "/rest/2.0/ocr/v1/accurate_basic";var ocr_Res = http.post(ocrUrl, {headers: {"Content-Type": "application/x-www-form-urlencoded"},access_token: access_token,//之前获得的access_tokenimage: img64,//和 url/pdf_file 三选一，img64是传入的图片});var json = ocr_Res.body.json();/**** 返回结果 ******/return json;}