诚意满满的水贴, 谁看了不迷糊啊
接了个需求, 需要分析对话中出现的图片, 是否包含某些关键字以便屏蔽或者...巴拉巴拉的什么玩意儿的吧. 调研了几个ocr, 看起来百度这个paddleocr比较受推崇, 而且中文识别率看起来还不错. 所以, 先试试水咯~
因为是调研阶段, 老板说让我自己捯饬捯饬, 试试稳定性. 就不去嚯嚯我们的小服务器了. 本地搞, 但是看起来依赖的东西过多, 不想污染我的电脑. 那就好说了...docker走起.
众所周知, 百度的文档也是x, 一言难尽. 装了一早上. 当然, 也有我本身就不熟悉docker的原因
写下来的目的是为了以后...八成也用不上...好吧, 我承认, 我为了水活跃
下面进入备忘录正文:
https://www.paddlepaddle.org.cn/documentation/docs/zh/install/docker/macos-docker.html
1. 拉取镜像 CPU. 自己也没有GPU啊. 这么奢侈
docker pull registry.baidubce.com/paddlepaddle/paddle:2.5.1
2. 本机切换到工作目录, 主要为了挂载目录
cd /data
3.启动容器, 并进去
docker run --name paddle_ocr --net=bridge -p 9998:9998 -it -v $PWD:/paddle registry.baidubce.com/paddlepaddle/paddle:2.5.1 /bin/bash
# --network=bridge 设置宿主网路 # -p 9998:9998 映射端口. ocr的端口默认9998, 自己也可以在改, 改完记得最后的config里处理下 # --name paddle_ocr:设定 Docker 的名称,paddle_ocr 是自己设置的名称; # -it:容器和本机交互式运行; # -v $PWD:/paddle:指定将当前路径(PWD 变量会展开为当前路径的绝对路径)挂载到容器内部的 /paddle 目录;(相当于 /opt/ppocr 挂载到容器内) # registry.baidubce.com/paddlepaddle/paddle:2.5.1:指定需要使用的 image 名称,可以通过docker images命令查看;/bin/bash 是在 Docker 中要执行的命令
4.安装OCR
# 升级 pip pip install -U pip # 容器中已经包含了 paddlepaddle 2.2.2 pip list # 拉取 PaddleOCR 代码 git clone https://gitee.com/paddlepaddle/PaddleOCR.git # 切换进入 PaddleOCR 目录 cd PaddleOCR # 安装运行所需要的whl包 pip3 install -r requirements.txt -i https://mirror.baidu.com/pypi/simple
tips: python 工具管理
#如果遇到问题,尝试使用pip-review:pip-review是一个可以帮助你管理Python包依赖的工具。你可以使用以下命令安装它: pip install pip-review # 然后自动更新包和依赖 pip-review --auto
5.准备PaddleServing运行时环境
Tips:
https://github.com/PaddlePaddle/Serving/blob/v0.8.3/doc/Latest_Packages_CN.md
# 切进部署目录 cd /home/PaddleOCR/deploy/pdserving # 安装serving,用于启动服务 pip3 install https://paddle-serving.bj.bcebos.com/test-dev/whl/paddle_serving_server-0.8.3-py3-none-any.whl # 安装client,用于向服务发送请求 pip3 install https://paddle-serving.bj.bcebos.com/test-dev/whl/paddle_serving_client-0.8.3-cp37-none-any.whl # 安装serving-app pip3 install https://paddle-serving.bj.bcebos.com/test-dev/whl/paddle_serving_app-0.8.3-py3-none-any.whl
6.模型转换
# 使用PaddleServing做服务化部署时,需要将保存的inference模型转换为serving易于部署的模型。 # 下载并解压 OCR 文本检测模型 wget https://paddleocr.bj.bcebos.com/PP-OCRv3/chinese/ch_PP-OCRv3_det_infer.tar -O ch_PP-OCRv3_det_infer.tar && tar -xf ch_PP-OCRv3_det_infer.tar # 下载并解压 OCR 文本识别模型 wget https://paddleocr.bj.bcebos.com/PP-OCRv3/chinese/ch_PP-OCRv3_rec_infer.tar -O ch_PP-OCRv3_rec_infer.tar && tar -xf ch_PP-OCRv3_rec_infer.tar # 接下来,用安装的paddle_serving_client把下载的inference模型转换成易于server部署的模型格式。 # 转换检测模型 python3 -m paddle_serving_client.convert --dirname ./ch_PP-OCRv3_det_infer/ \ --model_filename inference.pdmodel \ --params_filename inference.pdiparams \ --serving_server ./ppocr_det_v3_serving/ \ --serving_client ./ppocr_det_v3_client/ # 转换识别模型 python3 -m paddle_serving_client.convert --dirname ./ch_PP-OCRv3_rec_infer/ \ --model_filename inference.pdmodel \ --params_filename inference.pdiparams \ --serving_server ./ppocr_rec_v3_serving/ \ --serving_client ./ppocr_rec_v3_client/
检测模型转换完成后,会在当前文件夹多出ppocr_det_v3_serving 和ppocr_det_v3_client的文件夹(识别模型同理),具备如下格式:
|- ppocr_det_v3_serving/ |- __model__ |- __params__ |- serving_server_conf.prototxt |- serving_server_conf.stream.prototxt |- ppocr_det_v3_client |- serving_client_conf.prototxt |- serving_client_conf.stream.prototxt
7. Paddle Serving pipeline部署
- 确认工作目录
# pdserver目录包含启动pipeline服务和发送预测请求的代码,包括 __init__.py config.yml # 启动服务的配置文件 ocr_reader.py # OCR模型预处理和后处理的代码实现 pipeline_http_client.py # 发送pipeline预测请求的脚本 web_service.py # 启动pipeline服务端的脚本
- 启动服务
# 启动前需要检查设置 config中的GPU和CPU设置, 线程可以暂时不用理会 vim config.yml # set op.det.devices = "" 不写使用cpu rec同理 # 启动服务,运行日志保存在log.txt python3 web_service.py --config=config.yml &>log.txt & # 查看启动日志 tail -f log.txt
赠送Java部分测试代码
/** * ocr 请求对象 */ @Data @Builder @NoArgsConstructor @AllArgsConstructor public class OcrParam { private List<String> key; private List<String> value; }
本机装好的地址是 http://127.0.0.1:9998/ocr/prediction
图片需要base64
/** * 获取OCR识别对象 * * @param imgs * @return */ private static String reqOcr(List<String> imgs, String ocrServer) { OcrParam data = new OcrParam(); List<String> keyList = new ArrayList<>(); keyList.add("image"); data.setKey(keyList); data.setValue(imgs); return HttpUtil.post(ocrServer, JSON.toJSONString(data)); } /** * 转base64图片 * * @param imgPath * @return */ private static String imageToBase64(InputStream imgPath) { byte[] data = null; // 读取图片字节数组 //Read the image byte array try { InputStream in = imgPath; System.out.println(imgPath); data = new byte[in.available()]; in.read(data); in.close(); } catch (IOException e) { e.printStackTrace(); } // 对字节数组Base64编码 //Base64 encoding of byte array BASE64Encoder encoder = new BASE64Encoder(); // 返回Base64编码过的字节数组字符串 return encoder.encode(Objects.requireNonNull(data)); }
好!看不懂
好,看不懂