OCR(Optical Character Recognition,光学字符识别)功能用于识别图片中的文字内容,支持多种识别类型:
- 通用文字识别
- 发票识别
- 身份证识别
- 手写体识别
ocr-api.cn-hangzhou.aliyuncs.com:443)在 application.yml 中配置:yaml ocr: accessKeyId: YOUR_ACCESS_KEY_ID accessKeySecret: YOUR_ACCESS_KEY_SECRET
确保服务器能够访问:
- 地址:ocr-api.cn-hangzhou.aliyuncs.com
- 端口:443 (HTTPS)
- 协议:TCP
菜单路径:系统工具 > OCR管理 > OCR测试
GET /system/ocr/typesPOST /system/ocr/recognizefile(图片文件)、type(识别类型)GET /system/ocr/recognizeByUrlimageUrl(图片URL)、type(识别类型)POST /system/ocr/extractFieldsGET /system/diag/ocrConnection支持的识别方法:
- recognizeGeneral() - 通用文字识别
- recognizeInvoice() - 发票识别
- recognizeIdCard() - 身份证识别
- recognizeHandwriting() - 手写体识别
extractTargetFields() - 提取金额、日期、备注等关键信息OcrType.GENERAL - 通用文字识别OcrType.INVOICE - 发票识别OcrType.IDCARD - 身份证识别OcrType.HANDWRITING - 手写体识别错误信息:code: 415, The image format or content is not supported
可能原因:
- 图片格式不支持
- 图片内容损坏
- 图片太大
解决方案:
- 检查图片格式是否为JPG/PNG/BMP
- 验证图片文件是否完整
- 压缩图片至4MB以下
错误信息:ocr-api.cn-hangzhou.aliyuncs.com
可能原因:
- DNS解析失败
- 防火墙阻止连接
- 网络策略限制
- 代理配置问题
解决方案:
1. DNS问题:
- 检查DNS服务器配置
- 尝试使用公共DNS(如8.8.8.8)
- 验证域名解析:nslookup ocr-api.cn-hangzhou.aliyuncs.com
-Dhttp.proxyHost=proxy.example.com -Dhttp.proxyPort=8080 -Dhttps.proxyHost=proxy.example.com -Dhttps.proxyPort=8080 错误信息:认证失败相关错误
解决方案:
- 检查AccessKey ID和Secret是否正确
- 确认账户有OCR服务权限
- 验证AccessKey是否过期
访问页面:系统工具 > OCR管理 > OCR测试
在识别失败时,点击"网络诊断"按钮查看连接状态。
# 测试DNS解析
nslookup ocr-api.cn-hangzhou.aliyuncs.com
# 测试端口连通性
telnet ocr-api.cn-hangzhou.aliyuncs.com 443
# 测试HTTPS连接
curl -I https://ocr-api.cn-hangzhou.aliyuncs.com
logs/ocr.logAliOCRUtil 类的日志如遇无法解决的问题,请提供以下信息联系技术支持:
- 完整错误日志
- 网络诊断结果
- 系统环境信息
- 防火墙/代理配置信息
在部署和使用OCR功能前,请确认:
- [ ] 已开通阿里云OCR服务
- [ ] 已配置有效的AccessKey
- [ ] 服务器可访问互联网
- [ ] 防火墙开放443端口
- [ ] DNS解析正常
- [ ] 图片格式支持验证
- [ ] 网络连通性测试通过
注意:本功能依赖外部服务,网络状况可能影响识别成功率和速度。