Comments (3)
(Update:此问题已在 v1.2.6 解决。)
v1.2.5 的原回复:
您例图的上下边缘太窄,这会阻碍OCR文本检测算法的解析。这是本项目采用的识别库PaddleOCR中 文本检测(det)目前的一个缺陷,它需要一定的额外空间来确定文字范围框。
只要加大图片的高度,就能让识别准确率恢复正常:
👇增加高度之后:由于没有选择俯仰或倾斜方式,飞行方式指示器显示A/P处于驾驶盘操纵(CWS)方式。
因此,这个问题的临时解决方法:
- 截取上下边缘更多的素材图片用于识别。据我测试,只要上下边缘 >= 一个字符的高度,就不会影响识别准确度。
可能的程序优化方式:(我暂时没计划实现这些优化)
- 针对性地训练文本检测det模型用于该场景。
- 在OCR前预处理,为高度过窄的图片自动添加空白边缘。
关于其他家API:
- 我测试了腾讯OCR在线接口,似乎没有这个问题。你有大量需求的话,也许可以寻找使用 腾讯在线api(收费) 的同类项目。
from umi-ocr.
感谢答复
from umi-ocr.
新版本 v1.2.6
已经彻底解决这个问题了。随着识别引擎的更新,窄边图片不会降低准确度
from umi-ocr.
Related Issues (20)
- 请保留之前版本中 OCR文本后处理 - 排版解析方案中的 /单行/ 模式 HOT 6
- docker部署 HOT 3
- 使用 docs/http /api_doc_demo.py 的上传代码 测试返回未上传文件。 HOT 11
- 写入csv文件失败 HOT 1
- 启动后白屏无响应 HOT 5
- 请问用命令行的方式,如何返回json形式带坐标的dict类数据 HOT 1
- 用过其他插件后换回自带的截图OCR不会翻译了 HOT 4
- 求一个默认关闭的检查软件版本和自动更新功能 HOT 1
- 增加docker方式的部署 HOT 2
- 请问自带的PaddleOCR-json如何添加缅甸语模型? HOT 1
- 请问能在批量OCR的界面增加 多选删除功能么 HOT 2
- Windows Server 2016 保存PDF时 “已停止工作” HOT 4
- 有个java调用cmd导出pdf的路径拼接疑问 HOT 2
- 2.1.3 打开有环境错误;回到1.3.7也有错误: No such file or directory: 'nul' HOT 1
- 希望可以增加翻译功能 HOT 1
- HTTP报错 HOT 12
- 文档识别可否增加旋转角度? HOT 2
- 使用截图ocr功能会黑屏两次 HOT 1
- 识别繁体字图片报错,更换models_1.3后报同样的错误 HOT 1
- {'code': 803, 'data': "任务提前结束。[Error] OCR init fail. Argd: {'enable_mkldnn': True, 'cpu_threads': 4, 'config_path': 'models/config_chinese.txt', 'cls': False, 'use_angle_cls': False, 'limit_side_len': 960}\nOCR init fail."} HOT 2
Recommend Projects
-
React
A declarative, efficient, and flexible JavaScript library for building user interfaces.
-
Vue.js
🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.
-
Typescript
TypeScript is a superset of JavaScript that compiles to clean JavaScript output.
-
TensorFlow
An Open Source Machine Learning Framework for Everyone
-
Django
The Web framework for perfectionists with deadlines.
-
Laravel
A PHP framework for web artisans
-
D3
Bring data to life with SVG, Canvas and HTML. 📊📈🎉
-
Recommend Topics
-
javascript
JavaScript (JS) is a lightweight interpreted programming language with first-class functions.
-
web
Some thing interesting about web. New door for the world.
-
server
A server is a program made to process requests and deliver data to clients.
-
Machine learning
Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.
-
Visualization
Some thing interesting about visualization, use data art
-
Game
Some thing interesting about game, make everyone happy.
Recommend Org
-
Facebook
We are working to build community through open source technology. NB: members must have two-factor auth.
-
Microsoft
Open source projects and samples from Microsoft.
-
Google
Google ❤️ Open Source for everyone.
-
Alibaba
Alibaba Open Source for everyone
-
D3
Data-Driven Documents codes.
-
Tencent
China tencent open source team.
from umi-ocr.