Comments (1)
全屏长图怎么处理
实际上应该拆分为两个问题:超大分辨率图片如何添加忽略区域?超大分辨率图片如何准确地识别?
1. 超大分辨率图片如何添加忽略区域?
答:很遗憾,忽略区域窗口的UI不支持滚动,所以目前可能难以操作。未来有可能改善这个功能。
2. 超大分辨率图片如何准确地识别文字?
可能你也发现了,直接将超大图片扔处理列表转文字,效果奇差,甚至一个文字都转不出来。这是因为 为了提高效率,PaddleOCR预先将长度超标的图片进行压缩,再执行文字识别。想临时关闭这个功能,只需将PaddleOCR_json_config.txt
中的max_side_len 960
改写到比较大的数(要处理的图片的高度)即可。不过,处理完图片后,最好将参数改回来,否则以后处理正常尺寸图片时会很慢。
或者可以参照下面的步骤生成一个专门应对大图片的识别器:
- 复制一份PaddleOCR_json.exe,重命名为
PaddleOCR_json_大分辨率.exe
。复制一份PaddleOCR_json_config.txt,重命名为PaddleOCR_json_大分辨率_config.txt
。 - 将
PaddleOCR_json_大分辨率_config.txt
中的max_side_len一行改为max_side_len 7000
。 - 打开Umi-OCR软件,转到设置,将识别器路径改为
PaddleOCR-json\PaddleOCR_json_大分辨率.exe
。 - 正常导入大分辨率图片并识别即可。
from umi-ocr.
Related Issues (20)
- 能否增加一个选项,截图时屏幕是否变暗 HOT 2
- 跪求linux命令行版 HOT 2
- Performance issue over HTTP HOT 6
- 跪求支持韓文OCR功能! HOT 3
- 全新部署的WIN10 LTSC 2021系统上启动报错:Cannot load python3.dll HOT 2
- 最新的2.12版本http调用图片base64 ocr 返回为什么不是正常的json 会有换行符的存在破坏掉json格式 HOT 2
- 作者老师,能不嗯加上ⒶⒷⒸⒹⒺⒻⒼⒽⒾⒿⓀⓁⓃⓄⓅⓆⓇⓈⓉⓊⓋⓌⓍⓎⓏⓐⓑⓒⓓⓔⓕⓖⓗⓘⓙⓚⓛⓜⓝⓞⓟⓠⓡⓢⓣⓤⓥⓦⓧⓨⓩ HOT 2
- 大神,我最近使用下咱们的软件,整体很不错,不过有的文字会识别错误, HOT 11
- 快捷键与其他软件的默认快捷键重复时,可否屏弊其他软件的,或者不要重复 HOT 3
- 希望能在linux上运行并允许接口调用 HOT 5
- 能否对http调用增加token选项 HOT 4
- 一识别就提示:OCR init fail Argd: {'models': 'models', 'ensureAscii': 1, 'det': 'ch_PP-OCRv3_det_infer.onnx HOT 4
- 建议添加debug日志文件输出
- 有长截图功能了吗 HOT 5
- http 命令方式调用批量文档接口异常 HOT 9
- 截图失败~~上次截图操作未结束,不能进行新的截图 HOT 1
- OCR后的文字后处理不会保持原有格式 HOT 1
- 允许在界面中直接选择 TesseractOCR traineddata 模型 HOT 2
- 建议增设切换ocr目标语言的快捷键 HOT 2
- 请保留之前版本中 OCR文本后处理 - 排版解析方案中的 /单行/ 模式 HOT 1
Recommend Projects
-
React
A declarative, efficient, and flexible JavaScript library for building user interfaces.
-
Vue.js
🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.
-
Typescript
TypeScript is a superset of JavaScript that compiles to clean JavaScript output.
-
TensorFlow
An Open Source Machine Learning Framework for Everyone
-
Django
The Web framework for perfectionists with deadlines.
-
Laravel
A PHP framework for web artisans
-
D3
Bring data to life with SVG, Canvas and HTML. 📊📈🎉
-
Recommend Topics
-
javascript
JavaScript (JS) is a lightweight interpreted programming language with first-class functions.
-
web
Some thing interesting about web. New door for the world.
-
server
A server is a program made to process requests and deliver data to clients.
-
Machine learning
Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.
-
Visualization
Some thing interesting about visualization, use data art
-
Game
Some thing interesting about game, make everyone happy.
Recommend Org
-
Facebook
We are working to build community through open source technology. NB: members must have two-factor auth.
-
Microsoft
Open source projects and samples from Microsoft.
-
Google
Google ❤️ Open Source for everyone.
-
Alibaba
Alibaba Open Source for everyone
-
D3
Data-Driven Documents codes.
-
Tencent
China tencent open source team.
from umi-ocr.