Comments (1)
建议收到 √
这实际上是两个问题:第一,ocr引擎使用恰当的模型,输出正确的竖排文本段。第二,umi对得到的文段进行整理排序,以正确的顺序输出为纯文本或其他格式。
对于问题一,我不擅长训练模型,得看看paddle有没有相关模型或等相关领域的大佬提供帮助。另外,umi-ocr的界面、后处理模块,和引擎模块是完全独立的。通过更换本地引擎(甚至在线ocr服务)来适配这种场景也是可行的。
对于问题二,如 issue #12 这类关于文段排序的问题。我正在开发一套“文段后处理器”框架,它不仅包含我写的忽略水印区域之类的后处理模块,还可以比较方便的拓展,让别的开发者按自己的需求来开发后处理模块。像日文漫画,可能按常规竖排的逻辑来排版 效果很差,那么就可以再写一套专门针对漫画文段的后处理类。但精力有限,我可能短期内不会着手这类小众模块的具体实现。
Update:v1.3.0
已实现后处理器框架。
from umi-ocr.
Related Issues (20)
- 关于图片被旋转或者干脆就是竖着的图(90度或者270°) HOT 2
- 你好,这个能在公司内网运行吗?内网没法连互联网 HOT 1
- 有点疑惑:识别率低于十年前的一款离线OCR软件 HOT 4
- Mac版无法打开
- 为什么返回值都是原始输入的结果,经过函数处理的结果都没有返回和处理,一直的是原始的,这逻辑是否有错? HOT 3
- 关于api请求多的问题 HOT 6
- 源码如何打开 HOT 1
- 识别后的行顺序错位 HOT 3
- 咨询表格功能什么时候添加? HOT 4
- 截图OCR时可以选定屏幕上一个固定区域进行连续截图么? HOT 2
- 能否保留原pdf的名字 HOT 7
- 能否提供高级指令的调用示例,感谢! HOT 2
- 命令行批量ocr目录只能识别1个。Umi-OCR.exe --path D:/images HOT 2
- 想问下大佬,pdf文档识别有没有命令行或者说http调用的方法呢? HOT 4
- 启动umi-ocr报错 HOT 5
- 能否实现API请求后过滤字符功能 HOT 1
- 大佬,如果商用,需要给你多少钱 HOT 3
- 大佬请问一下这个项目怎么集成到java项目中 HOT 2
- 部分pdf文件识别光速完成但什么也没识别出来 HOT 8
- 省略号经常识别不上 HOT 3
Recommend Projects
-
React
A declarative, efficient, and flexible JavaScript library for building user interfaces.
-
Vue.js
🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.
-
Typescript
TypeScript is a superset of JavaScript that compiles to clean JavaScript output.
-
TensorFlow
An Open Source Machine Learning Framework for Everyone
-
Django
The Web framework for perfectionists with deadlines.
-
Laravel
A PHP framework for web artisans
-
D3
Bring data to life with SVG, Canvas and HTML. 📊📈🎉
-
Recommend Topics
-
javascript
JavaScript (JS) is a lightweight interpreted programming language with first-class functions.
-
web
Some thing interesting about web. New door for the world.
-
server
A server is a program made to process requests and deliver data to clients.
-
Machine learning
Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.
-
Visualization
Some thing interesting about visualization, use data art
-
Game
Some thing interesting about game, make everyone happy.
Recommend Org
-
Facebook
We are working to build community through open source technology. NB: members must have two-factor auth.
-
Microsoft
Open source projects and samples from Microsoft.
-
Google
Google ❤️ Open Source for everyone.
-
Alibaba
Alibaba Open Source for everyone
-
D3
Data-Driven Documents codes.
-
Tencent
China tencent open source team.
from umi-ocr.