Giter Club home page Giter Club logo

Comments (1)

hiroi-sora avatar hiroi-sora commented on July 17, 2024 5

你好~

关于 PaddleOCR ,本项目默认自带的是原项目提供的轻量版模型,在家用电脑上有较好的效率。原项目还提供了高精度版模型(体积大、识别速度慢)。你可以在 这里 下载模型,并参考 #316 将模型导入 Umi 。

注意, #316 中只提到了 高精度文本检测库 _server_det 。如果你想要达到最大精度,可以将 高精度文本识别库 _server_rec 也一并导入。

你可以自己训练或微调Paddle的高精度模型。本地训练的一个关键优势是:可以根据自家业务,有针对性地调整模型。比如说,你们业务中经常出现某种地名、人名、专业术语的生僻字,就可以用这些素材来针对性的训练,这是在线服务所无法实现的。

精度与设备(CPU/GPU)没有直接关系。设备性能只影响推理速度。不过,如果打算在生产环境中使用计算量大的高精度库,那么部署到GPU服务器可以提升响应速度。

当然,在开始之前,你们还是应该先做充分的调研。百度、腾讯等都提供了高精度识别的在线接口(比常规接口更贵,效果更好,也支持多种语言)。它们或许采用了更先进的推理方式或模型架构,比我们这些开源项目性能更好。如果这些接口能满足你们业务需求,则直接用在线接口,或许比自己部署的成本更低。

总之,采用在线还是本地,需要经过调研、评测才能决定,不能只凭直觉。

另外,传统OCR技术是有极限的。像你提到的0变成o,大部分OCR模型都难以避免。使用NLP来二次纠正OCR结果,或者使用基于大模型的端到端式OCR,或许是未来的出路。可以了解一下相关的技术。

from umi-ocr.

Related Issues (20)

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.