Giter Club home page Giter Club logo

subextractor-ocr's Introduction

SubExtractor-OCR

字幕提取器-OCR版-1.0

简介

SubExtractor-OCR 是一款基于 OCR(Optical Character Recognition 光学字符识别)技术的视频字幕提取器。它利用 PyQT6 构建,旨在帮助用户从视频中提取视频文本字幕,从而获取视频文案。

这是一款开源自制软件,专为解决提取视频文案的烦恼而生。不再需要手动暂停视频抄录文案,字幕提取器为你助力!

功能亮点

  • OCR 提取: 使用光学字符识别技术从视频中提取字幕文本。

  • 用户友好的界面: 基于 PyQT6 构建,提供直观、易用的用户界面。

  • 支持自定义高度区间:设置字幕高度区间,提高适应性。

如何安装

下载安装包:

就是项目中的rar文件,解压即可使用。

下载链接:https://github.com/w-x-x-w/SubExtractor-OCR/releases

注意事项

好了,现在揭晓一些坏消息。由于这是字幕提取器1.0版本,一些功能尚未支持,比如批量化视频处理和自动一键完成。但是,我们已经有了改进的计划,期待未来更完美的版本。

为什么没有实现批量化?

批量化处理涉及到复杂的业务场景,视频尺寸不一致可能导致字幕高度区间的错误。

我正在思考是否可以添加为每个视频设置字幕高度区间的功能,欢迎在评论区一起探讨。

开发者的心路历程

虽然功能是无限的,但我们的完美主义者一直在思考更好的方案,想为大家呈现最佳版本。当前版本虽不完美,但每个流程和函数都已实现,只是用户操作流程还需要梳理。有代码基础的同学可以尝试使用并提出建议。

使用方法

  1. 选择视频文件。
  2. 点击“视频抽帧”按钮,耐心等待抽帧完成。
  3. 量取字幕的高度区间。
  4. 点击后续按钮,完成后续处理。
  5. 复制文案,享受提取字幕的乐趣!

效果展示

在软件运行界面中,选择一个视频文件,点击视频抽帧按钮,即可开始操作。后续处理速度快,最终效果可在文案中查看。 1.0

  • 解决了换行字幕的识别问题

待改进实现的方面

  • 批量化自动化处理
  • 单独线程处理任务而不是单线程
  • 预设功能,无需每次输入高度区间

最后的话

感谢您使用字幕提取器-OCR版-1.0!我们将不断改进和更新,为用户提供更好的体验。有任何问题或建议,请在评论区与我们分享。希望您喜欢这个小工具,让视频文案提取更轻松愉快!

字幕一般不会换行吧

就截取一行得了,不纠结那么多了

打包命令

pyinstaller -w 视频字幕提取-OCR版-1.0.py -i ./logo.png

pyinstaller -w 视频字幕提取-OCR版-2.0.py -i ./logo.png

贡献

如果您发现任何问题或有改进建议,请提出 issue 或创建 pull 请求。我们欢迎您的贡献!

许可证

SubExtractor-OCR 使用 MIT 许可证


请注意,上述 README 只是一个示例,具体内容可能需要根据你的项目的实际情况进行修改。你可以添加更多的详细信息,例如支持的字幕格式、示例截图等。希望这个示例对你有帮助!

subextractor-ocr's People

Contributors

cpython666 avatar

Stargazers

 avatar 尹楷楷 avatar  avatar zhangkejiang avatar Jimmy Liu avatar  avatar  avatar

Watchers

 avatar

Forkers

1934266584

subextractor-ocr's Issues

感谢大佬的开发,有一个功能建议

我使用这个功能是用于字幕,最后的TXT还需要分行处理,我是复制了cmd里的信息解决。
我使用表格删除重复项后发现有识别会有一些误差,无法通过重复项删除,大佬有没有解决这个问题的建议。
感谢大佬的开发,这是我最近找的最吊的OCR字幕识别方案

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.