Giter Club home page Giter Club logo

video-srt-windows's Introduction

VideoSrt

GitHub license GitHub stars GitHub forks GitHub Action

简介

VideoSrt 是用 Golang语言,基于 lxn/walk Windows-GUI 工具包开发。

这是一个可以识别视频语音自动生成字幕SRT文件的开源软件工具。
适用于快速、批量的为媒体(视频/音频)生成中/英文字幕、文本文件的业务场景。

0.3.5 版本将会使用以下接口:

软件帮助文档/使用教程看这个:https://www.yuque.com/viggo-t7cdi/videosrt

B站Up主自制教程:https://search.bilibili.com/all?keyword=videosrt

Videosrt Pro 已发布,支持语音转字幕、字幕翻译、视频智能翻译配音、人声分离、视频字幕压制、字幕格式转换、字幕自动打轴、视频硬字幕提取,建议使用!软件下载/说明详见:https://www.yuque.com/viggo-t7cdi/videosrt-pro/cpwtwl

线上“字幕生成/字幕翻译”解决方案:字幕酱(付费)

界面预览

应用场景

  • 识别视频/音频的语音生成字幕文件(支持中英互译,双语字幕)
  • 提取视频/音频的语音文本
  • 批量翻译、过滤处理/编码SRT字幕文件

软件优势

  • 使用阿里云语音识别接口,准确度高,标准普通话/英语识别率95%以上
  • 视频识别无需上传原视频,方便快速且节省时间
  • 支持多任务多文件批量处理
  • 支持视频、音频常见多种格式文件
  • 支持同时输出字幕SRT文件、LRC文件、普通文本3种类型
  • 支持语气词过滤、自定义文本过滤、正则过滤等,使软件生成的字幕更加精准
  • 支持字幕中英互译、双语字幕输出,及日语、韩语、法语、德语、西班牙语、俄语、意大利语、泰语等
  • 支持多翻译引擎(百度翻译、腾讯云翻译)
  • 支持批量翻译、编码SRT字幕文件

Download

下载地址:

你也可以到 release 页面下载其他版本

注意事项

  • 软件目录下的 data目录为数据存储目录,请勿删除。否则可能会导致配置丢失
  • 项目使用了 ffmpeg 依赖,除非您的电脑已经安装了ffmpeg环境,否则请下载包含ffmpeg依赖的软件包

升级说明

  • 先下载最新版本的软件包
  • 然后用旧版本软件的 data 文件夹覆盖新版软件的 data 文件夹
  • 0.2.6 升级至 0.2.9 以上的版本时,由于翻译设置无法直接兼容低版本,可能需要重新在软件创建翻译引擎才能继续使用翻译功能

其他

今日,有小伙伴在淘宝、闲鱼上发现一些界面相似的盗版且额外收费的软件。由于VideoSrt 是开源软件,所以不排除个别不良用户通过微调软件源代码,然后进行二次售卖甚至传播病毒。

目前已知的有:大象字幕

因此,软件的安装包不要在第三方平台渠道下载,尽量在 github/码云/帮助文档 等官方渠道的页面进行下载。

小伙伴们要擦亮眼睛,打击盗版,望周知!

FAQ

1.为什么Linux和Mac不能用?

因为VideoSrt的GUI是使用lxn/walk开发的,仅支持Windows的GUI,如果您想在Linux上使用,可以体验CLI版本

2.使用此软件会产生费用吗?

如果您适量使用本软件(各个API的免费使用额度可以自行查询),将不会产生费用。 如果您大量使用,建议根据自己的情况购买各个平台的资源包,以满足需求。

3.难受,为什么我一直报错?

报错的原因有很多,软件配置错误、阿里云、腾讯云等账户权限问题都可能会导致软件显示错误。如果您遇到麻烦,建议加入QQ群与我们交流。

交流&联系

捐赠&支持

video-srt-windows's People

Contributors

eldersjavas avatar wxbool avatar xiaoxinmiao avatar

Stargazers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar

Watchers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar

video-srt-windows's Issues

English UI of Video SRT

Hello dear developer of VideoSRT
I would be very glad to see the English UI of this tool
would you please Localize it to English
Kind Regards

换行字幕翻译时只会翻译第一行

你好,非常感谢你们开发了如此好用的免费软件,但是我在使用过程中遇到了问题,具体如下:

我使用的软件版本是 0.3.5, 翻译引擎是 腾讯云,在翻译 字幕文件(srt) 时,无论是否勾选 双语字幕 选项,最终翻译的 srt 文件始终只会有第一行的翻译结果,第二行的原文以及翻译结果都丢失了.

image

我不知道这是我使用上的问题,还是翻译功能实际存在的问题,希望能得到开发者的帮助,谢谢!

翻译BUG报告 BUG report for translation

使用功能:百度翻译引擎翻译srt文件
BUG场景:在导入翻译srt文件时发现,源srt文件在某个时间段如果有超过一行字幕时,翻译出来的句子只有第一行字幕有读取并翻译,第二行没有被读取到。
举例:
437
00:53:50,180 --> 00:53:55,180
Been a fool too long I guess
it's time for me to come on home.

437
00:53:50,180 --> 00:53:55,180
我想我做傻子太久了

时间戳-每个单词

video-set-windows 可以对单个单词的时间戳进行识别吗
而不是每句话的识别而是一个字一个字识别
然后可以得到每个字对应的时间戳

Google API

可以考虑把 Google/MicroSoft 的 API 放进去,走出去还是很不错的。

百度翻译API请求失败

翻译请求失败,重试第n次 ...

该key和secret在其他软件调用正常,版本选择高级版和普通版都无效

服务区域选择问题

人在海外。当“新建语音引擎”的服务区域选择“**”时,点击“生成字幕”提示“错误:录音文件识别失败 , (音频文件访问失败,请检查OSS存储空间访问权限)”。而当服务区域选择“海外”时点击“生成字幕”后提示“错误:录音文件识别失败 , (阿里云智能语音项目未创建/无访问权限。请检查语音引擎Appkey是否填写错误;如果是海外地区,在软件创建语音引擎时,服务区域需要选择“海外”)”。
语音交互功能在阿里云控制台测试过运行正常。在选择“海外”的语音引擎使用本软件时也能观测到阿里云OSS产生调用。

软件必须要求添加OSS对象存储吗?

我下载的是最新的0.3.3的版本按照文档配置了百度翻译跟腾讯翻译,但是我把文件添加进去点生成字幕却提示“请先设置OSS对象配置”,这个OSS是必须添加吗,他的作用是什么呢,按我的理解文件应该是直接通过api将文件传递给百度翻译或腾讯翻译才对呀。还有三群也已经满人了先进都进不去,试了所有群都是提示满人了。

还是很赞的

特别是给录制了视频教程,照着操作没问题。

而且好像如果是随时传上去然后随时删除,基本上连储存也不产生费用的样子。

遇到半角符号“.”会自动换行

提取出的 srt 字幕是这样的

57
00:03:11,260 --> 00:03:14,760
盘中包含了Quartus II 13

58
00:03:14,760 --> 00:03:15,880
0版本的软件安装包

但是,正确的应该是这样

57
00:03:11,260 --> 00:03:14,760
盘中包含了Quartus II 13.0版本的软件安装包

关于文件名错误的提示

请教大佬,按照阿里云设置做完之后,出现错误提示

任务开始...
【111】提取音频文件 ...
【111】上传音频文件 ...
【111】错误:bucket name obolbuc can only include lowercase letters, numbers, and -
任务完成!

但实际上文件名已经是小写数字了,还一直提示这个,无法使用,请问是什么问题?

video-srt.exe命令行工具,找不到生成的字幕文件

您好,感谢您的杰出工作!我对config.ini进行了配置,运行程序后显示成功,但是找不到生成的字幕文件,请问应该在哪里找呢?我用相同的配置,使用video-srt-windows可以正常找到生成的字幕文件。
image

挂一个盗版:小象字幕生成 https://sf.taozhc.com/

挂一个盗版,避免有的用户不明情况付费被坑

特此公告

介绍

这是我在刷知乎的时候看到的,因为 videosrt 的作者是我的朋友,我就 QQ 群里和 videosrt 作者说了。
但我觉得有必要在 issue 也挂一份

怎么个盗版法?

这个盗版"小象字幕生成"直接拿开源软件的代码改了改,加上收费功能,加上一个官网,就有脸到处宣传了。

能否在任务完成或失败之后添加语音提示?

很不错的软件。

深度使用下来几个小意见。

  1. 能否在任务完成或失败之后添加语音提示?
    因为任务进行时很多时候是需要一定时间的,所以会放到后台运行。加入语音提示可以很快知道结果。

  2. 对已有的引擎进行编辑
    初次尝试这个软件的时候,对已经保存的引擎无法直接编辑。只能先删除,再新建。能否直接在删除按钮旁边加一个编辑按钮呢?
    虽然直接修改json也可以,不过能可视化操作就更好啦~

  3. 希望能加入更多的引擎支持,比如腾讯的语音识别、网易见外的语音识别,讯飞的语音识别。

  4. 能否提供字幕转换的功能?或者支持更多的字幕格式,比如ass/vtt?

感谢开发者的作品!

很赞,另一点点建议

很赞的作品!在输出为普通文本时,能否增加双语?目前即使勾选翻译和双语,也只能输出一种语言。

根据教程做完所有操作后 遇到了问题

语音引擎翻译 则提示 错误:录音文件识别失败 , (识别内部通用错误,请稍候重试
字幕翻译则提示 错误:翻译失败!错误信息:SYSTEM ERROR
请问是哪里做错了么

需求建议

如果能将这个AI语音识别集成到potplayer上就更好了

Pro 打轴

The system cannot find the path specified
Snipaste_2022-09-02_14-48-42

给字幕自动打轴报错
请问有方法解决不?

识别成功后出现超时

日志如下:
【2020-07-31 08-56-12】提取音频文件 ...
【2020-07-31 08-56-12】上传音频文件 ...
【2020-07-31 08-56-12】上传文件成功 , 识别中 ...
【2020-07-31 08-56-12】OSS临时音频清理成功
【2020-07-31 08-56-12】错误:net/http: request canceled (Client.Timeout exceeded while reading body)

任务完成!

再次尝试识别时出现免费识别时长2小时已满,故应该是识别成功后下载超时了。

video-srt-windows I18n

video-srt-windows 国际化翻译计划

目标 Target

  • English UI

  • English Documents

  • Internationalization solutions

  • Other language for UI

    • 繁体中文
  • Other language for Documents

    • 繁体中文

链接 Link

#23

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.