硬字幕提取工具6.5(原创)目前为止可行的硬字幕(hardsub)提取方案。这里只说“可行”的方案,那些不成熟的按时收

老掉牙的微软MODIocr识别引擎准确率较低,为了照顾MODIocr,esrXP需要做较多设置、试验、调整参数的工作,以便提供漂亮的黑底白字clearTxT给MODIocr,这就很考验用户的经验了。总体来说识别率不高、工作量较大。虽然esrXP已经停更多时,但是苦于没有更好的选择,长期以来字幕爱好者只能将就着用。

VideoSubFinder_5.50_x64做类似esrXP的工作(区别是保存每个字幕图片,不打包成一个idx文件),ABBYYFineReader15做类似IdxSubOcr的工作,将每个jpg字幕图片ocr识别为一个txt文件,然后回到VideoSubFinder_5.50_x64将所有txt文件合成一个srt文件。

ABBYYFineReader15号称地表最强离线文字ocr引擎,虽然比MODIocr好得多,但在实际使用效果上,对比经过数年AI人工智能训练的云识别引擎(例如百度OCR通用文字识别引擎),识别准确率还是差了一大截。

采用VideoSubFinder_5.50_x64+百度搜狗有道讯飞OCR通用文字识别引擎,整合第三方工具APP(为什么不好好利用别人的成果呢?),从开始到结束,整个字幕提取流程一气呵成,识别率高、省时省力。

总体来说,三个大步骤:

1、将字幕从视频中切片截图下来

2、将字幕图片OCR为文字

3、校对编辑字幕文字

具体步骤如下所述:

一个手机号码注册一个账号(须实名认证)。

每账号每天免费识别次数有规定(依精度不同从每天500次到每月1000次不等,每次识别1张图片,具体政策由厂家规定),如不够用可多注册几个账号,同时厂家经常有优惠活动(例如百度1元购1W次,讯飞0元购10W次,搜狗有道新注册送50、100元等)。对于长期需求用户,建议充点钱购买次数吧,价格不贵,还能支持国家高科技发展。

注册步骤很简单,可自行百度,获得的APP_ID/API_KEY/SECRET_KEY信息先保存起来下面会用到。

类似的:

注:APP2不指定,可以选用户熟悉的其他软件,例如SubtitleEdit可换成Aegisub或ArcTime

打开工具,

点击‘系统设置’

填入步骤1获得的百度OCR服务APP_ID/API_KEY/SECRET_KEY

点Browse找到步骤2安装好的APP的入口exe文件,APP1–APP2顺序不要错,然后Save保存设置。

这时,主界面的APP1、APP2按键将显示刚才设置好的exe文件名

点击主界面VideoSubF按键,将启动运行VideoSubFinder_5.50_x64

快速浏览全片,查看字幕区间矩形最大范围(注意有些视频是两层字幕),用两根竖线两根横线设置字幕截图区间(四根线在视频边缘不容易发现,试着点击选中可以移动它)。注意:矩形边框要比实际字幕稍大,不要为了节省图片尺寸而把区间设置成紧贴字幕(当然也没必要设置得太大,太大会导致叠图数量降低)。

点击Search右边的Settings,出现设置界面,我们只关心左边这块能影响Search字幕图片的参数。

第一个参数‘TextAlignment’默认设置是‘Center’,须要点击设置成‘Any’。

其他众多参数中,有一个参数至关重要,就是UseFilterColors这项,default值是空的,其他参数可以不设,这个一定要设置上,特别是非纯白字幕,例如黄色!如果不设置,有大几率会漏字幕。

在右边界面先点一下PixelColor

然后点击字幕白色文字中心骨干取色,点不准可以多点几下。

取到了颜色,会显示出来

点击Search->ClearFoders清空RGBImages目录,

然后点OCRSearch,程序开始扫描视频文件,生成RGBImages。

几分钟后扫描完成,可以关掉VideoSubFinder_5.50_x64,初次使用我们可以打开RGBImages目录看一下

打开文件看看,是RGB原色字幕截图切片,很适合喂给百度AI过的OCR引擎做识别。

点击主界面上的‘删合’按键,将打开‘删合窗’并自动定位到RGBImages目录,

我们可以在‘删合窗’中清除RGBImages目录中的空字幕图片。

一页可以显示几十张图片,浏览、选中、删除非常方便。

翻页:将鼠标指针停留在图片区,滚动鼠标滚轮,或者键盘↑↓键、键盘←→键,可以翻页(一次滚动三列)

选中:鼠标左键点击可以标记选中图片,再次点击可以去选中。Shift+鼠标左键可以连续多选、连续去选。

更多方便的功能可以看“第四节之6、删合窗(删除合并)”

如下图一处为空字幕图片,可以选中标记它:

一直标记到最后一页:

然后点‘总删合’,确认后将会把刚才标记过的所有空字幕图片删除(如果发现不能删除,多半是系统权限问题,请不要将VSF和本工具安装在C盘或桌面):

清理完空字幕图片后,点击面板上的‘返回主界面’。

百度高精度每天免费识别额度较低,如不采用叠图---多张字幕图片合成一张大图来识别以节省额度,每天只能识别较少字幕图片,因此,如果用户没有购买额度,应该在系统设置中先选上叠图,并保存设置。

点击主界面的OCR按键,程序将连接百度OCR服务器,对RGBImages目录中的所有字幕图片从头到尾按顺序做识别,只需等待完成即可(免费用户最大每秒能处理2–3次识别)

OCR识别完成了!

这时在RGBImages目录下已经为每个.jpeg文件生成了一个同名.txt字幕文件,初次使用可以看一下。

点击主界面上的‘校对’按键,将打开校对窗,校对窗显示一页6组图文。

编辑:可以用输入法进行常规的输入、删除、鼠标左键/右键插入空格等操作。

翻页:将鼠标指针停留在任一图片上,滚动鼠标滚轮,或者键盘↑↓键可以翻页。翻页将自动保存校对过的字幕。

选中:鼠标右键点击可以选中图片,再次点击可以去选中。

删除:按Delete会弹出删除提示,按回车Enter执行删除。

更多方便的功能(例如‘精准对齐’,‘一键插入空格’)可以看“第四节之7、校对窗(补漏校对)”

如果希望在SubtitleEdit等字幕软件中做校对,可以略过这个步骤,直接到下个步骤。

校对完字幕后,点击面板上的‘返回主界面’。

之所以前面在校对窗做过校对,这里又用到APP2来做编辑,是因为有些用户(例如字幕组)对字幕要求高,还需要做调轴、批量替换、方言转换等进一步校对工作。

可以大概浏览一下,然后关掉。

点击主界面SubtileE按键,将自动打开SubtitleEdit编辑刚才生成的123.srt字幕文件。

在波形图窗口里,“点击以添加波形”,打开视频文件,本例是‘倚天屠龙记之魔教教主-中字.mp4’

在波形图窗口,勾选‘选择当前播放时刻的字幕’,设定播放速度,例如200%,然后开始播放视频,字幕会同步显示在播放窗口,可随时暂停播放,进行字幕校对。

该删除的删除,该修正的修正,该替换的替换,该调轴的调轴。

一般来说,走到SubtitleEdit这步,剩下的校对工作已经不多了,有时甚至不需要校对就能用了(注重细节的用户还是认真过一遍吧)。

完成字幕校对后,点击“文件->另存为”保存校对好的字幕文件,SubtitleEdit会自动将123.srt重命名为跟视频文件同名的srt文件“倚天屠龙记之魔教教主-中字.srt”,并保存在视频文件所在目录下,方便大多数播放软件播放视频文件时自动加载同名字幕文件。

至此,整个硬字幕提取流程就走完了。

问题反馈及建议:

1、

Q:软件需要安装吗?运行出错怎么办?

A:绿色免安装。如果32bit版本运行出现“Failedtoexecutescriptpyi_rth_multiprocessing”错误,说明win7x32系统太旧,要先装KB2533623才行。如果出现找不到dll的报错,请安装Microsoft.NETFramework4.8和MicrosoftVisualC++2015-2019。如果运行过程中,执行命令或删除出错,多半是系统权限问题,请不要将VSF及工具软件解压安装在C盘、或者偷懒放到桌面运行,有这种坏习惯要改。

2、

Q:APP1、APP2指定必须要用文档例子中的第三方软件吗?

3、

Q:OCR服务商免费吗?

A:每家OCR服务商提供不同的免费识别额度(每天每月有一定数量,具体看厂家规定),业余人士可利用免费额度。同时厂家经常有优惠活动(例如百度1元购1W次,讯飞0元购10W次,搜狗、有道新注册送50、100元等)。而对于长期需求用户,建议充点钱购买次数吧,价格不贵,还能支持国家高科技发展。

4、

Q:为什么填写了OCR服务商的KEY后,不能识别?

A:请确认开通了服务商的文字识别服务,填写获得的KEY等资料前后不能有空格、双引号、单引号等其他字符,鼠标双击拷贝KEY有时候会多拷贝一个空格。如识别出现“NetworkException!”错误提示,说明无法连接到OCR厂家的服务器,请检查网络连接是否正常(不要用VPN代理),或重启一下电脑再试。

5、

Q:高精度和低精度识别率差别大吗?

A:对于清晰简单的字幕,差别不大,模糊复杂(多种语言混合)的字幕、大图识别,差别较大,在批量识别前可做识别试验,以便选择最佳设置。

6、

Q:有时候叠图出现‘间隔标记丢失,尝试纠正!’的告警提示,怎么办?

A:OCR厂商训练的机器学习模型,对不同特征的图片识别能力不同,甚至有些特殊爱好或怪癖,例如百度OCR对于模糊字幕的叠图容易丢失间隔标记(模糊与清晰并存时眼睛有点花),其他厂家的OCR则没有这种问题。有些语言类型设置会丢失第一个英文字符,有些会丢失标点,小问题不一而足。每种机器学习模型的情况都不同,在批量识别前可先做识别试验(包括加入增强魔棒),以便获得最佳设置,得到最佳识别结果。

7、

Q:极速叠图会导致识别率降低吗?

8、

Q:想切换图片做字幕文字编辑,老是要在文件列表区用鼠标点击,很不方便。

A:请用鼠标滚轮或者键盘↑↓来做图片切换浏览,滚动时请将鼠标指针停留在图片区中,然后滚动滚轮,养成使用习惯后会很方便。

9、

Q:批量识别过程中出现NetworkException错误、额度用完、手动中止,导致识别未完成,又不想重头识别,想从中断点处继续识别怎么操作?

A:主界面Restart去选中,接下来再做批量识别将自动从中断点处继续识别。

10、

Q:识别率不高、漏字、错字、漏标点、漏空格,怎么办?

A:识别率主要由OCR厂家训练的机器学习模型决定,遇到识别率问题,可以:

1)更换OCR厂家

2)更改语言类型设置

3)利用‘增强魔棒’提高识别率

4)如果用了叠图,可以改为半叠或者不叠

5)识别完成后,利用SubtitleEdit、Aegisub等字幕软件替换错误字符

11、

Q:如果不想用VSF的RGBImages想改用TXTImages来做OCR可以吗?

A:当然可以,只需要在文件列表区手动Browse打开定位到TXTImages目录即可,其他一切操作跟在RGBImages目录下无异。

12、

Q:OCR识别率挺高的,多数情况下只需要补上识别丢失的空格,就能完成文字校对工作了。在校对窗校对时,有办法提高插入空格的速度吗?

A:6.3版及以前版本支持“鼠标左键定位+鼠标右键插入空格”,须按两下鼠标插入一个空格,6.5版新增“鼠标左键一键定位+同时插入空格”功能,只需要按一下鼠标左键就能插入一个空格,变得更轻松了。

13、

Q:OCR批量识别完成后,是在校对窗中校对,还是在APP2第三方字幕软件中校对?

A:常规流程做法:OCR批量识别完成后,切换到校对窗,先缩放和移动字幕图片,做精准对齐,然后开始校对。校对完后生成SRT文件,启动APP2进行替换、转换、调轴。

有时候也可以:OCR批量识别完成后,生成SRT文件,启动APP2进行替换、转换(但不调轴),然后切换回校对窗、导入APP2加工过的SRT文件做精校对(校对完还可再次生成SRT文件,启动APP2做调轴)。具体看识别率来定。

14、

Q:网页截图识别没反应?如何提高网页、pdf文件截图识别率?

A:需要先安装第三方截图软件如Snipaste,然后配合本工具才能实现截图识别。为了提高识别率,可以选用高识别率OCR厂家、还可开启增强魔棒,并将Snipaste输出图像质量设置成100。

15、

Q:使用时遇到报毒

A:请不用担心,因为本工具采用python+pyinstaller打包,很多防毒软件会误报(除非购买白名单证书或申请鉴定)

16、

Q:有朋友担心程序植入了木马

A:我只想说:稍微做过python编程的,都知道python是解释型语言,是不能加密的,exe只是个打包。你担心木马可以读读本程序代码嘛(凡是你能找到的从1.0到最新的版本),花不了你几分钟,就能解开你的疑虑。或许你还能学到点知识,提高点水平,如果整天只会人云亦云疑心重,精神萎靡搞黄色,你这辈子也就这样了。。。

本工具仅供个人使用,为业余提取字幕的朋友提供方便,不可用于商业目的,不可侵犯他人知识产权。

同时,作者建议有长期大量需求的用户,请购买OCR服务商的额度,支持国家高科技发展。

6.5最新版(64bit、32bit)下载地址:

提取码:2021

2021.09.13更新:

1、修复了进度条长度异常问题

2021.09.02更新:

1、允许秘钥拷贝填写误多输入空格

6.3开放了5个OCR,对比6.2只开放了1个OCR

因近期OCR服务商免费额度政策调整,导致很多新用户额度不够用,故开放5个OCR,不够用的朋友可以实名申请最多5个OCR秘钥填入,从而提供5倍于单个账号的免费额度。如果还不够用,请购买OCR服务商的额度。

6.5版新增“鼠标左键一键定位+同时插入空格”功能,校对窗中文本框只须按一下鼠标左键就能插入一个空格,对于高精度版这种文字识别率很高,但是空格不能识别,需要补漏空格的校对工作,变得更轻松了。对比6.3及以前版本支持“鼠标左键定位+鼠标右键插入空格”,须按两下鼠标才能插入一个空格(继续支持)。具体请看6.5版用户使用手册-校对窗章节。

VSF+SubtitleEdit(64bit)下载(内有中文设置使用手册):

THE END
1.自动生成汉字风格的随机设计工具:推荐哪些免费软件用于手写风格随着数字化时代的到来越来越多的设计工具和软件应运而生使得咱们可以轻松地生成各种风格的文字。本文将为您推荐几款免费的自动生成汉字风格的随机设计工具帮助您快速制作出个性化的手写风格文字。 ## 一、Canva:简单易用的在线设计工具 ### 1. 简介 Canva是一款在线设计工具内置了丰富的艺术字生成功能。客户能够通过https://www.yanggu.tv/webgov/aizhishi/88574.html
2.盘点主流AI个性书写字体生成软件:一键打造专属字迹,满足多样化在数字化时代书写字体的个性化和独到性变得越来越必不可少。无论是为了打造个人、设计创意作品,还是提升文档的视觉效果,个性化的书写字体都显得至关要紧。得益于人工智能技术的飞速发展,咱们现在可以通过生成个性书写字体的软件一键打造专属字迹,满足多样化的书写需求。本文将为您盘点主流的个性书写字体生成软件让您轻松拥有http://www.guanxian.org/consult/aizhishi/87106.html
3.2024年排行榜:十款常用字体设计软件软件分类:中文字体大小:104 KB时间:2020-04-20 软件介绍:本款艺术字体在线生成器为绿色版,是一款可将普通字转换为艺术字的艺术字体转换器。如果你是photoshop菜鸟的 立即查看 4.小湖个性签名设计软件 1.0 小湖个性签名设计软件是一款方便易用的工具,可以帮助用户轻松设计个性签名。用户可以自定义更换背景、字体颜色和https://app.zol.com.cn/jiqiao/150269.html
4.什么软件能自己做字体(2款简单好用字体app推荐)手迹造字app拥有强大的机器学习力,你只需要书写100个字,它就能根据你的笔顺、书写压感、笔迹粗细、字架结构、偏旁部首的紧凑。 写完点击“制作字体”以后,你还可以给字体命名。会让你留下邮箱。只需要等候大约三个小时,生成的字体会发到邮箱里。里面会有详细的操作步骤。 https://pinkehao.com/infor/121949.html
5.图片加字软件照片上面加字的软件自己做文字图片的软件图片加字软件 30 APP应用 6943 浏览 火热 热度 多特软件站为您整理多款可以在数码照片上添加文字或日期的软件。使用ImageSign可以轻松地将日期/文本批量添加到照片中。简单易用,您可以在照片上添加图章。在线为照片添加水印,为照片添加文字,添加LOGO。pc软件 https://m.duote.com/zt/soft20200535/
6.做字体设计用什么软件好?这5款足够了字体设计在现代视觉传达中扮演着重要角色,而选择适合的字体设计工具是字体设计师必不可少的一步。那么,做字体设计用什么软件好?在众多的字体设计工具中,即时设计、FontCreator、RoboFont、Fontlab 8 和 Glyphs这 5 个软件备受设计师关注。一起来看看吧! https://js.design/special/article/doing-font-design.html
7.做空心字软件哪个好用(可以制作空心字体的软件下载盘点)空心字是一种很潮流的字体,写出来是很好看,有不少小伙伴对于这一类的字体都是比较喜欢的,想要应用到我们的日常生活中,就需要选择一款好用的软件,那么做空心字软件哪个好用呢?小编将根据大家的需求来推荐几款热门字体软件,不但可以制作空心字,还能写出其他更多的好看字体内容哦。1、《炫字体》在这个充满个性的时代.https://www.18183.com/183youxituijian/202303/4510064.html
8.用ae软件做写字效果图ae做手写字效果教程摘要:新片场课堂小编凤桐宸为您整理用ae软件做写字效果图 ae做手写字效果教程的相关内容,欢迎小伙伴点击查看用ae软件做写字效果图 ae做手写字效果教程的内容,如果您喜欢可以转发及收藏本网站。 本文目录 ae制作写字效果教程,用ae软件做写字效果图课程 ae做手写字效果教程,用ae软件做写字效果图课程 https://edu.xinpianchang.com/article/baike-117980.html
9.免费图片文字提取软件腾讯云开发者社区自动提取图片中文字内容,这个开源免费软件送给你 | PA实战资源 | PA实战应用》里,讲了使用Power Automate Destkop直接提取PDF文件内容的操作方式,但有朋友问,是否可以提取图片转成的PDF内容: 如上面回复,这里的核心其实并不是PDF内容的提取- 2 - OCR引擎安装及使用 实际上,对于不同语言的识别,关键是能获取到https://cloud.tencent.com/developer/information/%E5%85%8D%E8%B4%B9%E5%9B%BE%E7%89%87%E6%96%87%E5%AD%97%E6%8F%90%E5%8F%96%E8%BD%AF%E4%BB%B6
10.FLASH实用代码大全(二)阿K&LiveCai39。问:怎样做到字列成环型并围绕圆心转动? 答:你可以用CORELDRAW软件或者相关软件来做好了,再导入到FLASH中便可! 40。问:外部导入txt如何变字体的颜色? 答:在设定文本框时,设定字体的颜色。 41。问:才打开FLASH4时使用铅笔工具画圆时还可以,但再次新建一个时用铅笔工具画圆时(模式是平滑)画出来的却不是一https://www.cnblogs.com/qq419524837/archive/2009/07/29/1534241.html
11.以方·字体管理器以方·iFonts字体助手客户端引进全网优秀品牌字库资源满足用户的用字需求,以方·iFonts彻底简化字体使用流程,只需3步即可拥有全网字库,超级字体管理工具,值得您试试。https://ifonts.com/
12.发光字自动报价软件产品发光字自动报价软件产品,快速报价,准确报价,节省人工风云标识(广州)有限公司荣誉出品 < > 详细信息 发光字自动报价软件产品 报价快速,节省人工,省钱就是赚钱。 报价准确,价格统一,减少烦恼增加公司收入。 风云标识(广州)有限公司荣誉出品https://www.fengyunsigns.com/html/product/100.html
13.9款AI写作软件推荐,让文章撰写更加轻松!场辞,ai视频字幕制作软件,一款基于语音识别技术的视频字幕制作软件,提供语音转字幕、一键加字幕、视频加字幕,字幕快捷校对等功能,一键智能识别字幕,用AI加速你的创作。 场辞功能: 1、操作简单,快速做字幕 场辞采用行业头部视频制作团队的工作流,让你能轻松为各种类型的视频内容制作字幕。 https://www.360doc.cn/mip/1115236180.html
14.方正公文制作国产化软件2、文字占字宽 为保证公文美观,在编辑过程中需要将字数少的段落与较多文字段对齐,通过文字占字宽功能,只需简单的输入想要撑满多少个字数,即可以实现占字宽效果。支持小数输入,效果更精确。无需考虑字间距大小,自动横向均匀撑满,方便快捷。 3、文字做整体 http://www.founderpod.com/m/ProductCenter/GreenPrintingProcess/197.html
15.磨金石教育丨文字游侠AI,实现头条文章一键生成!磨金石教育工具目前的费用是398/年,这个价格也是因为软件刚出来需要推广,故而初始定价并不高,但会随着软件用户数的增加不定期提升! 当然这个费用不是给到我这边,雷哥只是做推荐和分享,因为我自己测试过,功能确实牛逼,所以分享出来给大家 如果需要的小伙伴,在工具内直接支付即可 https://www.mojinshi.online/index/news_detail/id/1125.html
16.文字矢量图怎么做用什么软件可以做文字矢量图软件版本:CorelDRAW X8 我们碰见一些比较好看的毛笔字或者其他字体库中没有的字体时,需要把这些图片上的文字进行矢量化来更深一步的进行设计优化,那文字矢量图怎么做,用什么软件可以做文字矢量图,下文会进行详细讲解。 一、文字矢量图怎么做 制作文字矢量图整个过程,我们通过CorelDRAW矢量设计软件来进行详细讲解。 首先https://www.coreldrawchina.com/shiyongjiqiao/cdr-sltgg.html
17.揭自媒体“洗稿”:千字10元靠改头换面做成大号新闻频道记者在QQ群检索发现多个“洗稿”交易群,有的贩卖“洗稿”文章,有的招收写手,还有的群甚至公开售卖自动“洗稿”的软件。 记者随机加入一个名为“洗稿文案原创资源”的QQ群。该群声称“为头条号、百家号、大鱼号、企鹅号等多个内容分发平台的账号提供‘洗稿’服务”。在实时群聊中,不断有人提出需求:“2000字20元中国https://news.cctv.com/2018/10/24/ARTIrjdmTzVX5c4Gy5dQDE1a181024.shtml
18.2024年甘肃省普通高校高职(专科)升本科统一考试招生工作实施方案根据《关于做好2024年普通高等学校专升本考试招生工作的通知》(教学司〔2023〕15号)和《2024年甘肃省普通高等学校高职(专科)升本科考试招生工作方案》(甘教学〔2023〕3号)有关要求,为做好2024年我省普通高校高职(专科)升本科(以下简称普通专升本)考试招生工作,特制定本实施方案。 https://www.ganseea.cn/putongzhuanshengben/904.html
19.字体设计软件字体设计软件大全下载字体设计软件有哪些问:为什么有些impact字体字体的字打不出来? 答:有些字库必须要在繁体输入的情况下才能打出来的。(例如金梅字库等),如果使用繁体输入法输入的文字依然无法出来,可能是字体的字库不全,是没办法打字这个字的。 同类软件对比 楷体gb2312字体正式版是款有着古典文字韵味的字体软件。楷体gb2312字体最新版书写自然流畅,笔画https://soft.onlinedown.net/sort/26-hot/3/
20.文字图片制作app软件下载【多款气泡图,情侣对话图】提供多种气泡图模版,制作情侣甜蜜对话图,秀恩爱党不容错过的软件装备。文字控,图片加文字,更多神仙功能等你来发现,做头像,做壁纸,小红书分享图制作,抖音、快手文字图和卡点图制作,发挥你的想象,这里有片精彩的天地等你来探索,还等什么,赶快下载试试吧! 开发者:重庆萌一点科技有限公司https://m.liqucn.com/os/android/rj/123379.wml
21.最火的文字作图软件有哪些可以自己做文字背景图的软件日常生活中少不了拍照,那么怎样将拍出的照片添加文字、加工、修改让它变得更加的精美呢?小编这里给大家带来了最火的文字作图软件,全面屏适配优化,支持拍摄1分钟的长视频,美化特效内置滤镜更新,让你的照片焕然一新,还有丰富的模板和滤镜让你轻松P图,感兴趣的朋友快来http://www.ishaohuang.com/s/zhdwzztrj/