该用户匿名发帖 发表于 2009-11-22 17:20 只看TA 1楼 |
---|
该用户已被删除 |
[教程]教你如何提取视频中的中文字幕 你是否正为大量AVI格式的影片没有中文字幕而惋惜呢,那么请看此文,或许将带给你一些启发。 重要前提:必须要有RMVB小格式带有中文字幕的相同影片,而且影片字幕最好是黑体,好识别。 字幕提取所需要用的软件:esrXP,尚书7号,word等。 一、esrXP软件的使用 首先点“Option”下的“Language”打开“Simplified Chinese”改为简体中文版。 ![]() 打开影片(工具栏第2个)《以诱惑女教师第一章穗花为例》,点“字幕过滤器”(工具栏第6个)视频在“字幕过滤器”里面显示,拉一下最下面进度栏,找到有字幕的地方进行调整。“完整宽度”请勾选上,“启动过滤器”请勾上,这样我们才能调整一些参数便于识别出完美的字幕。请选择“颜色和边线”。 “字幕颜色”设置成和片中字幕的主颜色的同色(如何正确知道字幕的颜色:可以把鼠标移动到字体上,在设置的左下角会出现当前鼠标所在处的RGB值) “边线颜色”设置成和片中字幕的边线颜色的同色(一般都是白色字体,其他的边线颜色都可以用黑色来代替) ![]() “进阶设置”(此处很重要,为识别的核心部分,识别出来的字幕完不完美就靠它了)点击如下图所示,大家可参考图中的设置。 ![]() 说明:没有打勾的不生效,意味着随便什么数值都可以(软件自动默认为最高或者最低) 需要调整的地方有2个:边线里的最高光度和最后阶段的RGB差距(图中2处的数值无参考意义,需自行根据影片设置) 最高光度需要根据不同的rmvb设置不同的值,调整到识别出来的字幕不丢字,也无太多的杂点即可。当然最好识别出来和我图中的字幕那样完美.. RGB差距为字幕的清晰度,越高越清晰,但是也同时会带来非字幕地方出现杂点,影响到后面的OCR识别。所以我们的原则是:只要能看了比较清楚,OCR软件能够顺利识别就可以了。 此处设置的时候可以拖动进度栏,观察总体字幕识别情况,不要总是盯着一出字幕来设置。那样容易会出现本处字幕识别了完美,其他时间字幕出现丢字或者杂点太多的情况 “后处理设置”如下图。 ![]() 设置完毕后我们可以开始识别了,返回到软件的主界面。点左下角的开始,让软件自己开始识别吧。识别时间需要看机器的配制和字幕的多与少。为了节约时间,本文中只识别的影片的前几分钟。 ![]() 现在我们会发现识别出来会多很多无用的字幕(到底会多多少,这个要看你设置的情况了一般设置了比较好的话,基本没有太多的无用字幕)我们需要手动删除他们。 依次点“字幕”“字幕管理”(工具栏第8个)出现如下界面 ![]() 无用字幕选择好之后,我们点字幕管理中的删除(红叉)。 关闭字幕管理,返回软件主界面。现在我们开始输出OCR所需要使用的bmp图片。 依次打开“文件”“保存OCR影像”(工具栏第5个) 说明:请按照本图设置,每张图片不宜太大,否则OCR软件无法识别 ![]() ![]() 输出图片结束后,我们需要把刚才提供的esr文件另存为一下。这个习惯要养成。 二、OCR软件:尚书7号的使用 打开软件,打开图片。(注意打开图片的顺序) ![]() ![]() 图片全部打开之后,我们先点全选图片(工具栏第5个) 然后开始识别(工具栏第6个)识别很快,几秒一个图片。 识别结束后,再按一次全选(工具栏第5个)然后依次点“输出”“输出到指定文件”(把识别出来的文字存为一个txt文件) 三、Word的用处 到了这里我们会发现,文中提示所需要的word还没派上用场,这个时候我们就需要用上它了。因为识别出来的文字,偶尔有几个会有识别错误,而且是批量的,我们需要用到word的全部替换功能,把一些常用字的识别错误给修正(不要问我有哪些常用字会识别错误,基本很少。做过这么一两个字幕后你就会知道那些字需要全部替换下)然后在word里面全选文字,使用“居中”。 现在我们所需要做的是把word里调整过文字复制到esrxp软件的左边的文字框里去。 然后开始我们最为辛苦的校对过程,结束后如下图 ![]() 注:一行对应一行。 现在我们的工作差不多结束了…可以输出为了srt ssa等格式的字幕了(推荐srt)。 具体方法是另存为的时候选择 srt类型。 ![]() (不一定需要)最后还有需要做的是断句了,用记事本打开srt或者ssa文件把一行显示过长的字幕分成2行显示(简单的回车一下)然后保存。 OCR软件:尚书7号请自行搜索。 提供《诱惑女教师第一章穗花》《苍井空淫乱巨乳女教师SOE-224)这两部影片的中文字幕给大家,大家使用暴风影音打开上述影片后,手动载入字幕即可。 [ 本帖最后由 A4Y 于 2009-12-9 17:09 编辑 ] 附件: 您所在的用户组无法下载或查看附件
|
0 |
wwjwxmmeimei 发表于 2009-11-26 00:20 只看TA 4楼 |
---|
技术很好,但有点搞不懂提取字幕来干什么啊,现成的用不就行了? |
0 |
|
---|
wldblys791018 发表于 2009-12-4 15:57 只看TA 8楼 |
---|
真是很好的办法,又学啦一招,以后就能看到中文字幕啦,太好啦 |
0 |
|
---|
radiostation 发表于 2009-12-4 16:08 只看TA 9楼 |
---|
很难得的好教程啊,就是LZ的图片挂掉几张了 如果能补上就更好了 |
0 |
|
---|