如何将蓝光SUP字幕OCR成srt字幕(二)

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

本文讲述如何将图片型的蓝光字幕通过OCR(光学字符识别)进行识别,做成文本型的电影字幕。

准备工作
1、相关的软件必须安装到位,参见《蓝光字幕OCR相关软件安装指南》一文。

并准备好以下两款工具:
2、准备好从蓝光片源中提取的SUP字幕文件(即PGS字幕)
1、双击java应用程序,“File”->“Load”,导入sup字幕文件;
2、勾选Change frame rate,蓝光片源的帧速率一般为23.976p(源帧速率),由于咱们做电影字幕,所以更改为24p(目标帧速率),按<OK>
备注:这步很关键,电影字幕在这里一步到位,直接做成24p。

3、为了最大限度提高OCR的识别率,建议将字幕移到下方的黑边处进行识别。

按“Edit”->“Move all captions”
4、选择Move outside bounds(移动字幕到银幕边界,推荐选它),或者选Move inside bounds(移动字幕到蓝色画面下方)也可以。

按<Move>
5、“File”->“Save/Export”,Language(语言)请选择Chinese(zh),即中文简体,设置好保存路径,按<Save>【小技巧】选择语言时,在键盘上连按六下C,即可快速定位到Chinese(zh)。

6、运行里面的IdxSubOcr.exe文件,按<打开idx文件>,导入刚刚输出的idx文件,严格按下图操作:
7、OCR语言,选择“中文(简体)”,按<确定>
8、开始OCR,自动识别,稍候片刻……出现“文件已存盘”时,按<确定>
9、识别完之后,从第一条字幕开始检查、核对,对照源盘的sup字幕,看看有没有无法识别或识别错误的字,如果有,手工改正过来。

①从第一条字幕开始检查、核对,一直检查到最后一条。

每条字幕必须正确无误,不能放过任何错误。

②有些生僻字,是二级字库,可能无法识别出来,可以手工加上去。

③字幕中一般不允许出现标点符号,如果两句话之间用逗号分隔,逗号可以用一个中文状态的空格代替。

有些情况可以例外,如:詹姆斯·卡梅隆,中间的句点(分隔符),可以保留。

④蓝光字幕,通常将两行字幕并排显示,OCR之后,会用|(竖线符号)来分隔,建议将竖线符号用空格代替。

10、所有字幕修改完之后,一定要记得保存,建议每20分钟保存一次,以防不测。

按<保存srt文件>,<确定>
11、操作结束。

相关文档
最新文档