如何将蓝光SUP字幕OCR成srt字幕(一)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
按语:正规的商业片,一般导演会把剧本的台词交给剪辑师,根据台词来制作字幕,虽然导演或演员在拍摄过程中,时常会因某种需要即兴发挥,改变台词,不一定完全按剧本的台词来拍戏,但大体上改动的幅度不会太大。有些低成本电影,剧本边拍边改,拍到哪里算哪里,最终可能没有完整的台词,剪辑师做完终剪,需要自已根据成片来制作字幕,敲定字幕。
本文以一部正版蓝光DVD的电影片段为例,说说如何根据成片来制作字幕。
1、由于片源是蓝光m2ts格式,可以用tsMuxerGUI工具将里面需要的东西提取出来,当然,也可以用eac3to来提取。PR可以直接导入m2ts这种封装格式,支持AC3音轨,但不支持DTSHD音轨,也不支持PGS这种类型的字幕,因此,将DTSHD音轨和PGS字幕单独提取出来。
另外,AC3音轨是中文配音,是2.0声道,我们打包时不准备用它,听写字幕时,只作为参考之用。我们打包时,准备采用DTSHD英文音轨,因为它是5.1声道,质量比AC3更好。
PGS字幕提取后,会得到一个后缀为sup的字幕文件。
2、用SubtitleEdit导入sup格式的字幕文件。“文件”->“导入/OCR蓝光字幕…”,选中sup字幕,按<打开>
3、弹出OCR的窗口。什么是OCR?
通俗来理解,蓝光碟里的字幕,它是以图片的形式,而不是以文本文字的形式来显示,每一行字幕对应于一张图片。要将蓝光里的字幕提取出来,提取成文本格式,目前只能用OCR这种技术手段。由于汉字的结构比英文字母复杂得多,用OCR的手段来识别汉字,目前最多只能达到98%左右的识别率、准确率,也就是说,有的汉字可能会识别不出来,或者识别错误。这时候,需要在OCR的基础上,对OCR识别出来的错误字幕,进行手工修改,还是比较费事。
OCR的好处是,可以将整个片子的所有字幕自动识别出来,不需要手工一行一行地敲入字幕,可以大大提高效率。由于SubtitleEdit里的OCR功能,对中文简体的支持不大好,识别率不高,所以,暂时放弃OCR的手段,准备用手工的方
式录入字幕。OCR如何操作,参见
4、录完了第一行字幕,再用鼠标点击第二行的时间轴(编号为2的时间戳),录入第二行字幕;依此类推,从第一行,一直录到最后一行,所有字幕录完后,从头到尾检查一遍,是否有漏字、错别字现象,检查无误后,按<确定>
5、这是录好的字幕,这个纪录片的片段,一共有129行字幕。
6、然后,按“同步”->“更改帧率”,“到帧率”设为24,转成24p,按<确定>;
7、用“另存为…”的方式,另存为(这个字幕可以用来分卷操作)
8、操作结束。