视频采集方法与相关技术
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
图片简介:
本技术提供了一种视频采集方法。获取用户的检索词,确定所述检索词的同义词集合;根据所述同义词集合构建检索视频的约束模型,根据所述约束模型检索并获取与所述同义词集合对应的检索视频集合;根据所述同义词集合在所述视频集合中对应内容出现的特征,通过预设的特征参数对所述检索视频集合中的视频进行筛检,得到目标视频集合。本技术介绍了一种视频的采集方法,主要用于用户采集大量同类视频;通过对视频的同义词进行提取能够最大限度的获取与检索词相关的视频。
技术要求
1.一种视频采集方法,其特征在于,包括:
获取用户的检索词,确定所述检索词的同义词集合;
根据所述同义词集合构建检索视频的约束模型,通过所述约束模型检索并获取与所述同义词集合对应的检索视频集合;
获取所述同义词集合在所述检索视频集合中对应内容的特征,通过预设的特征参数对所述检索视频集合中的视频进行筛检,得到目标视频集合。
2.如权利要求1所述的一种视频采集方法,其特征在于,所述获取用户的检索词,确定所述检索词的同义词集合,包括:
获取检索词;
根据词典获取所述检索词的第一同义词集合A={a1,a2……ax};
根据网页标签获取所述检索词的第二同义词集合B={b1,b2……by};
根据文本关系获取所述检索词的第三同义词集合C={c1,c2……cz};
对所述第一同义词集合A、第二同义词集合B和第三同义词集合C进行相同项分析,得到相同项集合S(A,B,C):
其中,所述ax表示所述第一同义词集合A中的第x项;所述by表示所述第二同义词集合B中的第y项;所述cz表示所述第一同义词集合C中的第z项;所述x=1,2,3……x;所述y=1,2,3……y;所述z=1,2,3,……z;
根据所述相同项集合S(A,B,C),确定所述同义词集合。
3.如权利要求1所述的一种视频采集方法,其特征在于,所述根据所述同义词集合构建视频的约束模型,包括:
步骤1:确定所述同义词集合与所述检索词的距离D:
D=(G-si)P-1(G-si);
其中,所述G表示所述检索词;所述P-1为所述同义词集合的协方差矩阵,所述si表示所述同义词集合的第i个同义词;
步骤2:构建所述同义词集合的线性回归方程;
其中,所述ξ为所述同义词集合内积;所述表示所述同义词集合的均值;
步骤3:根据所述距离D合线性回归方程确定所述视频的约束模型F:
其中,所述kj表示检索视频集合的第j个视频;所述表示检索视频集合的均值;所述β表示所述检索视频集合的误差系数。
4.如权利要求1所述的一种视频采集方法,其特征在于,所述根据所述约束模型检索并获取与所述同义词集合对应的检索视频集合,包括:
根据所述同义词集合在任意视频检索网站获取第一检索视频集合;
确定所述第一检索视频集合的均值;
根据所述均值,将所述检索视频集合中检索的视频的参数导入所述约束模型,得到约束值;
获取所述约束值中的正值和与所述正值对应的视频,确定所述检索视频合集。
5.如权利要求1所述的一种视频采集方法,其特征在于,所述根据所述约束模型检索并获取与所述同义词集合对应的检索视频集合,还包括:
根据所述同义词集合在任意视频检索网站进行检索视频;
获取所述检索视频的链接地址;
根据所述链接地址,确定所述链接地址对应的视频网页;
当所述链接地址没有对应的视频网页时,删除所述链接地址;
对所述视频网页中的视频进行触发,响应对所述视频网页触发行为,当所述视频网页的触发行为具有响应时,获取所述视频网页的视频,构成所述检索视频集合;
当所述视频网页的触发行为没有有响应时,判断所述视频网页为无效网页。
6.如权利要求5所述的一种视频采集方法,其特征在于,所述根据所述约束模型检索并获取与所述同义词集合对应的检索视频集合,还包括:
获取所述检索视频的网络传输协议;
根据所述网络传输协议判断所述检索视频的获取方式;
根据所述检索视频的获取方式,获取对应的视频加载工具;
根据所述加载工具,获取所述检索视频集合。
7.如权利要求6所述的一种视频采集方法,其特征在于,所述根据所述约束模型检索并获取与所述同义词集合对应的检索视频集合,还包括:
获取检索视频对应的视频网页;
判断所述视频网页异常弹窗的次数;
根据所述异常弹窗的次数,判断所述视频网页是否为异常网页;
当所述视频网页为异常网页时,删除所述视频网页;
当所述视频网页为正常网页时,获取所述视频网页的视频,构成检索视频集合。
8.如权利要求1所述的一种视频采集方法,其特征在于,所述根据所述同义词集合在所述检索视频集合中对应内容的特征,通过预设的特征参数对所述检索视频集合中的视频进行筛检,得到目标视频集合,包括:
在所述检索视频集合确定后,获取所述同义词集合中每个同义词的语意;
根据所述同义词集合中每个同义词的语意,判断与同义词对应的视频的特征;
根据所述同义词对应视频的特征与预设的特征参数对比,确定最终的目标视频集合。
9.如权利要求1所述的一种视频采集方法,其特征在于,所述预设特征参数通过以下步骤确定:
步骤S1:获取检索视频集合E={e1,e2……eg};所述g表示第g个视频;所述g=1,2,3……g;
步骤S2:根据所述检索视频集合E,确定所述检索视频集合的特征矩阵R:
其中,所述rgl表示第g个视频的第l个特征;
步骤S3:根据所述检索视频集合的特征矩阵R,计算所述检索视频集合的差值系数η:
其中,所述em为模板视频的特征参数,所述N为检索视频集合的个数;
步骤S4:根据所述差值系数η和模板视频确定所述目标视频的阀值ε=emη: