10-视频内容的结构化

合集下载

[AI开发]零代码分析视频结构化类应用结构设计

[AI开发]零代码分析视频结构化类应用结构设计

[AI开发]零代码分析视频结构化类应⽤结构设计视频结构化类应⽤涉及到的技术栈⽐较多,⽽且每种技术⼊门门槛都较⾼,⽐如视频接⼊存储、编解码、深度学习推理、rtmp流媒体等等。

每个环节的⽔都⾮常深,单独拿出来可以写好⼏篇⽂章,如果没有个⼏年经验基本很难搞定。

本篇⽂章简单介绍视频结构化类应⽤涉及到的技术栈,以及这类应⽤常见结构,因为是实时视频分析,因此这类应⽤基本都是管道(pipeline)设计模式。

本篇⽂章算是科普⼊门介绍⽂章,不涉及详细技术细节,适合这⽅⾯的新⼿。

所谓视频结构化,就是利⽤深度学习技术对视频进⾏逐帧分析,解析出视频帧中感兴趣的⽬标、并且进⼀步推理出每个⽬标感兴趣的属性,最后将这些⽬标、属性保存成结构化数据(能与每帧关联起来)。

如果是实时类应⽤,要求实时看到分析结果,那么整个过程要求能做到实时性,⽐如单路视频分析保证FPS能达到原视频的FPS(常见是25)。

当然,还有另外⼀类结构化类应⽤并不要求做到实时性,⽐如分析监控录像,将视频录像⽂件进⾏结构化处理,结果存于数据库,⽤于后期快速检索,这类应⽤不⽤做到实时分析,打个⽐⽅,每秒处理25帧和处理5帧对于这类应⽤影响不⼤,只是处理完⼀个录像⽂件总耗时不同。

本篇⽂章主要介绍实时(Real-Time)视频结构化。

上图中实时将结构化数据叠加在视频画⾯中,图中红⾊多边形为⼈⼯配置检测区域(ROI),ROI之外的⽬标可以忽略。

视频结构化常见Pipeline视频从接⼊,到模型推理,再到结果分析、界⾯呈现,是⼀个“流式”处理过程,我们可以称为pipeline,对于实时视频结构化类应⽤,要求整个pipeline各个环节均能满⾜性能要求,做到实时处理,某个环节达不到实时性,那么整个pipeline就有问题。

下⾯是我整理出来的视频结构化处理pipeline,这个设计基本可以满⾜要求,有些pipeline可能不长这样,但是⼤同⼩异。

如上图所⽰,数据从左往右移动。

视频结构化产品解决方案

视频结构化产品解决方案

视频结构化产品解决方案解决方案部目录1 项目概述 (4)1.1 项目背景 (4)1.2 项目建设目标 (4)2 系统总体建设 (4)2.1 系统架构 (5)2.2 建设原则 (6)2.3 建设规范 (7)3 产品介绍 (8)3.1 产品特点 (8)3.2 技术描述 (9)3.2.1 深度学习技术 (9)3.2.2 高性能计算技术 (11)3.3 智能分析 (11)3.3.1 目标结构化分类 (11)3.3.2 机动车结构化 (12)3.3.3 非机动车结构化 (14)3.3.4 行人结构化 (15)3.4 应用平台 (16)3.4.1 设备接入 (16)3.4.2 任务管理 (16)3.4.3 实时预览 (17)3.4.4 智能检索 (18)3.4.5 以图搜图 (19)3.4.6 系统管理 (19)3.4.7 系统集成及对接 (19)4 系统性能 (20)4.1 识别指标 (20)4.2 性能指标 (20)5 硬件计划 (21)5.1 产品形态 (21)5.2 产品参数 (21)6 存储系统设计 (21)6.1 高可用性 (21)6.2 高速数据库 (22)7 网络系统规划 (22)7.1 IP地址规划 (22)7.2 网络安全规划 (22)8 集群规划 (23)8.1 集群模式 (23)8.2 横向扩展 (23)8.3 分布式设计 (23)8.4 动态调度 (24)8.5 堆叠式集群 (24)8.6 服务自动化 (24)9 机房建设规划 (24)9.1 位置选择 (24)9.2 环境要求 (25)9.2.1 温度、相对湿度及空气含尘浓度 (25)9.2.2 噪声、电磁干扰、振动及静电 (25)附件一配置清单 (25)1 项目概述1.1 项目背景随着平安城市及智慧城市建设的推进,目前高清监控的覆盖率已占绝大部分。

其中,新建监控项目已基本全部实现高清化,且传统的模拟/非高清监控正逐步被更新换代。

媒体行业短视频内容创作与管理平台搭建方案

媒体行业短视频内容创作与管理平台搭建方案

媒体行业短视频内容创作与管理平台搭建方案第1章平台概述与目标定位 (3)1.1 短视频行业背景分析 (3)1.2 平台定位与核心功能 (3)1.3 平台发展目标与预期效果 (3)第2章市场调研与需求分析 (4)2.1 市场现状与竞争对手分析 (4)2.1.1 市场现状 (4)2.1.2 竞争对手分析 (4)2.2 用户需求与痛点挖掘 (4)2.2.1 用户需求 (4)2.2.2 痛点挖掘 (5)2.3 市场机会与挑战 (5)2.3.1 市场机会 (5)2.3.2 市场挑战 (5)第3章平台架构设计 (5)3.1 技术选型与架构模式 (5)3.2 系统模块划分与功能描述 (6)3.3 数据存储与处理 (7)第四章内容创作与管理模块设计 (8)4.1 内容创作流程规划 (8)4.1.1 创意孵化 (8)4.1.2 内容策划 (8)4.1.3 内容制作 (8)4.1.4 内容优化 (8)4.2 短视频制作工具与功能 (8)4.2.1 视频拍摄 (8)4.2.2 视频剪辑 (8)4.2.3 特效添加 (9)4.2.4 音频处理 (9)4.2.5 字幕制作 (9)4.3 内容审核与发布机制 (9)4.3.1 审核标准 (9)4.3.2 审核流程 (9)4.3.3 发布机制 (9)4.4 内容管理功能设计 (9)4.4.1 内容分类 (9)4.4.2 内容检索 (9)4.4.3 数据分析 (9)4.4.4 用户反馈 (9)第5章用户互动与社交模块设计 (10)5.1 用户注册与认证 (10)5.1.1 注册流程简化 (10)5.1.2 认证机制 (10)5.2 用户互动功能设计 (10)5.2.1 点赞与评论 (10)5.2.2 转发与分享 (10)5.2.3 关注与粉丝 (10)5.3 社交分享与传播策略 (10)5.3.1 平台内分享 (10)5.3.2 跨平台传播 (10)5.3.3 话题营销 (11)5.4 用户成长体系与激励机制 (11)5.4.1 积分制度 (11)5.4.2 成长等级 (11)5.4.3 激励政策 (11)5.4.4 用户反馈与建议 (11)第6章推荐算法与个性化推荐 (11)6.1 推荐系统架构设计 (11)6.1.1 数据收集 (11)6.1.2 数据处理 (11)6.1.3 推荐算法模块 (11)6.1.4 个性化推荐 (12)6.1.5 结果反馈 (12)6.2 用户画像与兴趣模型 (12)6.2.1 用户画像构建 (12)6.2.2 兴趣模型建立 (12)6.3 短视频内容标签体系 (12)6.3.1 标签体系设计 (12)6.3.2 标签应用 (12)6.4 推荐算法选择与优化 (13)6.4.1 推荐算法选择 (13)6.4.2 推荐算法优化 (13)第7章数据分析与运营策略 (13)7.1 数据收集与处理 (13)7.2 数据分析与可视化 (13)7.3 运营策略制定与优化 (14)7.4 数据驱动决策支持 (14)第8章平台安全与合规性 (14)8.1 信息安全策略与措施 (14)8.2 数据隐私保护与合规性 (15)8.3 系统稳定性与功能优化 (15)8.4 法律法规与行业规范遵循 (15)第9章商业模式与盈利策略 (15)9.1 市场定位与商业模式选择 (15)9.2 盈利渠道与收益分析 (16)9.3 营销推广与合作策略 (16)9.4 成本控制与盈利预测 (16)第10章项目实施与推进计划 (17)10.1 项目团队与资源分配 (17)10.2 项目进度与里程碑 (17)10.3 风险评估与应对措施 (18)10.4 项目总结与持续优化 (18)第1章平台概述与目标定位1.1 短视频行业背景分析移动互联网的迅速发展和普及,短视频作为一种新兴的内容传播形式,已经成为人们日常生活中不可或缺的一部分。

视频结构化解决方案

视频结构化解决方案

视频结构化大数据平台解决方案目录1. 建设背景 (4)2. 建设目标 (5)3. 建设原则 (6)3.1. 标准化原则 (6)3.2. 统一设计原则 (6)3.3. 大数据处理原则 (6)3.4. 高可靠/高安全性原则 (6)3.5. 适用性原则 (7)3.6. 可扩展性原则 (7)4. 系统总体设计 (7)4.1. 设计依据 (7)4.2. 总体架构设计 (10)4.3. 业务架构设计 (11)4.4. 网络架构设计 (12)5. 数据结构化 (13)5.1. 概述 (13)5.2. 数据采集 (14)5.3. 控制调度单元 (15)5.4. 目标结构化单元 (15)5.5. 车辆结构化单元 (21)5.6. 前端要求 (26)6. 数据存储 (29)6.1. 概述 (29)6.2. 功能设计 (29)6.2.1. 数据存储 (29)6.2.2. 数据服务 (30)6.2.3. 系统管理 (31)6.3. 存储设计 (32)7. 数据应用 (32)7.1 以图搜车 (33)7.2人物大数据 (34)7.2.1人物综合查询 (34)7.2.2人物检索 (34)7.2.3人骑车检索 (36)7.2.4视频框选嫌疑目标 (37)7.3以图搜图 (38)7.3.1智能建库引擎 (38)7.3.2以图搜图应用 (38)7.4GIS应用 (39)7.4.1基本操作 (39)7.4.2地图查询 (39)7.4.3轨迹展示 (40)7.4.4摄像头操作...............................................................................错误!未定义书签。

7.4.5系统管理 (41)8. 平台特点 (44)8.1. 提高海量视频倒查的效能 (44)8.2. 提供视频关键特征的视频检索 (45)8.3. 永久保存结构化的视频信息 (45)8.4. 基于虚拟化服务的云计算架构 (46)9. 配置清单.......................................................................................................错误!未定义书签。

视频语义上下文标签树及其结构化分析

视频语义上下文标签树及其结构化分析

视频语义上下文标签树及其结构化分析余春艳;苏晨涵【摘要】Video content is strongly associated with time series and has a strong logical structure. Shot semantic is a kind of basic unit for understanding video content. From the point view of user cognition, among shot semantics, there are various context information hidden rather than explicit temporal association, such as logical and structural association. Obviously, it is important to describe these context information in an reasonable manner. Firstly, this paper presents a label tree with context label to represent the structured context as characterization model of video semantic context. Within the label tree, each shot semantic in a shot semantic sequence is taken as a leaf node and all inner nodes with context label is adopted to represent the inter-dependencies among its child nodes. More important, its hierarchical structure, corresponding to the hierarchical model of video content, leads to significant information gain for video content understanding. Furthermore, it is tough to construct a hierarchical video semantic context label tree from the shot semantic sequence, which needs to bridge from sequence space to tree structure space. Then, according to the combined feature of shot semantic sequence and video semantic label tree, this paper uses an SVM-Struct analysis to construct structural function and loss function for the semantic context and implement the construction of video semantic context label tree. The experimental results show thatvideo semantic context label tree has a better characterization ability in many aspects. And SVM-Struct driven analysis ensures the characterization ability of video semantic label tree with high precision, recall and F1 rate.%视频内容具有非常强的时间关联和逻辑结构,镜头语义是视频内容理解的基本单元。

什么是视频结构化,又能做些什么?

什么是视频结构化,又能做些什么?

什么是视频结构化,又能做些什么?在科技飞速发展的今天,我们的生活变得更加便捷与智能。

构建未来智慧城市,视频结构化是至关重要的一点。

经过算法的演进和技术的革新,如今,视频结构化已开始大规模地得到应用。

超清股份子公司安徽超视野智能科技有限公司,正占领视频结构化技术制高点。

什么是视频结构化利用CPU+GPU协同计算能力实现资源动态调配,采用先进的智能分析技术,自动提取实时或离线的视频图像中的车辆、行人、非机动车细节特征信息,对目标类型、颜色等属性特征进行结构化,为事前、事中、事后的事件布防、综合布控、研判分析提供数据基础,保证信息查找检索的高效性,提高公安视频的应用效率。

简而言之,视频结构化就是一种智能分析,能够对视频数据进行深度挖掘和信息提取。

视频结构化能做什么在以往的案件办理过程中,公安在排查时需要翻查之前的监控视频。

但是在现在的智慧城市监控中,一条主街道就至少有上百个监控摄像头,视频的翻查大大降低了案件后期取证效率。

视频结构化平台超清股份子公司安徽超视野智能科技有限公司的视频结构化可对实时视频和录像进行视频结构化分析。

在提取了车辆、行人、非机动车的特征信息后,录入至服务器中,在需要时可直接搜索关键字特征信息,例如:车牌号“皖Axxxxx”的车辆,或“穿红色上衣的男人”,服务器可直接调取出对应关键字信息所在的视频录像。

秒级精准检索极大的减少了查证时间,提高效率。

可以提取哪些特征超视野科技的视频结构化支持机动车、非机动车、行人的检测、识别,包括:一级结构化在视频中检测行人、自行车、两轮摩托车、三轮摩托车、小汽车、面包车、卡车和大型客车这八大类目标,并对目标进行跟踪、去重、择优,将质量最好、最有利于二级结构化的目标图片存档,用于后续识别分析。

11-关键帧提取

11-关键帧提取


16
基于聚类的关键帧提取


聚类方法在人工智能、模式识别和语音识别等领域中 有着很广泛的应用,也可以使用聚类方法来提取镜头 关键帧。 实现步骤: 第一步:设某个镜头Si包含n个图像帧,可以表示为 Si={Fi1,……,Fin},其中Fi1为首帧,Fin为尾帧。如 果相邻两帧之间的相似度定义是这相邻两帧颜色直方 图的相似度(也即是直方图特征差别),预定义一个 阈值δ控制聚类的密度。
4
关键帧提取的意义

减少视频帧间存在的大量冗余信息内容

更凝炼地表达一段视频中包含的信息,便 于对视频内容建立索引、管理
5
减少冗余信息

视频由成千上万的帧组成,视频数据流中t时刻的 图像帧和t+1时刻的图像帧在视觉特征和内容上差 别不大。 人们从由成千上万存在冗余的图像帧提取出“关 键图像帧”,而且使用这些关键图像帧表示视频 ,会更加简洁。这是在视频内容分析中提取视频 关键帧的原因之一。
25
基于PGF(peer group filtering)的关键帧提取

视频帧i和视频帧j的直方图差HDij的计算如下:
H颜色分量的归一化直方图
26
基于PGF(peer group filtering) 的关键帧提取


PGF主要思想:找出滤波窗口与中心象素特征 相近的邻域象素作为同组成员参加滤波。它是 先根据滤波窗口中邻域象素与原来象素特征的 相似性进行升序排列,再根据Fisher判别找出 该象素的同组成员,然后用滤波窗口中属于同 组成员象素的加权特征值代替原来中心象素的 特征值。 优点:很好的滤除混合噪声,且保护图像边缘 信息
和最后一幅图像作为镜头关键帧。 依据:既然在一组镜头中,相邻图像帧之 间的特征变化很少,所以整个镜头中图像 帧的特征变换也应该不大,因此选择镜头 第一帧和最后一帧可以将镜头内容完全表 达出来。

媒体行业短视频内容与推荐系统优化方案

媒体行业短视频内容与推荐系统优化方案

媒体行业短视频内容与推荐系统优化方案第一章系统概述 (3)1.1 系统背景 (3)1.2 系统目标 (3)第二章短视频内容策略 (4)2.1 内容创意与方法 (4)2.1.1 创意来源 (4)2.1.2 创意方法 (4)2.2 内容制作与优化 (4)2.2.1 内容制作流程 (4)2.2.2 内容优化策略 (4)2.3 内容审核与管理 (5)2.3.1 内容审核标准 (5)2.3.2 内容审核流程 (5)2.3.3 内容管理策略 (5)第三章数据采集与处理 (5)3.1 数据来源与采集 (5)3.1.1 数据来源 (5)3.1.2 数据采集 (5)3.2 数据预处理 (6)3.2.1 数据清洗 (6)3.2.2 数据规范化 (6)3.2.3 数据特征提取 (6)3.3 数据存储与管理 (6)3.3.1 数据存储 (6)3.3.2 数据管理 (7)第四章用户行为分析 (7)4.1 用户画像构建 (7)4.2 用户行为数据挖掘 (7)4.3 用户兴趣模型 (7)第五章推荐算法优化 (8)5.1 现有推荐算法分析 (8)5.1.1 内容推荐算法 (8)5.1.2 现有算法存在的问题 (8)5.2 改进推荐算法 (9)5.2.1 基于深度学习的推荐算法 (9)5.2.2 融合多源数据的推荐算法 (9)5.3 算法评估与优化 (9)5.3.1 评估指标 (9)5.3.2 优化策略 (9)第六章短视频内容质量评估 (10)6.1 内容质量指标体系 (10)6.1.2 内容形式指标 (10)6.1.3 内容情感指标 (10)6.1.4 内容价值指标 (10)6.2 内容质量评估方法 (10)6.2.1 数据挖掘方法 (10)6.2.2 人工评估方法 (10)6.2.3 用户反馈方法 (11)6.3 质量评估结果应用 (11)6.3.1 优化内容生产 (11)6.3.2 指导内容推荐 (11)6.3.3 激励创作者 (11)6.3.4 促进平台发展 (11)第七章个性化推荐系统 (11)7.1 个性化推荐策略 (11)7.1.1 用户画像构建 (11)7.1.2 内容标签体系 (11)7.1.3 推荐策略设计 (12)7.2 个性化推荐算法 (12)7.2.1 协同过滤算法 (12)7.2.2 内容基推荐算法 (12)7.2.3 深度学习算法 (12)7.3 个性化推荐效果评估 (13)第八章系统安全与隐私保护 (13)8.1 数据安全策略 (13)8.1.1 数据加密 (13)8.1.2 数据备份 (13)8.1.3 访问控制 (14)8.2 用户隐私保护 (14)8.2.1 隐私政策 (14)8.2.2 数据脱敏 (14)8.2.3 用户画像匿名化 (14)8.3 法律法规遵守 (14)8.3.1 内容审核 (14)8.3.2 数据合规 (14)8.3.3 跨境数据传输 (14)第九章系统实施与运维 (15)9.1 系统架构设计 (15)9.1.1 总体架构 (15)9.1.2 数据层设计 (15)9.1.3 服务层设计 (15)9.1.4 应用层设计 (15)9.1.5 展示层设计 (15)9.2 系统开发与测试 (15)9.2.2 技术选型 (16)9.2.3 测试策略 (16)9.3 系统运维与监控 (16)9.3.1 运维策略 (16)9.3.2 监控指标 (16)9.3.3 故障处理 (16)第十章未来发展趋势与展望 (17)10.1 行业发展趋势 (17)10.2 技术创新与应用 (17)10.3 市场竞争与合作 (17)第一章系统概述1.1 系统背景互联网的迅速发展和移动设备的普及,媒体行业正面临着前所未有的变革。

视频结构化技术方案

视频结构化技术方案

2、技术服务方案建设内容本次项目的主要建设内容:视频构造化,同时对接整合县局建设的监控视频前端等系统,通事后端建设平台实现视频剖析、实战、案件研判、案件侦办等功能。

系统构造本次项目设计的平台系统,采纳先进的架构系统,实现智能监控,社会资源,案件侦察、研判等功能,同时与警用地理信息系统,警综系统等资源对接,实现地图显现,视频联动、案件侦察等功能。

系统建设在公安信息网和视频专网上,系统整体架构以下图:视频构造化简单来讲,视频构造化技术是一种将视频内容(人、车、物、活动目标)特征属性自动提取技术,对视频内容依照语义关系,采纳目标切割、时序剖析、对象辨别、深度学习等办理手段,剖析和辨别目标信息,组织成可供计算机和人理解的文本信息的技术。

从数据办理的流程看,视频构造化描绘技术能够将监控视频转变为人和机器可理解的信息 ( 以下列图 ) ,并进一步转变为公安实战所用的情报,实现视频数据向信息、情报的转变。

在视频构造化描绘的内容方面,公共安全关注的视频信息主假如:人员、车辆、行为。

人员构造化在视频中除了包含人员的面部精确立位、面部特色提取、面部特色比对,人员的性别、年纪等特色范围外,还可对人的穿着、运动方向,新增能否戴帽子、能否戴眼镜、能否背包、拎包、打伞、能否骑车等信息进行构造化描绘。

车辆构造化跟着智能交通高清电警、卡口、虚构卡口、泊车场的宽泛建设和应用、借助智能辨别算法将电警、卡口、泊车场进出口等场所的车辆有关构造化信息存入车辆主题库,包含车牌、车型、车牌颜色、车辆品牌、车辆种类、车身颜色、车标及遮阳板、能否系安全带、打电话、车辆年检标、摆件挂件、司乘人员的人脸。

鉴于这些车辆重点特色信息,形成上亿条过车记录数据,进而推进了后台大数据剖析服务的发展应用和行业数据发掘,形成隐藏车辆发掘、套牌车辆挑选、首次入城、一车多牌、一牌多车、屡次过车、相像车辆串并、高危车辆积分模型、车辆行驶轨迹剖析、时空碰撞等实战技战法的应用。

12-新闻类视频结构化

12-新闻类视频结构化

43
体育新闻节目结构化
由于针对的是体育新闻,所以系统主要考虑 这两种镜头类型: 主持人新闻报道镜头 体育新闻详细报道镜头

44
体育新闻节目结构化
在新闻节目中,主持人新闻报道画面多是 只有一个主持人在介绍,如图。
45
体育新闻节目结构化
这个系统中,采用双阈值法来检测镜头边缘。 该模块以用户提交的一个视频段作为输入,输 出结果为检测出的所有镜头单元。
9
主持人镜头模型定义

当有一个主持人进行新闻报道时,画面可以 分成三个部分:主持人人脸、节目(或电视 台)图标和背景画面
背景 主持人
台标
10
4种常见的主持人模型

区别的关键在于主持人数目和是否有图标
11
主持人新闻报道镜头识别


主持人新闻报道镜头识别的任务:从新闻视频中分割 出得到的镜头中,找出那些属于主持人新闻报道的镜 头单元 主持人新闻报道镜头的特征:在主持人报道新闻主旨 时主持人基本保持不动,只是嘴、头或者肩膀会有小 许细微运动,而背景和图标会完全静止。
26
构造新闻故事


对连续的视频新闻构造出独立新闻故事后, 就实现了新闻节目在内容上的自动分割。 这为视频数据库的检索和管理提供的方便。
27
构造新闻故事

建立新闻故事索引

对这些独立的新闻故事提供文本标注 用每个独立新闻故事的关键帧来对这个新闻 故事进行索引。
28
构造新闻故事

说明:
对于新闻节目会出现的其他镜头,如天气预报,也可 以通过事先定义天气预报镜头模块来判断,因为天气预报 镜头有固定结构。 对于广告节目,使用预定义模块的方法很难达到判断 识别目的,因为广告节目镜头没有固定模式。? 但是,广告节目的背景音与新闻报道背景音存在很大 差别(观众可以不看视频数据,只是听与视频流对应的音 频流,在大多数情况下就能判断出哪些是广告节目,哪些 是新闻报道节目)所以,在新闻节目分析中,可以结合音 频信息进行分析。

视频结构化技术应用与发展

视频结构化技术应用与发展

2019年7月视频结构化技术应用与发展吴晓鹏(佳都新太科技股份有限公司,广东省广州市510230)【摘要】国家安全是一个国家的基础,而国家安全最基础部分是国民安全即社会安全。

随着公共安全平安城市的建设以及天网、智慧城市和其他项目的建设,现在各个城市都建设了数以万计的监控视频,视频图像摄像机的数量也在不断增加,这在很大程度威慑了相关罪犯,保障了一定的安全,也为既定发生的事件进行了还原提供了方法工具。

现在社会正在进入人工智能发展的高速工路,本文具体讨论如何利用现代人工技术去合理应用视频。

【关键词】视频;结构化;数据;安防【中图分类号】TP391.41【文献标识码】A【文章编号】1006-4222(2019)07-0329-021引言视频里面真正有价值的是里面发生的数据,我们可以发现大规模建设的视频监控在社会治安防控中虽说起到了很大的作用,但是对于使用监控中心的人却使工作异常繁重。

当一个案件发生的时候,监控中心的人员要花很长的事件去查看案件周边的相关视频,去还原案件的真实情况,人员的轨迹情况等等,费时费力是一方面,还因为翻看监控视频而耽误了大量的时间,这对于一些重要紧急案件来说相当不利。

视频监控包含了社会公安安全中包含的人、地、事、物、组织的数据,这是视频监控的核心对象,随着知识图谱技术、大数据技术、人工智能技术的发展,为了实现视频图像大数据的深度挖掘、信息数据的应用,对视频图像进行解析透视结构化分析是很好的。

2视频结构化定义视频图像结构化技术是一种针对视频内容信息进行识别和提取解析技术。

它使用语义关系来处理视频内容,使用目标识别、特征提取和视频隔离来将其组织成可以被计算机和人类理解的结构化信息。

对于平安城市视频监控中的视频结构化,还需要应用视频图像解码结束、智能分析技术、数据检索技术于一体,并实现结构化的数据进行智能检索、以图搜图、视频跨镜追踪等相关应用,视频结构化能提升视频资源的应用水平,给社会公共安全工作带来了模式上的创新,这也成为平安智慧城市建设中视频智慧应用中很重要的一部分。

4.4什么是视频结构化解析系统?

4.4什么是视频结构化解析系统?

前言:基于深度学习、大数据和云存储的视频结构化服务系统定位“海量监控过滤网、网罗有价值信息”,作为视频监控系统的提档升级手段,为用户提供视频、图片、特征解析功能,实现从海量监控图像资源中提取有价值信息,过滤冗余数据,形成视频结构化数据积累,支撑政府实战应用。

1、总体概述结构化服务需要视频云结构化中心支撑,中心是一个具备汇聚前端所有产生的视频、图片、结构化信息,同时能对视频、图片再一次进行信息识别,以做到视频图像内有价值信息的完全提取,并且能实现基于结构化数据的海量信息快速检索,构建完整事件时间链能力的场所。

可归纳为三类系统:(1)解析类系统,包含视频结构化分析系统、视频图像智能处理工具集等;(2)存储类系统,包含海量视频解析数据存储库、视频图像基础资源库、专题资源库、索引库等;(3)服务类系统,包含视频图像解析中心管理系统、视频大数据分析系统等。

视频云结构化组成如下图所示,(1)视频结构化分析系统,利用视频结构化描述技术、智能图像分析技术,对实时视频或离线录像进行分析及处理,提取海量视频中的人、车、活动目标等内容信息,将海量非结构化视频、半结构化图片“变成”有价值的结构化信息的系统。

(2)视频图像智能处理工具集,包含视频图像采集工具、视频图像处理工具,用于离线录像的快速采集及快速播放、涉事视频的智能处理及单机分析、模糊图像的清晰处理等的工具。

(3)海量视频解析数据存储库,用于存储解析类系统自动分析得到的人、车、活动目标等要素的特征描述及结构化数据的数据库。

(4)视频图像基础资源库,用于存储解析类系统自动分析得到的人、车、活动目标等要素对应的图片的数据库。

(5)专题资源库,用于存储人工提取和现场采集、以及案事件研判过程中采集和标注的人员、车辆、案件等要素的视频片段、图像、特征描述等信息的数据库。

(6)索引库,指存储数据标签与索引数据等可支持全文检索等的资源数据库。

(7)视频大数据分析系统,依托存储类系统存储的解析数据、基础资源、专题资源等,提供结构化数据的快速检索、比对、碰撞、分析等服务。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

17
The Schema of Video Shot Detection
18
视频镜头边缘检测方法
基本思想:对比相邻帧间的特征 认为有重大变化的地方是镜头边缘的发生之处
Although cut detection appears to be a simple task for a human being, it is a non-trivial task for computers. Cut detection would be a trivial problem if each frame of a video was enriched with additional information about when and by which camera it was taken.

如果相邻图像帧之间的特征发生了明显变化,则认为发 生了镜头变化,需要对视频进行切分
10
镜头分类示例

长镜头(LS):显示场景的全貌 中镜头(MS):表现人物的动作,如谈话等 短镜头(CU) :近距离刻画人物的表情
长镜头 中镜头 短镜头
注:一般在电影中镜头常被分为7类,即特长(XLS)、长(LS)、中长(MLS)、 中(MS)、中短(MCU)、短(CU)和特短(XCU),
N
31
32
压缩域差法


不对图像解压,而是直接用JPEG压缩图 像帧的DCT系数作为帧相似度衡量的标准 。 省去解压步骤,直接从原始视频数据流 中提取特征,从而加快检测速度。 每个压缩域系数保留了原始图像帧中或 图像帧间最重要特征,所以压缩域系数 可以有效分析视频数据。
33
矩不变量法


图像矩不变量具有比例、旋转和过渡不变 性的特点,可以用来进行镜头边缘检测。 图像 f(x,y) 的矩定义为:
j 0
29
直方图求交
( f , f ') s ( f , f ') min( H ( f , j ), H ( f ', j ))
j 0 N
IS
color
从而d ( f , f ')
s ( f , f ')
H ( f , j)
j 0
N
30
直方图平方差
( H ( f , j ) H ( f ', j ))2 d ( f , f ') H ( f , j) j 0
28
均值化后的颜色直方图
N
d ( f , f ')
e e H ( f , j ) H ( f ', j ) j 0
w wmin 其中,veq Int .(l 1) 0.5 1 wmin v 1 w N 1 H ( f , j) j 0 H ( f , j )
矩不变量法

根据以上定义,使用以下三个矩不变量:
1 n20 n02
2 (n20 n02 ) 4n
2
2 11
3 (n30 3n12 )2 (3n21 n03 )2
矩不变量法
从相邻图像帧 f 和 f ’ 中提取矩不变特征,计 算这些矩不变特征的欧氏距离:
d ( f , f ) f f
镜头边界检测常用算法



20
绝对帧间差法 图像像素差法 图像数值差法 颜色直方图法 压缩域差法 矩不变量法 边界跟踪法 运动矢量法
绝对帧差法


判断相信图像之间特征的绝对差是否大 具体实现时,判断两个相信帧差别的方法可 以是:计算相邻两个图像中所有像素的色彩 亮度之和 注意:
16
In this kind of transitions the two shots are combined using chromatic, spatial or spatialchromatic effects which gradually replace one shot by another.
11
场景
场景:语义上相关和时间上相邻的若干镜头组 成了一个场景,场景是视频所蕴涵的高层抽象 概念和语义表达,如“学校运动会”这个场景 可以由“运动员入场”、“运动员比赛”和“ 观众呐喊”等镜头组成。 场景可以用属于这个场景的若干个镜头所对应 的关键帧来表示。 (为什么不使用文字信息?)

12
场景聚类示意图
While most algorithms achieve good results with hard cuts, many fail with recognizing soft cuts. Hard cuts usually go together with sudden and extensive changes in the visual content while soft cuts feature 19 slow and gradual changes.
3
结构化视频的作用

建立索引

视频表征 视频相似度比较

便于浏览和检索 视频结构化目的:


自动分析视频流中蕴涵的这种结构 切分有意义的视频段
4
视频结构化的基本概念
书 章 节 视频 场景 镜头


5
视频结构化的基本概念
若干镜头或场 景的集合 语义上相关,时间 上相近的若干镜头 在时间和空间上 连续数帧的集合 基本组成单位 独立的图象
边界跟踪法

在该算法中,如果用 pin 表示帧 f 和 f ’ 中最近边 中像素点距离超过阈值 r 的像素点数目在 f 中所占 百分比, pout 表示帧 f ’ 和 f 中最近边中像素点距离 超过阈值 r 的像素点在 f ’ 中所占百分比,则相邻 帧 f 和 f ’ 的差为:
d ( f , f ) max(pin , pout )



39
Zabih,Miller和Mai在边界识别的基础上提 出了比较颜色直方图和颜色比例的镜头边 缘检测方法。 该方法为:把连续帧排列成一行以减少镜 头移动造成的影响,然后比较图像中边的 个数和位置,同时计算相邻两帧间进入或 者离开图像的边所占百分比,百分比最大 的是镜头的切点。是否为Dissolve或fade也 可以通过百分比的相关值判断。 该方法对运动的敏感度不大。
15
镜头变化分类
This is a sudden transition from one shot to another, i. e. one frame belongs to the first shot, the next frame belongs to the second shot. They are be also known as hard cuts or simply cuts.
视频 场景 镜头

6
体育视频结构示意图
7
新闻结构示意图
8
研究点
镜头边界检测(shot boundary detection) 场景聚类(scene clustering) 镜头分类(shot clustering) 关键帧提取(Key frame extraction)
镜头边界检测示意图
9
镜头
视频内容的结构化
1
背景
Large multimedia database video 24 hours Broadcast videos
Online videos
2
2
视频的特点

时间上依赖的图象帧序列流 很强的情节发展性 但是其制作过程中存在“场景”“分镜头”,且其间 存在内容层次,只是在最后节目中消失了

镜头:摄像机拍下的不间断帧序列,是视频数 据流进一步结构化的基础结构层



如,在拍摄“飞机起飞”这组镜头时,画面的色彩 和纹理等图像特征将保持不变 镜头是对视频流进行处理的最小物理单元,而视频 帧是视频流的基本单元,镜头包含少许的语义内容 由于在同一组镜头中,属于同一组镜头的图像帧之 间的特征保持稳定
N
( H ( f , j ) H ( f ', j ))2 d ( f , f ') H ( f ', j ) j 0
N
( H ( f , j ) H ( f ', j )) 2 d ( f , f ') j 0 max( H ( f , j ), H ( f ', j ))

如果 d ( f , f ’) 超过一定阈值,则认为在 f 和 f ’ 处 应该进行镜头切割。
imd1 = rgb2gray(im1); Imd2 = rgb2gray(im2); % black background image bw1 = edge(imd1, 'sobel'); bw2 = edge(imd2, 'sobel'); % invert image to white background ibw2 = 1-bw2; ibw1 = 1-bw1; s1 = size(find(bw1),1); s2 = size(find(bw1),1); % dilate se = strel('square',3); dbw1 = imdilate(bw1, se); dbw2 = imdilate(bw2, se);
步骤

22
23
图像像素差法(2)
缺点

对镜头的移动敏感 对噪声的容错性小
改进

3*3 滤波 针对不同的视频流选不同的阈值
24
图像像素差法(3)

将图像分成若干子块区域 分别比较
相关文档
最新文档