视频处理_UCF Sports Action Dataset(中佛罗里达大学体育行为数据库)
基于视频处理的体育运动分析研究
基于视频处理的体育运动分析研究随着科技的不断发展,视频处理技术正在在各个领域中得到广泛应用,其中体育运动分析也是其中之一。
基于视频处理的体育运动分析研究,是指通过对先前录制好的体育比赛视频进行计算机分析和处理,以便得出一些有价值的数据和信息,来指导运动员的训练和技术提高,同时也为教练员提供更好的辅助工具。
在体育比赛中,诸如足球、篮球、网球、田径等等往往都包含了复杂的足迹、动作、体型等信息,在传统的分析数据中,不易获得涉及运动员整体状态的相关数据。
而利用视频处理技术,可以对整个比赛的局面进行分析,更好地把握运动员的动作和技术状况,从而准确地分析运动员的表现情况,为训练和赛事布阵提供重要参考。
基于视频处理的体育运动分析技术,首先需要通过专业的视频录制设备对比赛进行录制,然后使用一些专业的视频处理软件进行数据分析和处理。
此类软件的涵盖内容非常广泛,包括了人工智能、机器学习、计算机视觉等多个领域的内容,许多软件已经发展出非常成熟的算法和技术,来处理各种各样的体育运动比赛。
其中,最流行的体育运动分析软件是Opta和Stats,两家公司都是专注于体育数据收集和分析的公司。
Opta公司采用了一些高级的技术,包括机器学习和计算机视觉,以提供更全面的数据和信息,是足球运动中一些顶级技术的代表。
Stats公司则提供了更加综合和实时性的数据分析,允许客户在线实时监测一些数据(例如场上球员的位置,比赛进行的时间等)。
在使用这些软件时,需要进行预处理和处理流程,包括视频质量的检查、运动员识别模型的训练和调整,动作分析算法的适用性测试等。
一旦完成了预处理过程,接下来的工作就是针对自己的研究项目,进行数据的收集处理和分析。
基于视频处理的体育运动分析研究,主要分为三个方面的工作:运动员分析与技术提高、对手分析和之前比赛的分析。
对于运动员分析和技术提高方面,通过视频分析,可以对运动员的运动动作进行分析和提高,如检测出技术上可能存在的问题(例如组织顺序不佳,站位不准确,跳跃悬停不够稳定等等),进而通过后续研究和训练来弥补这些缺陷。
自适应分割的视频点云多模式帧间编码方法
自适应分割的视频点云多模式帧间编码方法陈 建 1, 2廖燕俊 1王 适 2郑明魁 1, 2苏立超3摘 要 基于视频的点云压缩(Video based point cloud compression, V-PCC)为压缩动态点云提供了高效的解决方案, 但V-PCC 从三维到二维的投影使得三维帧间运动的相关性被破坏, 降低了帧间编码性能. 针对这一问题, 提出一种基于V-PCC 改进的自适应分割的视频点云多模式帧间编码方法, 并依此设计了一种新型动态点云帧间编码框架. 首先, 为实现更精准的块预测, 提出区域自适应分割的块匹配方法以寻找最佳匹配块; 其次, 为进一步提高帧间编码性能, 提出基于联合属性率失真优化(Rate distortion optimization, RDO)的多模式帧间编码方法, 以更好地提高预测精度和降低码率消耗. 实验结果表明, 提出的改进算法相较于V-PCC 实现了−22.57%的BD-BR (Bjontegaard delta bit rate)增益. 该算法特别适用于视频监控和视频会议等帧间变化不大的动态点云场景.关键词 点云压缩, 基于视频的点云压缩, 三维帧间编码, 点云分割, 率失真优化引用格式 陈建, 廖燕俊, 王适, 郑明魁, 苏立超. 自适应分割的视频点云多模式帧间编码方法. 自动化学报, 2023, 49(8):1707−1722DOI 10.16383/j.aas.c220549An Adaptive Segmentation Based Multi-mode Inter-frameCoding Method for Video Point CloudCHEN Jian 1, 2 LIAO Yan-Jun 1 WANG Kuo 2 ZHENG Ming-Kui 1, 2 SU Li-Chao 3Abstract Video based point cloud compression (V-PCC) provides an efficient solution for compressing dynamic point clouds, but the projection of V-PCC from 3D to 2D destroys the correlation of 3D inter-frame motion and re-duces the performance of inter-frame coding. To solve this problem, we proposes an adaptive segmentation based multi-mode inter-frame coding method for video point cloud to improve V-PCC, and designs a new dynamic point cloud inter-frame encoding framework. Firstly, in order to achieve more accurate block prediction, a block match-ing method based on adaptive regional segmentation is proposed to find the best matching block; Secondly, in or-der to further improve the performance of inter coding, a multi-mode inter-frame coding method based on joint at-tribute rate distortion optimization (RDO) is proposed to increase the prediction accuracy and reduce the bit rate consumption. Experimental results show that the improved algorithm proposed in this paper achieves −22.57%Bjontegaard delta bit rate (BD-BR) gain compared with V-PCC. The algorithm is especially suitable for dynamic point cloud scenes with little change between frames, such as video surveillance and video conference.Key words Point cloud compression, video-based point cloud compresion (V-PCC), 3D inter-frame coding, point cloud segmentation, rate distortion optimization (RDO)Citation Chen Jian, Liao Yan-Jun, Wang Kuo, Zheng Ming-Kui, Su Li-Chao. An adaptive segmentation based multi-mode inter-frame coding method for video point cloud. Acta Automatica Sinica , 2023, 49(8): 1707−1722点云由三维空间中一组具有几何和属性信息的点集构成, 通常依据点的疏密可划分为稀疏点云和密集点云[1]. 通过相机矩阵或高精度激光雷达采集的密集点云结合VR 头盔可在三维空间将对象或场景进行6自由度场景还原, 相较于全景视频拥有更真实的视觉体验, 在虚拟现实、增强现实和三维物体捕获领域被广泛应用[2−3]. 通过激光雷达反射光束经光电处理后收集得到的稀疏点云可生成环境地收稿日期 2022-07-05 录用日期 2022-11-29Manuscript received July 5, 2022; accepted November 29, 2022国家自然科学基金(62001117, 61902071), 福建省自然科学基金(2020J01466), 中国福建光电信息科学与技术创新实验室(闽都创新实验室) (2021ZR151), 超低延时视频编码芯片及其产业化(2020年福建省教育厅产学研专项)资助Supported by National Natural Science Foundation of China (62001117, 61902071), Fujian Natural Science Foundation (2020J01466), Fujian Science & Technology Innovation Laborat-ory for Optoelectronic Information of China (2021ZR151), and Ultra-low Latency Video Coding Chip and its Industrialization (2020 Special Project of Fujian Provincial Education Depart-ment for Industry-University Research)本文责任编委 刘成林Recommended by Associate Editor LIU Cheng-Lin1. 福州大学先进制造学院 泉州 3622512. 福州大学物理与信息工程学院 福州 3501163. 福州大学计算机与大数据学院/软件学院 福州 3501161. School of Advanced Manufacturing, Fuzhou University, Quan-zhou 3622512. College of Physics and Information Engineer-ing, Fuzhou University, Fuzhou 3501163. College of Com-puter and Data Science/College of Software, Fuzhou University,Fuzhou 350116第 49 卷 第 8 期自 动 化 学 报Vol. 49, No. 82023 年 8 月ACTA AUTOMATICA SINICAAugust, 2023图, 以实现空间定位与目标检测等功能, 业已应用于自动驾驶、无人机以及智能机器人等场景[4−7]. 但相较于二维图像, 点云在存储与传输中的比特消耗显著增加[8], 以经典的8i 动态点云数据集[9]为例, 在每秒30帧时的传输码率高达180 MB/s, 因此动态点云压缩是对点云进行高效传输和处理的前提.N ×N ×N 3×3×3为了实现高效的动态点云压缩, 近年来, 一些工作首先在三维上进行帧间运动估计与补偿, 以充分利用不同帧之间的时间相关性. 其中, Kammerl 等[10]首先提出通过构建八叉树对相邻帧进行帧间差异编码, 实现了相较于八叉树帧内编码方法的性能提升; Thanou 等[11]则提出将点云帧经过八叉树划分后, 利用谱图小波变换将三维上的帧间运动估计转换为连续图之间的特征匹配问题. 然而, 上述方法对帧间像素的运动矢量估计不够准确. 为了实现更精确的运动矢量估计, Queiroz 等[12]提出一种基于运动补偿的动态点云编码器, 将点云体素化后进行块划分, 依据块相关性确定帧内与帧间编码模式, 对帧间编码块使用提出的平移运动模型改善预测误差; Mekuria 等[13]则提出将点云均匀分割为 的块, 之后将帧间对应块使用迭代最近点(Iterative closest point, ICP)[14]进行运动估计,以进一步提高帧间预测精度; Santos 等[15]提出使用类似于2D 视频编码器的N 步搜索算法(N-step search, NSS), 在 的三维块区域中迭代寻找帧间对应块, 而后通过配准实现帧间编码. 然而,上述方法实现的块分割破坏了块间运动相关性, 帧间压缩性能没有显著提升.为了进一步提高动态点云压缩性能, 一些工作通过将三维点云投影到二维平面后组成二维视频序列, 而后利用二维视频编码器中成熟的运动预测与补偿算法, 实现三维点云帧间预测. 其中, Lasserre 等[16]提出基于八叉树的方法将三维点云投影至二维平面, 之后用二维视频编码器进行帧间编码; Bud-agavi 等[17]则通过对三维上的点进行二维平面上的排序, 组成二维视频序列后利用高效视频编码器(High efficiency video coding, HEVC)进行编码.上述方法在三维到二维投影的过程中破坏了三维点间联系, 重构质量并不理想. 为改善投影后的点间联系, Schwarz 等[18]通过法线将点映射于圆柱体上确保点间联系, 对圆柱面展开图使用二维视频编码以提高性能. 但在圆柱上的投影使得部分点因遮挡丢失, 影响重构精度. 为尽可能保留投影点数, Mam-mou 等[19]根据点云法线方向与点间距离的位置关系, 将点云划分为若干Patch, 通过对Patch 进行二维平面的排列以减少点数损失, 进一步提高了重构质量.基于Patch 投影后使用2D 视频编码器进行编码, 以实现二维上的帧间运动预测与补偿的思路取得了最优的性能, 被运动图像专家组(Moving pic-ture experts group, MPEG)正在进行的基于视频的点云压缩(Video-based point cloud compres-sion, V-PCC)标准[20]所采纳, 但将Patch 从三维到二维的投影导致三维运动信息无法被有效利用, 使得帧间压缩性能提升受到限制. 针对这一问题, 一些工作尝试在V-PCC 基础上实现三维帧间预测,其中, Li 等[21]提出了一种三维到二维的运动模型,利用V-PCC 中的几何与辅助信息推导二维运动矢量以实现帧间压缩性能改善, 但通过二维推导得到的三维运动信息并不完整, 导致运动估计不够准确.Kim 等[22]提出通过点云帧间差值确定帧内帧与预测帧, 帧内帧用V-PCC 进行帧内编码, 预测帧依据前帧点云进行运动估计后对残差进行编码以实现运动补偿, 但残差编码依旧消耗大量比特. 上述方法均在V-PCC 基础上实现了三维点云的帧间预测,但无论是基于二维的三维运动推导还是帧间残差的编码, 性能改善都比较有限.在本文的工作中, 首先, 为了改善三维上实现运动估计与补偿中, 块分割可能导致的运动相关性被破坏的问题, 本文引入了KD 树(K-dimension tree,KD Tree)思想, 通过迭代进行逐层深入的匹配块分割, 并定义分割块匹配度函数以自适应确定分割的迭代截止深度, 进而实现了更精准的运动块搜索;另外, 针对V-PCC 中二维投影导致三维运动信息无法被有效利用的问题, 本文提出在三维上通过匹配块的几何与颜色两种属性进行相似性判别, 并设计率失真优化(Rate distortion optimization, RDO)模型对匹配块分类后进行多模式的帧间编码, 实现了帧间预测性能的进一步改善. 实验表明, 本文提出的自适应分割的视频点云多模式帧间编码方法在与最新的V-PCC 测试软件和相关文献的方法对比中均取得了BD-BR (Bjontegaard delta bit rate)的负增益. 本文的主要贡献如下:1)提出了针对动态点云的新型三维帧间编码框架, 通过自动编码模式判定、区域自适应分割、联合属性率失真优化的多模式帧间编码、结合V-PCC 实现了帧间编码性能的提升;2)提出了一种区域自适应分割的块匹配方法,以寻找帧间预测的最佳匹配块, 从而改善了均匀分割和传统分割算法导致运动相关性被破坏的问题;3)提出了一种基于联合属性率失真优化模型的多模式帧间编码方法, 在改善预测精度的同时显著减少了帧间编码比特.1 基于视频的点云压缩及其问题分析本文所提出的算法主要在V-PCC 基础上进行1708自 动 化 学 报49 卷三维帧间预测改进, 因此本节对V-PCC 的主要技术做简要介绍, 并分析其不足之处. 其中, V-PCC 编码框架如图1所示.图 1 V-PCC 编码器框架Fig. 1 V-PCC encoder diagram首先, V-PCC 计算3D 点云中每个点的法线以确定最适合的投影面, 进而将点云分割为多个Patch [23].接着, 依据对应Patch 的位置信息, 将其在二维平面上进行紧凑排列以完成对Patch 的打包. 之后,依据打包结果在二维上生成对应的图像, 并使用了几何图、属性图和占用图分别表示各点的坐标、颜色及占用信息. 鉴于Patch 在二维的排列不可避免地存在空像素点, 因此需要占用图表示像素点的占用与否[24]; 由于三维到二维的投影会丢失一个维度坐标信息, 因此使用几何图将该信息用深度形式进行表示; 为了实现动态点云的可视化, 还需要一个属性图用于表示投影点的颜色属性信息. 最后, 为了提高视频编码器的压缩性能, 对属性图和几何图的空像素进行了填充和平滑处理以减少高频分量; 同时, 为了缓解重构点云在Patch 边界可能存在的重叠或伪影, 对重构点云进行几何和属性上的平滑滤波处理[25]. 通过上述步骤得到二维视频序列后, 引入二维视频编码器(如HEVC)对视频序列进行编码.V-PCC 将动态点云帧进行二维投影后, 利用成熟的二维视频编码技术实现了动态点云压缩性能的提升. 但是, V-PCC 投影过程将连续的三维物体分割为多个二维子块, 丢失了三维上的运动信息,使得三维动态点云中存在的时间冗余无法被有效利用. 为了直观展示投影过程导致的运动信息丢失,图2以Longdress 数据集为例, 展示了第1 053和第1 054两相邻帧使用V-PCC 投影得到的属性图.观察图2可以发现, 部分在三维上高度相似的区域,如图中标记位置1、2与3所对应Patch, 经二维投影后呈现出完全不同的分布, 该结果使得二维视频编码器中帧间预测效果受到限制, 不利于压缩性能的进一步提升.2 改进的动态点云三维帧间编码为了在V-PCC 基础上进一步降低动态点云的时间冗余性, 在三维上进行帧间预测和补偿以最小化帧间误差, 本文提出了一个在V-PCC 基础上改进的针对动态点云的三维帧间编码框架, 如图3所示. 下面对该框架基本流程进行介绍.首先, 在编码端, 我们将输入的点云序列通过模块(a)进行编码模式判定, 以划分帧内帧与预测帧. 其思想与二维视频编码器类似, 将动态点云划分为多组具有运动相似性的图像组(Group of pic-tures, GOP)以分别进行编码. 其中图像组中的第一帧为帧内帧, 后续帧均为预测帧, 帧内帧直接通过V-PCC 进行帧内编码; 预测帧则通过帧间预测方式进行编码. 合理的GOP 划分表明当前图像组内各相邻帧均具有较高运动相关性, 因此可最优化匹配块预测效果以减少直接编码比特消耗, 进而提高整体帧间编码性能. 受文献[22]启发, 本文通过对当前帧与上一帧参考点云进行几何相似度判定,以确定当前帧的编码方式进行灵活的图像组划分.如式(1)所示.Longdress 第 1 053 帧三维示例Longdress 第 1 054 帧三维示例Longdress 第 1 053 帧 V-PCC投影属性图Longdress 第 1 054 帧 V-PCC投影属性图11223图 2 V-PCC 从三维到二维投影(属性图)Fig. 2 V-PCC projection from 3D to2D (Attribute map)8 期陈建等: 自适应分割的视频点云多模式帧间编码方法1709cur ref E Gcur,ref Ωmode mode E O R 其中, 为当前帧点云, 为前帧参考点云, 表示两相邻帧点云的几何偏差, 为编码模式判定阈值. 当 值为1时表示当前帧差异较大, 应当进行帧内模式编码; 当 值为0时则表示两帧具有较大相似性, 应当进行帧间模式编码. 另外, 在动态点云重构误差 的计算中, 使用原始点云 中各点与重构点云 在几何和属性上的误差均值表示, 即式(2)所示.N O O (i )R (i ′)i i ′E O,R O R 其中, 为原始点云点数, 和 分别表示原始点云第 点与对应重构点云 点的几何或属性值, 即为原始点云 与重构点云 间误差值.N ×N ×N K 接着, 在进行帧间编码模式判断后, 通过模块(b)进行预测帧的区域自适应块分割. 块分割的目的在于寻找具有帧间运动一致性的匹配块以进行运动预测和补偿. 不同于 等分或 均值聚类, 所提出的基于KD 树思想的区域自适应块匹配从点云质心、包围盒和点数三个角度, 判断分割块的帧间运动程度以进行分割深度的自适应判定,最终实现最佳匹配块搜索.之后, 对于分割得到的匹配块, 通过模块(c)进行基于联合属性率失真优化的帧间预测. 在该模块中, 我们通过帧间块的几何与颜色属性联合差异度,结合率失真优化模型对匹配块进行分类, 分为几乎无差异的完全近似块(Absolute similar block, ASB)、差异较少的相对近似块(Relative similar block,RSB)以及存在较大差异的非近似块(Non similar block, NSB). 完全近似块认为帧间误差可忽略不计, 仅需记录参考块的位置信息; 而相对近似块则表示存在一定帧间误差, 但可通过ICP 配准和属性补偿来改善几何与属性预测误差, 因此除了块位置信息, 还需记录预测与补偿信息; 而对于非近似块,则认为无法实现有效的帧间预测, 因此通过融合后使用帧内编码器进行编码.最后, 在完成帧间模式分类后, 为了在编码端进行当前帧的重构以作为下一帧匹配块搜索的参考帧, 通过模块(d)对相对近似块进行几何预测与属性补偿, 而后将几何预测与属性补偿后的相对近似块、完全近似块、非近似块进行融合得到重构帧. 为了在解码端实现帧间重构, 首先需要组合预测帧中的所有非近似块, 经由模块(e)的V-PCC 编码器进行帧内编码, 并且, 还需要对完全近似块的位置信息、相对近似块的位置与预测补偿信息通过模块(f)进行熵编码以实现完整的帧间编码流程.至此, 整体框架流程介绍完毕, 在接下来的第3节与第4节中, 我们将对本文提出的区域自适应分割的块匹配算法与联合属性率失真优化的多模式帧间编码方法进行更为详细的介绍, 并在第5节通过实验分析进行算法性能测试.3 区域自适应分割的块匹配N B j cur j ref j ∆E cur j ,ref j 相较于二维视频序列, 动态点云存在大量空像素区域, 帧间点数也往往不同. 因此, 对一定区域内的点集进行帧间运动估计时, 如何准确找到匹配的邻帧点集是一个难点. 假设对当前帧进行帧间预测时共分割为 个子点云块, 第 块子点云 与其对应参考帧匹配块 间存在几何与属性综合误差 . 由于重构的预测帧实质上是通过组合相应的参考帧匹配块而估计得到的, 因此精准的帧间块匹配尝试最小化每个分割块的估计误差,以提高预测帧整体预测精度, 如式(3)所示:图 3 改进的三维帧间编码框架Fig. 3 Improved 3D inter-frame coding framework1710自 动 化 学 报49 卷K K N N ×N ×N 为了充分利用帧间相关性以降低时间冗余, 一些工作尝试对点云进行分割后寻找最佳匹配块以实现帧间预测. Mekuria 等[13]将动态点云划分为若干个大小相同的宏块, 依据帧间块点数和颜色进行相似性判断, 对相似块使用迭代最近点算法计算刚性变换矩阵以实现帧间预测. 然而, 当区域分割得到的对应匹配块间存在较大偏差时, 预测效果不佳.为了减少匹配块误差以提高预测精度, Xu 等[26]提出使用 均值聚类将点云分为多个簇, 在几何上通过ICP 实现运动预测, 在属性上则使用基于图傅里叶变换的模型进行运动矢量估计. 但基于 均值聚类的点云簇分割仅在预测帧中进行, 没有考虑帧间块运动相关性, 匹配精度提升受到限制. 为了进一步提高匹配精度, Santos 等[15]受到二维视频编码器中 步搜索算法的启发, 提出了一种3D-NSS 方法实现三维上的匹配块搜索, 将点云分割为 的宏块后进行3D-NSS 以搜索最优匹配块, 而后通过ICP 进行帧间预测.K 上述分割方法均实现了有效的块匹配, 但是,基于宏块的均匀块分割与基于传统 均值聚类的块划分均没有考虑分割块间可能存在的运动连续性, 在分割上不够灵活. 具体表现为分割块过大无法保证块间匹配性, 过小又往往导致已经具有运动连续性的预测块被过度细化, 出现相同运动预测信息的冗余编码. 为了避免上述问题, 本文引入KD 树思想, 提出了一种区域自适应分割算法, 该算法通过迭代进行逐层深入的二分类划分, 对各分割深度下块的运动性质与匹配程度进行分析, 确定是否需要继续分割以实现精准运动块匹配. 算法基本思想如图4所示, 若满足分割条件则继续进行二分类划分, 否则停止分割.Ψ(l,n )其中, 准确判断当前分割区域是否满足运动连续性条件下的帧间运动, 是避免过度分割以实现精准的运动块搜索的关键, 本文通过定义分割块匹配函数来确定截止深度, 如式(4)所示:ρ(n )=max [sign (n −N D ),0]n N D ρ(n )=1ξ(l )l 其中, 为点数判定函数,当点数 大于最小分割块点数阈值 时, ,表示满足深入分割的最小点数要求, 否则强制截止; 为当前深度 下的块运动偏移度, 通过衡量匹配块间的运动变化分析是否需要进一步分割.ξξw ξu 提出的 函数分别通过帧间质心偏移度 估计匹配块间运动幅度, 帧间包围盒偏移度 进行匹ξn ξw ξu ξn T l ξ(l )配块间几何运动一致性判定, 点数偏移度 进行点云分布密度验证, 最后通过 、 与 累加值与分割截止阈值 的比值来整体衡量当前块的运动程度与一致性. 即对于当前分割深度 , 可进一步细化为式(5):其中,w cur w ref u cur u ref n cur n ref l P Max P Min 并且, 、 、 、 、与分别表示当前分割深度下该区域与其前帧对应区域的质心、包围盒与点数,和分别为当前块对角线对应点.ρ(n )=1ξ(l)lξξξξ在的前提下,值反映当前KD 树分割深度下该区域点云的帧间运动情况.值越大帧间运动越显著,当值大于1时,需对运动块进行帧间运动补偿,如果继续分割将导致块的运动一致性被破坏或帧间对应块无法实现有效匹配,从而导致帧间预测失败;值越小说明当前区域点云整体运动变化越小,当值小于1时,需进一步分割寻找可能存在的运动区域.l +1d 对于需要进一步分割的点云块,为了尽可能均匀分割以避免分割后匹配块间误差过大, 将待分割匹配块质心均值作为分割点, 通过以包围盒最长边作为分割面来确定 深度下的分割轴 , 分割轴l = 0l = 1l = 2l = m l = m + 1条件满足, 继续分割条件不满足, 停止分割图 4 区域自适应分割块匹配方法示意图Fig. 4 Schematic diagram of region adaptive segmentation based block matching method8 期陈建等: 自适应分割的视频点云多模式帧间编码方法1711如式(6)所示:Edge d,max Edge d,min d 其中, 和 分别为待分割块在 维度的最大值和最小值.总结上文所述, 我们将提出的区域自适应分割的块匹配算法归纳为算法1. 算法 1. 区域自适应分割的块匹配cur ref 输入. 当前帧点云 与前帧参考点云 输出. 当前帧与参考帧对应匹配块j =1N B 1) For to Do l =02) 初始化分割深度 ;3) Docur j ref j 4) 选取待分割块 和对应待匹配块 ;w u n 5) 计算质心 、包围盒 与块点数 ;ξ(l )6) 根据式(5)计算运动块偏移度 ;ρ(n )7) 根据函数 判定当前分割块点数;Ψ(l,n )8) 根据式(4)计算分割块匹配函数 ;Ψ(l,n )9) If 满足匹配块分割条件:d 10) 根据式(6)确定分割轴 ;cur j ref j 11) 对 与 进行分割;12) 保存分割结果;l +113) 分割深度 ;Ψ(l,n )14) Else 不满足匹配块分割条件:15) 块分割截止;16) 保存匹配块;17) End of if18) While 所有块均满足截止条件;19) End of for图5展示了本文提出的区域自适应分割的块匹配算法对帧Longdress_0536和其参考帧Longdress_0535进行分割后的块匹配结果. 在该序列当前帧下, 人物进行上半身的侧身动作. 观察图5可发现,在运动变化较大的人物上半身, 算法在寻找到较大的对应匹配块后即不再分割; 而人物下半身运动平缓, 算法自适应提高分割深度以实现帧间匹配块的精确搜索, 因而下半身的分块数目大于上半身.4 联合属性率失真优化的多模式帧间编码P Q在动态点云的帧间编码中, 常对相邻帧进行块分割或聚类后依据匹配块相似性实现帧间预测, 并利用补偿算法减少预测块误差以改善帧间编码质量. 其中迭代最近点算法常用于帧间运动估计中,其通过迭代更新待配准点云 相较于目标点云 S t E (S,t )间的旋转矩阵 和平移向量 , 进而实现误差 最小化, 如式(7)所示:N p p i P i q i ′Q p i 其中 为待配准点云点数, 为待配准点云 的第 个点, 为目标点云 中与 相对应的点.但是, 完全依据ICP 配准进行动态点云的三维帧间预测存在两个问题: 首先, ICP 仅在预测块上逼近几何误差的最小化而没考虑到颜色属性偏差引起的匹配块差异, 影响了整体预测精度; 其次, 从率失真角度分析, 对运动变化极小的匹配块进行ICP 配准实现的运动估计是非必要的, 该操作很难改善失真且会增加帧间编码比特消耗.为改善上述问题, 提出了联合属性率失真优化的多模式帧间编码方法. 提出的方法首先在确保几何预测精度的同时, 充分考虑了可能的属性变化导致的预测精度下降问题, 而后通过率失真优化模型,对块依据率失真代价函数得到的最优解进行分类后, 应用不同的编码策略以优化帧间编码方案, 旨在有限的码率约束下最小化编码失真, 即式(8)所示:R j D j j N B R C λ其中, 和 分别表示第 个点云块的编码码率和对应的失真; 是当前帧编码块总数; 表示总码率预算.引入拉格朗日乘子 ,式(8)所示的带约束优化问题可以转换为无约束的最优化问题, 即式(9)所示:当前帧分割可视化当前帧分割效果参考帧分割效果图 5 区域自适应分割的块匹配方法分割示例Fig. 5 Example of block matching method based onadaptive regional segmentation1712自 动 化 学 报49 卷。
视频处理_IR Marks video data set (加利福尼亚大学圣迭戈分校脸部运动视频数据库)
IR Marks video data set (加利福尼亚大学圣迭戈分校脸部运动视频数据库)数据摘要:The IR Marks video data set is a face motion data set of three video sequences. Prior to filming the three sequences, several points were drawn on the subject’s face using an infrared marking pen. Eac h video sequence was filmed simultaneously using 4 visible-light cameras (in which the drawn points are not visible) and 3 infrared-sensitive (IR) cameras (in which the drawn points are visible).For several frames in each sequence, the point locations in all three IR cameras were hand-labeled in order to obtain the groundtruth 3D locations of each of the points. The data set includes the groundtruth 3D locations of these points, as well as their groundtruth 2D locations in the images from the main visible-light camera.中文关键词:脸部运动,视频序列,红外相机,跟踪,变形,英文关键词:face motion,video sequences,infrared cameras,Tracking,Deformation,数据格式:VIDEO数据用途:To tracking face motion and deformation数据详细介绍:IR Marks video data setThe IR Marks video data set is a face motion data set of three video sequences. Prior to filming the three sequences, several points were drawn on the subject’s face using an infrared marking pen. Each video sequence was filmed simultaneously using 4 visible-light cameras (in which the drawn points are not visible) and 3 infrared-sensitive (IR) cameras (in which the drawn points are visible).For several frames in each sequence, the point locations in all three IR cameras were hand-labeled in order to obtain the groundtruth 3D locations of each of the points. The data set includes the groundtruth 3D locations of these points, as well as their groundtruth 2D locations in the images from the main visible-light camera.Citation and Additional InformationPlease give appropriate acknowledgement when you use any portion of this data set.The IR Marks video data set was introduced in the following journal paper. The paper, as well as the online Supplemental material for the paper, contain additional information about the IR Marks data set. Please cite this paper when you use any portion of the data set:Tim K. Marks, John R. Hershey, Javier R. Movellan, “Tracking Motion, Deformation, and Texture Using Conditionally Gaussian Processes,” IEEE Transactions on Pattern Analysis and Machine Intelligence, pp. 348-363, February, 2010.Bibtex:@article{Marks_TPAMI_2010,author = {Tim K. Marks and John R. Hershey and Javier R. Movellan},title = {Tracking Motion, Deformation, and Texture Using Conditionally Gaussian Processes},journal ={IEEE Transactions on Pattern Analysis and Machine Intelligence}, volume = {32},number = {2},year = {2010},pages = {348–363},doi = {/10.1109/TPAMI.2008.278}, publisher = {IEEE Computer Society},}The online Supplemental Material for the paper includes more detailed information about the IR Marks video data set in Appendix II, as well as ademo video of the G-flow algorithm tracking the Talk2 video sequence.There are two parts of the dataset available for download: The Basic Download (2.3 GB) and the Extra Data (6.9 GB). For most users, the Basic Download will be all that is necessary. The Basic Download includes all of the video data (including the groundtruth vertex locations) that were used in the paper (see Citation and Additional Information, above).The Basic Download contains:-light camera, including groundtruth vertex locations:framesin all of the training framesmain visible-light camera. All video frames are provided both in color and in grayscaleain visible-light camera, groundtruth vertex locations are provided:from each test sequencethese selected frames from each test sequenceof both the Basic Download and the Extra DataThe Extra Data includes:-light cameras The three test video sequences as filmed by the other three visible-light cameras-marked in the IR camera frames, which were used to compute groundtruth locations in the training frames and selected testing framesMATLAB code that computes the groundtruth vertex locations, in 3D and in the 2D image from the main visible-light camera, from the hand-marked locations in the IR framesvisible-light cameras), for 12 calibration frames.of both the Basic Download and the Extra Data.ContactContact: Tim K. Marks数据预览:点此下载完整数据集。
中佛罗里达大学在美国哪个地方
最近,有好多同学咨询中佛罗里达大学的地理位置在哪?下面就来告诉你中佛罗里达大学在美国哪个地方。
希望对你有帮助。
佛罗里达州是美国本土最南部的一个州。
包括佛罗里达半岛、西北部濒墨西哥湾狭长地带及南部近海珊瑚岛礁。
别称阳光州。
面积15.2万平方千米。
人口1300.34万(1990)。
城市人口约占84.3%。
首府塔拉哈西。
海岸线长1.35万千米(墨西哥湾沿岸8200千米,大西洋岸5300千米),仅次于阿拉斯加州,居全美第二。
地势低平,大部地区属大西洋和墨西哥湾沿岸平原,平均海拔不到35米,最高点位于西北部的沃尔顿县,仅105米。
岩溶地貌发育,多溶蚀湖泊。
亚热带季风气候,1月均温15℃,7月均温27℃,年均降水量1000~1500毫米。
森林覆盖率达67%。
奥兰多位于中佛罗里达州,是世界上最好的休闲城市之一。
湖泊众多,干净的街道、友善的居民及温暖的气候为健行、露营、水上活动、蜜月及家庭旅行的最佳去处。
在奥兰多还有老少咸宜的主题乐园,如华德迪斯尼世界《Walt Disney World》、爱普卡中心《Epcot Center》、环球影城《Universal Studio》、冒险岛乐园《Islands ofAdventure》,海洋世界《Sea World》及无数的旅馆,造就了它的观光地位。
中佛罗里达大学(通常简称UCF)成立于1963年,是一所座落在美国佛罗里达奥兰多(Orlando)的太空基金大学,是佛罗里达最大的本科教育公立大学,还是排名第二的全美最大的大学、全美三大光学中心之一。
学校规模到2008年,学校一共有50,000从本科到博士的在读学生。
为了提供学术学位和特殊专业学位,学校组建了12个学院,在大多数学生就读的主校区提供了接近100门不同的课程。
学校位于奥兰多市区东部大约21公里,她的东边89公里处是有名的“德通海滩”。
从1990年代以来,中佛罗里达大学快速发展,她的影响力已经扩展到整个佛罗里达州,并且在佛罗里达东中部地区拥有12个卫星校园。
美国留学指南:中佛罗里达大学
美国留学指南:中佛罗里达大学
特色专业Major type:新闻与传媒视觉艺术与设计商科/经济类工程类专业科学/数学
托福成绩TOEFL score:80
雅思成绩IELTS score:6.5
学校简介
支持雅思成绩申请;拥有国际大一课程;Top100全美公立大学;“后起之秀”大学排名第三位。
概况
中佛罗里达大学(UCF)成立于1963年,坐落在阳光明媚的佛罗里达州奥兰多市。
学校占地1415英亩,拥有180座各类教学和办公楼,学生来自全球148个国家和美国50个州。
中佛罗里达大学是全美第二大大学,在校生6万1千多名。
同时,大学也拥有超高的就业率,毕业生就业排名全美第四位。
学校不仅提供实习机会,还设有各种学生社团、体育俱乐部和运动队,更有出类拔萃的学术水平,这些因素共同促使UCF成为生活、学习和成长的最理想选择。
学术信息
强势专业:光学与光电子工程及计算机科学酒店管理。
多媒体信息处理-视频运动估计算法
课程设计任务书学生姓名:专业班级:指导教师:苏杭工作单位:信息工程学院题目: 多媒体信息处理初始条件:MATLAB软件平台;视频运动估计相关知识要求完成的主要任务:设计视频压缩系统中的运动估计算法:全搜索法(FS: Full Search)和三步法(TSS: Three Step Search),比较二种方法的搜索点和每帧的峰值信噪比(PSNR:peak signal to noise ratio)要求:编制算法代码;对视频进行运动估计;计算PSNR时间安排:指导教师签名: 2015年 1 月 18 日系主任(或责任教师)签名: 2015 年 1 月 18 日摘要随着计算机视觉、数字视频信号处理和通信技术的发展,多媒体技术得到了广泛的应用。
其中,数字视频信号处理是关键技术。
为了克服视频信号数据量大的问题,必须提高视频信号的压缩编码效率。
运动估计是视频压缩编码中的核心技术之一。
为了使多媒体产品能得到更加广泛的应用,国际上提出了一些视频压缩标准。
但这些标准并没有规定具体采用哪种运动估计算法。
因此,具有高压缩性的快速运动估计算法的开发成为近年来和今后的研究热点。
本文通过MATLAB仿真平台,实现了经典的全搜索算法(FS)和二维三步搜索算法(TSS),并对更加高效的ETSS算法进行编程仿真,性能比较也显示ETSS 比TSS、FS更加具有实时性。
关键词:运动估计;视频压缩;全搜索算法;三步搜索算法IAbstractWith the development of computer vision, digital video signal processing and communication technology, multimedia technology has been widely used. Among them, the digital video signal processing is the key technology. In order to overcome the problem of large amount of video data signal, video signal compression coding efficiency must be raised. Motion estimation is one of the core technology of video compression coding. In order to make the multimedia products can be used more widely, people put forward some international video compression standard. But these standards are not provided specific use what kind of motion estimation algorithms. Therefore, the development of the fast motion estimation algorithm with high compressibility is becoming a hot spot in recent years and the future research.In this article, through the MATLAB simulation platform, has realized the full search algorithm (FS) and the classic 2d three-step search algorithm (TSS),and simulated the more efficient algorithm--ETSS, performance comparisons also show ETSS is more real-time than TSS and FS .Keywords: motion estimation,video compression,FS, TSSII目录摘要 (1)ABSTRACT ....................................................................................................................................... I I 1视频运动估计概述 (1)1.1运动估计技术的地位与作用 (1)1.2运动估计技术的发展趋势 (1)1.3视频压缩系统的组成 (1)2 运动估计原理 (3)2.1基于块的运动估计 (3)2.2基于光流方程的运动估计 (4)2.3基于像素的运动估计 (4)2.4全局运动估计 (4)2.5基于区域的运动估计 (5)2.6多分辨率的运动估计 (6)3 全搜索算法和三步搜索算法 (7)3.1全搜索算法 (7)3.2三步搜索算法 (7)4 运动估计算法的设计 (9)4.1全搜索算法设计 (9)4.2三步搜索算法设计 (9)5仿真结果 (11)5.1全搜索法结果 (11)5.2三步法结果 (12)5.3性能比较 (14)5.3.1计算复杂度 (14)5.3.2 峰值信噪比 (15)6 结论 (17)7 参考文献 (18)附录 (19)I1视频运动估计概述1.1运动估计技术的地位与作用视频信号通常每秒包括十几帧以上的静态图像。
体育行业中运动视频分析技术的使用教程
体育行业中运动视频分析技术的使用教程在现代的体育竞技中,视频分析技术的应用正在变得越来越普遍。
通过运动视频的分析,教练和运动员能够更好地理解运动的细节、技术的优化以及对手的弱点。
本文将为您介绍体育行业中运动视频分析技术的使用教程,让您能够充分利用这项技术提高训练和比赛的效果。
一、准备工作在开始运动视频分析之前,您需要准备以下工具和设备:1. 摄像设备:选择高清晰度、高帧率的摄像设备,确保能够捕捉到细微的动作和动作变化。
2. 手持稳定器:为了获得更稳定的画面,建议使用手持稳定器或三脚架。
3. 视频编辑软件:选择一款适合您的操作系统的视频编辑软件。
常见的包括Adobe Premiere、Final Cut Pro等。
4. 视频分析软件:选择一款专门用于运动视频分析的软件,例如Kinovea、Dartfish等。
5. 计算机或移动设备:用于存储和处理视频材料。
准备工作完成后,我们可以开始进行运动视频的分析了。
二、录制运动视频运动视频分析的第一步是录制视频。
在录制视频时,需要注意以下几点:1. 视频角度:选择合适的角度来捕捉运动员的动作。
通常我们建议选择全景视角和俯视视角,以便更好地观察运动员的姿势和动作。
2. 光线条件:确保场地有足够的光线,以获取清晰的画面。
3. 摄像距离:与运动员保持适当的距离,以便能够捕捉到整个动作的过程。
4. 帧率设置:如果您的摄像设备支持,建议选择较高的帧率,以便更好地观察运动员的细微动作。
录制完成后,将视频文件传输到计算机或移动设备中,准备进一步的分析工作。
三、导入和编辑视频使用选定的视频编辑软件,导入录制好的视频文件,并进行必要的编辑工作:1. 剪辑视频:根据需求剪辑合适的片段,去掉不需要的部分,以便聚焦于重点内容。
2. 调整画面:如果需要,可以对画面进行调整,例如亮度、对比度、颜色等。
3. 添加标记和注释:在视频中添加标记和注释,以帮助您更好地分析和理解运动员的动作。
这些标记和注释可以是直线、箭头、文本等。
视频编码技术中的空间域滤波与运动补偿(一)
视频编码技术是现代数字视频传输中一个非常重要的领域。
在数字视频传输中,如何保持视频的高质量、高压缩率以及实时性是一个很大的挑战。
而在视频编码技术中,空间域滤波和运动补偿是两个非常重要的技术,它们能够显著提高视频质量和编码效率。
空间域滤波是一种处理视频信号的技术,它主要通过改变图像的像素值来实现。
在视频编码中,空间域滤波可以分为两类:预处理滤波和后处理滤波。
预处理滤波主要用于减少视频中的噪声和伪像,以提高编码效率。
后处理滤波主要用于在解码后的视频中进行去噪和增强处理,以提高视频的观看质量。
在视频编码中,运动补偿是一种利用帧间预测的技术,可以通过比较不同帧之间的像素值来计算两帧之间的运动矢量。
运动矢量表示了目标在运动中所经历的位移。
通过运动矢量,可以将目标的像素值从一个位置映射到另一个位置,从而实现视频的压缩。
运动补偿技术的核心是运动估计和运动补偿两个过程。
运动估计通过对视频中的像素值进行比较,找到最佳的匹配块。
然后,通过将匹配块的像素值从参考帧复制到当前帧,完成运动补偿过程。
空间域滤波和运动补偿在视频编码中的应用是相互关联的。
空间域滤波可以通过去除噪声和伪像的方式提高编码效率,从而减少数据的冗余。
而运动补偿可以通过预测目标的运动轨迹,进一步减少数据冗余。
通过运动补偿,可以将目标的像素值从参考帧复制到当前帧,从而减少编码的数据量。
同时,在解码端,通过运动补偿可以利用已解码的帧进行预测,从而实现视频的解码。
因此,空间域滤波和运动补偿在视频编码中的应用有着密切的联系。
在实际应用中,视频编码技术中的空间域滤波和运动补偿可以根据实际情况进行选择和调整。
例如,对于静止镜头的视频,运动补偿技术的应用并不重要,而空间域滤波技术的应用则可以提高视频的质量。
而对于运动镜头的视频,运动补偿技术的应用则至关重要,它可以更好地利用目标的运动特性,进一步提高编码效率和视频质量。
总之,在视频编码技术中,空间域滤波和运动补偿是非常重要的技术。
视频中运动物体检测与跟踪的opencv实现
foreground image.
..III..
一— — — — — — — — — — — — — — — — — 安徽理工大学硕士学位论文 — — — — — — — — —一 4.OpenCV vision library and VS 2005 write applications,which has a secondary
detection andtracking using OpenCV implementation. Figure 28 reference 60
KeyWords:video,motion detection,motiontracking,mean shift,camshifi,opencv
●
目录
2.1.1高斯滤波………………………………………………………….10 2.1.2均值滤波………………………………………………………….12 2.1.3中值滤波………………………………………………………….12 2.1.4形态学滤波……………………………………………………….13 2.1.5其它滤波器……………………………………………………….14 2.2图像增强………………………………………………………………..14 2.3直方图均衡化…………………………………………………………..1 5 2.4图像的二值化…………………………………………………………..17 2.5本章小结………………………………………………………………一18 3运动目标检测算法……………………………………………………………19 3.1引言………………………………………………………………………..19 3.2光流场法…………………………………………………………………19 3.3背景差分法………………………………………………………………2l 3.4帧间差分法………………………………………………………………22 3.5本文提出的算法…………………………………………………………23 3.6本章小结…………………………………………………………………24
体育训练的视频分析系统设计与实现
体育训练的视频分析系统设计与实现作者:王雪来源:《现代电子技术》2017年第15期摘要:设计基于TMS320DM642的体育训练视频分析系统,系统以数字处理器TMS320DM642为核心进行体育训练视频的快速存储、数据采集与目标跟踪,设计了系统硬件结构,介绍了多媒体接口与TMS320DM642之间的连接方式,给出基于马尔科夫链的体育训练视频目标跟踪模型,并在Visual Studio 2015的开发环境上实现了体育训练视频同步播放以及多动态目标同步跟踪两大重要功能。
实验结果表明设计的系统目标跟踪能力强,应用成本低。
关键词:数字处理器;体育训练;视频分析;系统设计中图分类号: TN948.4⁃34; TP391.41 文献标识码: A 文章编号: 1004⁃373X(2017)15⁃0029⁃04Abstract: A TMS320DM642⁃based video analysis system of sports training was designed. The digital processor TMS320DM642 is taken as the core of system to perform the fast storage, data acquisition and target tracking of the sports training video. The hardware structure of the system was designed. The connection mode between the multimedia interface and TMS320DM642 is introduced. The Markov chain based video target tracking model of sports training is given. Two important functions of video synchronous broadcasting and dynamic multi⁃object synchronous tracking of sports training were implemented in the development environment of Visual Studio 2015. The experimental results show that the system has strong target tracking ability, and low application cost.Keywords: digital processor; sports training; video analysis; system design0 引言改革开放以来,体育竞技越来越受到民众的欢迎,体育训练也开始依附于科技成果进行大力发展,可以说,体育竞技成绩与科技发展密不可分。
一种基于体育比赛视频的相似视频片段检索方法[发明专利]
专利名称:一种基于体育比赛视频的相似视频片段检索方法专利类型:发明专利
发明人:李炜,李小燕,李艳华,陈书骞
申请号:CN201210230108.0
申请日:20120704
公开号:CN102890700A
公开日:
20130123
专利内容由知识产权出版社提供
摘要:本发明涉及一种基于体育比赛视频的相似视频片段检索方法,通过离线部分对视频库中的所有视频进行预处理形成视频特征库,在线部分对查询片段进行视频结构化分析以及特征提取后在视频特征库中进行两轮不同粒度的检索。
第一轮粗粒度的检索确定候选视频集,第二轮细粒度的检索确定相似片段在视频对象中的精确位置。
并且,对所有的视频特征采用K-D tree进行组织以加速查询过程。
最后综合考虑视觉、时序、干扰因子对相似度的影响,对相似片段进行相似度进行计算并排序。
申请人:北京航空航天大学
地址:100191 北京市海淀区学院路37号
国籍:CN
更多信息请下载全文后查看。
用于视频编码分数像素插值的卷积神经网络的构建方法[发明专利]
专利名称:用于视频编码分数像素插值的卷积神经网络的构建方法
专利类型:发明专利
发明人:宋利,张翰,杨小康
申请号:CN201711207766.7
申请日:20171127
公开号:CN108012157A
公开日:
20180508
专利内容由知识产权出版社提供
摘要:本发明提供一种用于视频编码分数像素插值的卷积神经网络的构建方法,包括:收集不同内容、分辨率的图像,形成包含不同类型、编码复杂度的数据的原始训练数据集;对原始训练数据集进行预处理操作,得到符合视频编码帧间预测分数像素插值特性的训练数据;搭建深度卷积神经网络,得到适用于视频编码帧间预测分数像素插值的卷积神经网络结构;使用预处理得到的数据输入搭建好的卷积神经网络,同时将原始训练数据集作为对应的真值,训练搭建的卷积神经网络。
本发明保证了卷积神经网络可顺利训练,且使用训练好的卷积神经网络插值得到的分数像素满足视频编码分数像素插值特性需求,使用本发明进行分数像素插值可实现视频编码效率的提升。
申请人:上海交通大学
地址:200240 上海市闵行区东川路800号
国籍:CN
代理机构:上海恒慧知识产权代理事务所(特殊普通合伙)
代理人:徐红银
更多信息请下载全文后查看。
视频反馈技术在高校排球训练中的应用研究——以美国亚利桑那州立大学为例
Research on the Application of "Video Feedback" Technology in Volleyball Training in Colleges and Universities——Take Arizona State University as an
Example
作者: 薛强[1]
作者机构: [1]青海师范大学体育学院青海西宁810001
出版物刊名: 当代体育科技
页码: 44-46页
年卷期: 2021年 第6期
主题词: 视频反馈;排球教学;排球训练;应用研究
摘要:现如今国内高校排球训练主要存在训练方式方法单一、学生训练热情不高等一系列问题,如何在训练过程中采用新的方式,有效地提高高校排球训练过程中的训练质量及学生的积极性,是广大高校体育教师应该思考的问题.该文基于美国亚利桑那州立大学女子排球队训练过程中"视频反馈"技术的成功应用,以此探究视频反馈教学法在国内高校排球教学与训练过程中的可应用性,以及该技术在实际比赛过程中的高效利用,为我国高校排球训练提供了一种有效的辅助手段.。
体育比赛及训练视频分类管理数据库软件( TacAnalysis)的研究与开发
体育比赛及训练视频分类管理数据库软件( TacAnalysis)的研究与开发胡水清;冯葆欣;蔡宇辉;吴成亮【摘要】比赛及训练录像是教练员、体育科研人员在训练和科研工作常用的重要工具.在长期工作中,他们积累了大量的视频资料,如何有序管理并有效利用这些资料也因此成为一个重要课题.目前,市场上还没有针对体育项目特点研发的视频管理软件,针对体育比赛和训练开发了视频数据库管理软件TacAnalysis.该软件提供了一个开放式的数字视频数据库创建工具,视频分析方法简便、快捷,视频查找实现了快速、准确、分类功能,不同科研人员分析的视频资料和数据成果能够共用、分享或组合成统一的数据库,TacAnalysis还可以对技术动作进行分类统计.应用TacAnalysis数据库软件,初步形成了举重项目近年来的视频资料数据库、体操2008年奥运会的视频数据库,建立了乒乓球和摔跤项目视频管理数据库模型以及技术动作统计模板.【期刊名称】《中国体育科技》【年(卷),期】2011(047)004【总页数】6页(P73-77,81)【关键词】TacAnalysis;体育比赛;视频管理;视频数据库【作者】胡水清;冯葆欣;蔡宇辉;吴成亮【作者单位】国家体育总局体育科学研究所,北京100061;国家体育总局体育科学研究所,北京100061;北京中天诺亚体育科技有限公司,北京100089;;重庆三峡学院,重庆404100【正文语种】中文【中图分类】G819.31 前言反复观看比赛及训练录像,利用视频进行图像反馈和录像解析,是教练员、体育科研人员在训练和科研工作中常用的重要手段,视频图像资料在现场反馈和技术分析等方面,都发挥了相当重要的作用。
在长期工作中,体育工作者们积累了大量的比赛、训练、技术分析等视频资料,保存形式从最初的照片、电影胶片、模拟磁带,到目前的数码磁带、光盘、硬盘等。
我们仔细地记录了每盒胶片和每盘录像带的拍摄时间、拍摄者、拍摄内容等资料,录制视频过程中,会同时将一些比赛具体信息录音。
基于硬件实现的高效率视频编码整像素运动估计算法优化
基于硬件实现的高效率视频编码整像素运动估计算法优化聂宇鑫;施隆照;黄霖
【期刊名称】《福州大学学报:自然科学版》
【年(卷),期】2022(50)5
【摘要】为减少运动估计模块周期数,提高硬件工作效率,从硬件实现的角度对小菱形搜索算法进行优化,调整PU和CU的迭代与处理顺序,解决处理过程中流水线停滞的问题.对小块PU采取并行计算,进一步提高处理速度.用Matlab实现搜索算法,使用Verilog语言描述硬件电路,两个版本在数据上使用相同的激励文件,对比各模块中间值进行功能验证.通过对多组序列的测试,硬件电路对一个64 px×64 px的CTU进行先进的运动矢量预测技术和整像素处理,估计需要平均消耗5800个时钟周期,在QuartusII平台上选中Arria 10AX115N3F40E2SG型号的开发板,主频能够达到186 MHz,整像素运动估计模块综合性能能够达到1080p@61 f·s^(-1).【总页数】7页(P595-601)
【作者】聂宇鑫;施隆照;黄霖
【作者单位】福州大学物理与信息工程学院
【正文语种】中文
【中图分类】TN941.3
【相关文献】
1.一种基于硬件实现的快速运动估计半像素级搜索算法
2.适用于AVS的高性能整像素运动估计硬件设计
3.H.264运动估计整像素部分算法及硬件实现
4.一种高性
能HEVC整像素运动估计硬件设计5.HEVC整像素运动估计的并行螺旋搜索算法及其硬件实现
因版权原因,仅展示原文概要,查看原文内容请购买。
美国中佛罗里达大学基本概况
中佛罗里达大学位于佛罗里达州奥兰多市,是美国发展最快的大学之一,目前在QS美国大学排名中位居第129位。
下面请看为大家整理的中佛罗里达大学基本概况信息。
一、关于中佛罗里达大学One of the fastest-growing and largest universities in the US, theUniversity of Central Florida (UCF) is located in beautiful Orlando, Florida.UCF's combination of world-renowned faculty, cutting-edge research opportunitiesand exciting student life make it an ideal location to pursue a degree in avariety of academic programs.The University of Central Florida is a thriving preeminent researchuniversity located in metropolitan Orlando. With more than 66,000 students, UCFis one of the largest universities in the U.S. In addition to its impressivesize and strength, UCF is ranked as a best-value university by Kiplinger’s, aswell as one o f the nation’s most affordable colleges by Forbes. The universitybenefits from a diverse faculty and staff who create a welcoming environment andopportunities for all students to grow, learn and succeed.中佛罗里达大学位于佛罗里达州美丽的奥兰多市,是美国规模最大、发展最快的大学之一。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
UCF Sports Action Dataset(中佛罗里达大学体育行为
数据库)
数据摘要:
This dataset consists of a set of actions collected from various sports which are typically featured on broadcast television channels such as the BBC and ESPN. The video sequences were obtained from a wide range of stock footage websites including BBC Motion gallery, and GettyImages.
This new dataset contains close to 200 video sequences at a resolution of 720x480. The collection represents a natural pool of actions featured in a wide range of scenes and viewpoints. By releasing the dataset we hope to encourage further research into this class of action recognition in unconstrained environments.
Actions in this dataset include:
Diving (16 videos)
Golf swinging (25 videos)
Kicking (25 videos)
Lifting (15 videos)
Horseback riding (14 videos)
Running (15 videos)
Skating (15 videos)
Swinging (35 videos)
Walking (22 videos)
中文关键词:
体育行为,识别,非限制环境,宽场景,视点,
英文关键词:
Sports Action,recognition,unconstrained environments wide scenes,viewpoints,
数据格式:
VIDEO
数据用途:
To recognition Sports Action from unconstrained environments with wide scenes and viewpoints
数据详细介绍:
UCF Sports Action Dataset
This dataset consists of a set of actions collected from various sports which are typically featured on broadcast television channels such as the BBC and ESPN. The video sequences were obtained from a wide range of stock footage websites including BBC Motion gallery, and GettyImages.
This new dataset contains close to 200 video sequences at a resolution of 720x480. The collection represents a natural pool of actions featured in a wide range of scenes and viewpoints. By releasing the dataset we hope to encourage further research into this class of action recognition in unconstrained environments.
Actions in this dataset include:
Diving (16 videos)
Golf swinging (25 videos)
Kicking (25 videos)
Lifting (15 videos)
Horseback riding (14 videos)
Running (15 videos)
Skating (15 videos)
Swinging (35 videos)
Walking (22 videos)
数据预览:
点此下载完整数据集。