一种基于AIS数据的船舶徘徊检测方法[发明专利]

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

(19)中华人民共和国国家知识产权局
(12)发明专利申请
(10)申请公布号 (43)申请公布日 (21)申请号 202011047211.2
(22)申请日 2020.09.29
(71)申请人 南京北斗创新应用科技研究院有限
公司
地址 211500 江苏省南京市六合区龙池街
道虎跃东路8号
(72)发明人 朱欣焰 闫保奇 呙维 樊亚新 
(74)专利代理机构 北京金智普华知识产权代理
有限公司 11401
代理人 杨采良
(51)Int.Cl.
G06F 16/29(2019.01)
(54)发明名称一种基于AIS数据的船舶徘徊检测方法(57)摘要本发明公开了一种基于AIS数据的船舶徘徊检测方法,本发明能够根据获取到的船舶AIS轨迹数据,针对海量轨迹数据进行船舶徘徊行为检测,并将船舶徘徊行为进行分类,总结出四种典型船舶运动异常行为的轨迹与定义变量之间的关系。

根据船舶运动轨迹特征与统计参量之间的关系分析,根据网格中的轨迹分布情况进行船舶异常徘徊行为检测。

对其船舶AIS轨迹过滤平滑后建立全球时空网格索引,并将船舶轨迹进行网格化处理,根据船舶异常行为轨迹特点进行船舶异常运动的检测,并对于船舶运动行为轨迹异常进行异常分类报警。

船舶徘徊行为检测可以为海上安全监管提供决策支持,增强海上交通安全性,并保证船舶安全航行,对促进海上运输平安、高效、
畅通具有重要意义。

权利要求书1页 说明书6页 附图1页CN 112182133 A 2021.01.05
C N 112182133
A
1.一种基于AIS数据的船舶徘徊检测方法,其特征在于,包括以下步骤:
S1:获取重点研究区域的空间范围,即其经纬度范围;
S2:重点研究区域的空间范围确定后,根据空间范围的经纬度计算其覆盖的网格编码区域,并得到范围网格编码集合(u 1,u 2,…,u n );
S3:根网格编码范围计算并输出行列号范围({umin max ,{vmin max )}};
S4:对原始船舶运动轨迹进行筛选,获取在设定时间范围与空间范围内的轨迹数据,并将结果数据集合转换成相应的网格编码集合;
S5:遍历船舶运动轨迹网格编码集合,并统计该集合内的有效网格数目nValid。

S6:根据行列号范围确定每行的有效方格范围,即有效计数变量≥1的网格编码范围,计算近似面积s;
S7:通过船舶轨迹网格编码进行轨迹中心行列号计算,确定轨迹中心网格编码,辅助轨迹具体形状判断;
S8:计算轨迹长度,船舶运动轨迹的总长度是所有有效方格计数变量的和;
S9:船舶轨迹长度n sum 小于重点区域空间范围网格行列数之和的两倍,若n sum 超出该阈值,判断该轨迹为异常轨迹。

2.根据权利要求1所述的基于AIS数据的船舶徘徊检测方法,其特征在于:所述步骤S5中判断集合内的网格编码是否有重复值,若在不同时间节点内有相同的网格编码,则将该网格的计数变量加1,判断循环完成后输出结果集合,则该集合的长度即为有效网格数量。

3.根据权利要求1所述的基于AIS数据的船舶徘徊检测方法,其特征在于:所述步骤S6中获取每行范围内编码范围并找出有效计数变量n的最大值与最小值,计算每一行最大u和最小u的差再加一,对所有行的结果求和得出以行计算的近似面积s area ,随后以同样方式在研究区域内对每列网格进行计算,获取每列列计算结果求和得到以列计算的轨迹近似面积s areac ,最终近似面积为两个近似面积的平均值:s=(s areal +s areac )/2。

4.根据权利要求1所述的基于AIS数据的船舶徘徊检测方法,其特征在于:所述步骤S9中当效计数变量大于2的网格数目n (>2)为0时,船舶可能为近似S型曲线运动;

且s -n (有效)>20时,轨迹可能为椭圆轨迹;
当且s -n(有效)<10时,轨迹可能为往返轨迹;当船舶轨迹长度n sum 与n(有效)相等时,可确定轨迹为近似S曲线。

若船舶轨迹长度n sum 要大于重点区域空间范围网格行列数之和的两倍但不属于上述情况,且n (有效)>(p+q)/4时,判定该船舶正在进行无规则折线运动。

权 利 要 求 书1/1页CN 112182133 A
一种基于AIS数据的船舶徘徊检测方法
技术领域
[0001]本发明涉及大数据分析领域,尤其涉及一种基于AIS数据的船舶徘徊检测方法。

背景技术
[0002]近年来,随着海上船舶数量与密度不断攀升,船舶轨迹数据大规模增加,同时海上交通安全管理难度也日渐上升,需要对船舶轨迹数据进行更深层次的分析与处理,以便增强海上交通的安全性。

目前有越来越多的学者利用船舶自动识别系统的设备提供的数据信息进行海上交通研究。

[0003]根据船舶运动轨迹行为,当非渔业船舶具有近似徘徊行为时,这些异常行为往往与醉酒驾驶、劫持、非法捕捞、海盗和非法测量等相关。

那么它在一定范围内的轨迹长度会明显高于正常情况。

传统的船舶徘徊行为检测针对性不强,不能对船舶异常行为进行分类检测,例如近似椭圆的船舶徘徊轨迹、船舶反复往返轨迹等。

对船舶轨迹数据的分析处理上也缺乏针对海量数据的处理方法,整个过程耗时、耗力,数据处理结果缺乏客观性和可靠性。

发明内容
[0004]本发明的目的就在于为了解决上述问题而提供一种基于AIS数据的船舶徘徊检测方法。

能够跟去获取到的船舶AIS轨迹数据,针对海量轨迹数据进行船舶徘徊行为检测,并将船舶徘徊行为进行分类,总结出四种典型船舶运动异常行为的轨迹与以上定义变量之间的关系。

根据船舶运动轨迹特征与统计参量之间的关系分析,根据网格中的轨迹分布情况进行船舶异常徘徊行为检测。

[0005]本发明通过以下技术方案来实现上述目的:
[0006]本发明包括以下步骤:
[0007]S1:获取重点研究区域的空间范围,即其经纬度范围;
[0008]S2:重点研究区域的空间范围确定后,根据空间范围的经纬度计算其覆盖的网格编码区域,并得到范围网格编码集合(u1,u2,…,u n);
[0009]S3:根网格编码范围计算并输出行列号范围({umin max,{vmin max)}};
[0010]S4:对原始船舶运动轨迹进行筛选,获取在设定时间范围与空间范围内的轨迹数据,并将结果数据集合转换成相应的网格编码集合;
[0011]S5:遍历船舶运动轨迹网格编码集合,并统计该集合内的有效网格数目nValid。

[0012]S6:根据行列号范围确定每行的有效方格范围,即有效计数变量≥1的网格编码范围,计算近似面积s;
[0013]S7:通过船舶轨迹网格编码进行轨迹中心行列号计算,确定轨迹中心网格编码,辅助轨迹具体形状判断;
[0014]S8:计算轨迹长度,船舶运动轨迹的总长度是所有有效方格计数变量的和;[0015]S9:船舶轨迹长度n sum小于重点区域空间范围网格行列数之和的两倍,若n sum超出
该阈值,判断该轨迹为异常轨迹。

[0016]进一步,所述步骤S5中判断集合内的网格编码是否有重复值,若在不同时间节点内有相同的网格编码,则将该网格的计数变量加1,判断循环完成后输出结果集合,则该集合的长度即为有效网格数量。

[0017]进一步,所述步骤S6中获取每行范围内编码范围并找出有效计数变量n的最大值与最小值,计算每一行最大u和最小u的差再加一,对所有行的结果求和得出以行计算的近似面积s area,随后以同样方式在研究区域内对每列网格进行计算,获取每列列计算结果求和得到以列计算的轨迹近似面积s areac,最终近似面积为两个近似面积的平均值:s=(s areal +s areac)/2。

[0018]进一步,所述步骤S9中当效计数变量大于2的网格数目n(>2)为0时,船舶可能为近
似S型曲线运动;当且s-n(有效)>20时,轨迹可能为椭圆轨迹;当且s-n(有效)<10时,轨迹可能为往返轨迹;当船舶轨迹长度n sum与n(有效)相等时,可确定轨迹为近似S曲线。

若船舶轨迹长度n sum要大于重点区域空间范围网格行列数之和的两倍但不属于上述情况,且n(有效)>(p+q)/4时,判定该船舶正在进行无规则折线运动。

[0019]本发明的有益效果在于:
[0020]本发明是一种基于AIS数据的船舶徘徊检测方法,与现有技术相比,本发明能够根据获取到的船舶AIS轨迹数据,针对海量轨迹数据进行船舶徘徊行为检测,并将船舶徘徊行为进行分类,总结出四种典型船舶运动异常行为的轨迹与定义变量之间的关系。

根据船舶运动轨迹特征与统计参量之间的关系分析,根据网格中的轨迹分布情况进行船舶异常徘徊行为检测。

对其船舶AIS轨迹过滤平滑后建立全球时空网格索引,并将船舶轨迹进行网格化处理,根据船舶异常行为轨迹特点进行船舶异常运动的检测,并对于船舶运动行为轨迹异常进行异常分类报警。

适用于大数据分析领域,船舶徘徊行为检测可以为海上安全监管提供决策支持,增强海上交通的安全性,并保证船舶安全航行,对促进海上运输平安、高效、畅通具有重要意义。

附图说明
[0021]图1是几种典型的徘徊运动行为轨迹图;
[0022]图中:a:椭圆轨迹;b:往返轨迹;c:折线轨迹;d:S形轨迹;
[0023]图2是本发明船舶徘徊检测结果示意图。

具体实施方式
[0024]下面结合附图对本发明作进一步说明:
[0025]本发明假设研究区域内,空间网格的行列数分别为p和q,在船舶异常徘徊行为识别前,需要对相关变量进行定义:
[0026](1)网格计数变量n(u,v),网格内包含的轨迹点数目。

u为该网格行号,v为该网格列号。

n(u,v)以0为默认值,当查询到有轨迹点落入该网格后,该网格计数变量进行相应变化。

网格计数变量表示该网格内轨迹的重复度,如果同一船舶在一定时间范围内的航行轨迹有相交情况或者轨迹较为密集,则会在该网格内查询到多个轨迹点。

[0027](2)有效网格数n(有效),研究区域内的网格若计数变量比0大,则称该网格为有效
网格。

而在研究区域内所有网格中有效网格数量即为有效网格数,以n(有效)进行表示,有效网格数越大则体现船舶轨迹在整个研究区域内所占比例越高。

[0028](3)若研究区域内存在计数变量大于2的有效网格,将此类网格数目在网格区域范围内进行统计。

而n(>2)表示该类网格在整个研究区域内的网格数量。

n(>2)越大,则表示在该范围内船舶轨迹重叠度越高。

由于是针对船舶运动轨迹进行异常行为判断,该统计变量越大,则表示研究区域范围内船舶的行为异常概率越高。

[0029](4)研究区域内船舶轨迹中心网格对有效方格的行列号分别按照以下公式进行均值计算,得到轨迹中心点该网格表示轨迹在网格区域内的大致方位。

[0030]
[0031](5)研究区域内船舶轨迹的近似覆盖面积s,船舶轨迹构成的图形并不规则,因此我们不能使用轨迹行列号范围直接进行轨迹覆盖面积的计算。

本文采取以下方法进行船舶轨迹近似面积s的计算。

首先获取研究区域内所有的有效方格,随后对有效方格进行遍历,逐行扫描研究区域内的有效方格,获取每一行的有效方格列数,最大列数减去最小列数即为该行轨迹范围,将研究区域内每行轨迹范围进行相加即得出该轨迹的近似面积s1,为保证研究结果的准确性,将有效方格进行逐列遍历后,获取每列的轨迹范围得出轨迹近似面积s2,将两次计算结果s1与s2相加后取平均值,即可得到最终的轨迹近似面积s。

[0032](6)轨迹中心附近k*k邻域内非有效网格数目该对轨迹形状判断有重要辅助作用。

[0033](7)计数变量总和n sum,n sum表示轨迹经过的所有网格数目,用来代表轨迹长度。

[0034]根据船舶运动轨迹行为,当非渔业船舶具有近似徘徊行为时,这些异常行为往往与醉酒驾驶、劫持、非法捕捞、海盗和非法测量等相关。

那么它在一定范围内的轨迹长度会明显高于正常情况,本文总结出了四种典型船舶运动异常行为的轨迹与以上定义变量之间的关系。

若船舶正常航行,则在一段时间内其运动轨迹应当是研究区域内轨迹斜率变化较为稳定,轨迹形状一般来说并不复杂,轨迹基本上没有交点或交点较少,此时轨迹为正常运动轨迹。

若在时间阈值范围内其轨迹交点过多,且轨迹长度较大,此时考虑船舶轨迹为运动异常。

对船舶徘徊具体分类如下:
[0035](1)近似椭圆运动。

当船舶轨迹形状近似椭圆时,由于其并非船舶停留轨迹,故将其判定为运动异常轨迹。

当船舶出现近似椭圆轨迹时,可能是正在进行非法侦测。

此时船舶徘徊轨迹的交点较多且重合度较高,此时在研究区域内有效网格数目较大,因此其计数变量也会和相对较大。

由于轨迹范围内的有效方格很少,因此轨迹近似面积要比有效网格数量大,且也较大,具体异常表现如图1(a)所示。

[0036](2)反复往返运动。

船舶在海上两点间进行反复往返时,船舶可能是在醉驾或者受到某种挟制,此时船舶的有效网格数目n(有效)相对较小,但是其计数变量n(u,v)普遍较大,船舶轨迹近似面积s与有效网格数n(有效)相差不大,且船舶轨迹中心附近的船舶轨迹
也较为密集,此时轨迹中心一定范围邻域内的非有效网格数目较小,具体表现如图1(b)
所示。

[0037](3)无规则运动。

船舶在进行无规则运动时,可能是该船舶出现了故障或驾驶员醉驾的情况。

此时在该时间范围内船舶的轨迹交点不多,同时有效网格数目n(有效)并不小,但是很多有效网格的n(u,v)并不大,轨迹近似面积s比有效网格数目n(有效)大。

但是如果时间阈值设置较大,船舶轨迹交点会越来越多,轨迹重合率也就越高,在网格中的轨迹形状可能会向反复往返靠近。

如图1(c)所示。

[0038](4)S形曲线运动。

此时船舶可能正在进行海上非法测量,这时船舶轨迹的交点几乎为0,n(有效)较小,且轨迹近似面积s比有效网格数目n(有效)大,大部分有效网格的计数都是1。

具体表现如图1(d)所示
[0039]根据上述船舶运动轨迹特征与统计参量之间的关系分析,根据网格图中的分布情况进行船舶异常徘徊行为识别。

具体算法步骤如下:
[0040](1)获取重点研究区域的空间范围,即其经纬度范围,一般来讲,重点研究区域均为矩形区域,取其矩形四个角点的经纬度即可。

重点研究区域空间范围确定后,默认时间范围为一天,输入起止时间点即可开始该时间段内船舶运动轨迹数据异常识别;
[0041](2)重点研究区域的空间范围确定后,根据空间范围的经纬度计算其覆盖的网格编码区域,并得到范围网格编码集合(u1,u2,…,u n);
[0042](3)根网格编码范围计算并输出行列号范围({umin max,{vmin max)}};
[0043](4)对原始船舶运动轨迹进行筛选,获取在设定时间范围与空间范围内的轨迹数据,并将结果数据集合转换成相应的网格编码集合。

[0044](5)遍历船舶运动轨迹网格编码集合,并统计该集合内的有效网格数目nValid。

判断集合内的网格编码是否有重复值,若在不同时间节点内有相同的网格编码,则将该网格的计数变量加1,判断循环完成后输出结果集合,则该集合的长度即为有效网格数量;[0045](6)根据行列号范围确定每行的有效方格范围(有效计数变量≥1的网格编码范围),计算近似面积s。

获取每行范围内编码范围并找出有效计数变量n的最大值与最小值,计算每一行最大u和最小u的差再加一,对所有行的结果求和得出以行计算的近似面积s area,随后以同样方式在研究区域内对每列网格进行计算,获取每列列计算结果求和得到以列计算的轨迹近似面积s areac,最终近似面积为两个近似面积的平均值。

[0046]s=(s areal+s areac)/2 (式2)
[0047](7)通过船舶轨迹网格编码进行轨迹中心行列号计算,确定轨迹中心网格编码,辅助轨迹具体形状判断;
[0048](8)计算轨迹长度,船舶运动轨迹的总长度是所有有效方格计数变量的和;[0049](9)一般而言,船舶在航行过程中拐弯、穿越重点区域、原路折返等正常行为产生的船舶轨迹长度n sum要小于重点区域空间范围网格行列数之和的两倍。

若n sum超出该阈值,判断该轨迹为异常轨迹。

当有效计数变量大于2的网格数目n(>2)大于重点区域空间范围网格行列数之和的两倍时,船舶可能正在进行多次往返运动或者为近似椭圆运动;当效计数
变量大于2的网格数目n(>2)为0时,船舶可能为近似S型曲线运动;当且s-n(有效)>20
时,轨迹可能为椭圆轨迹;当且s-n(有效)<10时,轨迹可能为往返轨迹;当船舶轨迹长度n sum与n(有效)相等时,可确定轨迹为近似S曲线。

若船舶轨迹长度n sum要大于重点区域空间范围网格行列数之和的两倍但不属于上述情况,且n(有效)>(p+q)/4时,判定该船舶正在进
行无规则折线运动。

[0050]船舶在航行过程中,以100*100格网为例,若船舶运动轨迹满足分类检测结果,则与管理人员发布相关预警。

上述检测算法的具体规则如下:
[0051]当n sum-n(有效)>2(p+q),(n(u,v)≥3的方格数)>(p+q)/2,且s-n(有效)>20时,为近似椭圆运动;
[0052]当n sum-n(有效)>2(p+q),(n(u,v)≥3的方格数)>(p+q)/2,且s-n(有效)<10时,为往返运动;
[0053]当n sum-n(有效)>100,且s>80时,为折线运动;
[0054]当n sum-n(有效)<5,(n(u,v)≥3的方格数)=0,且s/n(有效)>1.5时,为S型曲线运动;[0055]对于不满足上述情况,但是n sum>400的轨迹,我们也认为运动目标具有运动异常行为。

[0056]首先以船舶AIS轨迹数据表为例,说明船舶轨迹分割过程
[0057]表1船舶轨迹AIS数据
[0058]
[0059]其中MMSI为船舶海上通信识别码,BaseDateTime为AIS信号发射时间,LAT为纬度,LON为经度,SOG为航速,COG为船舶航向。

[0060]步骤1,执行数据读取,针对输入数据源的所有AIS数据进行读取,在数据库中选取在研究区域经纬度范围(132W-130W,54N-56N)内与一定时间范围(2017年12月1日-2017年12月31日)内轨迹数据。

重点研究区域空间范围确定后,默认时间范围为一天,根据时间与空间范围可开始该时间段内船舶运动轨迹数据异常识别;
[0061]步骤2,重点研究区域的空间范围确定后,根据空间范围的经纬度计算其覆盖的网格编码区域,并得到范围网格编码集合(u1,u2,…,u n);
[0062]步骤3,进行船舶轨迹分割,进行船舶停留轨迹与船舶运动轨迹识别,得到船舶运动行为轨迹;
[0063]步骤4,根网格编码范围计算并输出行列号范围({umin max,{vmin max)}},对原始船舶运动轨迹进行筛选,获取在设定时间范围与空间范围内的轨迹数据,并将结果数据集合转换成相应的网格编码集合;
[0064]步骤5,遍历船舶运动轨迹网格编码集合,并统计该集合内的有效网格数目nValid。

判断集合内的网格编码是否有重复值,若在不同时间节点内有相同的网格编码,则将该网格的计数变量加1,判断循环完成后输出结果集合,则该集合的长度即为有效网格数量;
[0065]步骤6,根据行列号范围确定每行的有效方格范围(有效计数变量≥1的网格编码范围),计算近似面积s。

获取每行范围内编码范围并找出有效计数变量n的最大值与最小值,计算每一行最大u和最小u的差再加一,对所有行的结果求和得出以行计算的近似面积s area,随后以同样方式在研究区域内对每列网格进行计算,获取每列列计算结果求和得到以列计算的轨迹近似面积s areac,最终近似面积为两个近似面积的平均值。

[0066]s=(s areal+s areac)/2(式2)
[0067]步骤7,通过船舶轨迹网格编码进行轨迹中心行列号计算,确定轨迹中心网格编码,进行轨迹具体形状判断;
[0068]步骤8,进行船舶徘徊行为检测,获取船舶徘徊行为的轨迹段落,并将其进行输出。

得到船舶徘徊近似椭圆运动结果如图2所示。

[0069]以上显示和描述了本发明的基本原理和主要特征及本发明的优点。

本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。

本发明要求保护范围由所附的权利要求书及其等效物界定。

图1
图2。

相关文档
最新文档