一种基于张量分解的多源异构数据特征融合方法
多源异构数据的融合算法研究
![多源异构数据的融合算法研究](https://img.taocdn.com/s3/m/70cd750442323968011ca300a6c30c225901f020.png)
多源异构数据的融合算法研究随着各种传感器、云计算等技术的发展,数据的来源和类型也变得越来越多样化和异构化。
在这样的背景下,如何对多源异构数据进行融合,成为了数据挖掘与分析领域的一个热门研究方向。
本文将从算法的角度,探讨多源异构数据的融合算法研究。
一、多源异构数据的特点多源异构数据指的是由不同的数据源(如多个传感器、数据库等)采集得到的、类型和格式不同的数据。
由于来源的差异,多源异构数据具有以下的特点:1.数据量大:不同数据源同时采集得到的数据可能非常庞大,需要进行处理和筛选。
2.数据类型多样:不同的数据源可能会采用不同的数据类型(如文本、图像、音频等),使得数据的分析过程变得复杂。
3.数据质量参差不齐:由于不同的数据源采集环境和采集方式的不同,导致数据的质量存在差异(如只是部分数据存在噪声、无效数据等),这就需要进行有效的异常检测和数据清洗。
4.数据格式不同:由于不同的数据源可能存在不同的数据格式(如不同的编码、不同的数据结构等),所以需要进行数据转换或者规范化,以便进行统一的数据处理和分析。
二、多源异构数据的融合算法为了充分利用多源异构数据,同时避免由于数据的维数过高导致的数据过拟合问题,目前常用的做法是使用基于特征选择和特征融合的方法。
特征选择是一种针对原始特征选择出最重要的特征的技术,特征融合是指将不同来源的数据特征,进行整合或匹配,得到更加丰富的数据特征。
根据特征选择和特征融合的方法,目前的多源异构数据融合算法主要有以下几种:1.基于加权平均法的特征融合。
该算法将不同来源的特征进行平均,然后计算每一个特征在整个数据集上的加权得分,将具有高分的特征保留下来,其余则删除。
然后使用得分比较高的特征进行数据分析和建模。
2.基于主成分分析的特征选择和融合。
该算法将不同来源的数据特征进行降维处理,得到最具有代表性的主成分,并利用主成分上的变量来代替原始特征。
在此基础上,使用常规方法进行分类和预测。
3.基于迁移学习的特征融合。
基于张量分解的图像融合算法研究
![基于张量分解的图像融合算法研究](https://img.taocdn.com/s3/m/e2811d488f9951e79b89680203d8ce2f01666561.png)
基于张量分解的图像融合算法研究一、研究背景随着图像的广泛应用,图像融合技术逐渐受到人们的关注。
图像融合技术可以将多个源图像的信息进行融合,生成一张多特征的融合图像,其可以更加清晰地呈现块状区域、边缘等特征。
基于张量分解的图像融合算法是一种主流的图像融合技术,其利用张量的高维性质将多个图像进行分解,从而实现图像融合的效果。
本文将对基于张量分解的图像融合算法进行研究。
二、张量分解张量是一种将多个向量组合而成的数据结构,可以理解为高维矩阵。
在计算机视觉领域,图像可以利用三维张量来表示。
三维张量的定义如下:$V_{i,j,k}$表示在$(i,j)$位置的像素在第$k$个通道处的值。
张量的Kruskal分解是一种将张量进行分解的方法,其基本思想是利用矩阵分解的方法将三维张量分解为多个矩阵的叉积,从而实现图像的融合。
具体来说,假设我们有一个三维张量$T \in R^{I\times J \times K}$,我们想要将其分解为$R_1 \in R^{I \times R}$、$R_2 \in R^{J \times R}$、$R_3 \in R^{K \times R}$三个矩阵的叉积:$T_{i,j,k} = \sum_{l=1}^R R_{1,i,l}R_{2,j,l}R_{3,k,l}$三、基于张量分解的图像融合算法在基于张量分解的图像融合算法中,我们将多个源图像表示为三维张量,然后将其进行分解。
具体的图像融合过程如下:1. 将多个源图像表示为三维张量,即每个像素点的值表示为一个大小为$k$(通道数)的向量;2. 对每个三维张量进行Kruskal分解,得到对应的三个矩阵$R_1$、$R_2$、$R_3$;3. 对于每个源图像,我们将其对应的$R_3$矩阵作为掩膜,将其与$R_1$和$R_2$两个矩阵分别相乘,得到两个新的矩阵$R_{1}'$、$R_{2}'$;4. 将$R_{1}'$、$R_{2}'$、$R_{3}$三个矩阵合并,得到一个新的三维张量;5. 对新的三维张量进行逆Kruskal分解,得到融合图像。
一种基于深度学习的多源异构数据融合方法
![一种基于深度学习的多源异构数据融合方法](https://img.taocdn.com/s3/m/94acd0da89eb172ded63b7a6.png)
第3期
惠国保:一种基于深度学习的多源异构数据融合方法
·219·
可同时输入多源异构数据进行训练学习,提取融合 多源共享特征的目标高层特征。
2 深度学习模型
典型的深度学习模型都是基于 “特征变换-非线 性操作-特征选择(约简) ”的多层迭代模型,特征 变换通过设计滤波器或是其他特征提取方法,成功 的提取当前阶段的特征信息,同时也升高了数据的 维数;非线性操作模拟了人类神经元具有激活与抑 制两个状态,将变换后的特征二值化或使用逻辑回 归函数处理;特征选择将对分类或其他机器学习任 务起作用的特征进行挑选,同时达到降维的作用, 使得深度网络模型的规模维持在一定范围内。 深度学习概念源于人工神经网络的研究,通过 组合低层特征形成更加抽象的高层表示属性类别 或特征,以发现数据的分布式特征表示。深度学习 采用了神经网络相似的分层结构,系统由包括输入 层、隐层(多层)、输出层组成的多层网络,只有相 邻层节点之间有连接,同一层以及跨层节点之间相 互无连接,如图 2 所示。区别于传统的浅层学习, 深度学习的不同在于: (1) 强调了模型结构的深度, 通常有五六层, 甚至十多层的隐层节点; (2)明确突出了特征学习的重要性,也就是 说,通过逐层特征变换,将样本在原空间的特征表 示变换到一个新特征空间,从而使分类或预测更加 容易。与人工规则构造特征的方法相比,利用大数 据来学习特征,更能够刻画数据的丰富内在信息。 下面就神经网络模型构建和网络参数优化两方面 具体介绍。 2.1 模型构建 准备好训练图像集后,需要构建神经网络模型。 一个神经网络有多个简单神经元铰链在一起构成, 一个神经元的输出可以是另一个神经元的输入。图 2 是一个简单的深度神经网络,图中用圆圈表示网 络的输入。标“+1”的圆圈表示偏置单元,对应截 取项。最左边的一层是网络的输入层,最右边层是 网络的输出层。中间层为隐含层,因为它结点的值 在训练集里是观察不到的。也可以说图中的神经网 络输入层有 3 个输入单元(不包括偏置单元) ,有 两个隐含层,第一个隐含层有 3 个隐含单元,第二 个隐含层有 2 个隐含单元,还有输出层 2 个输出单 元。
一种多源异构数据融合平台及融合方法[发明专利]
![一种多源异构数据融合平台及融合方法[发明专利]](https://img.taocdn.com/s3/m/0da15129a9114431b90d6c85ec3a87c240288ab0.png)
(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号 (43)申请公布日 (21)申请号 201710872072.9(22)申请日 2017.09.22(71)申请人 吉林大学地址 130000 吉林省长春市前进大街2699号(72)发明人 徐昊 (74)专利代理机构 北京细软智谷知识产权代理有限责任公司 11471代理人 付登云(51)Int.Cl.G06F 17/30(2006.01)G06Q 50/00(2012.01)G06Q 50/20(2012.01)(54)发明名称一种多源异构数据融合平台及融合方法(57)摘要本发明涉及一种多源异构数据融合平台及融合方法,融合平台包括数据采集单元、数据存储单元、数据标准化单元、用户画像构建单元、知识图谱构建单元和可视化单元;数据采集单元用于采集多源异构数据;数据存储单元用于对多源异构数据进行缓存;数据标准化单元对多源异构数据进行词法、语法和/或语义分析,得到标准化文本数据;用户画像构建单元利用量化出的学生标签构建学生的用户画像;知识图谱构建单元构建学生的知识图谱、老师的知识图谱和课程的知识图谱,并将课程的知识图谱、学生的知识图谱和老师的知识图谱进行关联,得到以学生为中心的课程联系、社交关系和师生关系;可视化单元对以学生为中心的课程联系、社交关系和师生关系进行显示。
权利要求书2页 说明书5页 附图1页CN 107633075 A 2018.01.26C N 107633075A1.一种多源异构数据融合平台,其特征在于,它包括数据采集单元、数据存储单元、数据标准化单元、用户画像构建单元、知识图谱构建单元和可视化单元;所述数据采集单元用于采集多源异构数据;所述数据存储单元将采集到的多源异构数据进行缓存;所述数据标准化单元从所述数据存储单元中读取多源异构数据,并对多源异构数据进行词法、语法和/或语义分析,得到标准化文本数据;所述用户画像构建单元从标准化文本数据中提取出学生的动态信息数据和静态信息数据,并根据提取的数据量化出学生标签,利用量化出的学生标签构建学生的用户画像;所述知识图谱构建单元根据课程内容构建课程的知识图谱,根据学生的用户画像构建学生的知识图谱,根据老师的教学数据构建老师的知识图谱;并将课程的知识图谱、学生的知识图谱和老师的知识图谱进行关联,得到以学生为中心的课程联系、社交关系和师生关系;所述可视化单元对得到的以学生为中心的课程联系、社交关系和师生关系进行显示。
一种基于深度学习的多源异构数据融合方法
![一种基于深度学习的多源异构数据融合方法](https://img.taocdn.com/s3/m/08cc2643b42acfc789eb172ded630b1c59ee9b1e.png)
一种基于深度学习的多源异构数据融合方法深度学习技术在近年来得到了广泛应用,尤其是在多源异构数据融合领域。
多源异构数据融合是指对来自不同数据源、不同类型、不同结构的数据进行集成和分析,以获取更全面、准确、可信的信息。
本文提出了一种基于深度学习的多源异构数据融合方法,以解决数据融合过程中的挑战。
首先,我们需要对待融合的多源异构数据进行预处理,包括数据清洗、格式标准化、噪声去除等。
这一步是为了保证待融合数据的一致性和可比性,减少融合过程中的干扰。
接下来,我们将采用深度学习模型对预处理后的数据进行特征提取。
针对不同类型的数据,我们可以使用不同的深度学习模型,例如卷积神经网络(CNN)用于处理图像数据,循环神经网络(RNN)用于处理时序数据,递归神经网络(Recursive Neural Network, RNN)用于处理文本数据等。
通过深度学习模型的训练,我们可以得到数据的高级表达和特征。
然后,我们将利用多层感知机(Multilayer Perceptron, MLP)对提取得到的特征进行融合。
多层感知机是一种经典的深度学习模型,具有良好的非线性建模能力。
我们可以设计一个多层感知机网络,它的输入层对应于待融合的特征,隐藏层用于提取特征的高层表达,输出层用于生成最终的融合结果。
通过多层感知机的训练和优化,我们可以得到融合后的结果。
除了上述的基于深度学习的多源异构数据融合方法,还可以采用迁移学习的思想来解决数据融合中的挑战。
迁移学习是指将在一个领域上学习到的知识和经验应用到另一个相关领域的问题中。
我们可以将已经在其中一个领域上训练好的深度学习模型作为初始化参数,然后在目标领域上微调模型,以适应多源异构数据融合的任务。
这样可以避免从零开始训练模型,加快模型收敛速度,并提高融合结果的准确性。
总之,基于深度学习的多源异构数据融合方法具有很大的潜力和应用价值。
通过对待融合数据进行预处理、深度学习模型的特征提取、多层感知机的融合结果生成等步骤,可以获取更全面、准确、可信的信息。
多源数据的异构信息融合研究
![多源数据的异构信息融合研究](https://img.taocdn.com/s3/m/f7342c02a9956bec0975f46527d3240c8547a15f.png)
多源数据的异构信息融合研究随着互联网技术的发展以及物联网时代的到来,各种设备、平台、应用程序都在生成大量的数据。
这些数据虽然来源不同,但是都有一个共同的特点:异构。
异构数据往往具有不同的格式、数据库结构、数据内容及语义等差异,使得跨领域、跨平台的信息交互、集成、共享变得异常困难。
因此,如何针对这种异构数据的特点实现统一的数据集成与管理成为了一个非常重要的问题,而多源数据的异构信息融合就是其中的一个核心议题。
多源数据的异构信息融合,简单来说就是将多个不同来源的数据在一定的规则和条件下进行融合,形成一个具有相对完整的、高可信度的数据结构。
具体而言,这个过程就是通过将不同数据源中抽象和分离出的主题或特定领域的概念建立映射关系,使得从不同数据源中提取的信息能够进行有效的汇聚,进而形成一个具有全局代表性的信息资源组合。
多源数据的异构信息融合主要由以下几个步骤构成:第一步,进行数据源的选择。
在多个不同的数据源中,选择那些和当前任务相关联的数据源来进行数据融合。
这个过程需要考虑到数据源的可用性、数据源对任务的贡献度、数据源的价值等因素。
第二步,进行数据清洗和预处理。
可能会存在一些不符合标准的数据,需要对这部分数据进行清洗和预处理,以确保融合后的数据质量。
第三步,建立映射关系。
这个过程需要根据不同数据源中的主题或概念,建立它们之间的映射关系,使得融合后的数据能够达到一定的统一性和一致性。
第四步,进行数据整合。
在这个步骤中,需要将多个数据源中的数据进行适当的整合,以实现数据之间的对应和统一,进而形成一个整体的数据集合。
第五步,进行数据模型的定义。
这个步骤需要对整个融合后的数据进行逻辑上的归纳和总结,形成一个具有统一的逻辑结构的数据模型,这个模型应该能够体现整个数据集所包含的信息和含义,能够支持各种类型的应用程序。
最后一步,对融合后的数据进行分析和应用。
这个步骤就是利用整合后的数据进行各种类型的数据分析和应用开发。
一种基于深度学习的多源异构数据融合方法
![一种基于深度学习的多源异构数据融合方法](https://img.taocdn.com/s3/m/bf9bd0670622192e453610661ed9ad51f01d549d.png)
一种基于深度学习的多源异构数据融合方法随着互联网和物联网技术的发展,产生了大量的多源异构数据,如文本数据、图像数据、传感器数据等。
这些数据在不同的领域和应用中具有重要的作用,但其异构性和多源性也给数据融合带来了挑战。
深度学习作为一种强大的机器学习方法,具有自动学习特征表示和处理大规模数据的能力,因此被广泛应用于多源异构数据融合的研究中。
基于深度学习的多源异构数据融合方法主要包括以下几个关键步骤:特征提取、特征融合和决策分类。
首先,对于不同类型的数据,需要将其转化为深度学习模型能够处理的特征表示。
例如,对于文本数据,可以使用循环神经网络(RNN)或卷积神经网络(CNN)进行特征提取;对于图像数据,可以使用卷积神经网络进行特征提取;对于传感器数据,可以使用自编码器或注意力机制进行特征提取。
特征提取完成后,需要将不同类型的特征进行融合。
融合的方式包括级联融合、堆叠融合和并行融合等。
级联融合是将不同类型的特征连接成一个长向量,然后输入到深度学习模型进行训练;堆叠融合是将不同类型的特征输入到不同的深度学习模型中进行训练,然后将各个模型的输出进行融合;并行融合是将不同类型的特征输入到不同的深度学习模型中进行训练,并将各个模型的输出进行融合。
融合后的特征可以更全面地表达多源异构数据的特点。
最后,融合后的特征通过一个决策分类器进行分类或预测。
通常使用全连接层或softmax层等进行分类。
决策分类器的目标是学习出能够更准确地区分不同类别的决策边界。
除了上述基本步骤外,基于深度学习的多源异构数据融合方法还可以应用其他技术来增强融合效果。
例如,可以引入注意力机制来自动学习数据的重要性权重,从而更加关注重要的数据源;还可以利用迁移学习的方法,将在一个领域上学习到的知识迁移到另一个领域上,从而提高融合效果。
总之,基于深度学习的多源异构数据融合方法能够提供更全面和准确的数据描述,从而为各种领域和应用带来更好的性能和效果。
随着深度学习的不断发展和改进,相信这种方法将会得到更广泛的应用和进一步的研究。
多源异构数据融合技术
![多源异构数据融合技术](https://img.taocdn.com/s3/m/3f20b4d6951ea76e58fafab069dc5022abea4656.png)
多源异构数据融合技术随着互联网的不断发展,数据的规模和多样性不断增加,数据来源也变得越来越多样化,不同数据间的异构性也越来越明显。
这些数据可能来自不同的领域、不同的格式、不同的语言、不同的精度等,如何将这些异构数据进行有效融合成为了一个重要的问题。
多源异构数据融合技术就是解决这个问题的一种有效手段。
一、多源异构数据融合技术的定义多源异构数据融合技术是指将来自不同数据源、不同领域、不同格式、不同语言、不同精度等的异构数据进行有效地整合,提取出其中有用的信息,为后续的数据挖掘、决策分析等工作提供支持的技术手段。
该技术可以有效地提高数据的利用价值,实现数据的共享和交流,促进各领域之间的协作和发展。
二、多源异构数据融合技术的应用多源异构数据融合技术在许多领域都有广泛的应用,例如:1. 医疗领域:将来自不同医院、不同科室、不同病历系统等的病历数据进行融合,可以帮助医生更好地了解患者的病情和治疗历史,提高诊断和治疗的准确性和效率。
2. 金融领域:将来自不同银行、不同交易系统、不同金融产品等的交易数据进行融合,可以帮助银行更好地了解客户的需求和风险,提高风险管理和决策分析的能力。
3. 交通领域:将来自不同交通工具、不同路段、不同时间等的交通数据进行融合,可以帮助交通管理部门更好地了解交通状况和流量变化,提高交通规划和调度的能力。
4. 航空领域:将来自不同航空公司、不同机型、不同机场等的航空数据进行融合,可以帮助航空公司更好地了解市场需求和竞争情况,提高航班调度和运营效率。
5. 农业领域:将来自不同农场、不同作物、不同气象站等的农业数据进行融合,可以帮助农民更好地了解农作物的生长情况和灾害风险,提高农业生产效率和质量。
三、多源异构数据融合技术的挑战虽然多源异构数据融合技术有着广泛的应用前景,但是在实际应用中也面临着一些挑战:1. 数据质量问题:由于来自不同数据源的数据格式和精度不同,可能存在数据缺失、数据错误、数据冗余等问题,需要进行数据清洗和预处理。
一种多源异构非结构化病历数据融合方法[发明专利]
![一种多源异构非结构化病历数据融合方法[发明专利]](https://img.taocdn.com/s3/m/3b8877f181eb6294dd88d0d233d4b14e85243eed.png)
专利名称:一种多源异构非结构化病历数据融合方法
专利类型:发明专利
发明人:史晟辉,李五锁,詹思延,徐梓豪,张洋,杨羽,武姗姗,黄元升,黄定琦,陈晓宇,张永健,赵鑫,杨廷伟
申请号:CN201810047069.8
申请日:20180118
公开号:CN108198595B
公开日:
20220503
专利内容由知识产权出版社提供
摘要:本发明公开了一种多源异构非结构化病历数据融合方法。
所述方法基于以下构思,基于病历数据平台的数据表建立表虚拟类,所述表虚拟类包括实体生成SQL语句算法;通过表虚拟类建立与病历数据平台内的数据表的属性一一对应的表类;建立数据控制虚拟类,以属性的方式包含病例数据平台中数据表的对应表类的实例,所述数据控制虚拟类包括虚拟转换算法,所述虚拟转换算法将数据转换成为表类的对象;调用所述实体生成SQL语句算法,通过反射技术遍历所述表类的对象,将数据的属性转成SQL语句,存储进病历数据平台的数据表。
本发明在不影响原系统结构和稳定性的前提下,实现了病历数据融合,提升了操作安全性和融合效率,并且有效降低了出错率。
申请人:北京化工大学,北京大学
地址:100029 北京市朝阳区北三环东路15号北京化工大学
国籍:CN
代理机构:北京太兆天元知识产权代理有限责任公司
代理人:张洪年
更多信息请下载全文后查看。
一种基于词向量矩阵分解技术的多源数据融合方法及系统[发明专利]
![一种基于词向量矩阵分解技术的多源数据融合方法及系统[发明专利]](https://img.taocdn.com/s3/m/d7f921c59a89680203d8ce2f0066f5335a8167d3.png)
专利名称:一种基于词向量矩阵分解技术的多源数据融合方法及系统
专利类型:发明专利
发明人:杜登斌,杜小军,杜乐
申请号:CN202111330802.5
申请日:20211111
公开号:CN114169320A
公开日:
20220311
专利内容由知识产权出版社提供
摘要:本发明提出了一种基于词向量矩阵分解技术的多源数据融合方法及系统,通过获取多源数据样本,每个多源数据样本包括文本、语音、图像、视频的多模态数据,并获取对应的隐含语义知识库;将多源数据样本和从隐含语义知识库中提取对应的语义信息,共同投影到一个共享语义子空间中,生成词向量矩阵;对词向量矩阵进行分解,得到所述多源数据样本的低维特征;以所述多源数据样本的低维特征为输入,以对应的语义信息为标签训练分类器;将待挖掘的目标任务的多模态数据经过同样的生成词向量矩阵和分解矩阵的处理后输入至训练后的分类器,获得目标任务的语义信息,完成对目标任务的隐含语义挖掘。
本发明实现了有效提取多源数据的隐含意义及数据间的关系。
申请人:武汉东湖大数据交易中心股份有限公司
地址:430000 湖北省武汉市东湖新技术开发区高新大道999号龙山创新园一期F3栋2101室国籍:CN
代理机构:武汉红观专利代理事务所(普通合伙)
代理人:徐春燕
更多信息请下载全文后查看。
面向多源异构的数据融合方法、系统、装置及存储介质[发明专利]
![面向多源异构的数据融合方法、系统、装置及存储介质[发明专利]](https://img.taocdn.com/s3/m/7131b14003768e9951e79b89680203d8ce2f6a21.png)
(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号 (43)申请公布日 (21)申请号 201911039444.5(22)申请日 2019.10.29(71)申请人 珠海格力电器股份有限公司地址 519000 广东省珠海市前山金鸡西路申请人 珠海联云科技有限公司(72)发明人 寇茜茜 李润静 胡松青 龙富永 张红燕 (74)专利代理机构 北京聿宏知识产权代理有限公司 11372代理人 吴大建 张杰(51)Int.Cl.G06F 16/25(2019.01)G06F 16/215(2019.01)G06K 9/62(2006.01)(54)发明名称面向多源异构的数据融合方法、系统、装置及存储介质(57)摘要本发明提供一种面向多源异构的数据融合方法、系统、装置及存储介质,所述方法包括:采集待融合的业务系统的源数据;对所述待融合的业务系统的源数据提取关键业务字段,构成所述待融合的业务系统的数据集;利用已有的决策树模型对所述待融合的业务系统的数据集的数据进行数据融合识别,关联出异构的业务系统中与所述待融合的业务系统的数据集的数据相似度最高的数据,得到融合数据集。
本发明避免了由于业务系统的维护人员操作不规范、业务系统开发过程中未考虑到与其他业务系统间的关联性、历史数据遗留问题等导致的关联关系不明确,导致业务系统的数据分析无法自动匹配融合的问题。
权利要求书2页 说明书8页 附图4页CN 110750588 A 2020.02.04C N 110750588A1.一种面向多源异构的数据融合方法,其特征在于,包括:采集待融合的业务系统的源数据;对所述待融合的业务系统的源数据提取关键业务字段,构成所述待融合的业务系统的数据集;利用已有的决策树模型对所述待融合的业务系统的数据集的数据进行数据融合识别,关联出异构的业务系统中与所述待融合的业务系统的数据集的数据相似度最高的数据,得到融合数据集;其中,已有的决策树模型是利用历史融合数据集训练得到的。
一种多源异构模型的切片融合方法、系统及存储介质[发明专利]
![一种多源异构模型的切片融合方法、系统及存储介质[发明专利]](https://img.taocdn.com/s3/m/b13303c29f3143323968011ca300a6c30c22f127.png)
(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号 (43)申请公布日 (21)申请号 202110409564.0(22)申请日 2021.04.16(71)申请人 武汉光谷信息技术股份有限公司地址 430000 湖北省武汉市东湖新技术开发区高新大道888号高农生物园总部A区19#楼申请人 湖北省自然资源厅信息中心(72)发明人 洪勇 晏世武 吴培侗 李江 李先旭 董朝阳 姜益民 闫科 (74)专利代理机构 武汉蓝宝石专利代理事务所(特殊普通合伙) 42242代理人 谢洋(51)Int.Cl.G06K 9/62(2006.01)G06T 17/20(2006.01)G06F 17/16(2006.01)(54)发明名称一种多源异构模型的切片融合方法、系统及存储介质(57)摘要本发明提供一种多源异构模型的切片融合方法、系统及存储介质,方法包括:对模型数据进行网格划分或者分块处理;根据任一个网格数据或任一个块数据的顶点密度,确定对任一个网格数据或任一个块数据的切片方式,切片方式包顶点聚类切片方式和边折叠切片方式;进行切片处理,得到倾斜摄影模型数据的多个第一切片数据和BIM模型数据的多个第二切片数据;分别对多个第一切片数据和多个第二切片数据进行合并,输出第一切片模型数据和第二切片模型数据;对第一切片模型数据和第二切片模型数据进行融合。
本发明根据网格数据或分块数据中包含的顶点密度,采用不同的方式进行切片,在不改变原始数据模型的同时,也减少了数据切片处理时间。
权利要求书3页 说明书11页 附图10页CN 112819108 A 2021.05.18C N 112819108A1.一种多源异构模型的切片融合方法,其特征在于,包括:获取模型数据,并确定所述模型数据的类型;若所述模型数据为倾斜摄影模型数据,则对所述倾斜摄影模型数据进行网格划分,得到多个网格数据;若所述模型数据为BIM模型数据,则对所述BIM模型数据进行分块处理,得到多个块数据;获取每一个网格数据或每一个块数据中的顶点密度,根据任一个网格数据或任一个块数据的顶点密度,确定对所述任一个网格数据或所述任一个块数据的切片方式,所述切片方式包括顶点聚类切片方式和边折叠切片方式;利用所述切片方式对对应的所述任一个网络数据或所述任一个块数据进行切片处理,得到所述倾斜摄影模型数据的多个第一切片数据和所述BIM模型数据的多个第二切片数据;对多个所述第一切片数据进行合并,输出第一切片模型数据,以及对多个所述第二切片数据进行合并,输出第二切片模型数据;对所述第一切片模型数据和所述第二切片模型数据进行融合。
网络异构信息的张量分解聚类方法
![网络异构信息的张量分解聚类方法](https://img.taocdn.com/s3/m/65df650ae3bd960590c69ec3d5bbfd0a7956d50b.png)
网络异构信息的张量分解聚类方法
吴继冰;黄宏斌;邓苏
【期刊名称】《国防科技大学学报》
【年(卷),期】2018(040)005
【摘要】提出基于张量分解的聚类算法,能够同时处理网络中多类型、多语义关系的异构信息.网络信息体系中的各种异构信息被建模为一个多维张量,异构信息之间丰富的语义关系建模为张量中的元素.提出有效的张量分解方法,将不同类型的信息对象一次性划分到不同的簇中.在人工合成的数据集和真实数据集上的实验结果表明:该聚类方法可以很好地处理网络信息体系中的异构信息聚类问题,并且性能优于现有的聚类方法.
【总页数】8页(P146-152,170)
【作者】吴继冰;黄宏斌;邓苏
【作者单位】国防科技大学系统工程学院信息系统工程重点实验室,湖南长沙410073;国防科技大学系统工程学院信息系统工程重点实验室,湖南长沙 410073;国防科技大学系统工程学院信息系统工程重点实验室,湖南长沙 410073
【正文语种】中文
【中图分类】TN95
【相关文献】
1.FMS中异构网络异构数据库的信息集成 [J], 马云富;谭剑
2.异构属性数据的量子聚类方法研究 [J], 李志华;王士同
3.基于异构社交网络信息和内容信息的事件推荐 [J], 尚燕敏; 曹亚男; 刘燕兵
4.基于异构信息网络元路径作张量分解的深度学习推荐系统 [J], 许荣海;王昌栋
5.基于异构信息网络元路径作张量分解的深度学习推荐系统 [J], 许荣海;王昌栋因版权原因,仅展示原文概要,查看原文内容请购买。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一种基于张量分解的多源异构数据特征融合
方法
多源异构数据特征融合是在当今大数据环境下的一个重要任务。
针对这个任务,一种基于张量分解的特征融合方法被提出。
在多源异构数据中,不同数据源之间可能具有不同的特征表示方式和数据分布。
为了充分利用这些数据源,并获得更准确的融合特征,我们可以使用张量分解技术。
首先,我们将异构数据转化为一个张量,将不同的特征维度作为张量的维度。
然后,利用张量分解算法对张量进行分解,将其分解为多个低秩子张量。
这样做的目的是捕捉到数据源之间的共享特征和异态特征。
接下来,在每个低秩子张量中,我们可以根据具体任务的需要进行特征选择或
特征加权。
这可以通过一些经典的特征选择算法(如卡方检验、互信息等)或特征加权方法(如TF-IDF、标准化等)来实现。
最后,我们将经过特征选择或特征加权后的低秩子张量进行重组,得到最终的
融合特征表示。
这些融合特征既可以直接用于后续的任务,如分类、聚类等,也可以作为新的特征输入到深度学习模型中。
通过基于张量分解的多源异构数据特征融合方法,我们能够更好地利用异构数
据之间的特征信息,提高数据挖掘任务的性能。
这种方法不仅可以应用于文本数据、图像数据等传统的异构数据,还可以扩展到其他领域,如社交网络数据、传感器网络数据等。
总之,基于张量分解的多源异构数据特征融合方法是一种有效的数据融合策略,可以提高数据挖掘任务的准确性和可靠性。
它为多源异构数据的应用提供了有力的支持,并在实际应用中具有广泛的应用前景。