【CN109885697A】构建数据模型的方法、装置、设备和介质【专利】

合集下载

样本数据构建方法、装置、设备和介质[发明专利]

专利名称：样本数据构建方法、装置、设备和介质专利类型：发明专利
发明人：王业君,云朋,汪明伟
申请号：CN202010865395.7
申请日：20200825
公开号：CN112070132A
公开日：
20201211
专利内容由知识产权出版社提供
摘要：本申请实施例公开了一种样本数据构建方法、装置、设备和介质，涉及机器学习技术领域。

其中，该样本数据构建方法包括：对检测对象在目标操作类型下的运行状态进行监测，得到与目标操作类型对应的至少两个目标运行行为数据；对目标运行行为数据进行组合排列，并对组合排列结果进行样本标记得到样本数据；其中，样本数据用于训练针对检测对象的异常检测模型。

本申请实施例可以实现快速构建丰富的训练样本数据的效果。

申请人：北京百度网讯科技有限公司
地址：100085 北京市海淀区上地十街10号百度大厦2层
国籍：CN
代理机构：北京品源专利代理有限公司
代理人：孟金喆
更多信息请下载全文后查看。

建立数据输出模型的方法和装置[发明专利]

专利名称：建立数据输出模型的方法和装置专利类型：发明专利
发明人：田柳青,钱勇明
申请号：CN201711455168.1
申请日：20171228
公开号：CN109978579A
公开日：
20190705
专利内容由知识产权出版社提供
摘要：本发明公开了一种建立数据输出模型的方法和装置，涉及计算机技术领域。

该方法的一具体实施方式包括：根据获取的数据建立数据模型，获取的数据包括多个影响因素对应的多组数据；对数据模型进行分析以确定需要删除的影响因素；根据需要删除的影响因素对数据模型进行优化以得到数据输出模型。

该实施方式能够避免仅分析单一影响因素所导致的商品定货量方案的局限性，使得建立的用于确定商品定货量的数据输出模型更符合现实的情况，从而使得数据输出模型得出的商品定货量结论更具有实用价值。

申请人：北京京东尚科信息技术有限公司,北京京东世纪贸易有限公司
地址：100195 北京市海淀区杏石口路65号西杉创意园四区11号楼东段1-4层西段1-4层
国籍：CN
代理机构：中原信达知识产权代理有限责任公司
更多信息请下载全文后查看。

数据模型的构建方法、装置、计算机设备和存储介质[发明专利]

专利名称：数据模型的构建方法、装置、计算机设备和存储介质
专利类型：发明专利
发明人：熊英杰,王军,谭翔,肖壮锋
申请号：CN201910264390.6
申请日：20190403
公开号：CN110008226A
公开日：
20190712
专利内容由知识产权出版社提供
摘要：本申请涉及一种数据模型的构建方法、装置、计算机设备和存储介质。

所述方法包括：获取不同业务类型的原始数据，从原始数据中提取出与预设数据类型对应的目标数据；对目标数据添加对应的业务类型标识信息和数据层次标识信息；分别根据各个目标数据的数据类型确定各个目标数据对应的数据库，将目标数据及对应的业务类型标识信息和数据层次标识信息存储至对应的数据库中；根据各个数据库、各个数据库存储的目标数据、各个目标数据对应的业务类型标识信息和数据层次标识信息，构建数据模型。

本方法基于模型构建技术构建数据模型，实现了清晰集中地显示业务类型所涉及的业务数据的目的，不容易造成业务数据缺失，提高了业务数据的完整性。

申请人：平安信托有限责任公司
地址：518048 广东省深圳市福田区福田街道益田路5033号平安金融中心27层(东北、西北、西南)、29层(东南、西南、西北)、31层(3120室、3122室)、32层、33层
国籍：CN
代理机构：广州华进联合专利商标代理有限公司
更多信息请下载全文后查看。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

(19)中华人民共和国国家知识产权局
(12)发明专利申请
(10)申请公布号 (43)申请公布日 (21)申请号 201910105197.8
(22)申请日 2019.02.01
(71)申请人北京百度网讯科技有限公司
地址 100094 北京市海淀区上地十街10号
百度大厦2层
(72)发明人王赵煜　史亚冰　梁海金　蒋烨　
张扬　朱勇　
(74)专利代理机构北京市金杜律师事务所
11256
代理人李辉
(51)Int.Cl.
G06F 16/36(2019.01)
(54)发明名称构建数据模型的方法、装置、设备和介质(57)摘要本公开的实施例涉及用于构建数据模型的方法、装置、设备和介质。

一种用于构建数据模型的方法包括获取与实体类型相关联的第一属性集合。

该方法还包括通过将第一属性集合中具有相同语义的多个属性对齐到同一属性，来生成与该实体类型相关联的第二属性集合，第二属性集合中的两个属性具有不同语义。

该方法还包括基于该实体类型和第二属性集合，来构建与该实体类型相关联的数据模型。

本公开的实施例能够自动识别来自不同来源的数据中具有不同表达方式的同义属性。

通过自动对齐同义属性，本公开的实施例能够在有效降低人力成本的情况下高
效地构建数据模型。

权利要求书3页说明书8页附图3页CN 109885697 A 2019.06.14
C N 109885697
A
权　利　要　求　书1/3页CN 109885697 A
1.一种用于构建数据模型的方法，包括：
获取与实体类型相关联的第一属性集合；
通过将所述第一属性集合中具有相同语义的多个属性对齐到同一属性，来生成与所述实体类型相关联的第二属性集合，所述第二属性集合中的两个属性具有不同语义；以及基于所述实体类型和所述第二属性集合，来构建与所述实体类型相关联的数据模型。

2.根据权利要求1所述的方法，其中获取与所述实体类型相关联的所述第一属性集合包括：
获取与所述实体类型相关联的第三属性集合；
按照属性相似度将所述第三属性集合划分为多个子集；以及
将所述多个子集之一确定为所述第一属性集合。

3.根据权利要求2所述的方法，其中将所述第三属性集合划分为所述多个子集包括：
对所述第三属性集合进行聚类，以将所述第三属性集合划分为所述多个子集。

4.根据权利要求1所述的方法，其中将所述第一属性集合中具有相同语义的多个属性对齐包括：
将所述实体类型与所述第一属性集合中的第一属性进行组合，以得到第一类型属性对；
将所述实体类型与所述第一属性集合中不同于所述第一属性的第二属性进行组合，以得到第二类型属性对；
确定所述第一类型属性对与所述第二类型属性对是否具有相同语义；以及
响应于确定所述第一类型属性对与所述第二类型属性对具有相同语义，将所述第一属性与所述第二属性对齐到同一属性。

5.根据权利要求4所述的方法，其中确定所述第一类型属性对与所述第二类型属性对是否具有相同语义包括：
提取所述第一类型属性对与所述第二类型属性对的多个相似度特征；以及
基于提取的所述多个相似度特征，来确定所述第一类型属性对与所述第二类型属性对是否具有相同语义。

6.根据权利要求5所述的方法，其中所述多个相似度特征包括以下至少一项：
指示所述第一类型属性对与所述第二类型属性对的文本相似度的第一相似度特征；
指示所述第一类型属性对与所述第二类型属性对在语义词典中是否为同义词的第二相似度特征；
指示所述第一类型属性对与所述第二类型属性对的语义相似度的第三相似度特征；以及
针对与所述第一类型属性对相关联的第一组知识条目和与所述第二类型属性对相关联的第二组知识条目进行统计而得到的第四相似度特征。

7.根据权利要求4所述的方法，其中确定所述第一类型属性对与所述第二类型属性对是否具有相同语义包括：
利用经训练的分类模型来确定所述第一类型属性对与所述第二类型属性对是否具有相同语义。

8.根据权利要求7所述的方法，其中所述分类模型为支持向量机(SVM)模型。

2。