大数据交易客体
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
大数据交易客体即在大数据交易市场中交易的商品,大数据交易对象是大数据市场交易的商品,主要包括两类产品:经预处理的大数据产品和大数据分析产品。
经预处理的大数据产品是指对采集到的原始大数据进行清洗、脱敏后形成的产品。预处理主要解决两个问题:数据的无序性和数据的敏感性。只有经过完整预处理流程的大数据产品才能进入大数据交易市场。预处理大数据产品是指对采集到的原始大数据进行清洗、脱敏后形成的产品。
数据清洗是大数据预处理的第一步。其主要目的是清理脏数据,提高数据质量。脏数据主要表现为拼写问题、打印错误、非法值、空值、不一致值、缩写、同一实体的多个表示(重复)、不遵循引用完整性等。
数据脱敏是用随机字符或数据隐藏原始数据的过程,更具体地说,数据脱敏就是在一定系统规则下,对涉及个人隐私、商业秘密、国家秘密的真实数据进行适当改造的过程。脱敏一般可分为可恢复类脱敏、
不可恢复类脱敏。可恢复类脱敏是指经脱敏的数据可以恢复成原始数据,此过程一般需要利用加解密算法规则实现。不可恢复类脱敏是指经脱敏的数据无论如何都不能恢复成原始数据。一般而言,为了保证大数据交易中数据的安全性,采用不可恢复类脱敏方式对大数据进行脱敏比较合理。不可恢复类脱敏算法分为替换算法、生成算法。替换算法指利用特定的字符或字符串将脱敏内容替换,生成算法则在此基础上要求己脱敏数据有一定的逻辑规则,经生成算法脱敏的部分表面看起来很真实,但实际是假的。对大数据进行脱敏是合法交易大数据的最低标准,也是被广泛认同的。
大数据分析产品指对己预处理的大数据产品进行分析、建立数学模型、可视化处理等深度加工所得的大数据产品。分析、建模、可视化是不断提升大数据使用价值的几个环节,常用数据分析技术、商业智能技术、可视化技术、多媒体识别技术等都是这些环节经常采用的
技术,它能反映大数据应用的一种方向,一般来说,它比单纯清洗过后的大数据更能吸引大数据买方的注意。
以上就是全部内容,希望对大家有所帮助,感谢您的阅读!