基于K-means聚类分析的任务定价方案
基于k-means聚类的模糊神经网络市场清算电价预测
摘要正规化模糊神经网络(NFNN)具有结构复杂,学习时间长等缺点。
针对NFNN的缺点,本文应用了一种改进的模糊神经网络(IFNN)预测市场清算电价(MCP)。
该模型结构简单,只需通过k-means聚类确定模糊推理层节点的个数,适用性强,预测精确度较高。
关键字电价预测;模糊神经网络;k-means聚类1引言在电力体制改革的过程中,电价作为重要的经济杠杆,在建立和培育电力市场、优化配置电力资源及调整各种利益关系等方面具有不可替代的作用。
MCP(MarketClearingPrice)反映了电力商品的短期供求关系,对MCP的准确预测将为市场监管部门提供重要的科学依据,从而促进市场健康、稳定、有序地发展。
因此,电价预测已成为许多学者研究的热点,提高电价的预测精度成为研究的核心。
人工神经网络(ANN)能够处理多变量和非线性问题,且具有自适应和容错能力,预测精度高,是目前研究比较多的预测MCP的方法。
但是,利用ANN进行MCP预测存在网络复杂,训练速度慢,缺少学习不确定、模糊信息的能力等诸多缺点。
而模糊逻辑系统恰能处理不确定、模糊的信息,信息处理的速度快,因此近年来,把两者结合起来的理论—模糊神经网络(FNN),引起了许多学者的广泛关注。
已经有学者应用FNN预测电价,预测精度也有了一定的提高,但大多数采用的是正规化的模糊神经网络(NFNN)[1-2]。
这种模型需要根据专家的经验确定每一个变量的模糊分割数,但有时候连专家都很难把握某些经验。
针对NFNN存在的缺陷,本文采用一种改进的FNN模型,利用北欧电力市场的历史电价数据对模型进行训练,并预测MCP,仿真结果表明所提出的模型能达到较高的预测精度,具有一定的研究价值。
2电价的特点电力的市场化运营使得电力和普通商品一样可以自由交易,电力价格会随机波动,但是由于电力的特殊性,使得电价表现出与普通商品价格不同的特点[3]。
首先,由于电力商品不能有效存储,而电力消费要求实时供需平衡,这使得电力价格呈现出强烈的波动性,如图1所示。
基于K-Means聚类算法的配送中心物流成本分析
= 碡 爵 薛
其 中 ,C— — 单 位 车 辆 的存 储 成 本 ,c — — G 配 送 区 域 的订 货 成 本 ,R — — G 配 送 区域 销 售 旺 季 的需 求 量 ,尺 — — G配
送 区域 正 常 销 售 季 节 的需 求 量 , — — G 为 配 送 区域 销 售 淡 季 的 需 求 量 , — — G 配 送 区 域 销 售 旺 季 的 时 间 , — — G 配 送 区 。
m i ( n ,
f ,需 求 点 由 配 送 中 心 i 1 配送 l ,需 求 点 不 由 配 送 中 心 i 送 。 0 配
+ D s . t ・
V
其 中 ,S — 所 有 需 求 点 的 集 合 ,G— — 第 i 配 送 区域 ,D — — 配送 中 心 i 需 求 点 的 距 离 ,D —— 配 送 中心 i 工 厂 — 个 到 到
域 正 常 销 售 季节 的 时 间 , — — G 配 送 区 域 销 售 淡 季 的 时 间 。
3 配 送 中 心 位 置 确 定
对 于 已 确定 的 G 配 送 区 域 来 说 ,配 送 中心 的 位 置 对 于整 个 配 送 的运 输 距 离 是 十分 重 要 的 , 主要 通 过 计 算 工 厂 到 每 个 配 送 . 中心 的距 离 以及 配送 中 心 到相 邻 的 配送 点 的 距 离 ,找 出距 离 之 和 最 短 的 做 为 配 送 中 心 ,并 可 以 确定 相 应 的 配 送 区域 。该 方 法 数 学 表 示 如 下 : ( )首 先 Vi 1 ∈G ,作 为 G 的 配 送 中 心 位 置 ,它 到 G 内其 他 点 的 距 离 记 为 D ,它 的 工 厂 的距 离 记 为 D ; ( ) 2
k-means聚类方法的原理和步骤
k-means聚类方法的原理和步骤k-means聚类方法是一种常用的数据聚类算法,它可以将一组数据划分成若干个类别,使得同一类别内的数据相似度较高,不同类别之间的数据相似度较低。
本文将介绍k-means聚类方法的原理和步骤。
k-means聚类方法基于数据的距离度量,具体而言,它通过最小化各个数据点与所属类别中心点之间的距离来达到聚类的目的。
其基本原理可以概括为以下几点:-定义类别中心点:在聚类开始前,需要预先设定聚类的类别数量k。
根据k的数量,在数据集中随机选取k个点作为初始的类别中心点。
-分配数据点到类别:对于每一个数据点,计算其与各个类别中心点之间的距离,并将其分配到距离最近的类别中。
-更新类别中心点:当所有数据点分配完毕后,重新计算每个类别中的数据点的均值,以此获得新的类别中心点。
-重复分配和更新过程:将新的类别中心点作为参考,重新分配数据点和更新类别中心点,直到类别中心点不再变化或达到预设的迭代次数。
按照上述原理,k-means聚类方法的步骤可以分为以下几个阶段:-第一步,随机选择k个类别中心点。
-第二步,计算每个数据点与各个类别中心点之间的距离,并将其分配到距离最近的类别中。
-第三步,重新计算每个类别中数据点的均值,以此获得新的类别中心点。
-第四步,判断新的类别中心点是否与上一次迭代的中心点相同,如果相同,则结束聚类过程;如果不同,则更新类别中心点,返回第二步继续迭代。
-第五步,输出最终的类别划分结果。
需要注意的是,k-means聚类方法对聚类的初始中心点敏感,不同的初始点可能会导致不同的聚类结果。
为了避免陷入局部最优解,通常采用多次随机初始化的方式进行聚类,然后选取最好的结果作为最终的聚类划分。
综上所述,k-means聚类方法是一种常用的数据聚类算法,它通过最小化数据点与类别中心点之间的距离来实现聚类。
按照预设的步骤进行迭代,最终得到稳定的聚类结果。
在实际应用中,还可以根据具体问题进行算法的改进和优化,以满足实际需求。
基于ANP和K-means聚类的客户价值分类模型的最小市场单元建设方案.doc
基于ANP和K-means聚类的客广1价值分类模型的最小市场单元建设方案基于ANP和K-means聚类的客户价值分类模型的最小市场单元建设方案为贯彻落实省局《2016年全省卷烟营销网络建设工作要点》文件精神, 培育优质客户,提升客户经理队伍素质,提高市场控制水平,促使营销人员做到“三个回归回归基础、回归职能、回归市场。
根据实际,特制定最小单元建设执行方案如下:一、卷烟零售户最小市场单元的客户划分方法(%1)选用客户价值评价方法传统的最小市场单元划分方法是以客户经理所服务区域为范围,以地域相邻、卷烟消费相似、商圈类型相同的客户群组成为最小市场单元,原则上一个客户经理划分7-10个最小单元,然后在最小市场单元中选择一个标杆客户,让标杆客户作为标杆示范,以点带面带动整个最小市场单元的客户的总体提升。
但传统确定最小市场单元的方法、如何选取最小市场单元选取标杆客户的方法存在三个基本问题:一是主要使用单一的定量指标进行价值判断,比如同一商圈、同一地理环境、消费相似等因素;二是少数的评价指标体系对指标进行赋权时忽略了指标间的相互影响;三是对客户等级的划分没有科学的标准,主观性较强。
闽侯县烟草分公司这三个问题出发,基于客户价值理论,设计了实用性、操作性较强的客户价值评价指标体系,采用网络层次分析法(Analytic Network Process,ANP)对指标赋权,并根据K-means聚类的结果指导每个客户经理如何划分自己所服务区域的最小市场单元,指导客户经理选择最小市场单元内的标杆客户。
(二)选用ANP与K-means聚类方法的优势首先采用网络层次分析法(ANP)确定指标权重,它不仅能够客观地反映客户对企业的价值贡献,而且定量与定性指标相结合,各指标最终都能得到量化,易于形成分类的标准,对客户价值的体现也更全面。
通过指标体系可以清晰界定客户的价值所在,并能促进客户行为模式向客户价值提升的方向转变。
其次,K-means方法在对客户分类方面具有诸多优点:它对客户进行“类标识”,避免了大样本引起的网络结构复杂、收敛性和泛化能力差的问题,并且K值的确定取决于客户希望的分类数,比较容易操作。
基于K-means聚类算法的青岛房屋分布及价格分析
2021年2月基于聚类算法的青岛房屋分布及价格分析吴正哲(山东科技大学计算机科学与工程学院,山东青岛266590)【摘要】随着大数据时代的到来,互联网已经深深地改变了我们的生活模式。
本文使用Python爬虫技术从青岛链家网二手房网站中抓取招聘信息并清洗;然后利用Python中的matplotlib库,对清洗后的数据进行可视化分析,分析不同类型房屋情况的分布;最后,通过K-means算法和线性回归算法分析青岛房屋的分布与价格,准确得出多个方面的分析数据,起到购房决策辅助作用。
【关键词】K-means;线性回归;数据可视化;机器学习;Python语言;Beautiful Soup技术【中图分类号】G350【文献标识码】A【文章编号】1006-4222(2021)02-0297-020引言“互联网+”时代的到来,增强了房地产经纪业务适应线上、线下场景的产品和服务能力,目前我国房地产经纪业务已经形成O2O的发展格局,未来线上线下渠道将继续加速融合发展。
因此,无论是从带动国民经济发展的角度,还是从满足人民群众基本需求以及开发商投资决策的角度,掌握了解商品住宅价格的变动发展趋势都显得尤为重要。
1相关工作Beautiful Soup是一个可以从HTML或XML文件中提取数据的Python库,简单来说,它能将HTML的标签文件解析成树形结构,然后方便地获取到指定标签的对应属性。
爬取网页的内容其实就是先把页面的信息先通过Urllib库抓取到本地,然后再通过Beautiful Soup库精细划分抓取得到的页面内容数据。
K表示聚类个数,读取全部数据之后,随机选取K个数据作为初始聚类中心,然后将剩余数据计算到聚类中心距离并分配到最近的中心簇,并且相应的删除每个聚类中的个数,更新聚类中心。
Means也就是均值,就是每次“选举大会”每个组内由X和Y的平均值组成新的老大,往往是虚拟的。
形成的新簇并不一定是最好的划分,因此生成的新簇中,重新计算每个簇的中心点,然后在重新进行划分,直到每次划分的结果保持不变。
基于K-means算法的产品市场定位聚类分析
基于K-means算法的产品市场定位聚类分析作者:翟音罗萍来源:《电脑知识与技术·学术交流》2008年第26期摘要:聚类算法是数据挖掘中核心技术之一,而k-means算法在经典聚类算法中占有重要地位。
根据市场调查中的顾客感知质量,感知价格,市场份额和品牌类别为测试数据,用k-means算法进行数据挖掘,充分利用数据挖掘结果,得出符合市场现状的市场定位结论。
关键词:市场定位;顾客感知;k-means 算法;聚类中心中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2008)26-1635-02Clustering Analysis of Market Location of the Product Based on K-means ArithmeticZHAI Yin, LUO Ping(Mathematics and Information School, Langfang Teachers College, Langfang 065000, China)Abstract:Clustering is the one of core technology in data mining. K-Means algorithm is a very famous clustering algorithm technology in the classical clustering. The test data based on a market survey of the quality of customer awareness, perception prices, market share and brand categories. Using k-means algorithm of data mining, and making full use of the results obtained the market status of market positioning conclusions.Key words: marketing positioning; customer perception; k-means algorithm; clustering center1 引言随着数据挖掘技术的发展,作为数据挖掘主要方法之一的聚类算法,也越来越受到人们的关注。
如何利用K均值算法进行商品定价分析(四)
在当前市场的商业竞争中,定价策略是企业营销战略中至关重要的一环。
正确的定价策略可以提高产品的竞争力,进而提高销售量和利润。
为了更好地制定定价策略,利用K均值算法进行商品定价分析已成为一种普遍的商业实践。
K均值算法是一种常用的聚类算法,它能够将数据集划分为K个不同的类别。
在商品定价分析中,可以利用K均值算法对市场上的商品进行聚类,从而找到合适的价格区间,以满足不同消费者的需求。
首先,利用K均值算法进行商品定价分析需要准备相应的数据集。
数据集可以包括商品的销售量、价格、市场份额、消费者评价等信息。
通过收集和整理这些数据,可以为算法提供足够的信息来进行分析。
值得一提的是,数据的质量对于分析结果是至关重要的,因此在收集数据时需要尽量确保数据的准确性和完整性。
接下来,对数据进行预处理是必不可少的。
在预处理阶段,可以通过数据清洗、特征选择等方式对数据进行处理,以便为K均值算法的运行做好准备。
同时,还需要对数据进行标准化,使得数据处于相同的量纲下,以便更好地运用K均值算法进行分析。
然后,可以利用K均值算法对商品进行聚类分析。
在进行聚类分析时,需要首先确定K的取值。
K的选择直接影响到聚类的效果,因此需要进行一定的实验和比较来确定最优的K值。
在确定K值后,可以运行K均值算法,将商品划分为不同的类别。
这些类别可以代表不同的市场定位、价格范围等信息,对于制定定价策略是非常有益的。
最后,根据K均值算法的结果,可以制定相应的定价策略。
根据不同类别的商品,可以采取不同的定价策略,以满足不同消费者的需求。
同时,还可以根据聚类结果对市场定位和产品定位进行调整,以更好地适应市场的需求。
总的来说,利用K均值算法进行商品定价分析是一种有效的商业实践。
通过对商品进行聚类分析,可以更好地了解市场需求,制定更加合理的定价策略,提高产品的竞争力。
当然,K均值算法只是一种工具,真正的成功还需要结合实际情况进行灵活运用,不断进行实验和调整,以实现最终的商业目标。
如何利用K均值算法进行商品定价分析(七)
在商业领域,商品定价一直是一个重要的议题。
商家需要根据市场需求和竞争情况来合理定价,以获得最大的利润和市场份额。
然而,针对不同的情况,如何进行商品定价却是一个复杂的问题。
在这篇文章中,我们将介绍如何利用K均值算法来进行商品定价分析,从而帮助商家更好地制定定价策略。
K均值算法是一种常用的聚类分析方法,通过对数据进行分组,来寻找数据内部的模式和规律。
在商品定价分析中,我们可以将商品的属性和定价数据作为输入,利用K均值算法将商品分成若干个簇,从而更好地理解不同商品之间的定价特征和异同点。
首先,我们需要准备数据。
商品定价分析的数据通常包括商品的属性信息和定价信息。
商品的属性信息可以包括品牌、功能、材质、适用人群等,而定价信息包括商品的售价、促销价、折扣信息等。
通过收集和整理这些数据,我们可以构建一个商品定价的数据集。
接下来,我们需要对数据进行预处理。
在进行K均值聚类之前,我们需要对数据进行标准化处理,以保证不同属性的数据在进行聚类时具有相同的权重。
同时,我们还需要对数据进行缺失值处理和异常值处理,以确保数据的准确性和可靠性。
然后,我们可以利用K均值算法对商品进行聚类分析。
K均值算法通过迭代寻找最优的聚类中心,将数据划分成K个簇。
在商品定价分析中,我们可以将商品的属性信息和定价信息作为特征,利用K均值算法将商品进行聚类,从而找出不同定价特征的商品簇。
通过对商品进行聚类分析,我们可以更好地理解不同商品的定价特征。
例如,我们可以发现某一类商品的定价相对较高,而另一类商品的定价相对较低,从而帮助商家进行差异化定价策略。
同时,我们还可以发现某些商品的属性特征与定价存在明显的相关性,从而帮助商家更好地进行商品定价决策。
除此之外,K均值算法还可以帮助商家发现潜在的市场需求和竞争情况。
通过对商品进行聚类分析,我们可以发现某些商品的定价特征与市场需求具有一定的相关性,或者发现竞争对手在某一类商品上具有明显的优势。
这些信息都可以帮助商家更好地制定定价策略,以获得更大的市场份额和利润。
如何利用K均值算法进行商品定价分析(五)
在商业竞争日益激烈的今天,定价策略成为企业取得竞争优势的重要手段之一。
然而,对于许多企业来说,制定一个合理的定价策略往往是一个具有挑战性的任务。
在这种情况下,利用K均值算法进行商品定价分析成为了一个备受关注的话题。
本文将探讨如何利用K均值算法进行商品定价分析,以帮助企业更好地制定定价策略。
K均值算法是一种常用的聚类分析算法,其基本思想是将n个观测值划分为k个聚类,使得每个观测值都属于离它最近的均值所对应的聚类。
在商品定价分析中,可以将K均值算法应用于对不同商品的价格特征进行聚类,从而为企业提供定价策略的参考依据。
首先,利用K均值算法进行商品定价分析需要准备相关的数据。
这些数据可以包括商品的价格、销量、市场份额、利润率等信息。
其次,需要根据具体的定价目标和需求确定聚类的数量k。
一般来说,聚类的数量应该根据实际情况进行调整,以保证聚类的有效性和可解释性。
接下来,可以利用K均值算法对所准备的数据进行聚类分析,得到不同商品的定价类别。
最后,根据不同定价类别的特征,制定相应的定价策略,以实现企业的定价目标。
在实际应用中,利用K均值算法进行商品定价分析可以带来许多好处。
首先,它可以帮助企业更好地理解不同商品的定价特征,为企业制定定价策略提供数据支持。
其次,通过对商品进行聚类分析,企业可以更好地理解市场的定价结构,为企业提供定价决策的参考依据。
同时,K均值算法还可以帮助企业发现具有相似定价特征的商品,为企业提供产品组合和定价组合的建议。
然而,利用K均值算法进行商品定价分析也面临一些挑战和限制。
首先,K 均值算法对初始聚类中心的选择比较敏感,不同的初始选择可能导致不同的聚类结果。
因此,在实际应用中需要对算法进行多次运行,选择最优的聚类结果。
其次,K均值算法对异常值比较敏感,需要进行数据预处理和异常值处理以提高算法的稳健性。
最后,K均值算法对数据的特征要求比较高,需要满足独立同分布和方差相等的假设。
综上所述,利用K均值算法进行商品定价分析是一种有效的手段,可以帮助企业更好地理解市场的定价结构,为企业制定定价策略提供依据。
如何利用K均值算法进行商品定价分析(Ⅲ)
在当今竞争激烈的市场环境下,企业需要通过科学的方法来制定商品的定价策略,以实现营销和盈利目标。
K均值算法是一种常用的数据挖掘技术,可以帮助企业对市场进行细分,并制定针对性的定价策略。
本文将从K均值算法的原理和应用入手,探讨如何利用K均值算法进行商品定价分析。
K均值算法是一种基于距离的聚类分析方法,通过将数据点划分为不同的簇,以便对数据进行分类和分析。
在商品定价分析中,可以利用K均值算法对市场进行细分,找到不同的消费群体,并制定针对性的定价策略。
首先,需要准备相关的市场数据,包括商品的定价信息、销售数量、销售额以及消费者的特征等。
然后,利用K均值算法对这些数据进行聚类分析,将市场划分为不同的簇。
通过对每个簇的分析,可以了解不同消费群体的特征和需求,为制定定价策略提供参考。
在进行K均值算法分析之前,需要选择合适的聚类数目K。
一般来说,可以通过绘制“肘部法则”图来确定最佳的K值。
该方法通过计算不同K值下数据点与其所属簇中心的距离平方和,找到一个拐点,即为最佳的K值。
选择合适的K值对于聚类分析的结果具有重要影响,因此需要仔细选择。
通过K均值算法得到不同的簇之后,可以对每个簇进行进一步的分析。
可以通过计算不同簇的平均销售数量、平均销售额、平均定价等指标,了解不同簇的消费特征。
同时,还可以对消费者的特征进行分析,包括年龄、性别、偏好等方面,进一步了解不同簇的消费者特点。
基于对不同簇的分析,可以制定针对性的定价策略。
对于高消费能力的簇,可以采取较高的定价策略,以提高销售额和利润;对于中低消费能力的簇,可以采取更具竞争力的定价策略,以提高市场份额和市场占有率。
通过对不同簇的定价策略的优化,可以实现更有效的销售目标。
除了对市场进行细分和定价分析,K均值算法还可以用于定价策略的调整和优化。
通过监控市场数据的变化,可以不断地对市场进行重新分析,发现新的消费群体和需求,及时调整定价策略,以适应市场的变化,提高销售效益。
如何利用K均值算法进行商品定价分析(八)
在现代商业领域,定价策略是一个至关重要的决策因素。
商家需要根据市场需求、竞争对手定价、成本等多方面考虑来确定产品的价格,以获得最大化的利润。
而K均值算法作为一种经典的聚类分析方法,可以帮助商家对市场进行细分,从而更好地制定定价策略。
本文将围绕如何利用K均值算法进行商品定价分析展开讨论。
首先,K均值算法是一种无监督学习的算法,主要用于将数据集划分成K个簇。
在商品定价分析中,商家可以将不同产品的定价数据作为输入,利用K均值算法将产品进行聚类,找出不同价格区间内的产品特点和市场需求。
通过这种方式,商家可以更好地了解市场的细分情况,从而有针对性地进行定价策略的制定。
其次,K均值算法在商品定价分析中的应用还可以帮助商家找出潜在的价格敏感型客户。
通过对客户的购买行为进行分析,并结合K均值算法对客户进行聚类,商家可以发现在不同价格水平下具有不同购买偏好的客户群体。
这对商家来说是非常有益的信息,可以帮助他们更好地针对不同客户群体进行定价策略的制定,提高销售的效率和效益。
另外,K均值算法还可以帮助商家对产品进行定价弹性分析。
商家可以根据产品的定价数据,利用K均值算法找出不同价格区间内产品的销量、市场份额等信息。
通过对这些信息的分析,商家可以了解产品在不同价格水平下的市场反应情况,进而为产品的定价策略提供数据支持和参考。
除此之外,K均值算法还可以结合其他因素进行商品定价分析。
比如,商家可以将产品的定价数据与市场营销活动、季节性因素、地域差异等因素进行结合,利用K均值算法找出不同定价策略下的市场细分情况。
这可以帮助商家更好地了解市场的需求特点,为定价策略的制定提供更全面的信息支持。
综上所述,K均值算法作为一种经典的聚类分析方法,在商品定价分析中有着重要的应用价值。
商家可以利用K均值算法对产品定价数据进行聚类分析,找出不同价格区间内的产品特点和市场需求,从而更好地制定定价策略。
通过对客户进行聚类分析,商家可以发现潜在的价格敏感型客户,为定价策略的制定提供有益的信息支持。
基于因子分析与K-means聚类耦合的分时保费定价方法研究
基于因子分析与K-means聚类耦合的分时保费定价方法研究曾娟;吴兴华;张洪昌
【期刊名称】《武汉理工大学学报(信息与管理工程版)》
【年(卷),期】2018(040)002
【摘要】传统车险定价基于"一人一车"前提,与租赁汽车所有权与使用权分离的运营模式冲突.为了解决租赁汽车分时保费的定价问题,研究了基于驾驶员行为的费率因子分级设计方法.首先,采用因子分析法提取驾驶行为因子,以方差贡献率的加权均值作为权重,设计了驾驶员综合风险评价因子S;然后,以S为聚类指标利用K-means聚类算法实现对驾驶员风险的自动分级,进而为分时保费费率因子的分级提供依据;最后,以某大型租赁公司所提供的19位驾驶员实车数据作为样本,结合某保险公司所提供的违章及出险事故数据,证明了该方法的可行性与有效性,该方法可为以人为中心的车险保费定价提供积极的理论参考.
【总页数】6页(P213-218)
【作者】曾娟;吴兴华;张洪昌
【作者单位】武汉理工大学汽车工程学院,湖北武汉430070;武汉理工大学汽车工程学院,湖北武汉430070;武汉理工大学汽车工程学院,湖北武汉430070【正文语种】中文
【中图分类】U46
【相关文献】
1.基于因子分析和K-means聚类的空中交通复杂性评价 [J], 温瑞英;王红勇
2.基于因子分析和K-means聚类算法的党员等级评定 [J],
3.基于因子分析和K-means聚类算法的行业聚类研究 [J], 曹钰;何国辉;谭钜源
4.基于因子分析与K-means聚类的退役动力电池快速分选方法 [J], 张朝龙;赵筛筛;章博
5.基于因子分析与改进K-means聚类的交通状态判别 [J], 高艳艳;陈秀锋;曲大义;陈伟
因版权原因,仅展示原文概要,查看原文内容请购买。
聚类分析在任务定价规律中的应用
聚类分析在任务定价规律中的应用摘要针对“众包”形势下的任务定价问题,主要通过数据分析,选取任务地点研究任务的定价规律。
首先将任务定价分区,根据所作散点图可知数据存在辐射圈,利用K 均值聚类算法解出三个聚类中心点。
进而,拟合求得三点对应的任务位置和定价的关系式,检验得到三个关系式的平均偏差比,即可以反映任务定价的规律。
关键词定价;聚类分析;定价分区;辐射圈前言聚类问题实际上是将一组数据分成若干个组,每个组里的对象具有很大的相似性,不同的组之间存在尽量大的差异性。
在这些组之间寻找数据之间内在的联系。
这个过程实际上是一中在无监督状态下寻找最优划分的过程[1]。
聚类算法一般有五种方法,最主要的是划分方法和层次方法两种。
其中层次聚类由不同层次的分割聚类组成,层次之间的分割具有嵌套的关系。
本文主要应用K-means 算法解决任务定价规律问题。
1 数据的获取与假设本文数据均来源于2017 年全国大学生数学建模竞赛题B题[2]。
为方便求解,提出以下两点假设:①将经纬度坐标系下的两点间的距离公式看作直角坐标系下的两点间距离公式;②假设不考虑天气等自然因素的影响。
2 任务定价规律2.1 任务定价分区首先,将数据中的任务定价按照从高到低的顺序分为五个区域,其中的第一、第二、第三、第四、第五区间为定价分别85~75、74.5~72.5、72~70、69.5~67.5、67~65;数据中任务地点主要涉及的地区自西向东依次为广东的佛山市、广州市、东莞市以及深圳市。
2.2 运用K均值聚类法求解辐射圈中心点以全部定价和定价为85的数据作散点图,可知数据存在点聚集现象,说明数据存在辐射圈。
K均值聚类算法能实现类内相似度最高和类间相似度最低且能达到局部最优。
利用SPSS求得4种聚类结果,最终分析选择聚类中心点数为3的情况,结果如下表1所示:2.3 利用拟合求解任务位置和定价的关系式各散点到其聚类中心点的距离为,利用EXCEL结合表1得到了各点到三个聚类中心点距离;将上述距离和定价利用Matlab 软件分别拟合得到三条曲线,拟合得到聚类点的函数关系式分别为:2.4 检验建立的函数关系式3 结束语本文考虑距离对任务定价的影响,分别以2个、3个、4 个、5个聚类中心进行分析,最后确定以3个聚类点来分析。
优作鉴赏-基于聚类分析的双目标优化定价模型(1)
模型求解
.1 根据任务位置分布进行 K-Means 聚类分析 • 首先将新任务通过 K-Means 聚类方法聚成 4 类,即找到四个基本聚类中心, 聚类算
问题四的模型建立与求解
• 问题四要求给出附件三中的新项目的任务定价方案,任务数 据只有位置信息。 首先考虑,新项目的任务定价方案基于 之前建立的定价模型,用影响因子的数值、定价、完成度数 据作为样本,建立神经网络预测模型。
基于多层聚类的神经网络模型建立
• 根据任务位置分布进行 K-Means 聚类分析:在广东省的南部,呈现出部分集中。位置的地理位 置分布在很大程度上会 响其定价,在城市中心地带,交通便利,人口密集,商业繁华,因而分 布着大量 的任务,并且任务定价相对较低。据此可以推断,相对分散的特点。任务的位置距离 其所处区域的 密集分布中心点的距离会影响其定价。仿照模型一确定任务的四类基本聚类中心, 然后参照模型三对所有任务进行 聚类,得到影响因素的值,并作为神经网络模型的样本,通过 预测可得新任务打包下定价与完成度。
• (3)信誉高者优先获得竞争任务 • (4)可多次预定任务 • (5)某任务对会员的吸引度不小于阈值时,任务被预定并完成
双目标优化模型的约束条件是根据以上规则来设定的
流程图:
问题三的模型建立与求解
• 1 聚类分析确定打包方案
判断任务的位置分布,从而确定打包方案。将位置较为集中的任务联合打包发布, 合理分配任务包内的任务数量,从而提高了任务完成的效率。利用聚类分析的方法,从位 置分布 上对任务进行准确、细致的分类,对于合理的分类,直接将此类中的任务联合打 包。对于不合理的分类,我们将对分类结果进一步调整后再打包。
基于K-means聚类算法的任务定价
An Empirical Analysis of Task Pricing Based on Kmeans Clustering Algorithm
作者: 朱家明[1];曹绮琦[2];潘雪航[2];钱礼会[1];李春忠[1] 作者机构: [1]安徽财经大学统计与应用数学学院,安徽蚌埠233030;[2]安徽财经大学财政与 公共管理学院,安徽蚌埠233030 出版物刊名: 厦门理工学院学报 页码: 85-90页 年卷期: 2018年 第3期 主题词: 定价模型;任务定价;K-means聚类算法
基于聚类分析的双目标优化定价模型
图 2 已结束任务在地图上的位置分布示意图
根据该项目各个任务在地图上的分布状况,我们可以清晰直观地观察到各个 任务的位置信息, 直观的结果显示在城市中心任务数据拟合点密集程度高,因此 为了进一步观察每项任务的地理位置与其定价的信息,利用 Matlab 的曲线拟合 工具箱 CFTOOL 做出每项任务的经度、纬度以及定价状况的三维曲线拟合图,如 图 3 所示:先要求我们根据一项已完成项目的任务数据中的每个任务的位置、 定价和完成情况来分析任务定价规律。在经济学中,一个竞争性市场上的商品价 格规律受到供求关系影响而上下波动,因此,要分析定价规律,便需要找到影响 定价的因素, 对于每一个任务而言,它的定价与完成情况会受到其它任务与会员 的影响, 我们将从这两大方面考虑任务定价的影响因子,定义影响任务定价的四 大影响因子。 首先,我们将利用任务数据的经纬度与定价信息来进行图像分析,观察出定 价的定性规律,在此基础上,将标定任务位置的空间数据进行离散化处理,并根 据任务的位置分布进行 K-Means 聚类分析, 结合附件一给出的数据将影响因子量 化。最后,利用灰色关联度矩阵计算各影响影响因子与定价之间的相关度,定量
4
每个任务的定价受到其周围任务的数量、会员的人数分布及其信誉属性的影 响,为了定量分析这种影响,首先将每个任务的位置信息,即空间数据,进行离 散化处理。 找出任务所在的经纬度范围作为总区域,将总区域划分为若干单位网 格,以便统计每个网格内的任务数据与会员数据。由于任务分布范围较广,定价 规律可能存在分布区域间的差异,因此,根据任务的经纬度坐标对这些散布的位 置点进行 K-Means 聚类分析,得到位置分布相近的任务簇与中心点。接着,确定 对任务定价产生影响的四大因子, 根据空间数据离散化处理与 K-Means 分析的结 果将影响因子量化。得到影响因子的数值后,结合任务的定价数据,利用灰色关 联度矩阵来分析每个影响因子与任务定价之间的相关度, 得到任务定价规律的量 化结果。 最后,由于未完成任务与已完成任务的相关度矩阵之间一定存在某种差异, 通过比较它们之间的差异找出任务未完成的原因。 具体的思路流程图如下:
量价k-means聚类算法
量价k-means聚类算法量价k-means聚类算法是一种常用的基于PAC指导下的聚类分析方法。
在量价k-means 聚类算法中,我们将股票的每日成交价格和成交量作为样本数据,使用聚类算法来对股票进行分类,即将相似的股票分到同一类中,而将不相似的股票分到不同的类中。
这种分类可以帮助投资者更好地了解市场,找到具有不同市场行为的股票。
在本文中,我们将介绍量价k-means聚类算法的基本原理、应用、算法流程以及算法的优劣势等方面。
1.1 聚类算法的基本概念聚类算法是一种无监督的学习方法,主要用于将相似的样本数据划分为同一个簇,而将不同的样本数据划分到不同的簇中。
在聚类算法中,我们要求同一簇内的样本数据之间尽量相似,而不同簇内的样本数据之间尽量不相似。
量价k-means聚类算法主要是基于k-means聚类算法。
与传统的k-means聚类算法只使用样本数据的特征值进行分类不同,量价k-means聚类算法还考虑了样本数据的量价两个因素,从而在分类时更加准确、有效。
2.1 股票分析股票分析是量价k-means聚类算法的主要应用之一。
通过对每只股票的成交价格和成交量进行聚类分析,可以将股票分为不同的类别,以便投资者更好地了解市场行情,找到具有不同市场行为的股票,从而进行更加精准的投资决策。
2.2 电子商务电子商务也是量价k-means聚类算法的一个重要应用领域。
在电子商务中,聚类算法可以应用于用户购物行为分析、产品推荐等方面,具有重要的应用价值。
3.1 初始化首先,我们需要进行初始化,即随机选择k个数据点作为聚类中心,这k个聚类中心对应了分类结果的k个类别。
3.2 计算距离然后,我们需要计算每个样本与聚类中心的距离,计算方法可以使用欧几里得距离或曼哈顿距离等。
接着,我们需要计算每个聚类的质心,即将属于该类的所有样本的特征值求平均值。
3.4 分配数据点现在,我们将每个数据点分配到离其最近的聚类中心所在的簇中。
3.5 重新计算聚类中心重新计算每个簇的聚类中心,得到更新的聚类中心。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第17卷第2期VoL.17No.2实验科学与技术Experiment Science and Technology2019年4月Apr.2019基于K-means聚类分析的任务定价方案宋争艳1,王振坤2,尹奕1,李厚彪3(1.电子科技大学计算机科学学院,四川成都611731;2.电子科技大学光电信息学院,四川成都611731;3.电子科技大学数学科学学院,四川成都611731)摘要该文研究了“拍照赚钱”的定价问题。
基于K-means聚类分析,建立了任务定价与任务周围的会员个数、会员的信誉度、会员开始预定任务的时间及任务距离位置的定价模型;利用逻辑回归函数预测任务是否可以完成来评价模型的完成度;最后利用该算法得到的任务定价与APP给出的定价对比,验证了模型的正确性。
另通过建立“打包”定价模型,在总任务价格不变的情况下,打包后任务点的完成度由打包前的70.5%提高到80.3%,打包对于任务完成情况有了明显的改善。
关键词K-means聚类分析;信誉度;逻辑回归函数;完成度;改善中图分类号O151.2文献标志码A doi:10.3969/j.issn.1672⁃4550.2019.02.012Pricing Scheme Based on K-means Clustering AnalysisSONG Zhengyan1,WANG Zhenkun2,YIN Yi1,and LI Houbiao3(1.School of Computer Science and Engineering,University of Electronic Science and Technology of China,Chengdu611731,China;2.School of Optoelectronic Information,University of Electronic Science and Technology of China,Chengdu611731,China;3.School of Mathematics Sciences,University of Electronic Science and Technology of China,Chengdu611731,China)Abstract This paper mainly studies the pricing problem of“photographing to make money”.Based on the K-means cluster anal⁃ysis,the pricing model of the task pricing and the number of members around the task,the credibility of the members,the time when the members start the scheduled tasks and the location of the task distance are established.The logistic regression function is used to predict whether the task can be completed to evaluate the completion of the model.Finally,the task pricing obtained by the algorithm is compared with the pricing given by APP,and the correctness of the model is verified.In addition,by establishing a packaged task points is increased from70.5%before packaging to80.3%when the total task price is unchanged.The packaging has a significant im⁃provement on the task competition.Key words K-means clustering analysis;the degree of credibility;logic regression function;completion;improvement随着移动互联网的快速发展,出现了基于移动互联网的自助式劳务众包平台。
“拍照赚钱”是其中一种自助式服务模式,用户下载APP成为会员,再从APP上领取拍照任务,为企业进行商业检查和信息搜集,同时赚取酬金。
因此APP上的任务定价成为APP的核心要素,定价合理与否关系任务是否被领取以及完成的关键[3]。
本文建立了一种任务定价模型,该模型基于K-means聚类分析[1]得到“拍照赚钱”问题中任务定价与任务位置、任务周围的会员个数、会员的信誉度以及会员开始预定任务时间的关系,并利用这些关系对任务进行分类,从而求得未完成任务的最优价格,对原价格进行修正。
同时,建立以已完成任务为训练集的逻辑回归预测模型,计算修正后任务完成度从而对修正后价格进行检验。
对此类众包平台在任务的定价问题上具有一定的指导意义。
收稿日期:2017-11-09;修回日期:2018-07-23基金项目:国家自然科学基金(51175443,11101071);四川省科技支撑计划(2015GZX0002);高等学校大学数学教学研究与发展中心教学改革项目(CMC20160403)。
作者简介:宋争艳(1997-),女,本科生,计算机科学与技术专业。
通信作者:李厚彪(1976-),男,博士,副教授,主要从事数学建模、数学实验方面的工作。
E-mail:lihoubiao0189@2019年4月实验科学与技术1建模前分析考虑到对任务价格建立定价方案,而任务的定价与众多因素相关,我们参考2017高教社杯全国大学生数学建模竞赛B 题中附件相关数据对任务定价进行分析。
对附件中的任务开始预定任务时间、会员信誉度、会员分布以及已知任务的价格进行分析,从而得出与任务的定价相关的因素。
1.1开始预定任务的时间我们将时间分为6个阶段,分别统计已完成任务和未完成任务在这6个阶段开始预定任务的会员人数所占的比例。
这6个阶段分别6:30-6:45、6:45-7:00、7:00-7:15、7:15-7:30、7:30-7:45、7:45-8:00,某一类任务中会员在这6个时间阶段开始预定任务的人数占总人数的比例如表1所示。
由表1可知,未完成的任务虽然会员个数多,但是大多数会员开始预定任务的时间比较晚。
1.2价格由图1和图2发现,有些会员个数多的地方仍然会有一些任务没有完成,我们猜测是因为任务的价格太低,会员的积极性不高,因此我们用会员信誉度分布图替代会员分布图。
图中横轴表示纬度,纵轴表示经度,并用颜色深浅变化反映价格和信誉度变化趋势:图1中任务价格区间为65~85元,颜色分别由深到浅表示价格逐渐提高;图2中颜色由深到浅表示信誉度逐渐提高。
由表2可知,没有完成的任务与价格有一定的关系。
1.3信誉度由图1和图2可知,在一些会员聚集、价格较高但是还是没有完成的任务周围,会员的信誉度较低,所以信誉度低也是任务没有完成的因素之一。
2定价模型的建立首先,在不考虑会员开始预定任务时间的情况下对任务定价的分析。
利用高斯变换,将任务位置坐标和会员位置坐标转换成平面坐标。
大地坐标与平面坐标(x ,y )存在函数关系,可参考文献[1]得其具体形式为:表1各时间阶段开始预定任务的人数占总人数比例任务编号1234完成状态0101会员人数234293第一阶段13.00%50.00%10.30%66.70%第二阶段4.30%0.00%6.89%0.00%第三阶段8.70%50.00%10.30%33.33%第四阶段13.00%0.00%6.90%0.00%第五阶段0.00%0.00%0.00%0.00%第六阶段60.90%0.00%65.50%0.00%表中完成状态中的0代表未完成,1代表已完成。
图1未完成任务图2会员信誉度表2价格表经度/(°)23.0440423.1136022.8846022.7679022.88214纬度/(°)112.9215113.0153113.2183113.2924113.2179任务状态11010价格71.573.568.070.068.5··52第17卷第2期宋争艳,等:基于K -means 聚类分析的任务定价方案ìíîïïïïïïïïïïïïx =X +N 2sin B cos Bl 2+N 24sin B cos 3B × (5-l 2+9η2+4η4)l 4+N 720sin B cos 5B × (61-58t 2+t 4)l 6y =N cos Bl +N 6cos 3B (1-t 2+η2)l 3+ N 120cos 5B (5-18t 2+t 4+14η2-58t 2η2)l 5式中,X 为维度B 对应的子午线弧长(m ),N 为所求点对应的卯酉圈子午线半径(m )。
转换后可以求出任意两个位置之间的距离,距离公式为:d ij =[(x i -x j )]2+[(y i -y j )]22由此任务周围会员的个数计算如图3所示。
图中,r =30,圆心为任务位置,圆形区域中会员的个数就是任务周围会员的个数。
然后我们将任务周围会员的平均信誉度作为任务周围会员的信誉度,其计算公式如下:H (i )=1n ∑j =1nτj式中,τj 为第j 个会员的信誉值,n 为任务点周围会员的个数。
在K-means 中算法总会给任务贴一个标签,但是每一类的最开始的点是随机的,所以我们改变任务的价格,使得它到它属于的那一类的平均距离最小,写出任务到所属类的距离。
距离函数为:L =式中,n 为该类中任务的个数,x 0j 为要定价格任务的第j 个指标,x ij 为该类中第i 个任务的第j 个指标。
目标函数为:min L当求得距离函数L 最小时,即可得到任务点处的较为合理的价格。
3模型的修正3.1与原始数据的对比计算出来的结果与原始数据对比,如表3所示(仅为部分数据)。
从表3可知,用本文模型计算出的数据与APP 给出的数据相对误差足够小,这在一定程度上证明了我们模型的正确性。