2017数学建模B“拍照赚钱”的任务定价模型
基于最短距离的打包任务定价模型
Wide Angle | 广角MODERN BUSINESS现代商业184基于最短距离的打包任务定价模型席蒙雨 刘婵 西北政法大学 710122摘要:随着科学技术的不断发展,我们的生活中出现了拍照赚钱这种自助式的劳务众包平台,会员可在APP上接受并完成任务来获得一定的酬金,所以APP中每一任务的定价多少就会成为该任务完成与否的关键因素。
本文针对2017全国大学生数学建模竞赛B题数据,通过MATLAB软件计算出众多会员距每一任务位置的最短距离,找到距打包任务总距离最短的会员,并以此为基础建立了打包任务定价模型,找到了切实有效的任务定价方案,从而提高了任务的完成效率。
关键词:拍照赚钱;最短距离;最小二乘法;打包任务;等差次序定价一、问题的提出与分析(一)问题的提出“拍照赚钱”是移动互联网下的一种自助式服务模式。
用户下载APP,注册成为APP的会员,然后从APP上领取需要拍照的任务(比如上超市去检查某种商品的上架情况),赚取APP对任务所标定的酬金。
但是如果任务定价不合理,有的任务就会无人问津,而导致商品检查的失败。
而实际情况下,多个任务的位置可能是比较集中的,导致用户会争相选择,所以有的企业会考虑将这些任务联合在一起打包发布。
在这种考虑下,企业应如何修改原先的任务定价,对打包任务进行定价,而这种定价方案又对任务的完成情况有什么影响呢?(二)问题的分析本文我们需要解决的问题是对打包任务进行合理的定价,使得任务能快速有效的完成,所以首先我们需要建立一个数学模型来帮助问题得到更好的解决,利用MATLAB软件求出距每一任务位置最短距离的会员位置,并由他来完成任务。
利用最小二乘法对最短距离和原先的任务定价做简单线性回归,得到样本回归函数。
其次利用之前MATLAB得到的数据,找到完成打包任务总距离最短的会员,将最短总距离代入样本回归函数,得到打包任务的总报酬。
最后将总报酬合理地分配到打包任务的每一任务上,得到优良的打包任务定价方案。
2017数学建模B“拍照赚钱”的任务定价模型
“拍照赚钱”的任务定价模型摘要本题要求分析“拍照赚钱”任务的服务模式,研究其定价规律,并设计新的任务定价方案,结合实际情况,修改定价模型,最终对新项目设计任务定价方案,并评价方案的实施效果。
求解的具体流程如下:针对问题一:为了研究项目的定价规律,分析任务未完成的原因,利用附件一的信息,在地图上定位所有坐标的位置,发现任务集中在广东、东莞、佛山、深圳四市,分别标明每个城市的成功任务和失败任务。
以深圳为例,对深圳市任务进行聚类分析,结果分成5类,由相应任务的定价可以得出,人口密集处定价较低,人口稀少处定价较高的定价规律。
将附件二的位置信息同理在地图上定位,分别计算任务周围的会员数,分析其与定价的联系。
针对问题二:由问题一结果可知,任务定价与任务周围人数和任务周围人口密度等因素有关。
利用网络爬虫爬取广州、东莞、佛山、深圳四市医院,学校,小区,超市四种人口密度较大场所的经纬度,统计成功任务周围十公里人口密集场所。
用RBF神经网络模型,从而确定新的定价方案。
将此方案与原方案进行比较,得出两种定价方案的差异。
针对问题三:为了解决用户争相选择位置集中任务等问题,可将多个任务联合打包,以便用户更好得执行任务。
利用问题二中RBF神经网络模型求出新的定价方案下的任务定价;同问题一,求任意两个任务之间的距离。
当两个任务之间的距离小于一定值时,便可将这两个任务种做打包处理。
对于打包的任务,可将每个任务的定价结合附近会员的信息求出最终定价;对于未打包的任务,任务定价不变。
针对问题四:为了对新项目设计定价方案,并评价方案的实施效果,将新项目中任务的位置定位于地图上,可以发现任务集中分布于两个区域,且两个区域距离较远,可认为互不影响。
结合前面问题的分析,可知任务定价与区域的经济发展情况和用户到任务的距离有关。
对用户而言,用户将优先选择距离较近且定价较高的任务,因此,可以使用灰度关联分析的方法,建立不同任务对会员的吸引力,从而对定价方案做出评价。
“拍照赚钱”的任务打包定价模型
由表1中可以看到,Hosmer-Lemeshow卡方统计量为24.927, 自由度为8,对应的P值为0.002<0.01,所以得出的模型是整体显著 的。从表2中的Wald统计量及其P值来看,任务GPS纬度和任务标价 对应的P值小于0.01,通过了1%水平下的显著性检验;任务GPS经 度的P值小于0.1,表明在10%的水平下显著。各个参数结果如下:
0.6251提升到0.7713,证实了任务打包模型对企业降低成本,提高任务完成度有积极影响的假设。
关键词:任务定价 Logistic模型 k-标识码:A
文章编号:2096-0298(2018)05(b)-180-02
随着中国经济实力的不断增强、互联网的快速发展、企业成本 的增加,网络群众的力量开始被越来越多的企业所重视。众包作 为一种创新的电子商务模型,帮企业节约了大量的资金,在市场上 占据着越来越重要的地位“。拍照赚钱”是一种基于移动互联网的 自助式劳务众包平台,任务定价对用户能否获得满意的劳动报酬 和降低成本(时间成本、经济成本)具有重要的影响作用。如果任务 的标价不合理,就会造成有的地方会员争先选择,而有的地方却无 人问津。本文基于这种现状将任务打包处理,以此吸引会员完成任 务,降低企业成本。
在上式中,解释变量 每增加一个单位时,发生比 就变为原 来的 倍。当 >0时,发生比会随着 的增加而增加;相反当 <0时,发生比会随着 的增加而减小。
接着依据极大似然法,借助SPSS软件进行回归分析,将835组 数据代入Logistic模型中,对 、 、 的值进行估计,可以得到表 1、表2。
表1 模型整体显著性的Hosmer-Lemeshow检验结果
文基于2017年数学建模竞赛B题“拍照赚钱”的数据,运用Logistic回归建立模型,得出任务地理位置是影响任务完成度的最重要因素。
建模国赛B题
2017高教社杯全国大学生数学建模竞赛承诺书我们仔细阅读了《全国大学生数学建模竞赛章程》和《全国大学生数学建模竞赛参赛规则》(以下简称为“竞赛章程和参赛规则”,可从全国大学生数学建模竞赛网站下载)。
我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。
我们知道,抄袭别人的成果是违反竞赛章程和参赛规则的,如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。
我们郑重承诺,严格遵守竞赛章程和参赛规则,以保证竞赛的公正、公平性。
如有违反竞赛章程和参赛规则的行为,我们将受到严肃处理。
我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。
我们参赛选择的题号是(从A/B/C/D中选择一项填写):B我们的参赛报名号为(如果赛区设置报名号的话):所属学校(请填写完整的全名):参赛队员(打印并签名):1.2.3.指导教师或指导教师组负责人(打印并签名):(论文纸质版与电子版中的以上信息必须一致,只是电子版中无需签名。
以上内容请仔细核对,提交后将不再允许做任何修改。
如填写错误,论文可能被取消评奖资格。
)日期:2017年9月17日赛区评阅编号(由赛区组委会评阅前进行编号):2017高教社杯全国大学生数学建模竞赛编号专用页赛区评阅编号(由赛区组委会评阅前进行编号):赛区评阅记录(可供赛区评阅时使用):全国评阅编号(由全国组委会评阅前进行编号):“拍照赚钱”的任务定价摘要本文就企业做市场调查时采取的“拍照赚钱”模式的定价规律展开研究。
我们绘制了任务点在地图上的位置后,发现任务点围绕深圳、广州、佛山、东莞四个城市的中心点呈散射状分布,并根据城市具体情况及会员信息逐步建立更加适应实际情况的任务定价模型。
“拍照赚钱”的任务定价模型
“拍照赚钱”的任务定价模型摘要:本文通过数据分析对任务定价方案进行了研究。
关键词:BP神经网络模型多元线性回归打包分布定价模型任务定价引言“拍照赚钱”是移动互联网下的一种自助式服务模式。
用户下载APP,注册成为APP的会员,然后从APP上领取需要拍照的任务(比如上超市去检查某种商品的上架情况),赚取APP对任务所标定的酬金。
这种基于移动互联网的自助式劳务众包平台,为企业提供各种商业检查和信息搜集,相比传统的市场调查方式可以大大节省调查成本,而且有效地保证了调查数据真实性,缩短了调查的周期。
1.任务定价方案的确立1.1任务定价方案的分析综合考虑地理位置、区域内的平均信誉值、会员人数的权值和平均任务量对任务定价的影响,选取完成任务情况为1的所有数据的75%采用基于最小二乘法的方法进行拟合,用剩余的25%的数据作为检测数据,采用两独立样本T检验的方法判断原始数据与拟合后解得的数据是否具有显著性差异。
然后利用神经网络模型预测会员的任务完成度与原始数据进行比较来判断所给价格是否合理。
1.2任务定价方案模型的建立与求解1.2.1目标值与指标值的确立目标值:Y表示定价值。
指标值:X1表示在[0~500]范围内指标平均会员数与平均信誉值的合成指标。
X2表示在[500~1500]的合成指标;X3表示在[1500~2500]的合成指标;M1表示平均任务量。
1.2.2基于最小二乘法的目标值与指标值的拟合函数求解根据最小二乘法的模型代入目标值与指标值可得参数指标。
利用MATLAB进行拟合得出各统计值。
1.2.3模型检验为了使模型的定价结果更为合理,我们建立任务定价拟合值与实际值的独立样本T检验模型,对模型的定价进行检验。
两独立样本t检验的原假设为:拟合值与实际值的均值无显著性差异。
给定显著性水平α=0.05,若T检验统计量和概率P值小于1-α,则接受原假设。
用spss 分析两独立样本的显著性差异。
由表9得当t=(3.87,6.299)时p=0.665可知比给定1-α小,所以接受原假设,说明对测试集的拟合值与实际值之间无显著性差异,即拟合的方程成立。
“拍照赚钱”的任务定价-全国大学生数学建模竞赛
M
N
Q Q
四. 问题分析
4.1. 问题一分析 问题一要求我们探索定价规律及研究任务未完成的原因。 从系统角度出发考 虑每个任务的定价有两个方向:任务与用户的关系、任务与任务的关系。从这两 个角度考虑,我们可以进一步分析任务与用户的关系主要有任务周围用户数量, 任务周围用户密度等;任务与任务之间的关系主要为任务的离群程度。 我们可以对以上因素量化, 并分别将定价与以上因素进行函数拟合,利用拟 合度判断定价是否与以上因素有关。 接着根据有关的因素对完成的任务与未完成 的任务分别进行分析,判断任务未完成的具体原因。 4.2. 问题二分析 问题二要求我们设计新的任务定价方案,并和原方案进行比较。这是一个博 弈问题的优化,博弈双方是定价与成功率。我们的目标是成功率尽可能高,定价 尽可能低。成功率除了与定价有关,还与问题一中的若干影响因素有关。我们可 以回归分析得到成功率关于以上因素的函数关系。 接下去可以建立优化模型并求解。根据给出的数据集,我们寻找成功执行的 任务定价与未成功执行任务的定价之间的差距,并寻找合理的定价区间。以该区 间为约束, 分别就成功率最高及定价总和最低为目标,将其划分为两个优化模型 并求解能得出总定价固定的情况下成功率最高的定价方案以及成功率固定总定 价最低的定价方案。 得出方案后可以就成功率与定价与原方案进行对比来判断新 定价获得的效果。 4.3. 问题三分析 问题三要求考虑多任务打包发布,修改定价并分析对任务完成情况的影响。 由于本题任务点分布不均匀,我们考虑对 DBSCAN 算法进行改进:算法的半径 改为得分半径,成功率高的点得分高,成功率低的点得分低。为了提高成功率, 我们将成功率低的点与成功率高的点打包。打包后还需要分析打包的合理性,即 打包任务周边会员的信誉、限额等因素,如果合理就保留该包,不合理就打散该任务本身价值、 路途花费。即任务打包后任务的本身价值不变,但由于路途花费(包括时间、交 通费用)减少,在系统定价时打包的任务总价低于原定价总和。根据原数据找到 任务本身价值、路途划分、总定价三者的关系,再根据问题二得到的优化模型进 行最优定价搜寻,最终可以对比打包前后成功率的变化情况来体现打包的效果。 4.4. 问题四分析 问题四给出了一个新项目,要求给出我们的定价方案及评估方案实施效果。 将数据代入问题二得到的定价模型以及问题三得到的打包模型进行求解, 输 出每个任务定价与成功率数据,并对结果进行分析。
“拍照赚钱”任务定价分析
一、引言“拍照赚钱”是移动互联网下的一种自助式服务模式,会员从APP上领取拍照任务,赚取对应报酬,帮助企业进行商业信息的搜集和调查[1]。
拍照任务定价是核心问题。
若定价过低,无人领取任务;定价过高,企业成本过高。
本文根据2017年大学生数学建模竞赛B题的样本数据,分析定价的规律和任务未完成的原因,并对已有定价模型起进行优化,以提高任务完成度。
二、定价模型进行频数分析以初步了解价格高低的大致分布状况,可确定65元为任务最低起价,划定定价区间:低价区(价格小于70);较低价区(价格大于等于70且小于75);中价区(价格大于等于75且小于80);较高价区(价格大于等于80且小于85);高价区(价格大于等于85)。
建立多元线性回归模型分析价格规律,令价格为被解释变量,影响因素为解释变量,影响程度为回归系数。
下面根据样本数据确定这些影响因素所代表的解释变量及其对应的回归系数。
(一)“地理位置”(x1)问题背景提示任务多关于商业数据的收集,任务发布的密集地即是商业区的聚集地,应是城市的中心地区。
根据样本数据的经纬度作散点图,观察发现:低价区在地理位置上分布密集且聚集明显,与城市中心区有关联。
交通便利、人流密集的城市区,完成任务的成本和花费相对于交通不便的乡镇区更低,任务接受者更偏好于接受城市区的任务,即能够以相对更低的价格接受发布在城市的任务。
由如上分析可得:越靠近城市中心点,定价越低;离城市中心点越远,定价越高。
低价区任务点的分布提示城市区的分布,低价区任务点的分布边缘提示城市和乡镇的边缘。
确定“地理位置”为第一个解释变量(x1),将任务点按照地理位置划分为“城市区”和“乡镇区”。
观察散点图发现低价区呈三个中心不同的聚集区趋势,用K均值聚类分析对低价区任务点分成三个区域,等同于三个城市区,三个中心对应三个城市中心点的经纬度(23.102063490780132,113.27916890673757)、(22.97700771477778,113.75894413666668)、(22.62107796724637,114.00599721014495)。
2017数学建模高教杯全套
2017年高教社杯全国大学生数学建模竞赛题目(请先阅读“全国大学生数学建模竞赛论文格式规范”)A题CT系统参数标定及成像CT(Computed Tomography)可以在不破坏样品的情况下,利用样品对射线能量的吸收特性对生物组织和工程材料的样品进行断层成像,由此获取样品内部的结构信息。
一种典型的二维CT系统如图1所示,平行入射的X射线垂直于探测器平面,每个探测器单元看成一个接收点,且等距排列。
X射线的发射器和探测器相对位置固定不变,整个发射-接收系统绕某固定的旋转中心逆时针旋转180次。
对每一个X射线方向,在具有512个等距单元的探测器上测量经位置固定不动的二维待检测介质吸收衰减后的射线能量,并经过增益等处理后得到180组接收信息。
CT系统安装时往往存在误差,从而影响成像质量,因此需要对安装好的CT系统进行参数标定,即借助于已知结构的样品(称为模板)标定CT系统的参数,并据此对未知结构的样品进行成像。
请建立相应的数学模型和算法,解决以下问题:(1) 在正方形托盘上放置两个均匀固体介质组成的标定模板,模板的几何信息如图2所示,相应的数据文件见附件1,其中每一点的数值反映了该点的吸收强度,这里称为“吸收率”。
对应于该模板的接收信息见附件2。
请根据这一模板及其接收信息,确定CT系统旋转中心在正方形托盘中的位置、探测器单元之间的距离以及该CT系统使用的X射线的180个方向。
(2) 附件3是利用上述CT系统得到的某未知介质的接收信息。
利用(1)中得到的标定参数,确定该未知介质在正方形托盘中的位置、几何形状和吸收率等信息。
另外,请具体给出图3所给的10个位置处的吸收率,相应的数据文件见附件4。
(3) 附件5是利用上述CT系统得到的另一个未知介质的接收信息。
利用(1)中得到的标定参数,给出该未知介质的相关信息。
另外,请具体给出图3所给的10个位置处的吸收率。
(4) 分析(1)中参数标定的精度和稳定性。
在此基础上自行设计新模板、建立对应的标定模型,以改进标定精度和稳定性,并说明理由。
“拍照赚钱”任务定价的优化设计模型
财经管理“拍照赚钱”任务定价的优化设计模型刘宇飞1㊀毕意舜2㊀陈康宇3(1.电子科技大学自动化工程学院,四川成都611731;2.电子科技大学微电子与固体学院,四川成都611731;3.电子科技大学物理电子学院,四川成都611731)摘㊀要:分析了现有的任务定价规律,找出了导致任务未完成的原因,在兼顾会员和企业利益的前提下,首先建立了任务定价优化模型,在此基础上又建立了任务打包发布时的定价方案模型,并进一步探索出分时段优化方案.运用多目标遗传算法在M a t l a b 环境下编程求解,将各优化的定价方案实施效果与原定价方案进行对比,同时通过所建立的任务定价方案的评价指标体系对各定价方案的实施效果做出评价.关键词:K-均值聚类;高斯 牛顿法;多目标遗传算法;任务定价方案中图分类号:F 23㊀㊀㊀㊀㊀文献标识码:A㊀㊀㊀㊀㊀㊀d o i :10.19311/j .c n k i .1672G3198.2019.05.041㊀㊀随着互联网技术的不断发展,基于移动互联网的自助式劳务众包平台的 拍照赚钱 应用程序应运而生.企业通过此应用程序发布需要被完成的任务,用于商业检查和信息搜集.而设计应用程序时任务的定价是其核心要素.本文通过S P S S 软件分析相关性较高的指标,再使用M a t l a b 编程对已有样本数据进行非线性回归,提取已有的任务定价规律以及构建任务成功率预测模型.最后采用分时发布策略和打包发布策略完成定价优化模型.1㊀模型假设在建立数学模型时,为简化问题,挖掘问题本质,我们在建立模型时做出了如下假设:(1)各任务完成难易程度相同;(2)会员信誉度反映过往任务完成情况;(3)假设被预定任务均被完成;(4)假设信誉度高会员享有优先预定资格.2㊀模型建立2.1㊀确定现有任务定价规律分析(1)任务所处城市的确定.首先找出任务集中地区域,再将区域中心的经㊁纬度和地图进行对照,即可确定所有任务所处的若干城市.对于任务集中区域的确定,考虑基于K-均值聚类的方法,将所有任务依据经㊁纬度的相近程度进行聚类,从而得到所有任务集中分布的若干位置.图1㊀任务分布区域情况由图1可知任务发布的城市主要是广州㊁佛山㊁东莞和深圳.(2)拍照任务与周边会员信息关系的确定.为了方便对会员的信息进行定量分析,引入d a v 表示会员与任务的距离值;引入p s 代表任务定价范围内的预定任务配额数;引入t a v 表示任务定价范围内预定开始时间;引入T a v 表征任务定价范围内会员的信誉值.假设任务定价y 满足多元非线性关系式:y =b 0+b 1ˑd a v +b 2ˑp s +b 3ˑt a v +b 4ˑT a v +b 5ˑd 2a v +b 6ˑp 2s +b 7ˑt 2a v +b 8ˑT 2av (1)基于非线性最小二乘法的原理,采用M a t l a b 中的高斯 牛顿法对未知系数进行确定.2.2㊀任务定价方案的评价指标体系为了评价任务定价方案的实施效果,需要建立评价指标体系,结合对问题的分析,确定评价指标体系中存在任务总完成比例㊁任务总定价㊁任务定价效率㊁会员满意度和会员参与积极性5个指标.2.3㊀任务定价方案优化模型(1)任务成功率预测模型的建立.基于相关性分析,确定平均距离㊁任务标价㊁交通便利度和标价占最低工资比例这四个参数作为变量,对任务执行情况进行多项式非线性回归,可以得到任务成功率预测模型预测完成情况与实际完成情况对比后,发现平均偏差为10.2%,检验精准度达到89.8%.(2)考虑时间分布后的模型优化.探索任务分时间段分布的优化方案.分析发现总配额数在某一时刻之前满足指数减少规律,而之后出现配额量堆积,导致预定配额利用率大幅下降.针对原方案中配额利用率偏低的问题,进行优化处理,最终各项指标均有提高.2.4㊀任务打包发布时的定价方案模型首先对任务之间的距离进行计算,然后通过聚类将距离相近的任务分群.最后根据任务群周边信息和打包策略确定最终的定价方案.对比分析任务标价情况,发现打包后任务标价分布更加密集,任务标价相比打包前更加统一,更有利于提高任务成功率.3㊀算例分析以下对2017年高教社杯全国数学建模试题B 题的实验数据进行算例分析.结合所建立的评价指标体系,运用多目标遗传算法在M a t l a b 环境下编程求解.得到分时发布前㊁后的定价方案与原定价方案的实施效果评价如图2.图2㊀优化方案与原方案比较情况观察图2可知,优化方案总定价没有明显增长,保证了企业的长久发展;优化方案任务完成比例和定价效率有所提升;会员满意度和可持续参与性有所提升,表示定价方案具有长久发展的潜力.综合上述分析,优化任务定价方案实施效果优于原方案.4㊀结束语本文针对 拍照赚钱 应用程序所建立的任务定价优化设计模型,改善了现有定价方案的任务完成情况,对现有的任务定价方案的改进提供了较大的帮助.并且提出了一套较为合理的评价指标体系,该评价指标体系还可用于评价现实生活中其他定价方案的优劣.参考文献[1]夏恩君,王文涛.企业开放式创新众包模式下的社会大众参与动机[J ].技术经济,2016,35(01):22G29.[2]施战,辛煜,孙玉娥,黄河.基于用户可靠性的众包系统任务分配机制[J ].计算机应用,2017,37(09):2449G2453.[3]夏恩君,赵轩维.网络众包参与者行为的影响因素研究 基于小米网络众包社区的实证研究[J ].研究与发展管理,2017,29(01):10G21.[4]孙信昕.众包环境下的任务分配技术研究[D ].扬州:扬州大学,2016.[5]2017年高教社杯全国大学生数学建模竞赛赛题[E B /O L ].h t Gt p://w w w.m c m.e d u .c n /h t m l _c n /n o d e /460b a f 68a b 0e d 0e 1e 557a 0c 79b 1c 4648.h t m l大学生使用第三方移动支付风险防控研究张珊珊(安徽财经大学,安徽蚌埠233030)摘㊀要:我国电子商务蓬勃发展的背景下,第三方移动支付以一种创新的支付结算方式出现并在经济生活中普及.因此将从第三方移动支付的现状入手,通过文献研究法和案例分析法,站在第三方移动支付用户的角度上,对目前存在于我国第三方支付发展中用户面临的主要风险进行了分析研究,并提出相应的防风险建议,为推动我国第三方移动支付平台用户安全的保护提供参考.关键词:电子商务;第三方移动支付;风险防控中图分类号:F 23㊀㊀㊀㊀㊀文献标识码:A㊀㊀㊀㊀㊀㊀d o i :10.19311/j.c n k i .1672G3198.2019.05.0421㊀背景随着电子商务的蓬勃发展,交易双方在网络上进行交易,货款的交付以各自的商业信用为基础,交易双方都没有保障,因而传统的支付方式不能适应电子商务的需求.为相应线上交易的市场需求,马云先生创立了以支付宝为代表的第三方移动支付.商户与国内外资金雄厚㊁实力强劲㊁信誉良好的第三方独立机构如银行等签订契约,获得第三方机构的支持.在交易过程中,第三方机构提供支付结算平台,消费者使用第三方机构提供的账户信息进行网络交易.第三方代收消费者货款,并通知商家货款接收㊁开始发货;消费者收到货款并确认收货后,第三方将货款转到商家账户.所谓的第三方移动支付,即指 互联网第三方支付 ,也称 网络第三方支付 或 第三方支付平台 .第三方支付是一种网络支付结算方式,它以I n t e r n e t 为媒介,以网络支付为平台,以移动电话和智能手机为工具,依赖于与银行的协议合作关系,通过银行在支付中的代理和第三方支付机构以托收的方式完成支付,为资金流动和资金安全提供保障.2㊀第三方支付的发展现状根据中商产业研究院数据,中国第三方移动支付移动互联网用户规模递增.截至2017年12月,中国网民人数共计7.72亿,全年网民新增人数4074万,为第三方移动支付的推行和发展提供了良好的基础.手机用户规模不断扩大.根据中国工商业研究所(C h i n a B u s i n e s sI n d u s t r y Re s e a r c hI n s t i t u t e )2017-2022年发布的«中国第三方移动支付产业市场前景和投资机会研究报告»(R e s e a r c hR e po r t )显示,截至2017年12月,中国移动电话用户总数已达到7.53亿.与2016相比,人群的比例增加了2.4%.第三方移动支付交易总额持续不断增大.根据中商产业研究院数据,智能手机的普及和二维码支付市场的爆发加快了电脑到手机的消费者的迁移速度,预计2018年中国第三方移动支付交易总额,超过150万亿元,增至171.5万亿元,增长率为68.0%.第三方移动支付市场供过于求,同质化现象严重,存在过度竞争的现象.第三方支付平台内部管理松散混乱㊁内部风险控制薄弱,不具有保护消费者的意识.。
2017数学建模B题问题1解析——“拍照赚钱”的任务定价
2017数学建模B题问题1解析——“拍照赚钱”的任务定
价
徐小玲;戴蓉;薛治;杨祎晨
【期刊名称】《数学学习与研究:教研版》
【年(卷),期】2017(000)020
【摘要】本文以2017全国大学生数学建模A题为基础,对问题1给出详细解答,并对问题1的两种数学模型进行了比较分析.
【总页数】2页(P15-16)
【作者】徐小玲;戴蓉;薛治;杨祎晨
【作者单位】延安大学西安创新学院,陕西西安710100;延安大学西安创新学院,陕西西安710100;延安大学西安创新学院,陕西西安710100;延安大学西安创新学院,陕西西安710100
【正文语种】中文
【中图分类】G632.474
【相关文献】
1."拍照赚钱"的任务定价问题的建模与计算
2.2017年数学建模B题问题一与问题二解析——"拍照赚钱"的任务定价模型
3.“拍照赚钱”问题的任务定价解题思路
4."拍照赚钱"APP中任务定价与失败问题研究
5.基于“拍照赚钱”任务定价问题的分析
因版权原因,仅展示原文概要,查看原文内容请购买。
数模视角下“拍照赚钱”任务定价的分析与探讨
数模视角下“拍照赚钱”任务定价的分析与探讨概述“拍照赚钱”是一种基于互联网平台的零工经济模式,其本质是将图片拍摄作为一种零工,通过互联网平台让照片拍摄者与需求方直接联系,完成各种各样的照片拍摄任务,从而获取相应的酬劳。
伴随着移动互联网的不断普及和终端设备的更新换代,图像处理技术的不断提升以及人们对于个性化、专业化服务的需求不断增加,“拍照赚钱”这种新的零工经济模式在国内迅速兴起。
而对于平台上的“任务定价”问题,如何合理定价、公平分配成为一个需要面对的问题。
在这篇文章中,我们将从数学建模与数据分析的角度,尝试探讨“拍照赚钱”任务定价的分析与探讨。
模型建立参考数据集在建立模型之前,我们首先需要准备一些数据作为参考。
由于“拍照赚钱”模式下的任务类型与要求千差万别,数据的来源和质量也很难保证完全统一,因此我们这里选取一些网上公开的数据集进行参考。
具体来说,我们选取了:•青岛拍照赚钱平台(QDAZQP)上发布的任务(共1000条)•美图秀秀平台上发布的各种美妆、时尚图片(共5000张)这些数据都经过了初步的筛选和处理,以确保其具有足够的参考价值。
模型应用任务分类首先,我们需要将这些任务进行分类。
为了简化问题,我们仅考虑任务的类型、数量、难度三个维度,并分为以下几类:1.普通摄影:拍摄风景、人像等通用模式的摄影任务。
数量相对较多,难度相对较低。
2.商业摄影:拍摄产品、广告等商业用途的摄影任务。
数量相对较少,难度相对较高。
3.美妆照片:拍摄美妆、时尚等内容的照片任务。
数量较多,难度较低。
4.艺术照片:拍摄艺术、个性化等照片任务。
数量相对较少,难度相对较高。
成本计算为了计算任务的成本,我们需要考虑以下几个因素:1.拍摄成本:包括设备摄影器材、摄影师劳务费用等成本。
2.后期处理成本:包括后期剪辑、修图等成本。
3.平台运营成本:包括平台技术、客服、人工费等成本。
这些成本因素都可以通过数据统计和市场调查来获取。
在此之上,我们可以简单地采用成本加成法来计算任务的价格:$任务价格=成本\\times系数(1+税率)$其中,系数可以根据任务类型的难度和数量来进行调整,税率则依据相关法规和政策来确定。
基于多元线性回归的“拍照赚钱”的任务定价模型房越
基于多元线性回归的“拍照赚钱”的任务定价模型房越多元线性回归是一种常用的统计分析方法,用于研究多个自变量对一个因变量的影响关系。
在“拍照赚钱”的任务定价模型中,我们可以使用多元线性回归来建立一个数学模型,该模型可以用来预测拍照赚钱任务的定价。
在这个模型中,我们将考虑以下几个自变量对任务定价的影响:1. 照片质量:照片质量是一个重要的因素,通常用于衡量照片的清晰度、色彩还原度等。
我们可以根据专业标准来评定照片质量,例如使用图像处理技术来计算图像的清晰度指标、色差指标等。
基于以上自变量,我们可以建立如下的多元线性回归模型来描述任务定价:定价= β0 + β1 * 照片质量+ β2 * 拍摄长短+ β3 * 任务类型定价表示任务的定价,照片质量表示照片质量的评分,拍摄长短表示任务的拍摄时间(以分钟为单位),任务类型表示任务的种类。
在这个模型中,β0表示模型的截距,β1、β2、β3表示对应自变量的系数,表示自变量对任务定价的影响程度。
我们可以使用最小二乘法来估计模型的系数。
一旦估计出了模型的系数,我们就可以使用该模型来预测任意一个任务的定价。
如果我们已经知道某个任务的照片质量评分为80,拍摄时间为30分钟,任务类型为商品照片,我们可以代入上述模型,根据估计的系数来计算任务的定价。
需要注意的是,上述模型只是一种初步的建模方式,实际应用中可能还需要对模型进行改进和完善。
可以考虑其他可能影响任务定价的因素,例如任务的地理位置、任务的难度等。
也可以使用更复杂的模型来更好地刻画任务定价与自变量之间的关系,例如多项式回归、非线性回归等。
基于多元线性回归的“拍照赚钱”的任务定价模型可以帮助我们理解影响任务定价的因素,并进行任务定价的预测和优化,从而提高用户的满意度和收益。
基于“拍照赚钱”运行结果分析任务完成情况的模型
基于“拍照赚钱”运行结果分析任务完成情况的模型作者:薛从康朱美鑫李亦筱胡西娟来源:《现代营销·信息版》2019年第05期摘 ;要:“拍照赚钱”是移动互联网下的一种自助式服务模式. 较于传统的商业检查和信息搜集方式,具有多重优势,而这种服务模式的核心要素在于任务定价. 本文基于2017年大学生数学建模竞赛B题第一问通过最小二乘法拟合了任务定价与任务经纬度之间的函数关系,并分析了任务未完成的原因.关键词:任务定价;最小二乘法;原因分析新兴的“拍照赚钱”是移动互联网下的一种自助式服务,用户下载并注册成为该APP的会员,然后从APP上领取需要拍照的任务,赚取所标定的酬金。
这个平台为企业提供了各种商业检查和信息搜集,不仅节省了调查成本而且保证了数据的真实性,对市场调查等有重要意义。
本文通过最小二乘拟合二元函数曲线法拟合了任务的经纬度与任务价格的函数,得到了任务定价规律。
通过层次分析法分析了任务未完成的原因。
一、模型的建立与求解(一)数据说明本文数据来源于2017年大学生数学建模竞赛B题题目附件一已结束项目任务数据,数据共835组,包含任务编号,任务gps经纬度,任务标价和任务完成情况,真实有效。
(二)价格与任务密集程度的规律根据已知数据,运用MATLAB软件将任务的位置价格的综合空间分布图绘制如图(1)所示该图反映了价格与任务密集程度的关系。
从图中可以清晰的看出任务点的密集分布,当纬度在22.5-23的范围,经度在114-114.5的范围内任务点较密集。
当纬度在23-23.5的范围,经度在113-113.5的范围内任务点较为密集。
并且,任务点越密集,所给任务的价格水平处于较低状态;任务点越稀疏,即所给任务的价格水平处于较高状态。
我们得出结论,价格与任务的密集程度密切相关,任务的密集度与价格水平成反比。
(三)任务价格与任务GPS经纬度的规律为了量化任务定价与任务经纬度之间的关系,假设附件一中“任务的GPS纬度将附件一“已结束项目任务数据”数据项目中的“任务GPS经度”;“任务GPS纬度”与“任务标价”在Excel中做出新的表格,导入MATLAB中运用MATLAB分析其相互关系。
“拍照赚钱”任务定价的优化模型研究
Estimate
SE
tStat
pValue
x1
0������ 021795
0������ 0036414
5������ 9852
3������ 2084e - 09
x2
- 0������ 076196
0������ 049597
- 1������ 5363
0������ 12484
x3
- 0������ 63057
图 1 任务地点及会员位置的分布图
的焦点ꎮ 它基于移动式互联网自助式劳务众包平台已成为
对于价格与地区繁华程度的关系ꎬ提取出价格为 85( 红
现阶段我国第三产业经济发展的重要目标ꎬ对提升城镇居民 色) 和 65 ( 黑色) 的任务点并通过 MATLAB 作图可知ꎬ人流
生活质量、 完 善 经 济 结 构 功 能 和 提 高 国 民 经 济 具 有 重 要 量越大ꎬ任务定价越低ꎬ而任务定价较高的地方ꎬ大多分布在
关键词:任务定价ꎬ回归分析ꎻFCA 聚类ꎻ优化模型
个区间ꎬ这些区间的任务的密度最大ꎬ其次是价格为[ 70 ꎬ75 ] 的区�� 问题的背景
“拍照赚钱”是当前互联网领域的热点之一ꎮ 它是移动
互联网下的一种自助取 APP 对任务所标定的酬金ꎮ 这种快 速发展的自助式服务模式是当今各大商户和劳工密切关注
现象探析———基于某学生深陷 P2P 网络借贷困境案例 分析[ J]������ 高校辅导员ꎬ2016(3) :76 - 79������ [2] 任一帆ꎬ马旭峰ꎬ王欣丛 ������ 大学生校园贷存在的问题及 干预[ J]������ 高校辅导员学刊ꎬ2017ꎬ9(2) :75 - 78������ [3] 莫海英 ������ 互联网时代下高校辅导员如何加强学生校园 贷教育[ J]������ 时代教育ꎬ2017(15) :179 - 179������
“拍照赚钱”APP中任务定价问题分析及求解
对原 有 的定 价机 制进 行改 进 并 结合 会 员 的分 布情 况, 信 誉值 等 因素 , 给 出优 化 的 任 务分 配 方 案 , 实 现 以最 低 成本 取得 更高 任务 完 成率 。
合分析伪 。 最后 . 将未完成 的任务单 独提
取, 从任务的
分布和定价 、 当地 的会 员信 息 、 任务分 布区域 的经 济状 况、 交通因素等方面 . 分析任务 的完成情况
中. 导 致用 户会 争相选 择 . 一 种 考虑 是将 这些 任 务联 合在 一起 打包发 布 。在这种 考虑下 , 如何 修改前 面 的
图 1 未 完 成 和 已 完 成 任 务 分 布 图
图 1中展 示 了任 务 依 据 坐 标 位 置 在 地 理 七的
呈现 . 其中红色圆点表示未完成任 务. 黑 色 表 示 已 完成任务 , 通偶 对该 图 的 观 察 , 发 现 黑 色 的 点 即完 成 的任 务 呈 聚 集状 态 . 并 且 聚 集 中心 主 要 分 布 在 城
最 高 是本 文 的研 究重 点 , 、 关 键词 : 任务定价 ; 优 化 问题 ; 最低成本 ; 最 高 完 成 率
中图分类号 : TP 1 3 9
根据 题 目信息 . 可知“ 拍 照 赚钱 ” A P P中 的任 务 定价 、 任 务分 配不 尽合 理 。部 分任 务 无人 问 津 . 某 些
完 成率 . 并 且呈 负 相关
括 任 务 地 点 的 经
度、 纬度 、 任务标 价 和完 成情 况 。首先 , 需要 明确 , 任 务 的 位 置 是 如 何 影 响 其 定 价 的 可 以利 用 E X C E L 以及 B D P应用 程序 将 全 部 任 务 的 信 息 以 散 点形 式 在 地 图 上表 现 出来 . 利 用不 同颜 色 区分 完 成 与 未 完
2017年数学建模B题答辩
问题二结论:
Step 4 Step 3 Step 2 Step 1
附件一数据任务完成率: 1 yk 1 e a bx
ry k y y k
'
解得:K=70 a=15.88 b=0.263
s型函数表达式为:
求解得该方案的 总完成率为: 63.76%
y 70
1 1 e15.880.263 x
模型的建立
聚类一
以聚类中心为原点,进 行三维数据拟合,在
beta= β0=211325.6948 β1=-3361.860361 β2=-1746.595812 β11=14.78759851 β22=37.77958872 beta= β0=726669.9856 β1=-12797.0227 β2=96.98660991 β11=56.25613031
matlab中用多元二项式
拟合命令得出其任务定 价规律。
聚类二
rmse=4.12325810 2 剩余标准差 Rmse=4.123258 10173269 此回 归模型显著性较 好 rmse=3.75029808 剩余标准差 Rmse=3.750298 07962618 此回 归模型显著性较 好 rmse=3.686227282 剩余标准差 Rmse=3.68622728 188014 此回归模 型显著性较好
求解问题四的过程:
结论:
由已知的任务密度及区域中心点的 半径,我们可以做出定价如下:
区域 E
价格
备注
F
G
59-63(±1.886) 集 中 地 区 域 进 行打包处理, 63(±2.886) 区域边界按单 73(±2.360) 个任务处理。
5
模型的评价和改进
拍照赚钱任务定价模型(2017年全国大学生数学建模大赛B题)-国家二等奖论文
将该式定义为一致性指标,CI=0时A为一致阵;CI越大A的不一致程度越严重, 所以CI相当于除 外其余n-1特征根的平均值。为衡量CI的大小,引入随机一致 性指标RI,形成A,计算CI既得RI。如表3
3 成对比较矩阵和权向量 元素之间两两对比,对比采用相对尺度,设要比较各准则C1,C2,C3...,Cn
对目标的重要性
A (aij)n n, aij 0, aij 1/ aij
C1,C2,...,C4 依次表示 6 个是否完成影响因素:会员密度、交通情况、任务 位置、价格、任务难度和信誉度 6 个准则,用成对比较法得到准则层对目标的成 对比较阵:
1
815
.000 72.435
1.624
1
815
.000 69.468
-.034
2
814
.000 67.418
4.032 30.138
3
813
.000 65.619 51.044 -259.841 493.254
1
815
.000 66.682
1.233
1
815
.000 72.347
.023
1
815
.000
4.239
.000
1
815
.000
4.200
.209
1
815
.000 66.682
.209
1
815
.000
.015
.811
自变量为 距市区距离。
4
图 3 任务标价关于任务点距市区的距离拟合图
由表 2 的 R2 可知,通过任务标价关于任务点距市区的距离拟合出的函数中三 次函数的贴合度最大,因此选取三次函数进行分析。根据表 2 可知任务标价 y 关 于任务点距市区的距离 x 的三次函数如下:
2017年全国大学生数学建模竞赛A题一等奖
针对问题四,首先用 Matlab 软件画出附件三中 2066 个任务的位置分布图, 由此初步判断这些任务的可能执行情况。对于 APP 开发商而言,希望在给出最少 总定价的同时满足最多的任务被会员领取,故问题四属于双目标优化问题,可用 最优策略解决,建立双优化定价模型对新项目给出任务定价计划。对建立的模型 进行模拟仿真,从而评价该计划的实施效果。
附件一是一组已结束项目的任务数据,包括各项任务的位置、定价和完成情 况(“0”为未完成,“1”为完成);附件二是会员信息数据,包括其位置、信誉 值、根据其信誉给定预订任务限额及其开始时间,原则上信誉越高,会员越优先 选择任务,配额越高(任务按照预订限额所占比例分配);附件三是一组新的项 目任务检验数据,仅包含任务的位置信息。请根据以上信息解决下述问题: 1. 根据附件一所给的项目任务定价,探究其规律性,分析任务未完成原因。 2. 针对附件一的项目制定新的任务定价计划,并与原计划进行对比。 3. 多个任务可能由于位置较集中,在实际情况下会使得会员之间产生竞争。考
针对问题二,考虑到任务定价与位置和执行情况有关,故采用聚类分析,按 任务与领取该任务的会员间距离将任务位置主要分为四类,建立距离价格比模型 (DPP 模型),求得 835 个任务的具体定价;按任务完成率和定价之间关系,利 用 0-1 整数线性规划,建立最小总定价模型(TRM 模型),同样得到每一个任务 的具体定价。最后得到原计划、按距离制定的计划和按完成率制定的计划三者对 应的 APP 开发商需支付的最小总定价分别为 36446 元、60225 元和 33650 元。最 后,结合具体内容分析可得两个计划均比原计划合理。
2017年数学建模B题问题一与问题二解析——“拍照赚钱”的任务定价模型
现代商贸工业2017年数学建模B题问题一与问题二解析—“拍照赚钱”的任务定价模型张姣丽杨荣庆钟芸(西南大学商贸学院,重庆402460)摘要:拍照赚钱APP”是基于移动互联网下的一种信息共享平台,其成功与否与任务发布者的出价密切相关。
基于此,主要研究其的任务定价问题,采用多元线性回归模型,借助SPSS软件处理数据,并通过分析任务所在的经度、纬度、任务完成情况三个影响因素对任务定价的影响。
此外,借助插值和拟合模型求出原方案的拟合函数,利用MAT-LAB计算出定价的理想值,并设计新的定价方案,利用 AHP和原方案进行比较,得出新方案优于原方案。
关键词:任务定价;多元线性回归模型;插值与拟合模型;AHP中图分类号:G4 文献标识码:A d oi:10. 19311/k i.1672-3198. 2018. 05. 085“拍照赚钱”是一种基于移动互联网络的自助式劳务众包平台,其成功与否与任务发布者的出价密切相关,因而任务定价成为该平台的运行核心。
根据数据信息剔除附件一的异常数据,筛选出有效信息。
1问题一的模型建立与求解1.1确定影响因子分析附件一的数据,任务定价作为因变量,其它因 素作为影响因子,即:(1) 任务GPS纬度。
(2) 任务GPS经度。
(3) 任务执行情况。
利用M A T L A B得出图1。
图1任务定价与任务GPS纬度,任务GPS经度3D散点图1.2模型的建立与求解多元线性回归分析一般模型为:水平。
3.2.2 组建教师微课制作团队,构建会计微课资源体系为实现微课教学的教学实效性,就需要积极组建教师微课制作团队,构建会计微课资源体系。
首先对教师团队进行合理分工,然后讨论确定每门课微课选题,主要从章节重难点内容进行微课制作,通过合理、精确选题,更好地解决传统教学中不能解决的教学问题;构建各种微课资源群,学生可根据自己的实际学习情况,有侧重点地进行巩固学习;其次将制作的微课运用到会计教学中,做好精品课程的教学设计,培养一批勤于实践探索、善于反思总结、乐于奉献的科研型骨干教师,从而提高整体教学水平,推进学校的教学改革。
数学建模b“拍照赚钱”的任务定价模型
“拍照赚钱”的任务定价模型摘要本题要求分析“拍照赚钱”任务的服务模式,研究其定价规律,并设计新的任务定价方案,结合实际情况,修改定价模型,最终对新项目设计任务定价方案,并评价方案的实施效果。
求解的具体流程如下:针对问题一:为了研究项目的定价规律,分析任务未完成的原因,利用附件一的信息,在地图上定位所有坐标的位置,发现任务集中在广东、东莞、佛山、深圳四市,分别标明每个城市的成功任务和失败任务。
以深圳为例,对深圳市任务进行聚类分析,结果分成5类,由相应任务的定价可以得出,人口密集处定价较低,人口稀少处定价较高的定价规律。
将附件二的位置信息同理在地图上定位,分别计算任务周围的会员数,分析其与定价的联系。
针对问题二:由问题一结果可知,任务定价与任务周围人数和任务周围人口密度等因素有关。
利用网络爬虫爬取广州、东莞、佛山、深圳四市医院,学校,小区,超市四种人口密度较大场所的经纬度,统计成功任务周围十公里人口密集场所。
用RBF神经网络模型,从而确定新的定价方案。
将此方案与原方案进行比较,得出两种定价方案的差异。
针对问题三:为了解决用户争相选择位置集中任务等问题,可将多个任务联合打包,以便用户更好得执行任务。
利用问题二中RBF神经网络模型求出新的定价方案下的任务定价;同问题一,求任意两个任务之间的距离。
当两个任务之间的距离小于一定值时,便可将这两个任务种做打包处理。
对于打包的任务,可将每个任务的定价结合附近会员的信息求出最终定价;对于未打包的任务,任务定价不变。
针对问题四:为了对新项目设计定价方案,并评价方案的实施效果,将新项目中任务的位置定位于地图上,可以发现任务集中分布于两个区域,且两个区域距离较远,可认为互不影响。
结合前面问题的分析,可知任务定价与区域的经济发展情况和用户到任务的距离有关。
对用户而言,用户将优先选择距离较近且定价较高的任务,因此,可以使用灰度关联分析的方法,建立不同任务对会员的吸引力,从而对定价方案做出评价。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
“拍照赚钱”的任务定价模型摘要本题要求分析“拍照赚钱”任务的服务模式,研究其定价规律,并设计新的任务定价方案,结合实际情况,修改定价模型,最终对新项目设计任务定价方案,并评价方案的实施效果。
求解的具体流程如下:针对问题一:为了研究项目的定价规律,分析任务未完成的原因,利用附件一的信息,在地图上定位所有坐标的位置,发现任务集中在广东、东莞、佛山、深圳四市,分别标明每个城市的成功任务和失败任务。
以深圳为例,对深圳市任务进行聚类分析,结果分成5类,由相应任务的定价可以得出,人口密集处定价较低,人口稀少处定价较高的定价规律。
将附件二的位置信息同理在地图上定位,分别计算任务周围的会员数,分析其与定价的联系。
针对问题二:由问题一结果可知,任务定价与任务周围人数和任务周围人口密度等因素有关。
利用网络爬虫爬取广州、东莞、佛山、深圳四市医院,学校,小区,超市四种人口密度较大场所的经纬度,统计成功任务周围十公里人口密集场所。
用RBF神经网络模型,从而确定新的定价方案。
将此方案与原方案进行比较,得出两种定价方案的差异。
针对问题三:为了解决用户争相选择位置集中任务等问题,可将多个任务联合打包,以便用户更好得执行任务。
利用问题二中RBF神经网络模型求出新的定价方案下的任务定价;同问题一,求任意两个任务之间的距离。
当两个任务之间的距离小于一定值时,便可将这两个任务种做打包处理。
对于打包的任务,可将每个任务的定价结合附近会员的信息求出最终定价;对于未打包的任务,任务定价不变。
针对问题四:为了对新项目设计定价方案,并评价方案的实施效果,将新项目中任务的位置定位于地图上,可以发现任务集中分布于两个区域,且两个区域距离较远,可认为互不影响。
结合前面问题的分析,可知任务定价与区域的经济发展情况和用户到任务的距离有关。
对用户而言,用户将优先选择距离较近且定价较高的任务,因此,可以使用灰度关联分析的方法,建立不同任务对会员的吸引力,从而对定价方案做出评价。
关键词:聚类分析、RBF神经、灰色关联分析法、网络爬虫一、问题重述“拍照赚钱”是移动互联网下的一种自助式服务模式。
用户下载APP,注册成为APP的会员,然后从APP上领取需要拍照的任务(比如上超市去检查某种商品的上架情况),赚取APP对任务所标定的酬金。
APP是该平台运行的核心,而APP中的任务定价又是其核心要素。
如果定价不合理,有的任务就会无人问津,而导致商品检查的失败。
1.研究附件一中项目的任务定价规律,分析任务未完成的原因。
2.为附件一中的项目设计新的任务定价方案,并和原方案进行比较。
3.实际情况下,多个任务可能因为位置比较集中,导致用户会争相选择,一种考虑是将这些任务联合在一起打包发布。
在这种考虑下,如何修改前面的定价模型,对最终的任务完成情况又有什么影响?4.对附件三中的新项目给出你的任务定价方案,并评价该方案的实施效果。
二、模型假设1.会员对任务没有主观偏好,不会因为自身原因不完成任务;2.各个任务难度相等,不影响会员的选择;3.假设会员与任务间的距离都是直线距离,不受道路、河流等的影响;4.问题中所有数据都真实有效。
三、符号说明四、问题分析4.1 问题一分析问题一要求研究附件一中项目的定价规律,并分析任务未完成的原因。
首先应在地图中找出附件一中所有任务的位置,确定任务的分布规律,同时将附件二中会员的位置定位于地图。
观察出这些数据集中分布在广东、东莞、佛山、深圳四个城市。
以深圳市为例,对深圳的任务进行聚类分析,分析聚类结果,从而得出项目的定价规律。
分别计算每个任务与所有会员之间的距离,结合每个任务周围十公里的会员数与任务的定价,确定任务未完成的原因。
4.2 问题二分析问题一可明显看出任务价格与任务周围人数和任务所在地区人口密度等有关。
利用网络爬虫爬取广州等四市医院、学校、小区、超市等人口密度大的场所,统计成功任务方圆十公里内的人口密度大的场所个数。
使用RBF神经网络分析,用所获得的数据训练神经网络,从而确定新的任务定价方案。
将新的任务定价方案与附件一中的任务定价做出比较,说明两种定价方案的不同情况。
4.3问题三分析问题三要求将任务打包发布并设计新的定价方案,以解决用户争相选择等问题。
利用问题二中RBF神经网络模型求出新的定价方案下的任务的定价;利用问题一中两点经纬度坐标求出两点距离的计算方法求出每个任务与其他任务之间的距离,当两个任务之间的距离小于一定值时,便可将这两个任务种做打包处理。
对于打包的任务,可将每个任务的定价结合附近会员的信息求出最终定价;对于未打包的任务,任务定价不变。
4.4问题四分析问题四要求对一个新项目设计定价方案,并评价该方案的实施效果,将附件三中的任务的地理位置定位于地图上,可以发现任务集中分布于两个区域。
通过前面的问题分析可知,任务定价与地区经济发展水平和会员距离有关。
对会员而言,可以从任务的难易程度和会员到任务的距离两个方面判断会员对任务的偏好,从而使用灰度关联分析对的方法,建立不同任务对会员吸引力的模型,便可以对这种方案的实施效果做出分析。
五、模型建立与求解5.1 问题一模型利用地图定位将附件一中经度纬度定位到地图中,发现这些数据集中分布在广东,东莞,佛山和深圳四个城市中。
分别分析四个城市的价格规律,以深圳市为例。
考虑到城市内部存在区的划分,因此对数据进行聚类分析,猜测聚类结果呈区域块状分布,结果同样验证猜测。
这是价格的分布规律,其内部原因是受每个任务周围会员数量的影响。
分别求出任务方圆每十公里会员人数,分析任务周围的会员数与任务定价的关系,从而确定任务未完成的原因。
5.1.1模型建立此题采用Q型聚类法建立模型并求解。
Step1. 距离设 x ik 为第i 个样本的第k 个指标,数据观测值如上表所示。
在表中,每个样本有p 个变量,故每个样本可以看作 R p 中的一个点,n 个样本就是 R p 中的n 个点。
在 R p 中需要定义某种距离,第i 个样本与第j 个样本之间的距离记为 d ij ,在聚类过程中距离较近的点倾向于归为一类,距离较远的点应属于不同类。
所定义的距离满足如下4个条件:(1) d ij ≥0 ,对一切i,j ;(2) d ij =0 ,当且仅当第i 个样本与第j 个样本的各个变量值相等;(3) d ij =d ji ,对一切i,j ;(4) d ij ≤d ik +d kj ,对一切的i,j,k 。
最常用的几种距离:(1) Minkowski (闵可夫斯基)距离d ij (q )=[∑(x ik −x jk )q p k=1]1q , q>0 对于q=1时,对应的是绝对值距离 (2) 绝对值距离d ij (1)=∑|(x ik −x jk )|p k=1对于q=2时,对应的是Euclid 距离(3) Euclid (欧几里得)距离d ij (2)=√∑(x ik −x jk )2p k=1Step2. 数据标准化标准化变换:x ij ∗=x ij −x̅js j ,i =1,2,⋯,n;j =1,2,⋯,p其中,均值:x̅j =1n ∑x kj nk=1 方差:s j =√1n −1∑(x kj −x̅j )2n k=1 变换后的数据均值为0,标准差为1,而且标准化后的数据与变量的量纲无关。
Step3. 系统聚类系统聚类法(hierarchical clustering method )是聚类分析诸多方法中用的最多的一种,其基本思想是:开始将n 个样本各自为一类,并规定样本之间的距离和类与类之间的距离,然后将距离最近的两类合并成一个新类,计算新类与其它类的距离;重复进行两个最近类的合并,每次减少一类,直到所有样本合并为一类。
以下用 d ij 表示第i 个样本与第j 个样本的距离,G 1 , G 2 ,…表示类,D KL 表示G K 与 G L 的距离。
下面所介绍的系统聚类法中,所有的方法开始时每个样本自成一类,类与类之间的距离与样本之间的距离相同,即 D KL =d KL ,所以最初的距离矩阵全部相同,记为 D (0)=(d ij ) 。
常用的系统聚类法:(1)重心法类与类之间的距离定义为它们重心(均值)之间的Euclid 距离。
设 G K 与 G L 的重心分别为x̅K 和 x̅L ,则 G K 和 G L 之间的平方距离为:D KL 2=d x̅K x̅L2=(x̅K −x̅L )T (x̅K −x̅L ) 这种系统聚类方法称为重心法(centroid hierarchical method )。
它的递推公式为: D MJ 2=n K n M D KJ 2+n L n M D LJ 2−n K n L n M 2D KL 2 重心法在处理异常值方面比其它系统聚类法更稳健,但是其他方面却不如离差平方和法的效果好。
(2)离差平方和法(Ward 方法)离差平方和法基于方差分析的思想,如果分类分得正确,则同类样本之间的离差平方和应当较小,不同类样本之间的离差平方和应当较大。
设类G K 与G L 合并成新的类G M ,则G K ,G L ,G M 的离差平方和分别为:W K =∑(x (i )−x̅K )T (x (i )−x̅K )i∈G KW L =∑(x (i )−x̅L )T (x (i )−x̅L )i∈G LW M =∑(x (i )−x̅M )T(x (i )−x̅M )i∈G M其中x̅K ,x̅L 和x̅M 分别是G K ,G L 和G M 的重心。
所以W K ,W L 和W M 反应各自类内样本的分散程度。
如果G K 和G L 这两类相距较近,则合并后所增加的离差平方和W M −W K −W L 应较小;否则,应较大。
于是定义G K 和G L 之间的平方距离为:D KL 2=W M −W K −W L这种系统聚类法称为离差平方和法或Ward 方法(Ward’s minimum variance method )。
它的递推公式为:D MJ 2=n J +n K n J +n M D KJ 2+n J +n L n J +n M D LJ 2−n J n J +n MD KL 2 G K 和G L 之间的平方距离也可以写成D KL 2=n K n L n M(x̅K −x̅L )T (x̅K −x̅L ) 由上述分析可见,这个距离与重心法给出的距离只差一个常数倍。
重心法的类间距与两样本的样本数无关,而离差平方和法的类间距与两类的样本数有关。
两个大类倾向于有较大的距离,因而不易合并,这更符合对聚类的实际要求。
离差平方和法在很多场合下优于重心法,是一种较好的系统聚类法,但它对异常值很敏感。
Step4. 已知两地经纬度求两地距离α和θ分别是两地的纬度,北纬记为正;β是两地的经度差,r 是地球半径。