2018年数学建模B“拍照赚钱”的任务定价模型

合集下载

拍照赚钱的任务定价数学建模论文

拍照赚钱的任务定价数学建模论文

“拍照赚钱”的任务定价分析“通过拍照赚钱”是一种自助服务模式,要求成员在应用程序上收集任务并在完成任务后获得为任务划定的报酬。

在此应用中,任务定价是其核心要素。

通过对“拍照赚钱”任务定价方案的分析,评价和改进,优化任务包装方案,达到了节约成本,提高任务完成度的目的。

对于问题一,通过分析附件一中的任务定价数据,我们可以看到任务评估的平均定价为69.11,任务定价的范围为[65,85]。

在分析未完成任务的原因时,首先,未完成任务的比例为37.9%。

其次,绘制任务完成和任务定价框的折线图。

未完成任务的价格低于已完成任务的价格。

最后,在地图上标记任务的完成。

可以看出,未完成的任务主要集中在区域1中,区域2的完成度最高。

对于第二个问题,选择附件1中的完整数据作为训练集,并将未完成的任务作为测试集。

通过按经度和纬度连接附件I和附件II,建立了以任务定价为因变量的线性回归模型。

利用该模型对原方案中未完成任务的定价进行了预测和分析,预测值为新的定价方案。

新方案的完成率比原方案高11.87%。

对于第三个问题,根据任务位置和成员位置的经纬度信息计算出每个成员到每个任务点的距离,并根据每个成员的任务配额和信誉来分配和打包任务成员,针对问题4和问题4,有必要为附件3中的新项目制定任务定价方案。

首先,从问题3中获得的约束公式用于打包和发布附件3中的数据,可以打包。

到300。

然后,对300组数据进行预测和分析,以获得一组任务定价。

为了知道该方案是好是坏,请进行一系列比较。

利用附件3中的数据,将问题2中建立的模型应用于预测和分析,并获得新的任务定价。

比较两个任务的总价值后,我们发现软件包发布方案的成本较低,因此此结果更为合理。

通过对“拍照赚钱”任务定价的分析,我们可以了解到打包发布任务的成本较低,方案较为合理。

关键词:多元线性回归任务定价任务包装R语言1,问题重述“通过拍照赚钱”是一种自助服务模式,用户可以下载应用程序并成为会员,然后选择执行任务以在应用程序上赚钱。

“拍照赚钱”的任务定价模型

“拍照赚钱”的任务定价模型

“拍照赚钱”的任务定价模型摘要:本文通过数据分析对任务定价方案进行了研究。

关键词:BP神经网络模型多元线性回归打包分布定价模型任务定价引言“拍照赚钱”是移动互联网下的一种自助式服务模式。

用户下载APP,注册成为APP的会员,然后从APP上领取需要拍照的任务(比如上超市去检查某种商品的上架情况),赚取APP对任务所标定的酬金。

这种基于移动互联网的自助式劳务众包平台,为企业提供各种商业检查和信息搜集,相比传统的市场调查方式可以大大节省调查成本,而且有效地保证了调查数据真实性,缩短了调查的周期。

1.任务定价方案的确立1.1任务定价方案的分析综合考虑地理位置、区域内的平均信誉值、会员人数的权值和平均任务量对任务定价的影响,选取完成任务情况为1的所有数据的75%采用基于最小二乘法的方法进行拟合,用剩余的25%的数据作为检测数据,采用两独立样本T检验的方法判断原始数据与拟合后解得的数据是否具有显著性差异。

然后利用神经网络模型预测会员的任务完成度与原始数据进行比较来判断所给价格是否合理。

1.2任务定价方案模型的建立与求解1.2.1目标值与指标值的确立目标值:Y表示定价值。

指标值:X1表示在[0~500]范围内指标平均会员数与平均信誉值的合成指标。

X2表示在[500~1500]的合成指标;X3表示在[1500~2500]的合成指标;M1表示平均任务量。

1.2.2基于最小二乘法的目标值与指标值的拟合函数求解根据最小二乘法的模型代入目标值与指标值可得参数指标。

利用MATLAB进行拟合得出各统计值。

1.2.3模型检验为了使模型的定价结果更为合理,我们建立任务定价拟合值与实际值的独立样本T检验模型,对模型的定价进行检验。

两独立样本t检验的原假设为:拟合值与实际值的均值无显著性差异。

给定显著性水平α=0.05,若T检验统计量和概率P值小于1-α,则接受原假设。

用spss 分析两独立样本的显著性差异。

由表9得当t=(3.87,6.299)时p=0.665可知比给定1-α小,所以接受原假设,说明对测试集的拟合值与实际值之间无显著性差异,即拟合的方程成立。

“拍照赚钱”的任务定价-全国大学生数学建模竞赛

“拍照赚钱”的任务定价-全国大学生数学建模竞赛

M
N
Q Q
四. 问题分析
4.1. 问题一分析 问题一要求我们探索定价规律及研究任务未完成的原因。 从系统角度出发考 虑每个任务的定价有两个方向:任务与用户的关系、任务与任务的关系。从这两 个角度考虑,我们可以进一步分析任务与用户的关系主要有任务周围用户数量, 任务周围用户密度等;任务与任务之间的关系主要为任务的离群程度。 我们可以对以上因素量化, 并分别将定价与以上因素进行函数拟合,利用拟 合度判断定价是否与以上因素有关。 接着根据有关的因素对完成的任务与未完成 的任务分别进行分析,判断任务未完成的具体原因。 4.2. 问题二分析 问题二要求我们设计新的任务定价方案,并和原方案进行比较。这是一个博 弈问题的优化,博弈双方是定价与成功率。我们的目标是成功率尽可能高,定价 尽可能低。成功率除了与定价有关,还与问题一中的若干影响因素有关。我们可 以回归分析得到成功率关于以上因素的函数关系。 接下去可以建立优化模型并求解。根据给出的数据集,我们寻找成功执行的 任务定价与未成功执行任务的定价之间的差距,并寻找合理的定价区间。以该区 间为约束, 分别就成功率最高及定价总和最低为目标,将其划分为两个优化模型 并求解能得出总定价固定的情况下成功率最高的定价方案以及成功率固定总定 价最低的定价方案。 得出方案后可以就成功率与定价与原方案进行对比来判断新 定价获得的效果。 4.3. 问题三分析 问题三要求考虑多任务打包发布,修改定价并分析对任务完成情况的影响。 由于本题任务点分布不均匀,我们考虑对 DBSCAN 算法进行改进:算法的半径 改为得分半径,成功率高的点得分高,成功率低的点得分低。为了提高成功率, 我们将成功率低的点与成功率高的点打包。打包后还需要分析打包的合理性,即 打包任务周边会员的信誉、限额等因素,如果合理就保留该包,不合理就打散该任务本身价值、 路途花费。即任务打包后任务的本身价值不变,但由于路途花费(包括时间、交 通费用)减少,在系统定价时打包的任务总价低于原定价总和。根据原数据找到 任务本身价值、路途划分、总定价三者的关系,再根据问题二得到的优化模型进 行最优定价搜寻,最终可以对比打包前后成功率的变化情况来体现打包的效果。 4.4. 问题四分析 问题四给出了一个新项目,要求给出我们的定价方案及评估方案实施效果。 将数据代入问题二得到的定价模型以及问题三得到的打包模型进行求解, 输 出每个任务定价与成功率数据,并对结果进行分析。

2018年数学建模B“拍照赚钱”的任务定价模型

2018年数学建模B“拍照赚钱”的任务定价模型

“拍照赚钱”的任务定价模型摘要本题要求分析“拍照赚钱”任务的服务模式,研究其定价规律,并设计新的任务定价方案,结合实际情况,修改定价模型,最终对新项目设计任务定价方案,并评价方案的实施效果。

求解的具体流程如下:针对问题一:为了研究项目的定价规律,分析任务未完成的原因,利用附件一的信息,在地图上定位所有坐标的位置,发现任务集中在广东、东莞、佛山、深圳四市,分别标明每个城市的成功任务和失败任务。

以深圳为例,对深圳市任务进行聚类分析,结果分成5类,由相应任务的定价可以得出,人口密集处定价较低,人口稀少处定价较高的定价规律。

将附件二的位置信息同理在地图上定位,分别计算任务周围的会员数,分析其与定价的联系。

针对问题二:由问题一结果可知,任务定价与任务周围人数和任务周围人口密度等因素有关。

利用网络爬虫爬取广州、东莞、佛山、深圳四市医院,学校,小区,超市四种人口密度较大场所的经纬度,统计成功任务周围十公里人口密集场所。

用RBF神经网络模型,从而确定新的定价方案。

将此方案与原方案进行比较,得出两种定价方案的差异。

针对问题三:为了解决用户争相选择位置集中任务等问题,可将多个任务联合打包,以便用户更好得执行任务。

利用问题二中RBF神经网络模型求出新的定价方案下的任务定价;同问题一,求任意两个任务之间的距离。

当两个任务之间的距离小于一定值时,便可将这两个任务种做打包处理。

对于打包的任务,可将每个任务的定价结合附近会员的信息求出最终定价;对于未打包的任务,任务定价不变。

针对问题四:为了对新项目设计定价方案,并评价方案的实施效果,将新项目中任务的位置定位于地图上,可以发现任务集中分布于两个区域,且两个区域距离较远,可认为互不影响。

结合前面问题的分析,可知任务定价与区域的经济发展情况和用户到任务的距离有关。

对用户而言,用户将优先选择距离较近且定价较高的任务,因此,可以使用灰度关联分析的方法,建立不同任务对会员的吸引力,从而对定价方案做出评价。

“拍照赚钱”任务定价分析

“拍照赚钱”任务定价分析

一、引言“拍照赚钱”是移动互联网下的一种自助式服务模式,会员从APP上领取拍照任务,赚取对应报酬,帮助企业进行商业信息的搜集和调查[1]。

拍照任务定价是核心问题。

若定价过低,无人领取任务;定价过高,企业成本过高。

本文根据2017年大学生数学建模竞赛B题的样本数据,分析定价的规律和任务未完成的原因,并对已有定价模型起进行优化,以提高任务完成度。

二、定价模型进行频数分析以初步了解价格高低的大致分布状况,可确定65元为任务最低起价,划定定价区间:低价区(价格小于70);较低价区(价格大于等于70且小于75);中价区(价格大于等于75且小于80);较高价区(价格大于等于80且小于85);高价区(价格大于等于85)。

建立多元线性回归模型分析价格规律,令价格为被解释变量,影响因素为解释变量,影响程度为回归系数。

下面根据样本数据确定这些影响因素所代表的解释变量及其对应的回归系数。

(一)“地理位置”(x1)问题背景提示任务多关于商业数据的收集,任务发布的密集地即是商业区的聚集地,应是城市的中心地区。

根据样本数据的经纬度作散点图,观察发现:低价区在地理位置上分布密集且聚集明显,与城市中心区有关联。

交通便利、人流密集的城市区,完成任务的成本和花费相对于交通不便的乡镇区更低,任务接受者更偏好于接受城市区的任务,即能够以相对更低的价格接受发布在城市的任务。

由如上分析可得:越靠近城市中心点,定价越低;离城市中心点越远,定价越高。

低价区任务点的分布提示城市区的分布,低价区任务点的分布边缘提示城市和乡镇的边缘。

确定“地理位置”为第一个解释变量(x1),将任务点按照地理位置划分为“城市区”和“乡镇区”。

观察散点图发现低价区呈三个中心不同的聚集区趋势,用K均值聚类分析对低价区任务点分成三个区域,等同于三个城市区,三个中心对应三个城市中心点的经纬度(23.102063490780132,113.27916890673757)、(22.97700771477778,113.75894413666668)、(22.62107796724637,114.00599721014495)。

“拍照赚钱”的任务定价

“拍照赚钱”的任务定价

“拍照赚钱”的任务定价作者:胡彀管若愚杨文娟冯静煜梁全欢来源:《世界家苑·学术》2018年第07期摘要:本文研究的是众包平台领域下的有关“拍照赚钱”的任务定价问题。

首先根据任务位置信息找到任务定价的规律之一,分析未完成任务原因,建立了多目标规划模型设计出基于多因素考虑的新任务定价机制,然后考虑联合打包和分区定价,改进了任务定价模型,最后通过神经网络模型对新项目的任务定价进行模拟,并对模型进行了评价与推广。

关键词:拍照赚钱;定价1.引言近年来,随着互联网时代的不断发展,一种基于互联网的企业,大众与社会新兴合作模型——众包正在悄然流行。

本文研究的是一种通过“拍照赚钱”的数据采集众包平台。

这种基于移动互联网的自助式劳务众包平台,通过集体智慧有效地为企业提供各种商业检查和信息搜集。

自从2009年开始,众包得到了各个领域的广泛关注,已经逐渐成为一个新的研究热点。

2.模型的建立2.1建立非线性曲线拟合模型对求得的任务密度和价格强度作出散点图,分析拟合曲线。

定义拟合曲线中的数据点,选择拟合曲线来描述散点所确定的曲线形状,由拟合分析可知这些数据点的分布大致为反函数曲线,满足关系式:由于这种非线性拟合函数模型直接采用最小二乘法不方便,所以对上式两边取倒数并将其化为线性模型:易知,用对数据点作最小二乘拟合,相当于用(即)对数据点作最小二乘拟合,即有:仍记是关于和的函数,于是和应满足于是得到下面的方程组利用最小二乘法求解得到式中,为的最小二乘估计,分别为与的数据点均值,进而得到和,求解出拟合曲线。

2.2建立基于多目标优化的定价模型下面将所有任务根据位置集中的标准,将位置利用MATLAB划分为个区域,其中在一个区域的所有任务打包发布。

将每块区域的中心点作为打包任务的坐标,会员完成打包任务的成本为。

假设所有打包后的任务都有人做,则在考虑会员的所得利润最高的情况下有以下目标函数:在商家的立场来说,期望花费的费用最少:其中表示打包群的任务定价,对于不同的打包任务来说,其定价的初始值为,表示第个打包任務群里总的任务数量。

基于多元线性回归的“拍照赚钱”的任务定价模型房越

基于多元线性回归的“拍照赚钱”的任务定价模型房越

基于多元线性回归的“拍照赚钱”的任务定价模型房越随着智能手机的普及和摄影技术的提高,拍照已经成为了人们生活中的一种乐趣和需求。

而利用拍照来赚钱,也成为了一个热门的话题。

很多人都希望通过拍照赚钱,但往往不知道如何定价。

本文将基于多元线性回归的方法,探讨如何制定“拍照赚钱”的任务定价模型。

1. 背景介绍拍照赚钱已经成为了一个热门的话题。

一些企业和个人通过发布一些任务来征集照片,比如风景照、美食照、时尚照等等。

而很多摄影师和爱好者也希望通过参与这些任务来赚取收入。

如何确定合理的价格,却成为了一个难题。

2. 多元线性回归多元线性回归是一种用于分析自变量与因变量之间关系的统计方法。

在本文中,我们将利用多元线性回归来建立“拍照赚钱”的任务定价模型。

我们将收集一系列任务的相关数据,包括任务类型、任务要求、照片数量、使用场景等因素,以及任务的定价。

然后,利用多元线性回归分析这些因素与定价之间的关系,建立定价模型。

3. 数据收集在实际操作中,我们可以通过调查问卷、网络数据等途径,收集与“拍照赚钱”相关的任务数据。

我们可以收集不同类型任务的定价数据,这些任务可以是商业广告、产品宣传、杂志编辑等等。

我们还可以收集任务的具体要求,比如照片的数量、拍摄场景、后期处理等等。

我们还需要收集照片的质量评价数据,这些评价数据可以来自客户评价、专业评审等。

4. 建立模型在收集到足够的数据后,我们可以利用多元线性回归分析这些数据。

我们首先需要确定哪些因素对任务定价有显著影响。

任务类型、照片数量、使用场景等因素都可能会对定价产生影响。

然后,我们需要建立多元线性回归模型,根据数据进行拟合并确定各个因素的权重。

最终,我们可以得到一个任务定价的数学模型,这个模型可以用于预测不同任务的定价。

5. 模型评估在建立模型之后,我们需要对模型进行评估。

我们可以利用交叉验证、残差分析等方法,来评估模型的拟合程度和预测能力。

如果模型的表现良好,我们就可以将其应用到实际任务中。

基于多元线性回归的“拍照赚钱”的任务定价模型房越

基于多元线性回归的“拍照赚钱”的任务定价模型房越

基于多元线性回归的“拍照赚钱”的任务定价模型房越随着手机摄影技术的不断提升和社交媒体的兴起,越来越多的人开始通过拍照赚钱。

从个人摄影师到社交媒体网红,拍照赚钱已经成为了一种新兴的赚钱方式。

对于这种任务的定价却一直是一个比较困扰的问题。

对于企业而言,如何合理地对拍照任务进行定价,既能够吸引到优质的摄影师,又能够控制成本,这是一个需要认真思考的问题。

基于这个背景,本文将针对拍照赚钱的任务定价问题,利用多元线性回归模型进行分析,并提出一种合理的定价模型。

一、问题定位在进行拍照赚钱的任务定价时,需要考虑以下几个方面的问题:1. 摄影师的水平和经验:摄影师的水平和经验直接影响着拍摄作品的质量。

对于高水平的摄影师,企业愿意支付更高的费用来吸引他们完成任务。

2. 拍摄作品的种类和数量:不同类型的拍摄作品需要的拍摄时间和技术要求不同,从而影响着定价。

3. 拍摄地点和条件:不同的拍摄地点和条件会影响到摄影师的拍摄体验和效果,也会对定价产生影响。

4. 社交媒体曝光度和粉丝数量:如果企业需要摄影作品在社交媒体上进行宣传和传播,摄影师的社交媒体曝光度和粉丝数量也会成为定价的考虑因素。

基于以上问题,我们可以建立一个多元线性回归模型,来分析这些影响因素对任务定价的影响,并提出一种合理的定价模型。

二、多元线性回归模型我们可以假设任务定价与摄影师的水平和经验、拍摄作品的种类和数量、拍摄地点和条件、社交媒体曝光度和粉丝数量等因素相关。

我们可以将任务定价定义为因变量Y,摄影师的水平和经验、拍摄作品的种类和数量、拍摄地点和条件、社交媒体曝光度和粉丝数量等因素定义为自变量X1、X2、X3、X4等。

于是,我们可以建立以下的多元线性回归模型:Y = β0 + β1X1 + β2X2 + β3X3 + β4X4 + εY表示任务定价,X1、X2、X3、X4分别表示摄影师的水平和经验、拍摄作品的种类和数量、拍摄地点和条件、社交媒体曝光度和粉丝数量,β0、β1、β2、β3、β4分别为模型的系数,ε为误差项。

“拍照赚钱”任务定价的优化模型研究

“拍照赚钱”任务定价的优化模型研究

Estimate
SE
tStat
pValue
x1
0������ 021795
0������ 0036414
5������ 9852
3������ 2084e - 09
x2
- 0������ 076196
0������ 049597
- 1������ 5363
0������ 12484
x3
- 0������ 63057
图 1 任务地点及会员位置的分布图
的焦点ꎮ 它基于移动式互联网自助式劳务众包平台已成为
对于价格与地区繁华程度的关系ꎬ提取出价格为 85( 红
现阶段我国第三产业经济发展的重要目标ꎬ对提升城镇居民 色) 和 65 ( 黑色) 的任务点并通过 MATLAB 作图可知ꎬ人流
生活质量、 完 善 经 济 结 构 功 能 和 提 高 国 民 经 济 具 有 重 要 量越大ꎬ任务定价越低ꎬ而任务定价较高的地方ꎬ大多分布在
关键词:任务定价ꎬ回归分析ꎻFCA 聚类ꎻ优化模型
个区间ꎬ这些区间的任务的密度最大ꎬ其次是价格为[ 70 ꎬ75 ] 的区�� 问题的背景
“拍照赚钱”是当前互联网领域的热点之一ꎮ 它是移动
互联网下的一种自助取 APP 对任务所标定的酬金ꎮ 这种快 速发展的自助式服务模式是当今各大商户和劳工密切关注
现象探析———基于某学生深陷 P2P 网络借贷困境案例 分析[ J]������ 高校辅导员ꎬ2016(3) :76 - 79������ [2] 任一帆ꎬ马旭峰ꎬ王欣丛 ������ 大学生校园贷存在的问题及 干预[ J]������ 高校辅导员学刊ꎬ2017ꎬ9(2) :75 - 78������ [3] 莫海英 ������ 互联网时代下高校辅导员如何加强学生校园 贷教育[ J]������ 时代教育ꎬ2017(15) :179 - 179������

“拍照赚钱”的任务定价规律

“拍照赚钱”的任务定价规律

Electronic Bussiness | 电子商务MODERN BUSINESS现代商业38“拍照赚钱”的任务定价规律贺吉庆 谢佳利 刘新洁 刘婵 西北政法大学 710122摘要:文章通过大量数据的采集与分析,应用定性与定量相结合的方法研究“拍照赚钱”APP任务定价规律。

首先对数据进行简单处理;然后通过SAS多元线性回归模型的建立并对回归系数检验得知地理位置与任务标价有显著性关系;使用MATLAB自编程序将任务的地理位置、定价及其完成度呈现在三维散点图中,明确了经纬度范围;通过比较分析法得出任务定价与会员密度成负相关;用K-means聚类分析法,得到四个聚类中心,将其划分为四区域,得出任务标价与任务密度之间正的线性关系。

最后通过数学模型的建立,定量分析得到任务定价规律。

关键词:众包;多元线性回归分析;假设检验;K-means聚类分析一、问题的提出“拍照赚钱”APP是一种基于移动互联网的自助式服务平台。

用户下载APP注册成为会员后,从APP上领取任务,赚取此任务所标定的酬金。

这种自助式劳务众包平台,为企业提供商业检查和信息搜集的便利,相比传统的市场调查方式,大大节省了调查成本,有效地保证了调查数据的真实性、准确性和及时性。

由于注册会员追求收益最大化,企业主追求成本最小化;因此,注册会员最关心的便是其劳动报酬,企业也会根据其需要和所能节省的成本大小来决定是否将任务众包,那么任务众包后该如何定价便成为我们的研究重点;鉴于影响定价的因素较多,文章通过数学模型的建立将其量化进而分析该APP 任务定价规律。

二、模型的建立(一)数据预处理1.通过SAS对所考察数据中已结束项目任务数据进行多元线性回归分析,得到经度,纬度与任务标价的多元线性回归方程为:=-656.643+6.67691x +5.02742x 各回归系数的经济意义为:β1=6.6769,表示在其他情况不变的条件下,纬度每增加1°,标价平均增加6.6769元。

2018全国大学生数学建模竞赛“拍照赚钱”

2018全国大学生数学建模竞赛“拍照赚钱”
3.4 问题四的分析 针对问题四:在给出的 GPS 数据中,需要给每一个任务进行定价,合理的 定价在一定程度上会影响任务的完成率。我们可以采用 BP 神经网络模型,筛取 附件一中的所有已完成任务作为训练数据,其中经纬度为输入数据,任务的价格 为目标数据进行训练。训练结束后将附件三中所提供的 GPS 信息导入,进行仿 真模拟,得出每个任务点对应的预测价格。
从企业的角度,当然希望报酬(定价)越低越好,但是会员期望自然是越高 越好。当价格较高时,企业负担较重而任务完成较好;价格较低时,会出现所需 信息收集偏少的情况。当价格在双方之间相对平衡时,所需信息就能够比较好的 满足企业需求,同时企业的支出又在可以接受范围内。
近期,某 APP 针对珠三角的广州、东莞、深圳和佛山四地进行了一场调研。 虽然该 APP 拥有的注册会员人数远远超过任务数,但是这一任务的完成率非常 低,而且不同地域的完成率差异非常显著。特别是在市场巨大的两个城市,获取 的信息非常少,从而导致获取的数据无法对于进一步的企业行为进行指导。
同时,在任务完成不好的地区,又拥有非常多的注册会员。因此,一个比较
2
明显的问题就是任务支付的报酬偏低。但是,对于企业,如果通过提高这些地区 的服务报酬,就增加了企业的负担。如何通过价格调整,保证后续任务较高的完 成率又不增加企业负担,就是 APP 运营商面临的问题。
1.3 需要解决的问题 对于运营商而言,重新制定价格并要保证企业以及会员的双赢,仅仅通过一 些经验的判断还不够充分。如果能够在历史数据的基础之上,对于价格的调整、 任务的发布进行一些定量分析,并提出一些定量的调整策略,那将对于后续任务 完成率起到非常大的帮助。 首先,本文要在历史数据的基础上,进一步寻找低任务完成率地区的定价、 任务数、会员数与其他数据的关联。其中关联的数据包括当地经济水平、物价指 数等,这是因为这些指标对于会员的预期报酬紧密相关。通过对比,判定出不同 地区的相对价格高低,并与现有定价方式比较,分析得到一些结论,为进一步的 价格调整提供定量参考并修正现有的定价方案。 其次,APP 运营商也有一些其他提高会员个人收益的设想。实际上,有许多 会员可同时接受好几个任务并且完成的非常不错,并且已经有一些现成的统计数 据。如果几个任务距离很近但同时被一个会员接受,那么他就可以在交通方面花 费较少时间完成几个任务,完成单个任务的平均时间就会缩短。这样即使单个任 务价格稍低,会员也会乐意同时接受几个邻近地区的任务。如果价格不是太低, 该会员的平均收益率还是可以接受的。如何结合地域、会员个数、会员可承担任 务最大值、会员信誉度等进行任务打包发送,是本文要解决的另一重要问题。 最后,对于这些方案的合理性,还将进行数值仿真。一方面,在历史任务中, 将调整过后价格分布与任务未完成情况对比,对于预期完成率给出一个直观的刻 画。其次,对于新的任务,依据新的定价方案,将任务进行打包发送,并给出相 应定价方案。此外,还将深入分析有关不足,为进一步价格调整做好准备。

“拍照赚钱”APP中任务定价问题分析及求解

“拍照赚钱”APP中任务定价问题分析及求解

对原 有 的定 价机 制进 行改 进 并 结合 会 员 的分 布情 况, 信 誉值 等 因素 , 给 出优 化 的 任 务分 配 方 案 , 实 现 以最 低 成本 取得 更高 任务 完 成率 。
合分析伪 。 最后 . 将未完成 的任务单 独提
取, 从任务的
分布和定价 、 当地 的会 员信 息 、 任务分 布区域 的经 济状 况、 交通因素等方面 . 分析任务 的完成情况
中. 导 致用 户会 争相选 择 . 一 种 考虑 是将 这些 任 务联 合在 一起 打包发 布 。在这种 考虑下 , 如何 修改前 面 的
图 1 未 完 成 和 已 完 成 任 务 分 布 图
图 1中展 示 了任 务 依 据 坐 标 位 置 在 地 理 七的
呈现 . 其中红色圆点表示未完成任 务. 黑 色 表 示 已 完成任务 , 通偶 对该 图 的 观 察 , 发 现 黑 色 的 点 即完 成 的任 务 呈 聚 集状 态 . 并 且 聚 集 中心 主 要 分 布 在 城
最 高 是本 文 的研 究重 点 , 、 关 键词 : 任务定价 ; 优 化 问题 ; 最低成本 ; 最 高 完 成 率
中图分类号 : TP 1 3 9
根据 题 目信息 . 可知“ 拍 照 赚钱 ” A P P中 的任 务 定价 、 任 务分 配不 尽合 理 。部 分任 务 无人 问 津 . 某 些
完 成率 . 并 且呈 负 相关
括 任 务 地 点 的 经
度、 纬度 、 任务标 价 和完 成情 况 。首先 , 需要 明确 , 任 务 的 位 置 是 如 何 影 响 其 定 价 的 可 以利 用 E X C E L 以及 B D P应用 程序 将 全 部 任 务 的 信 息 以 散 点形 式 在 地 图 上表 现 出来 . 利 用不 同颜 色 区分 完 成 与 未 完

“拍照赚钱”的任务定价

“拍照赚钱”的任务定价

Pure Mathematics 理论数学, 2018, 8(3), 269-272Published Online May 2018 in Hans. /journal/pmhttps:///10.12677/pm.2018.83035“Picture Money” Task PricingWang Ping, Guocai Rong, Xinzeng Wang*, Zhongxing MaSchool of Mathematics and Systems Science, Shandong University of Science and Technology, Qingdao ShandongReceived: May 5th, 2018; accepted: May 18th, 2018; published: May 25th, 2018Abstract“Photographing and making money” is a self-service mode under the mobile Internet. This self-service labor-sourcing platform mainly provides businesses with various business inspections and information collection. In order to make the task of photographing as much as possible, the core is to reasonably price each task. This paper first establishes a stepwise linear regression pricing model based on the existing data, and then uses a double-objective optimization model to improve the pricing model. Finally, the model is simulated to obtain the most reasonable pricing plan.KeywordsTask Pricing, Stepwise Linear Regression, Double Objective Optimization, Simulation“拍照赚钱”的任务定价王平,荣国才,王新赠*,马中行山东科技大学数学与系统科学学院,山东青岛收稿日期:2018年5月5日;录用日期:2018年5月18日;发布日期:2018年5月25日摘要“拍照赚钱”是移动互联网下的一种自助式服务模式,这种自助式劳务众包平台主要为企业提供各种商业检查和信息搜集。

拍照赚钱的任务定价数学建模论文

拍照赚钱的任务定价数学建模论文

1 “拍照赚钱”的任务定价1.1思路对于附件中的数据通过可视化的方式寻找规律对于任务定价方案的制定,引入吸引力因子,参考库仑定律建立表达式,并引入模型的评估机制(任务完成率、总完成率、用户总盈利、平台总收益等指标)对于打包策略,利用K-means聚类算法进行聚类,并对结合库仑定律引入的表达式进行推广,通过程序模拟发现规律根据两个定价模型的公式以及分配机制和评估机制进行模拟,得出较好的定价公式1.2 方法选取指标结合库仑定律自定义计算公式、K-means聚类算法1.3 亮点2 “拍照赚钱”的任务定价2.1 思路利用“地图无忧”和“百度地图开放平台”进行不同价位的任务点分布图提出任务对会员的吸引力指标函数来表达意愿,并提出坐标活跃度,通过matlabmatlabmatlab进行三维可视化,接着根据积分中值定理系列推导得出ppp值引入行动力建立打包数的函数关系(在一次活动中消耗的行动力= 行动到任务点的行动力+ 做任务的行动力),并定义0-1之间的相关系数u表示任务与会员之间的吸引力,接下来给出具体的打包算法引入描述任务和用户匹配程度的变量区分不同用户,得到两个变量量化后的关系,并用matlabmatlabmatlab将用户按城市聚类,得到各个任务完成能力最大的用户分别从属于哪个城市(根据行动力进行打包)2.2 方法对所有任务采用ISODATA算法进行聚类分析、将会员的分布与会员等级通过位势函数法抽象为空间内分布的用户活跃度、包内采用最近邻法则实现聚类聚类分析、回归分析、位势函数法、最近邻法则3 基于聚类分析的双目标优化定价模型3.1 思路通过百度地图观察位置分布,并利用CFTool工具箱做出经纬度与定价的三维立体图;利用拉依达准则剔除异常数据,接着进行空间数据的离散化处理。

随后确定任务定价的影响因子,并根据任务位置进行K-means聚类,最后利用灰色关联矩阵计算出任务定价情况与影响因子的相关度定义吸引度矩阵及计算出吸引度阈值后,建立多目标优化模型(约束条件是最大吸引力准则、竞争准则、分配准则及时间序列准则)双层嵌套聚类分析,并调整双目标定价优化模型建立基于多层聚类的神经网络模型,对新任务也进行联合打包发布。

数学建模b“拍照赚钱”的任务定价模型

数学建模b“拍照赚钱”的任务定价模型

“拍照赚钱”的任务定价模型摘要本题要求分析“拍照赚钱”任务的服务模式,研究其定价规律,并设计新的任务定价方案,结合实际情况,修改定价模型,最终对新项目设计任务定价方案,并评价方案的实施效果。

求解的具体流程如下:针对问题一:为了研究项目的定价规律,分析任务未完成的原因,利用附件一的信息,在地图上定位所有坐标的位置,发现任务集中在广东、东莞、佛山、深圳四市,分别标明每个城市的成功任务和失败任务。

以深圳为例,对深圳市任务进行聚类分析,结果分成5类,由相应任务的定价可以得出,人口密集处定价较低,人口稀少处定价较高的定价规律。

将附件二的位置信息同理在地图上定位,分别计算任务周围的会员数,分析其与定价的联系。

针对问题二:由问题一结果可知,任务定价与任务周围人数和任务周围人口密度等因素有关。

利用网络爬虫爬取广州、东莞、佛山、深圳四市医院,学校,小区,超市四种人口密度较大场所的经纬度,统计成功任务周围十公里人口密集场所。

用RBF神经网络模型,从而确定新的定价方案。

将此方案与原方案进行比较,得出两种定价方案的差异。

针对问题三:为了解决用户争相选择位置集中任务等问题,可将多个任务联合打包,以便用户更好得执行任务。

利用问题二中RBF神经网络模型求出新的定价方案下的任务定价;同问题一,求任意两个任务之间的距离。

当两个任务之间的距离小于一定值时,便可将这两个任务种做打包处理。

对于打包的任务,可将每个任务的定价结合附近会员的信息求出最终定价;对于未打包的任务,任务定价不变。

针对问题四:为了对新项目设计定价方案,并评价方案的实施效果,将新项目中任务的位置定位于地图上,可以发现任务集中分布于两个区域,且两个区域距离较远,可认为互不影响。

结合前面问题的分析,可知任务定价与区域的经济发展情况和用户到任务的距离有关。

对用户而言,用户将优先选择距离较近且定价较高的任务,因此,可以使用灰度关联分析的方法,建立不同任务对会员的吸引力,从而对定价方案做出评价。

数学建模之“拍照赚钱”的任务定价

数学建模之“拍照赚钱”的任务定价

6
z2
nm ni nm
(3)
ni 为任务点 1.5km 圆域内的会员数量, nm 是 ni 的最大值。
记 z3 为任务密度。
z3 mm mi mm
(4)
mi 为任务点 1.5km 圆域内的其他任务点数量, mm 是 mi 的最大值. z3 的提出
是对会员密度的矫正, 考虑到一个任务点的圆域内可能存在其他任务点,导致会 员密度的相对下降。认为 m 越大,定价越高。
图 3 定价模型拟合与实际定价对比图 图 3 表示了(7)的拟合情况,从杂乱的任务点定价散点中找出最贴合实际的 一般规律。 任务未完成原因 观察图 1 可知,Z3 的任务基本都已完成,而 Z1 任务基本都未完成,这两个 区域的任务完成情况比较特殊,故主要研究 Z3 区域。 首先研究 Z3 中已完成任务的特点。 根据 Z3 中已完成任务点的数据计算相应 的 z1 z2 z3 ,用最小二乘法拟合的方法重新计算(6)中的系数,得到新的定价规律:
5.2 问题二 5.2.1 问题二模型的建立
问题一中的模型主要利用了附件二中会员的位置信息, 没有考虑到会员信誉 值的影响,在问题二中将主要讨论该因素与定价的关系。 基于第一问的数学模型。 同时考虑到会员的信誉值反映会员的活跃程度,建 立新的模型。 对会员活跃的程度数据进行打分处理如下表 3: 表 4 会员打分情况 信誉值 打分 大于 10000 1 1000~10000 0.8 100~1000 0.6
z1 Pi O j Pm O j ( xi x j ) ( yi y j ) ( xm x j ) ( y m y j )
2 2 2 2 2 2 2 2
(2)
O j 是任务点所属区域 Z j 的中心点, Pm 是离中心点最远的任务点。即离中心

“拍照赚钱”的任务定价

“拍照赚钱”的任务定价

学 术 论 坛225科技资讯 SCIENCE & TECHNOLOGY INFORMATIONDOI:10.16661/ki.1672-3791.2018.13.225“拍照赚钱”的任务定价①郭家琪(大连理工大学 辽宁大连 116024)摘 要:“拍照赚钱”是移动互联网下的一种自助式服务模式。

用户下载APP ,注册为会员,然后从APP上领取需要拍照的任务(比如上超市去检查某种商品的上架情况),赚取APP对任务所标定的酬金。

这种基于移动互联网的自助式劳务众包平台,为企业提供各种商业检查和信息搜集,相比传统的市场调查方式可以大大节省调查成本,而且有效地保证了调查数据的真实性,缩短了调查的周期。

因此APP成为该平台运行的核心,而APP中的任务定价又是其核心要素。

如果定价不合理,有的任务就会无人问津,而导致商品检查的失败。

本文通过整体分析已有数据,得到新方案并针对不同问题提出修改措施。

关键词:任务 价格 位置 会员情况 解决方案 动态模型 筛选机制中图分类号:TP2112 文献标识码:A 文章编号:1672-3791(2018)05(a)-0225-03首先整体分析已有数据,从位置、价格、会员份额的分布入手,分析任务完成情况与价格、位置、会员情况的关系,分析后发现在不同的城市的影响因素和所占比例都不同。

根据对已有任务数据的分析,得到新方案的思考方向,在新方案中要能够改进已发现的问题,提出新的评价体系和定价策略,提高任务的完成度。

新方案初步建立后分别优化,针对不同的问题,有针对性的改进。

对于会员情况的不同将所有会员排序,根据等级和短期能力分配任务。

关于打包,是一种整合资源的手段,通过整合资源,在两方面提高性价比,一方面降低整体价格,另一方面通过将大家不愿意完成和愿意完成的任务进行打包,提高完成度。

最后将整体方案带入项目数据进行运行,检测是否足够合理,即检测是否找到并改善了每个地区的主要影响因素。

一个好的方案要能够首先确定任务情况,根据不同情况提出建议,将每个会员接取任务的可能限制在一定合理的范围内,最后达到提高任务完成度的效果。

“拍照赚钱”的任务打包定价模型

“拍照赚钱”的任务打包定价模型

由表1中可以看到,Hosmer-Lemeshow卡方统计量为24.927, 自由度为8,对应的P值为0.002<0.01,所以得出的模型是整体显著 的。从表2中的Wald统计量及其P值来看,任务GPS纬度和任务标价 对应的P值小于0.01,通过了1%水平下的显著性检验;任务GPS经 度的P值小于0.1,表明在10%的水平下显著。各个参数结果如下:
0.6251提升到0.7713,证实了任务打包模型对企业降低成本,提高任务完成度有积极影响的假设。
关键词:任务定价 Logistic模型 k-标识码:A
文章编号:2096-0298(2018)05(b)-180-02
随着中国经济实力的不断增强、互联网的快速发展、企业成本 的增加,网络群众的力量开始被越来越多的企业所重视。众包作 为一种创新的电子商务模型,帮企业节约了大量的资金,在市场上 占据着越来越重要的地位“。拍照赚钱”是一种基于移动互联网的 自助式劳务众包平台,任务定价对用户能否获得满意的劳动报酬 和降低成本(时间成本、经济成本)具有重要的影响作用。如果任务 的标价不合理,就会造成有的地方会员争先选择,而有的地方却无 人问津。本文基于这种现状将任务打包处理,以此吸引会员完成任 务,降低企业成本。
在上式中,解释变量 每增加一个单位时,发生比 就变为原 来的 倍。当 >0时,发生比会随着 的增加而增加;相反当 <0时,发生比会随着 的增加而减小。
接着依据极大似然法,借助SPSS软件进行回归分析,将835组 数据代入Logistic模型中,对 、 、 的值进行估计,可以得到表 1、表2。
表1 模型整体显著性的Hosmer-Lemeshow检验结果
文基于2017年数学建模竞赛B题“拍照赚钱”的数据,运用Logistic回归建立模型,得出任务地理位置是影响任务完成度的最重要因素。

“拍照赚钱”任务定价模型

“拍照赚钱”任务定价模型

“拍照赚钱”任务定价模型摘要:该文针对“拍照赚钱”任务定价问题建立了依赖于任务与会员的经纬度、任务定价与完成情况的数学模型。

通过对数据的可视化处理以及变量相关性分析,确定任务定价的规律,重新设计任务定价。

关键词:任务定价;智图交互地图;长短期记忆网络;聚类分析;1 问题重述“拍照赚钱”是一种基于移动端的自助服务模式。

其核心要素是任务定价。

定价的合理与否,将直接影响任务的领取情况,进而决定商品检查的成功与否。

在对附件数据进行定价分析时,通过对任务与会员的经纬度、任务的标价进行整合分析是确定定价规律的重要方法。

问题一:附件一为已结束的任务数据,附件二为会员的信息数据。

研究附件一内项目任务定价的规律,分析导致任务未能完成的原因。

问题二:为附件一的项目重新设计任务定价的方案,并与原方案比较。

2 模型的建立与问题的求解2.1问题一的模型建立与求解2.1.1 基于智能交互地图的任务定价规律分析利用智能交互地图将数据可视化,建立将地区任务标价平均值进行分段构建的标价格网图,将价格均分为65.7~68.92、68.92~72.13、72.13~-5.35、75.35~-8.57、78.57~81.78、81.78~85六个等级,分别用六种颜色表示;还建立了根据会员的地区分布图,均分为1~21、21~41、41~61、61~81、81~101五个等级建立格网图,分别用五种颜色表示。

发现任务地理位置均分布在广州、深圳、佛山、东莞四座城市,图中显示会员的密集分布区主要是在城市中心,距离城市中心较远的地区会员人数也相对较少。

从图中不难看出任务标价规律和会员分布存在联系,会员密集分布的地区所对应的任务标价较低,会员人数较少的地区所对应的任务标价则比较高。

2.1.2变量相关性分析模型结合附件一、二相关数据,认为任务的经度纬度、任务标价、任务方圆5公里内会员的平均信誉度、任务方圆5公里内会员到任务点的平均距离、任务方圆5公里内的会员人数都有可能对任务的完成存在影响。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

“拍照赚钱”的任务定价模型摘要本题要求分析“拍照赚钱”任务的服务模式,研究其定价规律,并设计新的任务定价方案,结合实际情况,修改定价模型,最终对新项目设计任务定价方案,并评价方案的实施效果。

求解的具体流程如下:针对问题一:为了研究项目的定价规律,分析任务未完成的原因,利用附件一的信息,在地图上定位所有坐标的位置,发现任务集中在广东、东莞、佛山、深圳四市,分别标明每个城市的成功任务和失败任务。

以深圳为例,对深圳市任务进行聚类分析,结果分成5类,由相应任务的定价可以得出,人口密集处定价较低,人口稀少处定价较高的定价规律。

将附件二的位置信息同理在地图上定位,分别计算任务周围的会员数,分析其与定价的联系。

针对问题二:由问题一结果可知,任务定价与任务周围人数和任务周围人口密度等因素有关。

利用网络爬虫爬取广州、东莞、佛山、深圳四市医院,学校,小区,超市四种人口密度较大场所的经纬度,统计成功任务周围十公里人口密集场所。

用RBF神经网络模型,从而确定新的定价方案。

将此方案与原方案进行比较,得出两种定价方案的差异。

针对问题三:为了解决用户争相选择位置集中任务等问题,可将多个任务联合打包,以便用户更好得执行任务。

利用问题二中RBF神经网络模型求出新的定价方案下的任务定价;同问题一,求任意两个任务之间的距离。

当两个任务之间的距离小于一定值时,便可将这两个任务种做打包处理。

对于打包的任务,可将每个任务的定价结合附近会员的信息求出最终定价;对于未打包的任务,任务定价不变。

针对问题四:为了对新项目设计定价方案,并评价方案的实施效果,将新项目中任务的位置定位于地图上,可以发现任务集中分布于两个区域,且两个区域距离较远,可认为互不影响。

结合前面问题的分析,可知任务定价与区域的经济发展情况和用户到任务的距离有关。

对用户而言,用户将优先选择距离较近且定价较高的任务,因此,可以使用灰度关联分析的方法,建立不同任务对会员的吸引力,从而对定价方案做出评价。

关键词:聚类分析、RBF神经、灰色关联分析法、网络爬虫一、问题重述“拍照赚钱”是移动互联网下的一种自助式服务模式。

用户下载APP,注册成为APP 的会员,然后从APP上领取需要拍照的任务(比如上超市去检查某种商品的上架情况),赚取APP对任务所标定的酬金。

APP是该平台运行的核心,而APP中的任务定价又是其核心要素。

如果定价不合理,有的任务就会无人问津,而导致商品检查的失败。

1. 研究附件一中项目的任务定价规律,分析任务未完成的原因。

2. 为附件一中的项目设计新的任务定价方案,并和原方案进行比较。

3. 实际情况下,多个任务可能因为位置比较集中,导致用户会争相选择,一种考虑是将这些任务联合在一起打包发布。

在这种考虑下,如何修改前面的定价模型,对最终的任务完成情况又有什么影响?4. 对附件三中的新项目给出你的任务定价方案,并评价该方案的实施效果。

二、模型假设1.会员对任务没有主观偏好,不会因为自身原因不完成任务;2.各个任务难度相等,不影响会员的选择;3.假设会员与任务间的距离都是直线距离,不受道路、河流等的影响;4.问题中所有数据都真实有效。

三、符号说明四、问题分析4.1 问题一分析问题一要求研究附件一中项目的定价规律,并分析任务未完成的原因。

首先应在地图中找出附件一中所有任务的位置,确定任务的分布规律,同时将附件二中会员的位置定位于地图。

观察出这些数据集中分布在广东、东莞、佛山、深圳四个城市。

以深圳市为例,对深圳的任务进行聚类分析,分析聚类结果,从而得出项目的定价规律。

分别计算每个任务与所有会员之间的距离,结合每个任务周围十公里的会员数与任务的定价,确定任务未完成的原因。

4.2 问题二分析问题一可明显看出任务价格与任务周围人数和任务所在地区人口密度等有关。

利用网络爬虫爬取广州等四市医院、学校、小区、超市等人口密度大的场所,统计成功任务方圆十公里内的人口密度大的场所个数。

使用RBF神经网络分析,用所获得的数据训练神经网络,从而确定新的任务定价方案。

将新的任务定价方案与附件一中的任务定价做出比较,说明两种定价方案的不同情况。

4.3问题三分析问题三要求将任务打包发布并设计新的定价方案,以解决用户争相选择等问题。

利用问题二中RBF神经网络模型求出新的定价方案下的任务的定价;利用问题一中两点经纬度坐标求出两点距离的计算方法求出每个任务与其他任务之间的距离,当两个任务之间的距离小于一定值时,便可将这两个任务种做打包处理。

对于打包的任务,可将每个任务的定价结合附近会员的信息求出最终定价;对于未打包的任务,任务定价不变。

4.4问题四分析问题四要求对一个新项目设计定价方案,并评价该方案的实施效果,将附件三中的任务的地理位置定位于地图上,可以发现任务集中分布于两个区域。

通过前面的问题分析可知,任务定价与地区经济发展水平和会员距离有关。

对会员而言,可以从任务的难易程度和会员到任务的距离两个方面判断会员对任务的偏好,从而使用灰度关联分析对的方法,建立不同任务对会员吸引力的模型,便可以对这种方案的实施效果做出分析。

五、模型建立与求解5.1 问题一模型利用地图定位将附件一中经度纬度定位到地图中,发现这些数据集中分布在广东,东莞,佛山和深圳四个城市中。

分别分析四个城市的价格规律,以深圳市为例。

考虑到城市内部存在区的划分,因此对数据进行聚类分析,猜测聚类结果呈区域块状分布,结果同样验证猜测。

这是价格的分布规律,其内部原因是受每个任务周围会员数量的影响。

分别求出任务方圆每十公里会员人数,分析任务周围的会员数与任务定价的关系,从而确定任务未完成的原因。

5.1.1模型建立此题采用Q型聚类法建立模型并求解。

Step1.距离表5.1.1 数据观测值设为第i个样本的第k个指标,数据观测值如上表所示。

在表中,每个样本有p 个变量,故每个样本可以看作中的一个点,n个样本就是中的n个点。

在中需要定义某种距离,第i个样本与第j个样本之间的距离记为,在聚类过程中距离较近的点倾向于归为一类,距离较远的点应属于不同类。

所定义的距离满足如下4个条件:(1),对一切;(2),当且仅当第i个样本与第j个样本的各个变量值相等;(3),对一切;(4),对一切的。

最常用的几种距离:(1)Minkowski(闵可夫斯基)距离, q>0对于q=1时,对应的是绝对值距离(2)绝对值距离对于q=2时,对应的是Euclid距离(3)Euclid(欧几里得)距离Step2. 数据标准化标准化变换:其中,均值:方差:变换后的数据均值为0,标准差为1,而且标准化后的数据与变量的量纲无关。

Step3.系统聚类系统聚类法(hierarchical clustering method)是聚类分析诸多方法中用的最多的一种,其基本思想是:开始将n个样本各自为一类,并规定样本之间的距离和类与类之间的距离,然后将距离最近的两类合并成一个新类,计算新类与其它类的距离;重复进行两个最近类的合并,每次减少一类,直到所有样本合并为一类。

以下用表示第i个样本与第j个样本的距离, ,,…表示类,表示与的距离。

下面所介绍的系统聚类法中,所有的方法开始时每个样本自成一类,类与类之间的距离与样本之间的距离相同,即,所以最初的距离矩阵全部相同,记为。

常用的系统聚类法:(1)重心法类与类之间的距离定义为它们重心(均值)之间的Euclid距离。

设与的重心分别为和,则和之间的平方距离为:这种系统聚类方法称为重心法(centroid hierarchical method)。

它的递推公式为:重心法在处理异常值方面比其它系统聚类法更稳健,但是其他方面却不如离差平方和法的效果好。

(2)离差平方和法(Ward方法)离差平方和法基于方差分析的思想,如果分类分得正确,则同类样本之间的离差平方和应当较小,不同类样本之间的离差平方和应当较大。

设类与合并成新的类,则,,的离差平方和分别为:其中,和分别是,和的重心。

所以,和反应各自类内样本的分散程度。

如果和这两类相距较近,则合并后所增加的离差平方和应较小;否则,应较大。

于是定义和之间的平方距离为:这种系统聚类法称为离差平方和法或Ward方法(Wa d’s minimum va iance method)。

它的递推公式为:和之间的平方距离也可以写成由上述分析可见,这个距离与重心法给出的距离只差一个常数倍。

重心法的类间距与两样本的样本数无关,而离差平方和法的类间距与两类的样本数有关。

两个大类倾向于有较大的距离,因而不易合并,这更符合对聚类的实际要求。

离差平方和法在很多场合下优于重心法,是一种较好的系统聚类法,但它对异常值很敏感。

Step4. 已知两地经纬度求两地距离和 分别是两地的纬度,北纬记为正; 是两地的经度差, 是地球半径。

忽略各地海拔高度差异,认为地球是理想的球面。

设 是两地的距离(地球的一条弦长), 是两地的球面距离(沿地球表面的弧长)。

则:可求得:分别计算出以每个任务位置为中心,半径为十公里的区域(即为方圆每十公里)内会员的人数与相应的任务定价,通过成功任务和失败任务每十公里内的会员人数比较即可得出任务失败的原因。

5.1.2模型求解Step1. 基本数据处理清洗数据,对于有明显错误的数据给予改正,例如将附件二中的“ 3. 3 48 3. 3 8 4”改为“ 3. 3 8 4 3. 3 48”。

对于附件一和附件二中的任务与会员坐标,使用XGeocoding解析出每个坐标所对应的地理位置,得出任务与会员集中分布于广东,东莞,佛山和深圳,则可删除极少的处于其他市的任务与会员,得到模型中使用的有效数据。

Step2. 确定定价规律(以深圳市为例)利用BDP在线数据分析软件将任务信息在地图上标出,将深圳市中的任务聚类分析,聚类后分成了五类1,2,3,4和5。

其中每一类任务在地图上的分布如下图:图5.1.1 深圳市任务分类图显然,这很符合实际,人口密集区任务定价偏低,如类别4所在区域为人口密集区,人口密度较小,相应任务定价较低;偏远地区定价高,而且明显高过其他类别,如类别5所在区域,任务分布很广,但任务定价为所有类别中最高。

同理可得出东莞,佛山,深圳三市的任务与价格分布。

这就是项目的任务定价规律。

Step3. 分析任务未完成原因通过Matlab编写程序分别求出每个任务方圆十公里内的会员人数,分析方圆十公里内的会员人数与任务是否完成的关系。

从附件一中统计可得,共有522个成功任务,313个失败的任务。

首先求出每个成功任务与每个会员的距离,然后筛选出任务方圆十公里内的会员人数。

同理可以求得失败任务方圆十公里内的会员人数。

画出其统计直方图,如下图所示:图5.1.2 成功任务频数分布直方图图5.1.3 失败任务频数分布直方图从图中可以看出,大部分成功任务方圆十公里内的会员人数在150人以下,在方圆每十公里少于100人之前,随着方圆十公里内人数的增加,成功任务总数增加;在方圆每十公里大于100人之后,随着方圆十公里内人数的增加,成功任务总数减少。

相关文档
最新文档