基于“拍照赚钱”的任务定价探究定价规律与定价模型

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
表6 不同地区任务量与会员数量
分类 完成任务量 会员数量
广州市 195 155
东莞市 97 46
深圳市 33 145
佛山市 75 54
4.1.3 经纬度转化为实际地址 GPSspg xGeocoding 是一种可以利用各大地图 API 接口(地理编码、搜索、坐标 转换)进行批量处理数据的工具,其中整合了坐标转换功能,以方便兼容各家地图不 同的坐标。本文从 522 组“已完成任务数据”中选取 400 组数据,从 1877 组“会员
基于“拍照赚钱”的任务定价探究定价规律与定价模型
摘要
本文就劳务众包平台的任务定价问题进行了定性研究和定量分析。利用 SPSS、 MATLAB、GPSspg XGeocoding 等软件进行数据处理与分析,并建立数学模型。使用主层 次聚类分析法、多元非线性回归分析法、多维 Logistic 回归分析法、插值与拟合方法、 双边效用最大化方法,分别建立了非线性回归分析模型、效用模型、利润分配模型、 Logistic 模型,分别得出:附件一中项目的任务定价规律;附件一中的任务未完成的 原因;附件一中项目的更加全面的任务定价方案;“打包”条件下的合理的任务定价 模型;附件三中新项目的任务定价方案,并给出方案实施效果的评价。 针对问题一,首先,提取处理后的样本数据,利用 MATLAB 对数据进行“均值化” 处理;其次,使用主成分聚类分析法寻找指标间关系。利用 SPSS 计算出指标的相关系 数矩阵及其特征值、特征向量,从而确定主成分个数;然后,基于聚类分析产生的指 标,做基于整体最小二乘的曲面拟合,得出四组拟合曲线,再利用 SPSS 做数据的可靠 性计量;最后,透视任务完成率后,由逐步拟合过程以及 SPSS 和 MATLAB 求解过程 分析出任务未完成的主导因素是未同时考虑“任务点到市中心距离”与“会员地址到市中 心距离”。 针对问题二,首先,本文利用问题一建立的模型,得到了影响任务标价的因素。 然后,利用 SPSS 对各个因素与任务标价进行相关性的分析,确定各因素之间的关系。 其次,使用非线性回归分析模型,运用 MATLAB 对数据进行拟合,得到了多元非线性 方程,通过数据检验可以看到其吻合程度较好;最后,对数学模型进行抽样检验,与 原数据进行对比,验证了模型的合理性、有效性。 针对问题三,首先,确定任务“打包”标准为区域内等分分割下对应的任务量; 其次,在问题二的基础上,添加“会员的经纬度”和“等分区域内任务量”等因素,在 5 个 指标间做基于最小二乘法的非线性回归分析,拟合“任务定价”函数;对会员“信誉度”划 分为 6 个优先等级,优先等级直接决定会员在包内选择任务的先后次序;然后,建立 出效用模型,得出任务完成率最大化、会员收益最大化以及总效用最优化的关系式表 达式,建立了任务定价与总效用之间的关系;最后,制定任务 “打包 ”状态下会员利润 分配函数。 针对问题四,首先,利用问题三得到的结论,对自变量进行了正态性分布检验、 交互相关性检验,确定了自变量之间的相互影响 , 且使用 Spearman 秩相关系数;然后, 利用任务定价与 GPS 关系得到积分方程,对其分别建立了幂函数曲线、 Logistic 曲线 增长模型,并基于 Simulink 动态仿真模型进行多元非线性回归,相关系数分别达到了 0.7631,0.9592。 最后,本文对模型进行了检验,结果表明四组模型实际性较高,效果理想。同时 本文还对模型进行了优缺点评价,并在横向和纵向对数学模型进行了适用性推广。综 合双边市场经济理论给出合理建议。 关键词:数据挖掘;众包定价机制;主成分聚类分析;多元回归分析;基于最小 二乘法曲面拟合;效用模型;SPSS;
*
4
四、 模型建立与求解
4.1 数据处理、分析与挖掘 数据(Data )是对事实、概念或指令的一种表达形式,可由人工或自动化装置进 行处理。数据经过解释并赋予一定的意义之后,便成为信息。数据处理是从大量的原 始数据抽取出有价值的信息,即数据转换成信息的过程。主要对所输入的各种形式的 数据进行加工整理,其过程包含对数据的收集、存储、加工、分类、归并、计算、排 序、转换、检索和传播的演变与推导全过程。数据分析是指用适当的统计分析方法对 收集来的大量数据进行分析,提取有用信息和形成结论而对数据加以详细研究和概括 总结的过程。数据分析是数学与计算机科学相结合的产物。 本文主要利用 Excel、SPSS、MATLAB 、GPSspg XGeocoding 等软件进行数据处理 与分析,先后对数据的格式和内容进行了收集、存储、加工、分类、归并、计算、排 序、转换、检索、传播等过程,对数据进行了“提出‘坏点’”、“指标分类”、 “抽取样本”、“坐标转换”、“粒度划分”、“间距计算”、“均值化消纲”、 “比例分析”等处理。主要得到了以下层面的数据处理结果和数据分析成果。 4.1.1 剔除“坏点” 利用 SPSS 将剔除经纬度小数点后位数不正确的数据,筛选出的点坐标请见附录 显示结果如图 5 所示。
2
二、 基本假设
2.1 模型假设
(1) 样本排除广州市、深圳市、佛山市、东莞市以外的数据点;
(2 ) 样本数据中经纬度,任务定价,预定任务时间等反映其自身属性的数 据波动范围较小,可取固定值;
(3)GPS 定位准确,即所给数据中的经纬度为准确值;
(4)进行区域内任务量“打包”时产生的每一个“任务包”均不为空; (5)“任务打包”的目标是任务完成度最大化; (6) 样本容量足够大,样本数据真实,能够反映具体情况;
Байду номын сангаас
图 5 GPS“坏点”分布图
5
4.1.2 数据指标的分类与样本选取 本文选取的样本为上文数据处理过程的成果,共分为广州市、深圳市、佛山市、 东莞市 4 组,每组样本容量为 400,每个样品有 4 个指标,分别为“任务地点与区域 中心点距离”、“区域内任务量”、“区域内会员量”、“任务定价”,这样每组共 有 1600 个数据,则样本数据可表示为矩阵 X:
1
一、 问题重述
1.1 问题重述 1.1.1 问题背景 “拍照赚钱”是移动互联网下的一种自助式服务模式。用户下载 APP,注册成为 APP 的会员,然后从 APP 上领取需要拍照的任务(比如上超市去检查某种商品的上架情 况),赚取 APP 对任务所标定的酬金。这种基于移动互联网的自助式劳务众包平台, 为企业提供各种商业检查和信息搜集,相比传统的市场调查方式可以大大节省调查成 本,而且有效地保证了调查数据真实性,缩短了调查的周期。因此 APP 成为该平台运 行的核心,而 APP 中的任务定价又是其核心要素。如果定价不合理,有的任务就会无 人问津,而导致商品检查的失败。 1.1.2 研究意义 近年来,随着市场竞争的不断加剧,受内部创新瓶颈的制约,越来越多的企业开 始尝试将具有一定创新性和技术性的工作任务通过互联网渠道委托给外部个体或组织 完成,这种新兴的基于互联网的开放式协作创新模式被称为众包。随着众包规模的不 断扩大,众包网站上展示的众包任务种类越来越多,交易方式也日益复杂。从实践层 面看,如何根据众包任务特点选择与之相匹配的交易方式不仅是发包方和接包方十分 关心的问题,也关系到众包平台的持续运营。就理论意义而言,目前学术界对于众包 的研究主要集中在运营模式、参与动机。众包模式的兴起离不开互联网众包平台的发 展,概念和信用评价机制等方面,对众包任务分类和交易方式匹配关系的研究尚不多 见。 1.1.3 提出问题 1.研究附件一中项目的任务定价规律,分析任务未完成的原因。 2.为附件一中的项目设计新的任务定价方案,并和原方案进行比较。 3.实际情况下,多个任务可能因为位置比较集中,导致用户会争相选择,一种考 虑是将这些任务联合在一起打包发布。在这种考虑下,如何修改前面的定价模型,对 最终的任务完成情况又有什么影响? 4.对附件三中的新项目给出你的任务定价方案,并评价该方案的实施效果。
3
三、 符号说明
符号 Ei PI Ai Bi Ci Di X1 X2 X3 X4 xij j R rij λ Ui W X5 X6 Bi xl Ul(xl) pk
*
含义 两点间的平面距离 标准圆周率 Excel 表格中第 i 行中心点的纬度值 Excel 表格中第 i 行中心点的经度值 Excel 表格中第 i 行任务点的纬度值 第 i 行任务点的经度值 任务地点与区域中心点距离 区域内任务量 区域内会员量 任务定价 样本中对应的每个数据 i 为第 i 组样本 第 j 个指标 相关系数 指标 XI 与 Xj 之间的相关系数 相关系数矩阵的特征值 相关系数矩阵的特征向量 累计贡献率 任务 GPS 的纬度 任务 GPS 的经度 函数自变量前的系数 会员 l 获得的任务量 任务在被会员完成时获得的效用 任务 k 的定价
6
信 息 数 据 ” 中 选 取 400 组 数 据 , 数 据 集 合 中 包 括 具 体 经 纬 度 信 息 , 在 GPSspg xGeocoding 中表示出实际位置,位置点分布图如下图:
图 6 已完成任务样本点地址示意图
图 7 会员样本点地址示意图
由地点分布图直观反映出的信息表明,任务地点多集中在东莞市、广州市和佛山 市,而会员地址多集中在深圳市和广州市。
7
4.1.4 分区统计任务量与会员量 从 GPSspg xGeocoding 导出 4.1.3 数据的转换结果,对导出的具体地址信息(请 见附件一《已完成任务地点样本信息表》、附件二《会员样本地址信息表》)进行统 计分析,结果请见下表:
表 7 不同地区完成任务量与会员数量
分类 完成任务量 会员数量
2.2 名词解释 众包:众包指的是一个公司或机构把过去由员工执行的工作任务,以自由自愿的 形式外包给非特定的(而且通常是大型的)大众网络的做法。 最小二乘法:最小二乘法(又称最小平方法)是一种数学优化技术。它通过最小 化误差的平方和寻找数据的最佳函数匹配。利用最小二乘法可以简便地求得未知的数 据,并使得这些求得的数据与实际数据之间误差的平方和为最小。最小二乘法还可用 于曲线拟合。 GPSspg xGeocoding :GPSspg xGeocoding 是基于空间定位技术的一种编码方法, 它提供了一种把描述成地址的地理位置信息转换成可以被用于 GIS(地理信息系统)的 地理坐标的方式。 回归分析法:回归分析法是在掌握大量观察数据的基础上,利用数理统计方法建立 因变量与自变量之间的回归关系函数表达式(称回归方程式)。回归分析法不能用于 分析与评价工程项目风险。回归分析法是依据事物发展变化的因果关系来预测事物未 来的发展走势,它是研究变量间相互关系的一种定量预测方法,又称回归模型预测法 或因果法,应用于经济预测、科技预测和企业人力资源的预测等。
x11 x 21 X=(X1,X2,X3,X4)= xi1
x12 x1 j x22 x2 j xi 2 xij
(1)
其中 X1,X2,X3,X4 分别为“任务地点与区域中心点距离”、“区域内任务量”、 “区域内会员量”、“任务定价”4 个指标,为样本中对应的每个数据 i 为第 i 组样本, j 为第 j 个指标,i=1,2,…,1600;j=1,2,3,4。 选取的样本分别为: (1)任务地点与区域中心点距离,请见附件三《深圳、广州、东莞、佛山任务点 到城市中心点的距离表》 ; (2)区域内任务量、区域内会员量,请见表 6 ; (3)任务定价,请见附录。
广州市 195 155
东莞市 97 46
深圳市 33 145
佛山市 75 54
根据统计分析表进一步进行指标比例分析,得到下图:
图 7 四地区完成任务量比例分布饼图
图 8 四地区会员数量比例分布饼图
由此可见,任务及会员的地理位置会对定价规律产生影响。 4.1.5 区域数据粒度划分与中心选址 数据粒度,是指数据仓库中数据的细化和综合程度。根据数据粒度细化标准:细 化程度越高,粒度越小;细化程度越低,粒度越大。本文进行区域粒度划分旨在减小 数 据 处 理 难 度 并 找 出 不 同 区 域 数 据 之 间 的 对 比 关 系 。 在 SPSS 中 以 从 GPSspg xGeocoding 导出的实际地址为对象进行数据分类,共分为“深圳市”、“广州市”、 “东莞市”、“佛山市”四个不同数据集合。经查询文献得知,“深圳市”、“广州 市”、“东莞市”、“佛山市”四个地区的地理中心点经纬度分别为:
相关文档
最新文档