前沿讲座
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
这次的前沿专题课程一共上了四次课,分别由不同的老师给我们讲解了不同的研究方向的一些前沿的知识,使我了解了很多自己课题方向之外的内容。
首先讲课的是郭希娟老师,她的方向是计算机器人与计算机科学。这是个集计算机,数学,机械,物理力学等多学科交叉的方向,而且实用性很强。她给我们讲解了用最小分离距离来解决碰撞检测问题的原理,演示了研究课题的一些成果,包括:直升机飞行器的原理仿真、乒乓球运动员直线打球的原理演示、物体的碰撞检测演示等。她根据自己多年的研究经验,总结出书《机构性能指标理论与仿真》。郭老师告诉我们:任何的学术研究一定要和实际应用联系起来。
第二次上课的是焦移山老师,他以日线股票为例给我们讲了时间序列预测的方法与应用。他讲的是一篇提出预测时间序列的最新方法的论文。时间序列是指将某种现象某一个统计指标在不同时间上的各个数值,按时间先后顺序排列而形成的序列。时间序列的预测一般用的是相似度预测原理,而相似度预测的方法有:欧式距离、最长公共子序列、DTW(Dynamic time warpping)。焦老师研究的是金融时间序列的预测,而金融时间序列的特点:1.适合用分段线性表示方式。这种方式容易去掉数据中的噪声,还原数据本质,而且易于计算。2.必须是zig-zag 形式。这篇论文所提出的算法使原来预测的准确率有65%提高到70%。这个结果已经很令人满意了。
第三次上课的是唐勇老师。他的研究方向是虚拟现实,他以虚拟现实的必然与冲击为题开始了这次的课程。唐老师讲到:我们生活在现实、抽象、数字这三个世界之中。虚拟现实及仿真技术影响深远,虚拟增强现实实践梦想体现在飞越时空、穿越极限、再现历史、颠覆传统、访问心灵、康复床上、虚实同进等。数字(虚拟)世界牵引科学技术的发展:仿真数据驱动的大规模场景的绘制与漫游,不规则物体建模的创新性探索。唐老师强调技术人生,强调把学术与人生联系一起。
最后一次上课的是张付志老师,他讲的是个性化协同推荐系统中的安全与信任问题。我觉得张老师的方向与自己的方向有一定的联系,所以下面重点总结一下张老师的内容。
1.推荐系统简介:
推荐系统是指能够为用户提供关于对用户来说有用的项目的建议的一类软
件工具和技术。推荐系统是一种重要的个性化服务模式,它为解决互联网上“信息过载”问题提供了一条有效途径,在电子商务和网络信息服务中得到了广泛应用。目前推荐系统是一个热点研究领域。典型的商用推荐系统有:, eBay, Netflix, Yahoo 等,其中亚马逊网站每年有35%的营业额来自于推荐。
推荐系统的主要功能有:提高项目的销售额、销售更多不同的项目、提高用户的满意度、更好的了解用户的需求、找到一些好的项目、提高用户模型。
常用的推荐算法有:
①基于内容的推荐:对每个项目做特征描述,对用户的兴趣做描述,对两
者进行匹配。
②协同过滤推荐:依据用户的偏好,根据用户之间的相似度作出推荐。两
种常用的协同过滤推荐算法:
基于用户的协同过滤推荐算法:根据目标用户与其他用户的相似度,选择k个最相似的邻居用户{User1, User2, …, Userk},同时得到对应的相似度{Sim1, Sim2, …, Simk},然后将目标用户对这k个最相似的用户的评分及这k个最相似的用户与目标用户的相似度中心加权平均值作对目标项目的评分。
基于项目的协同过滤推荐算法:根据目标用户评价过的项目与目标
项目i的相似度,选择k个最相似的项目{Item1, Item2,…, Itemk},同时得到对应的相似度{Sim1, Sim2, …, Simk},然后将目标用户对这k个最相似的项目的评分及这k个最相似的项目与目标项目的相似度加权平均值作为对目标项目的评分。基于项目的协同过滤推荐算法通过计算项目之间的相似性来选择目标项目的最近邻居集合。
③混合推荐:结合前两种算法的优缺得到的一种推荐算法。
2.个性化协同推荐系统中的安全问题
商用推荐系统往往会受到对手的攻击。最常受到的就是用户概貌注入攻击。
用户概貌注入攻击:利用系统的开放匿名性,注入大量虚假用户概貌使系统的推荐结果产生偏离
攻击模型:攻击者根据有关推荐系统、评分数据库、项目及用户等方面的知识,建立攻击概貌(Attack Profiles)所使用的策略。主要攻击模型有平均攻击
(Average Attack)、随机攻击(Random Attack)、流行攻击(Bandwagon Attack)和段攻击(Segment Attack)等类型。根据攻击目的不同,用户概貌攻击可分为推攻击(Push Attack)和核攻击(Nuke Attack)两种类型。
攻击检测方法:
无监督检测(Unsupervised Detection):这种检测方法不需要进行训练,其代表是Mehta、Kenneth等人的工作。Mehta等人利用攻击概貌之间的高相关性区分攻击概貌和真实用户概貌,并提出了基于主成分分析(PCA)的攻击检测算法。同Mobasher等人的算法相比,基于PCA的攻击检测算法对于攻击概貌高度相关的群攻击,检测精度有明显提高,被认为是目前检测效果最好的算法。但是,该算法需要预先知道注入攻击概貌的数量,在实用性方面存在局限性;另外,对于新出现的AoP攻击和高差异度模糊攻击,Mehta等人的算法检测效果较差。
有监督检测(Supervised Detection):将用户概貌攻击的检测视为传统的模式识别问题,根据已知攻击模型的特征对用户概貌进行分类。一些典型的分类学习算法(如支持向量机—SVM)均可用于用户概貌攻击的检测。其代表是Mobasher等人的工作。有监督攻击检测方法需要大量的训练样本,并且只能检测出与样本概貌相似的攻击概貌,在攻击概貌未知或模糊的情况下检测效果很差。
鲁棒推荐(Robust Recommendation)算法:这类算法自身具有一定的抗攻击能力。
①基于模型的推荐算法对于攻击策略有更高的鲁棒性并已被证明在基于基于的算法中高度有效。
②应用协同规则挖掘的推荐算法
③基于信任的推荐算法
3. 个性化协同推荐系统中的信任问题
信任的概念:
目前关于用户之间信任的定义有很多种形式,对于不同的领域和应用环境,信任的定义各不相同。对信任的研究源于社会学家Gambetta对信任的定义:信任(或者“不信任”)表示某个用户对某种行为做出的一定程度上的主观评价。也就是说,信任可以描述为在给定的环境下,两个实体之间确立的可信赖的程