【中枢教育】西北学长数据挖掘讲座

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

【TOP3运筹学博士学长聊聊数据挖掘相关项目申请】

主讲人:殷学长

北大数院本科

获得西北大学IEMS博士

目前正从事社交网络分析研究

内容简介:

1. 暑期科研实习的申请与后续

2. 统计背景如何申请数据挖掘相关项目

3. 推荐信老师的选择与沟通

讲座内容:

大家好,我先自我介绍一下吧,我叫殷裔安,我是北京大学数学学院概率统计系16年毕业的,然后我现在在西北大学工业工程与管理科学系读第一年的PhD,我现在的主要的研究呢还是跟一些跟网络有关和一些social science有关的一些东西。

那么在我申请PhD项目之前,其实我之前主要做过有3段科研的经历,一段是在我们统计系和一位老师做了有关于统计里面的实验设计这一方面的一个科

研项目,第二段科研是当时我在我们学校信息科学学院那边和一位信科的老师做的一个偏CS的关于社交网络的项目,第三个呢就是我在大三升大四那年暑假,在美国的宾州州立大学跟一位老师做的关于文献的引用网络的一些也是和网络

有关的科研。那么在我个人感觉来讲,特别是第三段科研,无论是成果还是最后的推荐信,其实对于我整个的申请都有着很大的帮助,所以我觉得今天我们第一想跟大家聊一聊关于暑期应该怎么去处理这个事情。

让我们先来聊一下暑期科研这件事情,暑期科研呢其实我觉得相对于我们选择一般的科研老师其实有两点是我们需要特别注意的,第一件事情是说当我们在选择现在手头比如说大家本科在做的科研的话,其实我们可能选择的方向相对会有限一些,因为可能自己熟悉或者自己愿意的老师就那么些,可是如果在暑期科研的话,他有一个好处我们有一个非常高的灵活性可以去选择,所以,虽然有一个趋势是大家可能需要发很多很多封邮件才能够找到一个合适的机会,但是这里面相对重要的是大家可能在这个阶段就要去思考自己以后到底对什么样的东西

感兴趣,而不是说我现在可能有什么样的资源满足我想要做的这一方面的东西。

那么暑期科研另外一个问题呢,可能就在于它的时间相对短,一般来说暑期科研的时间在2到3个月之内,所以大家另外考虑一个问题是我在这2到3个月之内能够有什么样的东西,能够有什么样的成果出来,当然最理想的情况是我们最后有一篇paper能够写出来,甚至是可以投出去,但是事实上的话,在2到3个月的时间内能完成,并不是每个人能完成这样的目标,那么我的建议是大家至少能有一个Technical report,或者有一个论文的初稿,同时呢大家在最后离

开以后能够和老师保持充分密切的联系,因为事实上对于每一个Faculty来讲,大家在remote work的时候,cooperative都不会很高,所以这个情况更需要大家主动的和教授在自己结束这段暑期科研以后保持联系,包括paper后续的发表,

包括推荐信的一些问题等等。

然后从我自己的经历来讲的话,我是一个统计背景但是对实际的数据分析和数据挖掘比较感兴趣的同学,所以我当时在寻找暑期机会的时候,我个人的感觉是,像统计系这边的老师,即使有做相关课题的,即使招summer intern或者summer research这样机会的概率会比较低一些,相对来说概率比较高的会是一些computer science和information science的老师,在这方面大家也可以多注意,甚至如果是跟你的research interest相关的话,有些EE的老师也有可能在这方面有一些机会大家可以考虑一下。

然后具体到找暑期科研这样一个机会的话,其实大家应该也都有听一些学长学姐说,在这边我想强调是注意两点,第一是大家一定要准备充分数量的自己感兴趣的老师,这可能是一个非常艰难的工作,当然包括我刚才说的如果大家真的想要了解这个老师做什么的话,如果一下子去了解几十个老师的话,其实会是一个非常繁重的工作,所以这一方面大家可以提前进行一些,去读一些老师的paper,或者说去看一些相关的系的老师的主页来了解一下到底在做什么事情。第二件事情是由于我理解大家可能在申请的时候会集中在一些学校或者一些系,所以发邮件的时候我希望大家能避免同时向一个系的老师发很多邮件这样一些情形,否则之后的话会有一些冲突的事情,如果解决不当的话可能会有一些减分项,这也希望大家能够注意。

那么具体到做暑期科研的时候,我觉得其实大家最重要的一个原则是能够非常高频而且高效的和老师保持沟通。高频是什么意思呢,就是说我们知道一般国外老师特别在暑假会非常忙,甚至会有非常多的travel,在这个时候可能需要我们主动的去和他们提前联系,像我当时在Penn State做的一段暑期科研的时候,我个人的感受是,甚至很多时候包括我们一开始拿到和自己research可能不是那么相关的课题,所以在前期保持频繁的联系不仅会让你对整个环境熟悉的更快,而且可能对于课题可能会更快的上手。第二件事情是叫做高效,高效的话我不知道大家有没有这个习惯,就是在做一个课题的时候一旦有了一些结果之后就可以慢慢的把它整理成一个document,然后每次和老师meet的时候就可以不断的把这个document更新,包括自己有什么结果有什么问题,这样子不仅可以帮自己理思路,而且可以使交流更高效。

暑期科研之后需要注意的一些事情我觉得还是从各个方面能够保持联系,因为在暑期科研之后,由于不在身边,所以导师希望跟你主动交流的频率肯定会更低,特别是我们有一些同学如果有一篇未完成的paper的话,其实在这个时候update甚至能在申请之前投出去,会是一个非常重要的加分项,那么在这方面大家需要注意一些。第二件事情是关于申请的方向,即使我个人感觉是有很多同学由于会考虑说我还需要拿这个老板的offer,可是我又不确定会不会去,所以在和老师交流的时候会比较谨慎一些,其实对于具体自己想做什么事情,或者想去哪的话,我觉得大家大可以相对open的和导师坦诚讲一下,第一个是因为这样会让你们有更少的误解,第二件事情是因为最后有一些怎样的信息其实并不是我们一开始查网页就能查到的,可能导师会给你提供。

第二个事情我想讲的是关于申请的项目,在这边大家肯定也已经查了很多的资料,所以在这边我想提醒大家的是特别是一些统计背景的,做数据挖掘或者想做数据分析的一些同学,可能会紧盯的是像我们统计的一些项目,或者是现在比较流行的CS的一些项目,其实还有一些选项的话是现在有一些学校有的information school,有很多学校有information school,其实这里面也会有

相关文档
最新文档