一、知乎的核心技术基础是什么
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
知乎
传播学概论第十一组一、知乎的核心技术基础是什么?
第一,知乎采用移动客户端技术。随着智能手机的发展和自媒体的兴起,知乎的移动客户端已经上线,在移动终端商下载相应的APP,可以体验知乎的相关服务,为用户使用知乎服务增加便利,并且可以带来更高的参与度。
第二,威尔逊得分算法。用此来对回答进行排序,更确切的说把二项分布样本的威尔逊置信区间下界作为排序的依据。投票总数增加时,得分趋向于正向反馈占总反馈的比例,对于内容质量有较强的解释性;在总投票数较少和极端参数的情形下,结果也能具有较高的准确性。在这种算法下,知乎的社交网络属性和高度同质性特征会对一些具有明显战队倾向的问题下的高票回答产生更严重的惩罚效果。(例子:如图1)
第三,协同过滤推荐算法。根据用户之间的相似性,对不同的的用户推荐与他相似的人喜欢的话题。这个算法也用于注册知乎后选择自己所感兴趣的话题,知乎会根据你的选择而日后安排话题推送。有利于点对点的个性化传播话题。个性化推荐算法对于知乎非常重要,知乎每天向用户推送各种问题或专栏,这种推荐需要依赖于用户历史的兴趣点以及不同用户之间的相互关联进行推荐。
第四,Kids日志系统。知乎从最初的邀请制到2011年下半年上线申请注册,这时出现了一些发广告的用户,为了扫除广告,知乎运用了日志系统。而这个系统必须支持分布式收集、集中存储、实时、可订阅和简单等特性。开发团队研发了Kids(Kids Is Data Stream),是用来汇集各种数据流的。(具体细节如图2)Kids参考了Scribe的思路。Kdis在每台服务器上可以配置成Agent或Server。Agent直接接受来自应用的消息,把消息汇集之后,可以打给下一个Agent或者直接打给中心Server。订阅日志时,可以从Server上获取,也可以从中心节点的一些Agent上获取。
第五,事件驱动架构。知乎开发了叫sink的小工具,它拿到消息后,先做本地的保存、持久化,然后再把消息分发出去。如果那台机器坏掉了,重启时可以完整回复,确保消息不会丢失。
第六,面向服务的架构(SOA)。知乎的服务分成了3层:聚合层、内容层和基础层。按属性又可以分成3类:数据服务、逻辑服务和通道服务。数据服务主要是一些要做特殊数据类型的存储,比如图片片服务。逻辑服务更多的是CPU密集、计算密集的操作,比如
答案格式的定义、解析等。通道服务的特点是没有存储,更多是做一个转发,比如说Sink。
第七,搜索技术。知乎的搜索是特定站点内搜索,但是仍需要解决文本搜索的一些基础问题。例如分词:搜索中的分词是指将文本切成多个独立的语义单元以作为检索的最小单元,然后分词后的词串建立倒排索引以加快检索服务的速度。目前知乎采用最前沿的分词技术是基于循环神经网络的语言模型进行中文的分词。搜索的其他问题例如查询纠错合查询理解也是通过相应的语言模型解决。
二、基于这个技术,它的主要传播特点是什么?
第一,从用户角色方面来看,在知乎网中,用户扮演了传者和受众的双重角色,既是信息的发布者,同时也是知识的获取者,这就体现了知乎网的定位是一个第三方平台——不直接生产或发布信息,只是提供一个信息交互的平台。
第二,知乎采用的是UGC内容生产方式。UGC即User-Generated-Content,意为用户生产内容,即知乎网的传播内容为用户自生产出来的。
在知乎这个问答型网站求解的方式,一种是“用户1提出问题,其他用户来回答,并且由所有浏览的用户选出优质答案”,在每个问题的下面,答案的分布是根据点赞数的多少来排列的,即用点赞数来体现优质答案。除此之外,用户还可以利用知乎的搜索引擎通过相关话题检索与自己的问题相近的问题,查看回答,选出最满意的答案或继续参与讨论。
这两种方式形成一种UGC生成的积极循环体系——既依托已经形成的知识库,又在问答交互中不断创造和积累新的知识资源。通过搜索机制的补充回答和讨论参与和提问机制的新话题开展,实现知识库的不断壮大。
同时,知乎增添了SNS(social network site:社交网站)功能,知乎账号同其他社交账号相关联,如QQ、微信等,用户之间可超越单纯问答层面的互动,延伸出更为紧密的社交关系,从而围绕网站形成以用户为核心、以知识共享为基础的网络社区。
第三,在知识传播类型上,知乎网的信息传播贯彻了问答型网站把“隐性知识”转化为“显性知识”的传统。知识分为“显性知识”和“隐性知识”。显性知识——直接的知识内容,如文字、图片、视频等;隐性知识——个人对于某一事物的看法、经验。隐性知识传输效率低、失真性强、不易交流与掌握社会化问答网站用户通过回答问题将隐性知识转化为文字、图片、视频等显性知识。用户生成内容泛指以任何形式在网络上发表的由用户创作的文
字、图片、音频、视频等内容。由此可见,知乎的内容生成方式,是一个由隐性知识转化到显性知识的过程。
第四,知乎的传播环境处于“弱关系理论”下。“弱关系理论”是指弱关系促成了不同群体之间的信息流动。弱关系传播了人们原本不太可能到的信息。弱关系群体具有来源广泛的特点,不拘泥于与自己相关的某个群体,他们不排斥外来文化,不同的观点可以通过弱关系介质从其他群体穿透过来。
“知乎”的“邀答制”给双方提供建立“弱关系”的通道,使得即使是不认识的用户之间也有方便快捷的方式建立联系,同时也缩短了“长尾理论”的进程与周期。这有利于互联网社交功能的发挥。
第五,知乎内容生产的激励机制——知乎通过用户激励机制驱使用户们,在没有利益获得的情况下,不断去解答问题从而实现内容的生产和知乎知识库的积累,主要包括以下几个因素:1、粉丝:用粉丝数衡量人气,这种人气相当于个人品牌价值,可以吸引用户进行内容生产。2、分数:将用户的活跃度以及解答的质量整合,积分制采用加权算法,在一定程度上,反映用户的综合素质和能力。3、自我满足感:对台湾最大的问答平台雅虎知识堂分析表明,自我满足和知识的自我效能是影响用户持续使用的重要因素。
第六,知乎网的信息传播是通过用户间的问答互动,仍然属于人际传播的范围。传统的知识传播的过程为:媒介信息传递到意见领袖再传递给大众。知乎的信息传播打破了传统的这种知识传播模式,媒介只是作为第三方平台,意见领袖和大众之间是双向的箭头,直接通过用户之间的问答互动,实现知识传播的一个过程。同时其间创造了一个特定的传播环境(即“弱关系理论”下的传播环境),用内容生产的激励机制作为这种传播的动力。
三、列出三个有意思并且有意义的研究题目。
(一)研究课题一:知乎与quora在规则制定上的比较
知乎的指南,Quora 大多都能涵盖;而一些Quora 的规则,在知乎上则是空白。比如Quora 要求复制内容时附上来源和链接,充分尊重问题回答者的知识产权。在设计医学和法律问题时有一系列的细节注意。以医学问题为例,Quora 要求医生们回答问题时不要给读者一个正在行医的印象。问题可以阐述一些症状、询问一些建议,但是不能表现出求医的倾向。回答可以提供一些建议、指导,但不可替代现实生活中的求医。医生不得提供过去治疗过的方案,不能在Quora 提供的互动平台上开处方药,因为这有可能触犯了许多州