简析数字图书馆的个性化服务用户模型
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
简析数字图书馆的个性化服务用户模型
数字图书馆拥有海量的信息资源,用户想要在浩如烟海的信息中快速挖掘出自己感兴趣或者有用的资源是相当困难的。
所以,我们就要不断加强数字图书馆的个性化服务工作,为用户做好信息的过滤工作,提高用户的使用效率,最大限度的满足用户的需求。
数字图书馆的个性化服务始终以用户为中心,这样用户就可以根据自身的兴趣快速寻找有用的信息,也就是要加快建立实用合理地用户特征模型,把握用户兴趣,跟踪用户行为,及时更新用户信息库,方便用户。
1数字图书馆的个性化服务
数字图书馆的个性化服务从用户的特点和兴趣出发,主动向用户提供个性化的服务,其目的在于提高用户对数字图书馆使用的满意度。
数字图书馆的个性化服务主要体现在以下几个方面。
1.1检索的个性化
数字图书馆可以建立用户个人档案,通过对用户档案的分析,判断出用户的需求、使用习惯等,建立用户的个人档案,从而准确把握用户的需求和个性,及时调整服务的内容和角度。
对于相同的检索条件,系统对于不同需求的用户应提供不同的内容。
1.2服务方式的主动性
传统的图书馆以馆藏图书和文献为中心,用户处在一种“人找信息”的被动模式中。
而数字图书馆,以用户为中心,采用“信息找人”的主动模式,主动分析用户不同的需求,向用户提供尽可能全面的服务与信息,并能够主动地将用户感兴趣的信息推送给用户。
1.3服务内容的多样性
数字图书馆的个性化服务是面向用户的服务,它可以根据用户不同的习惯、兴趣、爱好、专业知识等的不同,进行鉴别、筛选,从而给用户提供不同的信息服务。
与传统的图书馆相比,数字图书馆的服务内容进一步扩大,而不再仅仅局限于某一本书或者是某一篇文章。
同时还要求充分挖掘进行学术研究需要的包括电子期刊、
全文数据库、电子文档等,此外,用户还可以通过网络直接与图书馆的管理人员进行直接的沟通和交流,及时解决在使用过程中遇到的问题等。
1.4服务对象的多元化
数字图书馆服务对象的多样化主要体现在用户需求、用户交流方式、用户群体等方面的变化。
随着时代发展的进步,人们需要不断地更新自身的知识储备,来应对瞬息万变的发展形式,这都造成了图书馆用户群体的膨胀,同时,对于用户群体的概念也在逐渐模糊,表现出虚拟化的趋势。
对于大量的网络信息资源,用户获取信息的目的性也在逐步加强。
用户希望通过数字图书馆能够进行智能化地检索、获取多元化的内容。
信息资源的数字化也带动了用户交流形式和空间的变化。
数字图书馆不仅要实现人与人的对话,还要实现人机对话,建立完善的信息资源的动态评价和反馈机制,通过虚拟的在线咨询等形式同用户进行沟通和交流,解决用户在使用过程中遇到的问题。
2個性化服务的用户模型构架
构建用户信息需求模型是图书馆个性化服务的关键,其模型构建的好坏,将会直接影响图书馆个性化服务的效果。
通常,用户模型的构架包括用户模型的表示、用户兴趣抽取、用户兴趣信息收集和用户兴趣更新等内容。
2.1用户模型的表示
用户模型的表示由用户profile文件和log文件建立。
profile文件用来表示用户的兴趣偏好、知识结构、认知模式、行为模式等的模型,log文件是用户浏览行为的记录。
用户模型的表示方法是应该如何存储用户的兴趣和信息需求。
目前数字图书馆常用的表示方法包括语义网、关键词向量、关键词等方法。
关键词向量法一经提出就得到了广泛的应用,其处理方法简单,能够较好的满足用户的需求,但是它也丢失了大量概念的语义信息。
而对于用户模型的表示我们以本体论的向量空间表示法为基础,系统内部进行的运算需要同数字图书馆的本体库进行交互,所以,数字图书馆的建立初期,应做好数字图书馆的本体库建设。
2.2用户兴趣的抽取方法
目前,我们获取用户兴趣特征的方法主要有隐式方法和显式方法两种。
显式方法,是通过信息调查等形式让用户自己提供兴趣需求,这样就能够及时准确地反映
用户的需求。
用户在首次使用个性化系统时,系统可以要求用户以注册的形式,填写自己的基本信息,如姓名、职业、性别、年龄、兴趣等内容。
隐式方法,是对系统所保存的用户信息进行深入的分析,从而获得有效信息。
这种方法虽然在实际操作上较为复杂,但是因其不需要用户的直接参与,而是系统自动地进行,因而在实际应用中更具实用价值其实现思想是通过对用户的日志信息和浏览的网页等进行分析,提取相应的概念主题,然后对概念主题进行深入分析,获取用户对这一主题概念的兴趣程度。
这是一种完全没有类别的信息分类,在实际过程中,应对获取的信息进行粗略聚类,然后获得分类的依据,从而缩小分类的搜索范围,最后使用分类学习的方法,提高分类的精确度。
这一过程,我们可以使用向量机(sVM)和无监督聚类(UC)相结合的方法来提取用户兴趣。
2.3用户特征信息更新算法
用户在访问数字图书资源的过程中,其兴趣爱好也在不断变化着,由此带动系统中用户模型的变化。
要想使系统的个性化信息与用户的实际情况保持一致,系统可以选择定期让用户自主修改个性化信息,也可根据用户的反馈信息做出自动调整。
此时,就需要系统通过聚类算法和分类算话不断更新用户的兴趣爱好,还需要采用一定的算法对用户的兴趣爱好进行更新与遗忘,实现用户模型的更新。
在实际操作中,用户的兴趣序列十分庞大,所以,我们必须对用户的兴趣数量进行限度,当新增加的兴趣同以前的兴趣的数量和大于既定的总量时,就可以考虑遗忘部分兴趣。
理想情况下,被遗忘的兴趣应试用户近期访问次数较低的对象。
目前,对于用户模型的遗忘,很多学者提出了诸如遗忘函数法、时间窗方法、混合用户模型等地解决策略。
他们大多都是单纯的先进先出的思想,而没有考虑到兴趣和用户原有兴趣序列的综合影响。
因此,笔者认为,我们应该综合这些计算方法,并采用渐进遗忘、滑动窗口相结合的方式来进行用户模型的更新,这样就更加符合人类的遗忘规律,也更容易达到更新的效果。
3结语
个性化服务已经成为了数字图书馆的发展趋势,其最大的优点就是能够满足不同目的、不同背景用户的不同需求。
随着数字图书馆个性化服务理念和技术的不断深入和发展,我国的数字图书馆个性化服务一定能够取得更大的进步,真正实现以用户需求为重。