数字校园应用集成平台的研究和实现
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第27卷第7期 计算机应用与软件
Vol 127No .72010年7月 Computer App licati ons and Soft w are Jul .2010
数字校园应用集成平台的研究和实现
艾 飞 邹 杜
(华南理工大学信息网络研究中心 广东广州510640)
收稿日期:2009-01-13。
国家重点基础研究发展规划(973)项目
(2003CB314805)。
艾飞,工程师,主研领域:数字校园,安全与权限
研究。
摘 要 高校信息化建设的一个重点和难点就是应用和信息的集成,详细分析了目前存在的问题,提出了一种数字化校园应用集
成的框架,该框架较好地解决了数字校园中用户身份认证管理和信息孤岛问题,随后详细描述了组成框架的各组件的设计和实现。
关键词 数字化校园 身份管理中心 中央认证服务 信息门户 信息孤岛
O N APPL I ED I NTEGRAT I O N PLATFO R M O F D I G I TAL CAM PUS
AND I TS REAL I ZAT I O N
A i Fei Zou Du
(N et w ork Engineering and Research Center ,South China U niversity of Technology,Guangzhou 510640,Guangdong,China )
Abstract One p ivot and nodus on I nf or matisati on Constructi on f or Universities is the integrati on of app licati on and infor mati on .I n the pa 2per we analyzed the current p r oble m s existed thoughtfully and p r oposed a fra me work for app lied integrati on in D igital Ca mpus,which res olved the p r oble m s of user authenticati on manage ment and inf or mati on sil o .Then we als o described the design and realizati on of each component that for m s the fra me work in detail .
Keywords D igital ca mpus I dentity manage ment centre Central authenticati on service I nfor mati on portal I nfor mati on sil o
0 引 言
目前国内大多数高校已经实现了部门业务管理信息化。
但是,随着学校信息化的发展,业务系统越来越多,不同时期采用不同技术路线开发的系统各自独立,对用户身份标识、公共代码等数据的定义以及认证方式各不相同,用户访问不同系统必须使用不同的账号密码进行登录,缺乏统一的集成访问接口;同时由于信息孤岛[1]的存在,造成学校关键数据的不一致,如人事处的教师数据与科研处或者教务处的教师数据很难完全保持一致,从而无法向学校决策层提供可信的基础数据支持。
如何解决异构系统带来的上述信息同步和共享问题,为数字校园用户提供集成的个性化服务,成为当前高校信息化工作的一个重点和难点。
华南理工大学网络工程研究中心在实施数字化校园解决方案的过程中,专门对该问题进行了研究,提出了基于统一身份管理、统一中央认证服务、信息门户以及数据交换平台的数字化校园应用集成的框架。
1 数字化校园应用集成框架设计
数字化校园的一个重要特征是以用户为核心,向学校各类用户提供个性化服务。
如何实现数字化校园的网络化、智能化、个性化[2]三大特点,以人为本更好地为校园用户提供服务,关键在于如何实现对学校各职能部门独立建设和使用的应用系统进行无缝地应用集成和信息集成。
为了解决这一问题,我们提出了一种松耦合的应用集成模型,其模型结构如图1所示。
图1 数字化校园应用集成模型
数字化校园应用集成模型分为四层:网络基础设施、支撑软
件层、校园应用系统层、应用集成平台层。
其中,网络基础设施是数字化校园数字信息流动的平台,没有网络基础设施,数字化信息就丧失了活动空间[3];支撑软件层为数字化校园的应用提供了运行的软件基础环境;应用系统层为数字化校园的核心层,为学校管理、教学、科研等活动实现了业务逻辑处理和信息处理。
应用集成平台层是本文研究的重点,该层利用支撑软件层提供的基础服务,通过统一身份管理服务,集中管理数字化校园内所有系统的用户身份认证信息,并通过中央认证服务,实现校园内异构应用系统的单点登录(SS O );在此基础上,将各应用通过信息门户集中展现,为学校用户提供个性化的数字校园服务;利用数据交换平台,实现各异构系统间用户身份标识的同步和映射,为统一身份管理提供支持,并解决应用系统的“信息孤
38
计算机应用与软件2010年
岛”问题。
2 数字化校园应用集成平台的实现
本文提出的数字化校园应用集成平台是基于JavaEE5规范和X ML 技术实现的,同时兼容当前主流的技术路线,如PHP 、ASP .NET 等。
集成平台由以下四个部分组成。
2.1 身份管理中心
数字化校园内各个应用系统的用户管理相对独立,不同的系统,用户标识也各不相同,如:人事系统采用员工号,科研系统采用身份证号。
用户身份管理中心基于LDAP [4]为校园用户提供一个唯一的虚拟帐号(NetI D ),并将此NetI D 与用户的其他标识信息进行映射,实现对数字化校园用户的身份和认证信息的统一集中管理,为单点登录[4]和应用聚合提供基础服务。
在身份管理中心用户sche ma 设计中,考虑到高校用户的特殊性,用户对象在继承internet2的eduPers on [5]这个对象类(Ob 2ject Class )的基础上,结合国家高校教育信息化标准中对教师和学生属性的定义,扩展生成cnEduPers on 对象类,用于管理高校用户的基本信息和角色信息。
用户对象的ldif 格式的用户信息示例如图2所示。
图2 身份管理中心ldif 格式的用户信息
如上例所示:用户的NetI D 为“aifei ”,通过此帐号与用户的
其他身份信息(包括角色信息)相映射,比如:人事系统可以从该用户信息中得到所需的员工号(ZGH )为2001001,从而为中央认证服务和个性化门户提供了统一的身份认证数据基础。
2.2 中央认证服务
中央认证服务[6]基于用户身份管理中心,为数字化校园所有用户提供统一的身份认证服务,实现了单点登录功能。
图3是认证结构模型图。
图3 认证结构模型
中央认证服务(C AS )负责所有校园应用用户的认证过程。
该服务提供用户输入帐号密码的界面,通过将该用户信息与LDAP 中存储的用户身份数据进行匹配,鉴定用户是否合法。
数字化校园中每一个应用系统(App licati on )都由一个Filter 保护,Filter 检查对应用的访问请求是否合法,未经认证的用户
请求将被重定向到CAS 要求进行身份的确认。
用户成功通过认证后,C AS 生成一个随机串(票据),发回给客户端浏览器,客户端浏览器带着该票据被重定向到之前请求的应用,由应用前端的Filter 请求C AS 对该票据进行验证,验证通过后,CAS 返回用户身份信息,应用根据返回的信息决定是否允许用户的此次请求。
票据以I n M e mory Cookie 方式保存在客户端浏览器,这种Cookie 不保存在用户的硬盘中,会在浏览器关闭后自动失效,当用户通过同一个浏览器访问受Filter 保护的其他应用时,Filter 向CAS 请求验证其票据,如有效,则无需重新登录。
Filter 请求C AS 验证票据时,不需要用户干预,通过C AS 与用户浏览器之间的认证记录检查用户是否之前已经通过认证。
2.3 信息门户
在数字校园应用集成平台中,信息门户(Portal )是一个与其它业务应用系统平等的W eb 应用系统,用来提供个性化、单点登录和聚集等服务。
门户通过中央认证提供单点登录服务,通过提供聚集服务,将来自各个信息源(业务系统)的内容集成到一个W eb 页面里进行渲染和显示,从而改变原有应用系统的服务模式。
高校的业务系统普遍实行面向功能的服务模式,每个业务系统提供可以满足某种需求的功能,为特定用户提供单独的专业服务。
门户提供的是面向用户的服务模式,在这种服务模式中,门户通过Xm l +Xsl 、RSS 、portlets 、I nlineFra me 、W ebService 等多种技术将校园应用服务聚合在一起,通过中央认证服务保证单点登录,门户内的信息访问权限控制基于RBAC [7],用户的角色信息来源于身份管理中心。
通过配置角色的权限,可以动态控制用户访问门户时展现的信息范围,从而实现个性化的资源整合。
2.4 数据交换平台
数据交换平台是高校信息集成阶段的一个核心基础平台,提供实时或异步的数据同步和共享服务,通过在不同应用间转换和传递数据,保持数字化校园中使用的数据的一致性。
我校根据高校应用数据管理的特点,开发出基于J M S 和X ML 的数据交换平台。
该平台直接连接应用系统对应的关系型数据库,支持O racle 、Sybase 等各种异构数据库平台。
与应用集成的方式相比,利用数据交换平台实现信息集成的方式的主要优势是无须对现有应用逻辑进行修改,通过在已有应用顶部创建数据交换结构,即可实现数字化校园内信息的流动和共享,从而解决“信息孤岛”带来的问题。
该平台整体结构图如图4所示。
图4 数据交换平台架构图
在该平台中,每个应用数据库对应为一个交换节点,节点根
第7期 艾飞等:数字校园应用集成平台的研究和实现39
据在一次数据交换过程中对应的角色不同,分为数据供应节点(Data Pr ovider)和数据请求节点(Data Com su mer)两种逻辑身份。
通常一个节点可以同时具有这两种逻辑身份。
Data Pr ovider利用数据定义和发布模块将源数据库中可以供其它节点请求的数据以Xm l清单方式实时发布到指定的Da2 ta Com su mer;Data Com su mer通过监听消息处理引擎,获取该Xm l清单,通过数据订阅功能,从数据源获取数据,并通过数据转换和导入模块,对数据进行清洗和过滤,并导入到目的数据库。
从而完成一次数据交换的操作。
3 结束语
本文提出的数字化校园应用集成平台已经在华南理工大学和广州城市职业技术学院等学校成功地部署并运行。
通过身份管理平台、中央认证服务提出的相关标准和接口,对学校原有基于W eb的应用进行改造和整合,实现了数字化校园应用的单点登录,并将校园内分散的信息整合起来以个性化形式展示在信息门户内,实现了学校信息管理的“一站式”服务;通过数据交
信息孤岛”现象。
下一阶段我们将重点研究如何采用顶层设计方法论,在
,更好地提供信
参 考 文 献
[1]陆鑫,周明天.数字化校园统一应用支撑平台系统研究与设计.计
算机应用研究,2007,24(12).
[2]黄斌.高校数字化校园的研究与实现.武汉科技学院学报,2006,19(7).
[3]郭加书.高校数字化校园建设的研究与实践.中国高教研究,2007
(10).
[4]蒋东兴.清华大学数字校园整体解决方案白皮书.3版.
[5]htt p:///edupers on/.
[6]孙磊.数字校园门户的设计与实现.广州:华南理工大学计算机学
院,2004.
[7]Sandhu R S,Coyne E J,Feinstein H L.et al.Role2Based Access Con2
tr olModels,I EEE Computer,1996,29(2):38-47.
(上接第13页)
表2的所有概念:
(12345,<),(1,ae),(2,<),(345,d),
(4,ad),(14,a),(<,ade)。
表3的所有概念:
(12345,<),(124,bf),(2345,c),
(24,bcf),(1234,f),(234,cf)。
2)结果分析
结合推论1、推论2可以得到如下结论:
(1)对于表2属性确定粒背景,是属性相容粒经过确定算子运算的结果,例取其中每个粒子的一个属性作为代表重新组合成新的属性集,确定属性粒背景的概念格,具有属性a的概念格(1,ae)在表1概念格中必定同时含有bf,即(1,abef),含有e 必定含有元素a,即:(<,ade),(<,abcdef);含有元素d得概念格(345,d)必定在表1所得的概念中含有元素c,即(345,cd), (34,cdf),(4,abcdf),(<,abcdef):
(2)对于表3属性可能粒背景,是属性相容粒经过可能算子运算的结果,例取其中每个粒子的一个属性作为代表重新组合成新的属性集,可能属性粒背景的概念格,由于在背景中所取属性为a、d的可能粒,即含有bf的对象可能具有属性a、c的对象可能具有属性d;这里由表3得到的概念集合为表1概念集合的子集。
3.3 N2PGC算法可行性分析
为了验证上述算法的正确性与可行性,给出此算法与一经典的Next Cl osure算法的比较分析。
在Pentiu m42.4,1G内存,M icr os oft W indows XP操作系统,使用随机生成的数据集,利用2003实现了Next Cl osure 算法。
测试数据采用150组随机生成的样本数据,为提高数据的真实性,对随机生成的每10组样本数据取均值,仍以属性为例,并随机选取每个粒中的属性作为新背景的属性。
生成随机数据集时,考虑了三个参数:对象数|G|、属性数|M|以及用于反映背景稠密程度的参数|d|(每个对象具有的平均属性数),用来控制随机数据集的大小和稀疏程度。
试验结果如表4所示。
表4 |M|=100,|d|=5
对象数
计算时间(sec)
Next Cl osure N2PGC
概念数
确定概
念数
可能
概念100012.1 2.44872352412
250059.413.41055815871093
5000170.721.91593938273742
7500319.260.52067180789327
10000507.499.3251541054211743
经验证,N2PG C算法不仅运行速度快,并且在某种程度上具有了原背景的特征,并通过实验分析,该算法的提出是可行的。
4 结 论
本文根据属性与对象相容粒经过确定算子、可能算子运算结果分析,将粒计算引入到形式背景中,提出了N2PG C算法。
基于属性与属性、属性与对象、对象与对象为分析角度,分析了原有背景中属性与对象的关系,在保证正确的情况下时间复杂度优于原有分析背景计算概念格算法的速度。
如何在计算过程中对确定粒与可能粒的选取更有代表意义,将是下一步研究的工作。
参考文献
[1]甘特尔,等.形式概念分析[M].马垣,等译.北京:科学出版
社,2004.
[2]Yao Y Y,Zhong N.Potential app licati ons of granular computing in
knowledge discovery and data m ining[C]//p r oceedings of World
Multi2conference on Syste m s,Cybernetics and I nf or matics.[S.l.]:
Computer Science and Engineering,1999:573-580.
[3]Y Chen,Y Yao.Multiview I ntelligent Data Analysis Based on Granular
Computing[C]//Pr oc.I EEE I nt′l Conf.Granular Computing(Gr C′
06),2006:281-286.
[4]柏文博.粒度计算原理及其在知识发现中的应用[D].辽宁科技大
学,2007.
[5]程伟,石扬,张燕平.粒度计算的三种主要方法[J].计算机技术与
发展,2007,17(3):90-94.
[6]董辉.概念格分布处理及其框架下的知识发现研究[D].辽宁科技
大学,2008.。