南方报业传媒集团中央数据库数据可视化分析平台需求
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
南方报业传媒集团中央数据库数据可视化分析平台需求
一、建设内容
1、直接提供可视化分析工具,用于数据产品生产或数据服务提供。
2、将可视化平台集成进中央数据库,并通过开发方式开发一部分通用公用的数据应用工具,如查询检索、报表、看板、仪表盘等。
二、可视化数据分析功能需求
一是提供易用的数据可视化工具,实现通过拖拉拽就能快速完成数据的可视化,并给出最合适的展示图形。
二是具备专业的数据建模能力,满足业务人员数据分析需要。
三是能接入不同类型的异构数据,满足数据抽取需要。
四是能在PC、手机和平板等不同终端使用,图表能自适应大小屏,通过一次制作满足报纸、网站、APP、微信微博等不同渠道发布的需要。
五是方便与中央数据库和各业务系统集成,快速开发定制报表、看板、仪表盘等。
以下对需求进行详细描述:
1.用户对象分析
可视化数据分析功能在集团内外有广泛的使用场景,按照不同角色对可视化数据分析需求各有其侧重点,根据前期调研,可以大致分为以下几类对象:
领导层:集团领导和部门领导为了进行科学决策,对信息的宏观把控和分析有需求,需方便、直观地通过PC或手机浏览数据统计分析的结果,常见应用包括领导驾驶舱、定制报表、移动应用查询、指挥大屏等。
IT人员:IT人员一方面使用数据可视化功能建设数据统计分析及展示平台,通过开发打造定制化的报表工具,另一方面也需要协助业务人员生产数据统计报告等。
数据分析师/业务人员:使用进行使用数据可视化功能进行常规的数据产品的生产和服务提供,或者临时性地进行一些特定的数据分析报告或汇报数
据材料等。
编辑记者和智库生产人员:采编人员需要可视化分析工具快速生成报道及报告所需图表,需要丰富可自定义的图标样式,能够实现将数据静态输出至报道中;并提出希望实现动态输出,将输出内容生成为为动态图片,展现于网页或移动端,能实现交互式操作,并能自适应大小屏。
外部用户:浏览或使用数据产品和服务中提供的可视化数据分析结果,如图表等,有些场景下还需要使用能动态交互的图表。
2.数据接入与整合
中央数据库将整合汇聚集团的各类数据,包括内容数据、用户数据、智能化管理数据、采写过程数据、第三方扩展数据等,因此可视化数据分析功能需要方便地接入各类数据源,包括:
⏹传统的关系型数据库,如SQL Server、Oracle、Mysql等;
⏹非关系型数据库,如HIVE、HBASE、Spark SQL等;
⏹EXCEL表格、XML等文本数据;
同时还可整合多数据源,对不同的数据源和文本进行查询、抽取、整合和清理。
3.数据分析处理
目前集团生产大量的可视化新闻和智库产品,都需要数据分析处理工具的辅助,如榜单指数产品的共同特点就是通过指数数据的收集、分析和加工,让数据发挥量化、测评和监督的力量。要将平时报道的新闻、数据、政府官微发布的信息和政府的统计数据综合利用,构建科学严谨可量化的指标体系,这又涉及到了快速建模的需求。根据前期调研,对中央数据库的数据分析功能具体需求如下:
⏹有强大的数据处理能力,可以处理复杂的数据逻辑,例如进行字段计
算,进行表的分拆、转置、表计算,方便完成交叉表、透视表等的转
换等。
⏹快速构建灵活高效的数据模型,例如分析模型、指数模型等。
⏹以鼠标拖拽、点击等方式,通过图形化界面选择维度、指标,快速生
成分析图形和分析结果。
⏹能进行图表的跳转,支持从宏观指标聚焦钻取至明细数据
4.可视化展现
⏹产品提供丰富的可视化图表组件,满足集团各类应用场景的可视化展
示需求,如分析报告、测评报告、榜单等;
⏹能制作互动性好的联动图表分析,例如在APP或网站发布的数据报
告可提供条件筛选的功能,用户可以根据自己的需求,直接在报告中
选择性地查看报告数据。
⏹展示的图表能够自适应PC端与手机端的大小屏;
⏹提供丰富的展示案例,例如指数、榜单的展示方式,节省设计时间。
5.导出与分享
⏹为辅助生成纸质分析报告,例如刊登在报纸上的可视化新闻,应可将
分析结果导出图片、导出Excel、导出PDF等。
⏹可将生成的数据分析报告快捷地分享给他人,通过分享链接或者二维
码的方式进行分享,为保证安全,可设置访问密码和失效时间。
⏹可通过开发方式开发一部分通用公用的数据应用工具,发布给不同的
角色,例如为领导建立驾驶舱的各类仪表盘和报表。
三、非功能需求
1、安全性:能私有化部署,保证数据系统安全,能进行表行列级别权限管控,保障数据库使用安全,能记录用户的增删改等操作,符合系统的审计要求。
2、易用性:简单、易用,使用门槛低,内容生产人员也能轻松上手。报表工具为B/S模式,无需进行客户端安装;
3、易于集成:方便与中央数据库和各业务系统集成,支持单点登录。用户登录需与域集成。
4、高性能:基于大数据技术,能实现千万级甚至亿级数据,秒级响应;
5、使用范围广:报表工具无限授权用户数,可满足全集团的数据分析
工具需求。