将佰腾网结果数据库可视化编程分析怎么操作

提问者修改了问题描述感觉之湔的描述更准确一些。

先说我的结论:Power BI确实是面向浅编程用户的敏捷BI工具也是数据数据库可视化编程的福音(免费且有用户基础足够大),定性数据分析的未来是什么这个我不清楚数据分析不太可能有统一的工具,估计以后也很难出现而且定性分析和定量分析经常是結合使用的,Power BI也可以做定量分析

一个成功的提问需要一个吸引眼球的标题,这个问题的前半部分就是但很明显这不是事实,比如

  1. D3有很哆酷炫的交互图表Power BI没有,没关系可以基于D3开发然后放到Power BI里,目前基于D3开发的Power BI数据库可视化编程组件已经有不少了微软实验室在未来彡个月马上会发布一个基于D3的很酷的图表。点击下面这篇文章跳到TimeLine storyteller chart那里可以看到动图

无论Tableau、Qlik还是Power BI都强调自己对Python或R的支持,厂商很清楚这類工具的边界在哪里把一个敏捷BI工具做大做全是不现实的。所以超越不可能共生共荣倒是有可能,如果说Python和R集合了全世界各地开发者嘚智慧那敏捷工具就站在了它们的肩膀上。

问题到这里回答完了看了其他人的答案,我觉得还可以补充一些关于Power BI的内容因为有不少誤解。

说的微软是想打造一个BI平台,这个平台其实就是广义的Power BIPower BI不只做数据库可视化编程这一件事,它的两门语言M已经嵌入到SSIS,DAX是SQL Server未來的发展重点(MDX的发展已经明显落后与DAX)通过Power BI你可以完成从数据清洗、分析、数据库可视化编程展现和共享报告这整个流程。

Tableau对自己的萣位是数据探索工具业务人员使用T可以快速实现一个从数据到业务的闭环,Tableau有强大的VizQL通过鼠标拖拽就可以实现灵活的分析,简单的操莋呈现给用户复杂性都交给了软件,这是了不起的成绩而Power BI desktop目前远没有达到这种灵活度,复杂的分析需要写大量的代码这对业务人员並不友好。微软也意识到这个问题正在不断的提升软件的易用性和对业务人员的友好性,它的追赶速度是超过友商的未来能否在易用性上Tableau,现在下结论还为时尚早

杜雨的回答里提到 “Power BI试图定义单个图表,Tableau定义的是数据库可视化编程的业务逻辑所以不需要自定义图表庫”,我觉得不是Tableau不想做自定义图表库是自定义的图表很难像原生图表那样融入到Tableau的数据库可视化编程探索中,因为背后要考虑很多VizQL的邏辑成本过高。目前想在Tableau中绘制桑基图、玫瑰图工程量是很大的。Power BI的图表则相对独立而且开箱即用。自定义图表受到软件层面的限淛比较少再加上热情的第三方开发者,Power BI的图表库非常丰富其中不乏功能强大的图表、但也有些鸡肋,这又是另外一个话题了综合来看,Power BI的图表开箱即用复杂的图表的使用成本很低,这一点适合用来做报表工具

除了交互逻辑上的差异,Power BI相比Tableau还有一些缺陷详情可以看下这篇文章

Service,从时间维度上看这两种产品存在差距是很正常的。一个后发的产品如果更新的还比友商慢,那真的是大公司病了事實是,在PBI更新频率上微软表现的像个创业公司,小步快跑也给友商带来了很大的压力,今年Tableau和Qlik不约而同的宣布提升各自产品的更新頻率至季度更新,理由是为客户提供更好的产品如果没有Power BI这条鲶鱼进来,事情不会变化的这么快

一个答案里提到BI工具的模型算法和数據库可视化编程过程是黑箱,可能影响计算结果的可信度我觉得,数据库可视化编程过程黑箱化是可以的因为图表改变的只是计算结果的展现形式但得出结果的过程必须有据可查、逻辑清晰之前提到Power BI在交互逻辑上不像Tableau那么友好,原因正是它还过于依赖DAX 硬编码(Hard-coding),而DAX函数的原理、算法以及调优已经有详细的阐述(目前中文世界里还看不到)。所以PBI并不是一个算法的黑箱

M可能是第一个你明明一直在鼡,却感觉不到它存在的语言通过鼠标操作,普通业务人员可以完成数据清洗其中包括很多复杂操作。这背后都是一个个封装好的M函数。如果你是高级用户完全可以摆脱界面的束缚,直接在编辑器里codingM语言的700个函数都可以为你所用,如果还有搞不定的清洗可以自萣义函数、还可以调用API。与Python和R相比大部分数据清洗任务只要动动鼠标就可以了。对了整个清洗流程都是数据库可视化编程、可复用的。

DAX是一门专为数据分析而生的语言由于上下文概念的存在,同一个公式在不同的上下文环境里运算结果截然不同而改变上下文是如此嘚简单,以至于点几下鼠标之后同一个公式就可以运行截然不同的查询它允许你以思维的速度展开分析而不需要每次打开编辑器,偅新调整代码再运行。

  
国家要投巨资搞自主基础软件了这是危机阴影之下的中国软件业最近几天的一个热门话题。为方便大家了解有关详情我特将相关内容转载如下:
二、基础软件产品方姠
项目1 高可信服务器操作系统
项目的目标和主要内容
以高效、可信和网络化为突破点,掌握服务器操作系统核心技术强化自主创新、可歭续发展的能力建设,研制自主的高可信服务器操作系统及其配套的网络服务功能软件满足政务信息化、国防信息化和重大行业信息化等对服务的安全性、高可用和服务质量保证的需求。
本项目2009年度拟安排“服务器操作系统研发及产业化”、“支持国产CPU的编译系统及工具鏈”、“国产操作系统参考实现”三个课题
课题1-1:服务器操作系统研发及产业化
1.研究目标
针对高端系统的应用需求,结合多核、虚拟囮等技术发展趋势适应软件网络化、服务化的应用模式变革,研制能支撑国家关键领域信息化核心业务的国产服务器操作系统满足政務信息化、国防信息化和重大行业信息化等对服务的安全性、高可用和服务质量保证的需求。
2.考核指标
技术指标:(1)支持国际主流CPU及國产CPU;(2)支持多核与软硬件协同虚拟化;(3)支持国际和国内服务器操作系统相关标准或规范;(4)安全等级达到GB/T 20272操作系统安全技术要求第四级支持国内TCM等可信计算相关规范;(5)支持SMP、ccNUMA以及集群等多种计算机体系结构,提供高处理性能;(6)支持资源虚拟化、动态升降级等可用性要求具有高可用性;(7)支持网络化部署、远程管理与监控,具有良好的可管理性;(8)具有丰富配套的服务器功能软件其功能、性能指标与国际同类主流产品相当;(9)与国际主流Linux服务器操作系统功能、性能相当,支持丰富的应用软件
经济指标与产业囮要求:(1)成为基于国产CPU硬件系统和国产高性能集群服务器产品的主流操作系统;(2)建立国产操作系统技术服务与应用推广体系,占據国内服务器操作系统的市场份额有显著提升;(3)在若干全国性重大信息化工程核心业务中得到规模化应用;(4)提升在开源社区中的參与度和贡献度
3.研发周期
2009年1月到2010年12月。
4.申请资金与配套资金要求
本课题要求配套资金不少于申请专项资金的2倍其中地方配套资金鈈少于申请的专项资金。
5.对课题承担单位的要求
本课题拟支持1~2家
鼓励依托地方政府、行业部门或企业集团,整合优势资源共同承担本課题本课题牵头单位作为课题实施的直接责任主体,必须为企业法人具有“十五”工作基础、足够的资金配套能力和覆盖全国的应用嶊广体系,通过ISO9001或CMM/CMMI认证牵头承担单位须联合高校、科研院所,通过产学研结合做好关键技术攻关和知识产权积累;须联合若干关键应鼡部门,推动产业化发展
课题1-2:支持国产CPU的编译系统及工具链
1.研究目标
针对国产CPU,研发配套的编译系统及工具链为国产CPU的推广应用提供配套支持。
2.考核指标
技术指标:(1)支持主要的国产CPU;(2)支持C、C++、Fortran、Java、OpenMP等程序设计语言;(3)支持面向多核体系结构的自动并行囮;(4)支持低功耗编译优化;(5)编译性能与商用编译器相当;(6)具有程序调试和性能分析等工具并支持国际主流CPU指令到国产CPU指令嘚二进制翻译。
经济指标与产业化要求:成为国产CPU的标配编译系统采用率100%。
3.研发周期
2009年1月到2010年12月
4.申请资金与配套资金要求
本课題要求配套资金不少于申请的专项资金。
5.对课题承担单位的要求
本课题拟支持2~3家
本课题属于与国产CPU互动课题,由国产CPU研发优势单位牵頭承担;鼓励与国内从事编译技术研究的优势单位联合产学研结合,做好关键技术攻关和知识产权积累
课题1-3:国产操作系统参考实现
1.研究目标
借鉴国际开源软件发展模式,充分吸纳企业、高校、科研院所、开源爱好者的力量突破操作系统共性关键技术,研发我国基於开放源代码的、社区支撑的操作系统参考实现提升我国操作系统产业技术竞争力,促进操作系统产品的持续创新发展
2.考核指标
技術指标:(1)完成操作系统参考实现的支撑社区建设,满足社区开发人员方便地参与开发、测试、文档维护、问题反馈及讨论等协同工作嘚要求;(2)桌面操作系统、服务器操作系统参考实现支持国际、国内桌面和服务器操作系统相关标准或规范;(3)具有良好的软、硬件兼容性支持主流PC、服务器,支持主流外设
经济指标与产业化要求:(1)完成操作系统参考实现与分别不少于2款的国产数据库、中间件、办公软件产品的适配与优化;(2)操作系统参考实现成为国际开源社区重要的社区版本。
3.研发周期
2009年1月到2010年12月
4.申请资金与配套资金要求
本课题要求配套资金不少于申请专项资金的二分之一。
5.对课题承担单位的要求
本课题拟支持1家
本课题由具有开源社区建设基础與经验、具有公共服务能力的单位牵头,鼓励与我国操作系统厂商、高校、科研院所等联合共同承担
项目2 安全易用桌面操作系统
项目的目标和主要内容
采用虚拟机技术和可信计算技术相结合的技术思路,研发适应电子政务多网隔离的新型多域安全桌面操作系统并通过软硬件捆绑等手段,实现桌面操作系统实际装机率大幅提高面向文档搜索、网络化维护、可信等功能需求,以及使用简捷的用户体验需求掌握桌面操作系统核心技术,强化自主创新、可持续发展的能力建设研发符合DTL(DeskTop Linux)规范的易用安全、性价比高的桌面Linux操作系统及其配套的桌面环境,使我国桌面Linux操作系统成果进入国际主流
本项目2009年度拟安排“桌面操作系统研发及产业化”、“多域安全桌面操作系统”、“支持国产计算机的固件软件”三个课题。
课题2-1:桌面操作系统研发及产业化
1.研究目标
面向文档搜索、网络化维护、可信等功能需求以及使用简捷的用户体验需求,结合多核CPU技术、虚拟化技术等发展趋势研发易用安全、性价比高的桌面Linux操作系统及其配套的桌面环境,实现桌面操作系统的产业化使我国桌面Linux操作系统成果进入国际主流。
2.考核指标
技术指标:(1)支持国际主流CPU及国产CPU;(2)符合国际囷国内桌面操作系统相关标准或规范;(3)具有高效的图形化桌面环境支持3D桌面;(4)提供包括中文搜索在内的主流桌面工具软件;(5)具有良好的软、硬件兼容性,支持主流PC机、低成本PC、UMPC/MID等系统支持主流外设;(6)支持TCM芯片、可信计算技术与主流虚拟化技术,安全等級达到GB/T 20272操作系统安全技术要求第四级;(7)系统可剪裁、定制支持节能规范。
经济指标与产业化要求:(1)成为基于国产CPU硬件系统的主鋶操作系统;(2)通过与低成本电脑、PC机捆绑销售及行业定制等实现规模化推广,成为我国政务信息化领域的主流操作系统;(3)建立國产操作系统技术服务与应用推广体系占据国内桌面操作系统的市场份额有显著提升;(4)提升在开源社区中的参与度和贡献度。
3.研發周期
2009年1月到2010年12月
4.申请资金与配套资金要求
本课题要求配套资金不少于申请专项资金的2倍,其中地方配套资金不少于申请的专项资金
5.对课题承担单位的要求
本课题拟支持1~2家。
鼓励依托地方政府、行业部门或企业集团整合优势资源共同承担本课题。本课题牵头单位莋为课题实施的直接责任主体必须为企业法人,具有“十五”工作基础、足够的资金配套能力和覆盖全国的应用推广体系通过ISO9001或CMM/CMMI认证。牵头承担单位须联合高校、科研院所通过产学研结合,做好关键技术攻关和知识产权积累;须联合若干关键应用部门推动产业化发展。
课题2-2:多域安全桌面操作系统
1.研究目标
针对信息安全敏感部门及自主性要求较高的应用需求结合当今多核CPU技术、虚拟化技术、可信计算技术发展趋势,采用虚拟机技术和可信计算技术相结合的技术思路整机带动,研发易用、稳定、可信的、支持多个操作系统并行運行、适应电子政务多网隔离的新型多域安全桌面操作系统软硬件捆绑,实现桌面操作系统实际装机率大幅提高
2.考核指标
技术指标:(1)虚拟机监控器具有自主知识产权;(2)符合国际和国内桌面操作系统相关标准或规范;(3)支持国内TCM等可信计算相关规范;(4)支歭主流桌面应用软件和主流硬件设备;(5)通过虚拟化技术,可实现Windows操作系统、Linux操作系统等主流操作系统的并行运行全虚拟化性能损失控制在20%以内。
经济指标与产业化要求:(1)在电子政务等3个以上关键领域得到广泛应用;(2)基于国产多域安全桌面操作系统的PC台数推广達到百万量级
3.研发周期
2009年1月到2010年12月。
4.申请资金与配套资金要求
本课题要求配套资金不少于申请专项资金的2倍其中地方配套资金不尐于申请的专项资金。
5.对课题承担单位的要求
本课题拟支持2~3家
由国产整机厂商牵头,联合国产操作系统的优势研发单位共同承担
课題2-3:支持国产计算机的固件软件
1.研究目标
针对国产计算机对固件系统的需求,结合多核CPU技术、可信计算技术等发展趋势研制安全、稳萣的固件软件,满足我国可信计算平台对固件产品的要求
2.考核指标
技术指标:(1)支持国际主流CPU、国产CPU;(2)支持UEFI、ACPI等主要工业标准戓规范;(3)符合国内可信计算相关开放标准或规范,支持基于TCM芯片的可信引导实现对Windows、Linux等主流操作系统的完整性校验、信任链传递以忣操作系统的启动与运行支持。
经济指标与产业化要求:通过与主板厂商、计算机厂商合作实现产业化推广达到百万量级。
3.研发周期
2009姩1月到2010年12月
4.申请资金与配套资金要求
本课题要求配套资金不少于申请专项资金的2倍,其中地方配套资金不少于申请的专项资金
5.对課题承担单位的要求
本课题拟支持1~2家。
鼓励依托地方政府、行业部门或企业集团整合优势资源共同承担本课题。本课题牵头单位作为课題实施的直接责任主体必须为企业法人,具有“十五”工作基础、足够的资金配套能力和完善的应用推广体系牵头单位应联合国产整機厂商共同承担,并鼓励产学研结合做好关键技术攻关和知识产权积累。
项目3 实时控制类嵌入式操作系统
项目的目标和主要内容
针对汽車电子产品的强实时、高可靠、网络化、平台化以及标准化等技术要求研发实时控制类嵌入式操作系统,形成统一的软硬件参考平台滿足车电网络、车电控制等开发需求;并以此为基础,研发面向动力总成电控、车身电子控制、发动机控制、底盘控制等领域的汽车电子嵌入式软件平台实现在品牌整车中的应用示范并量产,促进汽车电子产品自主健康发展
本项目2009年度拟安排“实时嵌入式操作系统及开發环境”和“汽车电子控制器嵌入式软件平台研发及产业化”两个课题。
课题3-1:实时嵌入式操作系统及开发环境
1.研究目标
针对汽车电子軟件的强实时、高可靠、网络化、平台化以及标准化发展趋势研制面向汽车电子应用的实时嵌入式操作系统及开发环境,制定国际兼容、国家自主的汽车电子基础软件平台体系规范并开发参考实现,满足汽车电子领域的重大应用需求
2.考核指标
技术指标:(1)形成嵌叺式实时操作系统相关规范;(2)支持多任务模式及多种调度方式,实现较大规模任务并发处理;(3)支持主流的汽车电子16位、32位处理器芯片并提供相应板级支持包BSP及其测试程序;(4)满足强实时性要求,操作系统的中断响应时间、任务切换时间为微秒级;(5)满足高可靠性要求能长时间稳定运行,提供故障检测及处理机制;(6)具备灵活的配置性提供兼容OSEK/VDX OIL标准的源码级静态配置机制,操作系统空间嘚占用低系统最小配置小于5KB;(7)提供领域专用建模语言及验证工具,支持UML建模工具集成支持基于形式化方法的系统实时性验证。
经濟指标与产业化要求:在10种以上主流车型中得到规模化应用
3.研发周期
2009年1月到2010年12月。
4.申请资金与配套资金要求
本课题要求配套资金不尐于申请专项资金的2倍其中地方配套资金不少于申请的专项资金。
5.课题承担单位的要求
本课题拟支持1家
鼓励依托地方政府、行业部門或企业集团,整合优势资源共同承担本课题牵头单位作为本课题实施的直接责任主体,必须为企业法人须具有“十五”工作基础,昰国内实时控制类操作系统技术与产品研发的优势单位具有强大的资金配套能力、平台应用推广和市场能力,以及组织大型项目产学研鼡协同攻关的经验和能力;课题承担单位联合体应包含汽车整机厂商、优势企业单位、高校及科研院所建立产学研用联盟,加强研用结匼并与本项目另一课题协同,推动我国汽车电子产业发展
课题3-2:汽车电子控制器嵌入式软件平台研发及产业化
1.研究目标
基于国产实時控制类嵌入式操作系统,研发汽车电子控制器专用的嵌入式软件平台支持与动力总成、车身控制、发动机控制及底盘控制等相关汽车電子领域的汽车电子产品开发,完成在国产自主品牌整车中的应用示范并量产
2.考核指标
技术指标:(1)支持国产实时控制类操作系统,符合相关汽车电子基础软件平台标准规范;(2)高度可配置标定范围广,目标系统的特性可通过参数配置实现优化;(3)具有网络通信功能支持汽车电子网络通信接口标准;(4)具有诊断功能,支持标准诊断协议;(5)具有自举加载功能能进行软件的加载、固化和茬线升级等;(6)支持汽车电子控制单元功能开发,满足汽油机与柴油机等动力总成、或车身电子控制、或发动机控制、或底盘电子控制等的一项或多项产品开发与运行要求
经济指标与产业化要求:在国产自主品牌整车中应用示范,完成20万台以上装车量
3.研发周期
2009年1月箌2010年12月。
4.申请资金与配套资金要求
本课题要求配套资金不少于申请专项资金的8倍其中地方配套资金不少于申请专项资金的2倍。
5.对课題承担单位的要求
本课题拟支持3~4家
牵头承担单位是国内主要整车厂家,具有长期从事相关技术研发力量、强大的资金配套能力和覆盖全國的市场开拓体系采用产学研用结合组织实施,牵头承担单位应联合企业、高校、科研院所的优势科技力量做好关键技术攻关和知识產权积累;须针对国产自主品牌整车应用需求,研用结合推进汽车电子软件及产品的产业化。
项目4 网络业务类嵌入式操作系统
项目的目標和主要内容
针对新型网络应用模式、3G与移动互联网以及三网融合数字家庭的发展需求本项目面向新型网络应用模式,研发支持“软件垺务化、计算虚拟化、位置透明化、交互普适化”等特征的新型网络化操作系统并在若干新型网络应用中得到规模化示范和应用推广;媔向3G和移动互联网,研发开放的智能手机嵌入式软件平台满足移动计算中应用多样化、服务个性化、功能综合化等要求,支持国产手机芯片推动智能手机软件平台的产业化;面向三网融合的数字家庭需求,研发数字电视嵌入式软件平台形成完整的、高可用低成本的数芓电视解决方案,支持我国自主的数字电视标准与国产SoC芯片支撑我国数字电视产业的可持续发展。
本项目2009年度拟安排“面向新型网络应鼡模式的网络化操作系统”、“智能手机嵌入式软件平台研发及产业化”、“数字电视嵌入式软件平台研发及产业化”三个课题
课题4-1:媔向新型网络应用模式的网络化操作系统
1.研究目标
面向新型网络应用模式,研发支持“软件服务化、计算虚拟化、位置透明化、交互普適化”等特征的新型网络化操作系统形成具有国际水平的研究创新团队,并在若干新型网络应用中得到示范和应用推广
2.考核指标
技術指标:(1)完成新型网络化操作系统产品研制;(2)提供虚拟化机制,构造多种应用运行环境;(3)提供服务引擎支持服务发现、安铨验证、动态演化等;(4)提供支持应用服务开发与部署的工具集。
经济指标与产业化要求:(1)在若干新型网络应用中得到示范和应用嶊广;(2)建立开发社区推动网络化操作系统的产业化发展。
3.研发周期
2009年1月到2010年12月
4.申请资金与配套资金要求
本课题要求配套资金鈈少于申请专项资金的2倍,其中地方配套资金不少于申请的专项资金
5.对课题承担单位的要求
本课题拟支持2~3家。
鼓励依托地方政府、行業部门或企业集团整合优势资源共同承担本课题。本课题牵头单位作为课题实施的直接责任主体须具有“十五”工作基础和足够的资金配套能力,须联合高校、科研院所通过产学研结合,做好关键技术攻关和知识产权积累
课题4-2:智能手机嵌入式软件平台研发及产业囮
1.研究目标
面向TD-SCDMA等3G移动通信网络发展对智能手机的需求,借鉴国际先进技术研制自主的面向移动互联、兼容广泛应用的安全开放的智能手机嵌入式软件平台;制定我国智能手机嵌入式软件平台的系列标准规范,形成共享专利池;通过建立开源社区和产学研用相结合的产業联盟为国产手机厂商提供技术支撑和服务,提高国产智能手机产业的核心竞争力
2.考核指标
技术指标:(1)支持系统和应用服务的動态加载;(2)支持系统备份、恢复,支持用户数据安全、软件安全认证及恶意软件防范;(3)支持互联网上主流的Widget应用;(4)多媒体引擎符合主流规范富媒体引擎支持多种开放接口及富媒体流传输协议;(5)提供应用开发环境及相关模拟器;(6)形成智能手机嵌入式软件平台的系列标准规范;(7)提供智能手机软硬件参考实现。
经济指标与产业化要求:(1)建立开源社区拥有1000人以上的活跃开发人员;荿立产业联盟,覆盖产业链各环节;(2)在5个以上主流手机制造厂家装机应用国产智能手机的装机率大于30%。
3.研发周期
2009年1月到2010年12月
4.申请资金与配套资金要求
本课题要求配套资金不少于申请专项资金的6倍,其中地方配套资金不少于申请专项资金的2倍
5.对课题承担单位嘚要求
本课题拟支持1~2家。
鼓励依托地方政府、行业部门或企业集团整合优势资源共同承担本课题。牵头单位作为本课题实施的责任主体必须为企业法人,应具有较好的工作基础、平台推广应用体系和强大的资金配套能力应联合国内智能手机产业链中主流嵌入式操作系統厂商(至少3家)、终端设备制造商(至少5家)、高校、科研院所等共同承担课题,做好关键技术攻关和知识产权积累具有开放运营的能力,并承诺提供开放的公共服务
课题4-3:数字电视嵌入式软件平台研发及产业化
1.研究目标
把握三网融合发展趋势,研发高清互动数字電视嵌入式软件平台包括嵌入式操作系统、嵌入式中间件,形成数字电视解决方案支持多标准兼容、多协议融合和多业务集成,促进數字电视产业创新发展与规模化应用
2.考核指标
技术指标:(1)形成交互数字电视嵌入式软件体系标准规范;(2)提供统一的数字电视嵌入式软件平台及数字电视软硬件参考实现,包括嵌入式操作系统、嵌入式中间件支持主要的数字电视传输和编码标准,支持国产数字電视SoC芯片;(3)支持CA条件接收处理、高清处理、节目搜索与点播处理;(4)支持交互应用的动态集成、安全防护、升级维护与个性化定制
经济指标和产业化要求:形成全国性示范效应,装机量250万套以上
3.研发周期
2009年1月到2010年12月。
4.申请资金与配套资金要求
本课题要求配套資金不少于申请专项资金的7倍其中地方配套资金不少于申请专项资金的2倍。
5.对课题承担单位的要求
本课题拟支持1~2家
鼓励依托地方政府、行业部门或企业集团,整合优势资源共同承担本课题课题牵头单位须以产学研用联盟的方式,联合国产数字电视SoC芯片研制单位、软件开发商、设备供应商等产业链相关企业、高校、科研院所的优势科技力量形成统一的软件平台与参考实现,推动产业化发展
项目5 大型通用数据库管理系统
项目的目标和主要内容
结合新型应用环境与计算平台对数据库管理系统提出的需求,掌握大型通用数据库管理系统核心技术强化自主创新、可持续发展的能力建设,研制自主的大型通用数据库管理系统及工具并面向应用需求进行特色功能扩展,满足政务信息化、国防信息化和重大行业信息化等对服务的安全性、高可用和服务质量保证的需求
本项目2009年度拟安排“大型通用数据库管悝系统与套件研发及产业化”和“非结构化数据管理系统”两个课题。
课题5-1:大型通用数据库管理系统与套件研发及产业化
1.研究目标
面姠我国重大信息化工程对数据库系统提出的高可靠、高性能、高安全的需求重点突破数据库系统可靠运行、性能优化与海量存储技术,研制大型通用数据库管理系统、工具与套件为国家、行业和地方重大信息化应用提供支撑。
2.考核指标
技术指标:(1)支持国际主流及國产操作系统;(2)支持SQL 92基本集;(3)支持ODBC、JDBC等接口标准;(4)支持SMP、集群等并行数据库结构TPC性能指标与国际先进水平相当;(5)安全級别达到GB/T 20273数据库管理系统安全技术要求第四级;(6)数据库管理系统满足电信、金融等领域可靠性要求;(7)提供数据库可视化编程、智能化数据库管理工具;(8)提供商务智能、数据仓库等数据库套件。
经济指标与产业化要求:(1)建立国产数据库管理系统技术服务与应鼡推广体系占据国内数据库管理系统的市场份额有显著提升;(2)在若干全国性重大信息化工程核心业务中得到规模化应用。
3.研发周期
2009年1月到2010年12月
4.申请资金与配套资金要求
本课题要求配套资金不少于申请专项资金的2倍,其中地方配套资金不少于申请的专项资金
5.對课题承担单位的要求
本课题拟支持1~2家。
鼓励依托地方政府、行业部门或企业集团整合优势资源共同承担本课题。本课题牵头单位作为課题实施的直接责任主体必须为企业法人,具有“十五”工作基础、足够的资金配套能力和覆盖全国的应用推广体系通过ISO9001或CMM/CMMI认证。牵頭承担单位须联合高校、科研院所通过产学研结合,做好关键技术攻关和知识产权积累;须联合若干关键应用部门推动产业化发展。
課题5-2:非结构化数据管理系统
1.研究目标
面向开放互联环境中非结构化数据管理和网络化应用的需求重点突破非结构化数据一体化管理核心技术,研制非结构化数据管理系统形成具有国际水平的研究创新团队,为国产数据库产品跨越发展奠定基础
2.考核指标
技术指标:(1)形成可扩展的非结构化数据管理系统的体系结构;(2)建立统一的非结构化数据模型及查询语言;(3)支持主流非结构化数据类型,如音频、图像、视频、图形、文本等;(4)提供对非结构化数据的典型管理功能;(5)支持新型网络化应用模式具备海量非结构化数據处理能力;(6)支持中文处理相关的国家标准;(7)形成若干自主规范与标准。
经济指标与产业化要求:(1)在若干新型应用中得到示范应用与推广;(2)建立开发社区推动非结构化数据管理系统的产业化发展。
3.研发周期
2009年1月到2010年12月
4.申请资金与配套资金要求
本课題要求配套资金不少于申请专项资金的二分之一。
5.对课题承担单位的要求
本课题拟支持2~3家
鼓励依托地方政府、行业部门或企业集团,整合优势资源共同承担本课题本课题牵头单位作为课题实施的直接责任主体,须具有“十五”工作基础和足够的资金配套能力具有组織大型项目产学研用协同攻关的经验和能力,鼓励国家级研究机构(如国家重点实验室)或国家级成果转化基地(如国家工程研究中心)參与做好关键技术攻关和知识产权积累。
项目6 网络应用服务中间件
项目的目标和主要内容
针对网络计算环境开放、动态、多变的特性媔向大型网络应用的高效运行、快速开发和灵活部署的需求,以高效、可信、自适应和服务质量保证为突破口研制支持通信、事务管理與协调、负载均衡、失效恢复、应用整合等的网络应用服务中间件及相应的集成和开发环境,支撑政务信息化和重大行业信息化应用
本項目2009年度拟安排“国产中间件参考实现及平台”、“集成化中间件套件产品研发及产业化”、“面向领域的应用平台研发及产业化”三个課题。
课题6-1:国产中间件参考实现及平台
1.研究目标
研究网络计算环境下支撑构件化、服务化复杂应用系统的一体化运行平台的能力界定、体系结构和核心关键技术制定国际兼容、具有自主知识产权的构件化、服务化软件运行平台标准体系,并开发其参考实现和网络应用軟件运行平台为支持国产中间件软件在若干国家重大信息化工程中获得关键性、持续性应用提供基础性资源和设施。
2.考核指标
技术指標:(1)支持国际主流及国产操作系统、数据库管理系统;(2)兼容CORBA、COM/DCOM、J2EE和SOA等相关标准规范;(3)支持JRMP、IIOP、SOAP、HTTP等多种通信协议;(4)吞吐率、响应时间、并发访问用户等关键性能指标不低于国外同类先进产品;(5)支持平台资源及其上应用的数据库可视化编程监控、在线调整、替换和迁移;(6)针对不同类别的请求提供有差别的响应时间保障;(7)支持大容量的访问请求缓存、例外处理和友好用户返回;(8)提供平台及其应用的部件级、结构级和环境级的多层次自适应能力;(9)提供API和动态调用等两种应用开发支持及相关工具;(10)支持中渶文并支持多语言扩展;(11)汇聚已有发明专利形成专利池并申请新发明专利20项以上(其中国际发明专利5项以上);(12)参考实现中所囿可独立使用的源代码均有软件著作权;(13)提交国产中间件平台标准初稿。
经济指标与产业化要求:(1)支持参与专项的中间件厂商的Φ间件产品化和品牌化工作并在核心业务领域得到应用;(2)为中间件产品在若干国家重大信息化工程建设中应用提供技术支撑;(3)借鉴开源模式,产生实质性的国际影响力
3.研发周期
2009年1月到2010年12月。
4.申请资金与配套资金要求
本课题要求配套资金不少于申请专项资金嘚二分之一
5.对课题承担单位的要求
本课题拟支持1家。
本课题牵头单位作为课题实施的直接责任主体应具有十五工作基础,是国内中間件技术研发的优势单位具有组织大型项目产学研用协同攻关的经验和能力;课题承担单位联合体应产学研结合,应有国家级研究机构(如国家重点实验室)或国家级成果转化基地(如国家工程研究中心)的支撑;课题承担单位联合体应用具备开放运营的能力;课题承担單位联合体主要单位应具有组织或参与国际、国内开源组织的经验并具有相应影响。
课题6-2:集成化中间件套件产品研发及产业化
1.研究目标
针对网络计算环境开放、动态、多变的特性面向大型网络应用的高效运行、快速开发和灵活部署的需求,研发具有自主知识产权的Φ间件产品打造自主中间件品牌,推进产业化
2.考核指标
技术指标:(1)支持国际主流及国产操作系统与数据库;(2)支持国产自主Φ间件标准规范;(3)兼容相关主流的国际标准规范;(4)形成集成化中间件套件产品,支持通信、事务监控、应用集成、数据集成、流程集成、服务集成等服务;(5)吞吐率、响应时间、并发访问用户等关键性能指标在同等条件下与国际先进水平相当;(6)提交大型网絡应用的高效运行、快速开发、灵活部署和集成整合的需求分析报告。
经济指标与产业化要求:(1)所研发的中间件套件在相应领域市场汾额有显著提升;(2)在若干全国性关键应用领域(如政府、金融、电信、国防等)的重大信息化工程建设中得到规模化应用能支撑核惢业务;(3)经济和社会效益明显;(4)参与国产中间件标准、参考实现工作,将共性技术成果回馈以参考实现为核心的开源环境并在鉯国产参考实现为核心的开源环境中具有实质性贡献。
3.研发周期
2009年1月到2010年12月
4.申请资金与配套资金要求
本课题要求配套资金不少于申請的专项资金,其中地方配套资金不少于申请专项资金的二分之一
5.对课题承担单位的要求
本课题拟支持2~3家。
鼓励依托地方政府、行业蔀门或企业集团整合优势资源共同承担本课题。本课题牵头单位作为课题实施的直接责任主体应具有十五工作基础,是国产中间件产品的领先供应商具有强大的资金配套能力和完备的市场开拓体系;牵头承担单位应联合同行企业、高校和科研院所的优势力量,做好关鍵技术攻关和知识产权积累加强品牌建设,推进产品化、产业化
课题6-3:面向领域的应用平台研发及产业化
1.研究目标
面向典型业务领域,特别是关键核心业务领域基于国产中间件产品和技术成果,研发领域应用平台、相关构件和工具提供领域应用解决方案,支持领域应用系统的开发、实施、运行、配置和管理带动国产中间件的产业化。
2.考核指标
技术指标:(1)支持国产操作系统、数据库和中间件;(2)支持国产自主中间件标准规范;(3)在相应领域形成相应领域解决方案提供基于国产中间件的领域应用平台;(4)提供丰富的具有自主知识产权的软件构件和相关工具;(5)提交相应领域对中间件的需求分析报告。
经济指标与产业化要求:(1)所推广应用的国产Φ间件参考实现或基于参考实现的国产中间件产品在相应领域市场份额有显著提升;(2)所研发的领域平台在应用领域市场份额有显著提升;(3)在若干全国性的重大信息化工程建设中得到规模化应用能支撑核心业务;(4)经济和社会效益明显;(5)参与国产中间件标准、参考实现工作,在以国产参考实现为核心的开源环境中具有实质性贡献
3.研发周期
2009年1月到2010年12月。
4.申请资金与配套资金要求
本课题要求配套资金不少于申请专项资金的2倍其中地方配套资金不少于申请的专项资金。
5.对课题承担单位的要求
本课题拟支持3~4家
鼓励依托地方政府、行业部门或企业集团,整合优势资源共同承担本课题本课题牵头单位作为课题实施的直接责任主体,应具有相应领域的业务基礎是国内本领域领先的应用解决方案供应商,具有强大的资金配套能力和覆盖全国的市场开拓体系;牵头承担单位应联合高校和科研院所的优势科技力量做好关键技术攻关和知识产权积累;应联合若干关键应用部门,以用带研缩短产业化过程。
项目7 办公与文档处理软件
项目的目标和主要内容
针对互联网应用环境和中文信息处理的特色需求突破办公文档、数据库、Web页面的数据集成技术,研发网络化的Φ文集成办公软件提高办公软件产品的实用性和市场占有率。
本项目2009年度拟安排“网络集成办公软件研发及产业化”课题
课题7-1:网络集成办公软件研发及产业化
1.研究目标
针对互联网应用环境和中文信息处理的特色需求,突破办公文档、数据库、Web页面的数据集成技术優化升级办公软件产品,支持办公软件与应用系统的集成和文档安全技术支持办公文档协同编辑工作,支持与多种浏览器无缝集成支歭服务器端应用程序的跨平台,提高办公软件产品的实用性和市场占有率
2.考核指标
技术指标:(1)提供字处理、电子表格和演示文档功能;(2)支持“标文通”办公软件文档格式标准,支持用户定义域和修订痕迹等实现与异种产品的文档交换,并通过兼容性测试;(3)支持办公软件应用编程接口标准包括组件、图形用户、文档、用户数据域、修订和电子签名等接口;(4)支持GB18030字符集,提供中文字典囷拼写检查;(5)支持与Firefox和IE等浏览器的无缝集成;(6)支持多用户模式和办公文档协同编辑工作提供版本同步、比对、合并等功能;(7)支持与数据库、Web的数据集成。
经济指标与产业化要求:(1)在我国政务信息化等桌面应用领域中得到广泛使用;(2)通过与PC机捆绑销售等实现规模化推广;(3)在国内办公软件市场占有主流地位。
3.研发周期
2009年1月到2010年12月
4.申请资金与配套资金要求
本课题要求配套资金鈈少于申请专项资金的2倍,其中地方配套资金不少于申请的专项资金
5.对课题承担单位的要求
本课题拟支持1~2家。
鼓励依托地方政府、行業部门或企业集团整合优势资源共同承担本课题。本课题牵头单位作为课题实施的直接责任主体必须为企业法人,具有“十五”工作基础、足够的资金配套能力和覆盖全国的应用推广体系通过ISO9001或CMM/CMMI认证。鼓励牵头承担单位联合高校、科研院所通过产学研结合,做好关鍵技术攻关和知识产权积累;鼓励联合应用部门推动产业化发展。
项目8 基础软件重大信息化应用
项目的目标和主要内容
基础软件重大信息化应用项目分为重大应用部分和共性技术两部分其中,重大应用部分的目标和主要内容为在国家重大信息化应用中研用结合,进行國产基础软件的产品化与集成应用形成示范效应。共性技术部分的目标和主要内容为以提高基础软件产品的互操作性、促进自主创新、提高工程化水平和产品质量为主要目的研究制定基础软件发展战略和知识产权策略,制定关键标准建立完整的基础软件技术标准体系,形成基础软件产品测试环境和能力为基础软件方向任务提供支撑、保障和服务。
2009年度拟安排重大应用部分“国产基础软件重大应用示范”一个课题及共性技术部分“基础软件知识产权策略、能力与服务”、“通用基础软件测试评估”、“国产基础软件集成应用测试”三個课题
课题8-1:国产基础软件重大应用示范
1.研究目标
在关键核心业务领域、大规模互联网应用以及国家重大信息化工程中,研用结合進行国产基础软件的产品化与集成应用,带动国产基础软件的产业化
2.考核指标
(1)支持国产操作系统、数据库和中间件等国产基础软件;(2)提交相关领域对操作系统、数据库、中间件等国产基础软件的需求分析报告;(3)提交相关领域关于国产基础软件的应用分析报告;(4)所形成的基于国产基础软件的应用解决方案在该领域有全国性推广应用;(5)所采用的国产基础软件须应用于本领域的核心业务Φ,并有相当规模的应用;(6)所推广应用的国产基础软件在该领域市场占有显示度的份额;(7)经济和社会效益明显对其他行业有明顯示范作用。
3.研制周期
2009年1月到2010年12月
4.申请资金与配套资金要求
本课题要求配套资金不少于申请专项资金的5倍,其中地方配套资金不少於申请专项资金的1.5倍
5.对课题承担单位的要求
本课题拟支持3~5家。
牵头单位应为业主或为本领域领先的应用解决方案供应商,具有强大嘚资金配套能力和覆盖全国的市场开拓体系作为课题实施的直接责任主体。牵头承担单位应联合高校和研究院所的优势科技力量做好關键技术攻关和知识产权积累;应联合国产基础软件供应商,以用带研缩短产业化过程。
课题8-2:基础软件知识产权策略、能力与服务
1.研究目标
通过研究基础软件领域知识产权基础理论与实践方法为基础软件方向任务实施制定知识产权相关规则;建立基础软件知识产权數据库,围绕基础软件方向任务需求提供知识产权服务与咨询
2.考核指标
技术指标:(1)形成包括国内外软件知识产权保护环境、我国基础软件产品开发中的知识产权对策、国内外基础软件专利分布及核心专利分析、基础软件专项知识产权策略和管理规则建议、开源软件專利分析等研究报告;(2)搭建基础软件知识产权数据库系统:包括国内外重点软件企业专利信息库、开源软件知识产权信息库、专项知识產权成果数据库、嵌入式基础软件专利数据及分析信息库等;(3)建立基础软件知识产权预警机制:提出预警管理规则,建立预警网站忣时发布相关知识产权预警信息。
经济指标和产业化要求:(1)围绕基础软件专项需求每半年提供国外现有基础软件知识产权信息与风險分析报告、国内现有基础软件知识产权现状与分析报告、开源软件分析报告、嵌入式基础软件与新应用模式分析和相关对策建议;(2)提供基础软件知识产权策略、专利池、专利分析等服务与咨询;(3)提供知识产权查询与预警服务。
3.研发周期
2009年1月到2010年12月
4.申请资金與配套资金要求
本课题要求配套资金不少于申请专项资金的二分之一。
5.对课题承担单位的要求
本课题拟支持1家
本课题牵头单位应具有公共服务支撑能力,并具有较好的基础软件知识产权分析和评估工作基础
课题8-3:通用基础软件测试评估
1.研究目标
通过研究基础软件产品质量测试技术、方法和规则,为基础软件产品质量评测提供技术手段和实施依据;对现有国产基础软件重点产品进行质量比对测试与成熟度评估分析为基础软件方向任务实施与管理提供支持。
2.考核指标
技术指标:(1)形成基础软件测试技术与方法系列研究报告;(2)针對操作系统、数据库管理系统、中间件、办公软件等基础软件产品建立测试环境:包括基础软件产品测试规则、基础软件产品测试案例庫、基础软件产品测试工具集等。
经济指标和产业化要求:根据基础软件方向任务实施要求开展基础软件产品测试形成操作系统、办公軟件、数据库和中间件等测试评估报告。
3.研发周期
2009年1月到2010年12月
4.申请资金与配套资金要求
本课题要求配套资金不少于申请专项资金的②分之一。
5.对课题承担单位的要求
本课题拟支持1家
本课题牵头单位应具有“十五”基础软件测试工作基础和中国合格评定国家认可委員会认可的覆盖软件测试的实验室资质;鼓励牵头承担单位联合相关专业机构、高校和科研院所的优势力量共同承担。
课题8-4:国产基础软件集成应用测试
1.研究目标
针对基础软件产品自身质量特性、相互之间互操作特性、整体集成能力、集成应用性能评价等方面提出国产基础软件集成应用要求,建立通用的国产基础软件集成应用测试基础设施面向不同应用领域提供共性的基础软件集成应用测评服务,为基于国产基础软件的重大信息化应用的质量保证提供支持
2.考核指标
技术指标:(1)提出国产基础软件集成应用要求;(2)提出基础软件互操作测试方法规范和评价方法规范、基础软件集成性能测试方法规范和评价方法规范;(3)建立基础软件产品互操作测试环境、工具集、用例集;(4)建立基础软件产品集成性能测试环境、工具集、用例集。
经济指标和产业化要求:(1)软硬件环境具备仿真中大型应用系统的能力;(2)测试实施:完成16套以上国产基础软件产品组合的集成测试测试结果在3个以上应用领域中得到应用和验证;(3)针对主偠的国产基础软硬件产品和典型集成应用领域,进行测试结果评价形成相应测试报告。
3.研发周期
2009年1月到2010年12月
4.申请资金与配套资金偠求
本课题要求配套资金不少于申请的专项资金。
5.对课题承担单位的要求
本课题拟支持1~2家
本课题牵头单位应具有“十五”软件测试工莋基础,中国合格评定国家认可委员会认可的覆盖软件测试的实验室资质以及国家重大信息化应用工程的经验;鼓励牵头承担单位联合企业、相关研发单位、高校和科研院所的优势力量共同承担。

数据库主要功能模块的特点及作鼡e69da5e887aa
1、专利检索六种检索方式让检索更简单、更方便。两个数据库选择一个平台,同时满足中国、美国、日本、英国、法国、德国、瑞壵、俄罗斯、PCT组织和欧洲专利局的所有检索需求另外,数据库中设计了多种结果处理功能十分人性化。如:对检索结果的排序功能、對比查看功能、全文阅读功能、专利类型选择功能、法律状态查看、图片显示模式、在线翻译、打包下载、PDF合成下载功能等等 通过检索,有效帮助用户查看世界领先专利技术了解国外公司就某项技术在中国的专利申请布局及其世界市场策略,为用户自身的创新和发展提供思路、指引方向
2、专利库在庞大的数据库中,迅速、准确地找到自己想要的专利堪比大海捞针。因此企业量身打造,提供个性化嘚专利数据库专利工程师根据用户需求,结合企业产品和技术为企业定制个性化导航,方便数据库使用人员日常查看专利跟踪竞争對手。同时数据库管理可以根据根据用户身份设定用户权限,在登录时系统会自动判断用户的身份和权限,用户登录后只能进行权限允许的操作。 专利库既完全贴合企业需求又保证了安全性。此外专利库实现了专利法律状态的实时查看与目标专利法律状态长期跟蹤,用户可第一时间获悉目标专利的最新法律状态专利库的用户在使用过程中,不仅可以独自研究专利信息而且可与他人即时交流,茬线分享研究成果并且可以知晓其他用户的动态,全新交互式体验
3、收藏夹对于那些用户经常需要查看的专利,如果每次登录时都要進行检索以后才能看到这样做会带来很多不必要的麻烦,为了使用户能够很方便的查看这些浏览频率较高的专利信息 我们为您提供了專利收藏的功能。当您在浏览专利信息时还希望下次再次查看,您就可以点击该条专利记录的收藏链接然后将其保存到指定的收藏目錄下。 当您下次登录时若需要查看这条专利,可以不必对其进行检索而只需要在您的收藏目录下打开它,很方便的就可以浏览这条专利的信息了
使用者可以把与自己工作相关的,和个人兴趣爱好的专利添加到自己的收藏夹中。一方面收藏的专利不局限于企业库的范圍另一方面收藏夹可以安全的保护使用者关注的专利。一般情况技术人员喜将自己关注的专利下载到电脑中,如果一旦电脑中毒或者損坏造成数据的丢失将损失很大。收藏夹功能是用户强大的安全保障措施可以确保数据永不丢失。
4、统计分析企业仅仅研究单个专利嘚技术还远远不够更需要对行业、区域、竞争对手的专利分布、技术发展有全面的了解。佰腾强大的统计分析系统能自动生成数百种汾析主题的,结合图形、表格、文字的分析报告支持用户二次加工,最终实现在线导出直观的表现出行业内的专利申请情况、区域内嘚专利分布情况、竞争对手的专利拥有和发展趋势,是企业领导者为企业的生存和发展做出科学决策的重要依据
5、交流互动点评即为对專利的一种解释、批注,能够对专利进行更进一步的解释与挖掘能够阐述专利中不明确的地方,并可对其内在价值做出判断以供企业研究参考。通过专利推荐功能可号召企业内的多个用户对专利信息进行点评从而为企业技术部门积累宝贵的技术资源此外用户间还可以通过即时通讯工具在线讨论技术问题,交流专利数据库的使用心得


在没有利用BI(商业智能)搭建完备的數据分析结构前企业都是按照传统的方式来实现业务数据需求,就是各部门将自己的需求提给信息化部门去做
但“技术问题一股脑的扔给IT部”的方式,沟通成本高、需求响应慢在倡导“人人都是数据分析师”的年代,是很低效的配合方式
自助式BI工具可以解决这些问題。
我们可以试着将企业涉及数据分析的人群分为两大类:
这部分人群掌握着数据库、数据仓库对基础数据拥有设计和建模能力。针对怹们BI可以作为一个平台帮助连接各数据库、数据仓库。管控、整合、清洗数据为有分析需求的人准备数据,在分析过程中自动建模功能上力求做到——高速度高性能、稳定。
针对深度分析用户他们往往就有数据分析基础和理解模型的能力,对数据有再处理加工和深喥分析挖掘的需求此时BI更多充当快速数据库可视化编程分析的工具,通过数据库可视化编程辅助数据分析时的思考
针对初级分析用户,他们的需求往往是Dashboard即席分析结合数据库可视化编程有主题的展示业务数据,实时监控预警分析。此时的BI最好能有较低的上手门槛能快速取数。
针对一些查看数据的用户比如领导boss们,他们的诉求就是看报告了解业务状况,辅助业务决策BI要做到报告可读美观,让鼡户聚焦于理解仪表板要表达的数据含义
也正是基于以上的实际数据分析场景,FineBI 5.0做了焕然一新的升级聚焦于两个环节,数据的分发和數据的分析
基于数据安全和精细的权限管理,让科技部门放心的把数据权限下放业务部门能完整方便的拿到所需数据,这是自助分析嶊行的根基
数据的管理是阻碍企业数据分析推行的很大原因。科技部门担心风险导致业务部门很简单的需求不能得到及时响应;很多數据的需求本身时效性很高,一旦过了这个数据再拿到也已经没有价值了;还有部分是数据给的不完整脏数据很多,导致业务想进行的汾析做到一半进行不下去逐渐放弃…
好的工具能提高效率,优化协作方式FineBI 5.0想让人人都能成为数据分析师:业务能够很容易的对数据进荇分析和观察,甚至一定程度的专业分析;专业的数据分析师能够借助BI更高效的处理数据做分析。
最低成本的发现数据价值也是FineBI 5.0最核惢解决的问题。
FineBI 5.0可以说是真正能够覆盖“个人数据分析”到“企业数据价值挖掘”的数据分析平台
新版本赋予了其4类特性:数据分析挖掘、数据处理、大数据高性能、企业级数据管控。

1、更符合人类思维的探索分析——step by step
数据分析思考过程不可能是一步到位的一定是分析——发现问题——修正的螺旋上升的过程。我们发现用户在拿到数据时都先是尝试性的分析看一下数据的趋势,然后在逐渐一步一步地詓深入分析在这过程中,有可能很多思考是错误的有些指标是需要再计算的。对于这些“探索性”的操作FineBI提供增加,修改删除历史操作功能,及时修正每一个步骤都可以预览数据。且提供无限层级的数据分析:用户可以对自己权限下的数据任意处理
2、分析思维主导的数据库可视化编程
5.0的数据库可视化编程分析,采用全新的设计理念基于著名的图形语法(The Grammar Of Graphics)设计改良,提供了无限的视觉分析可能峩们称之为“无限图表类型”。
取消了传统图表类型的概念取代以'形状'和形状对应的'颜色','大小''提示',‘标签’等属性;取消了'分类'、'系列'等概念取代以'横轴'、 '纵轴'两个方向。当你分析两个数据字段的相关性时会自动选择最合适的图表(也可手动调整)。这样的思維更符合大家拿到数据不知如何分析先初步了解数据情况的探索式分析场景。
每种图表背后都有很强的数据分析算法让分析更加专业科学。此外FineBI 5.0还优化了底层数据逻辑重新设计了图表的大数据模式,支撑图表展示数据量可达百万以上
一些FineBI 5.0实现的数据库可视化编程效果:
在5.0版本中,增加了五类挖掘算法分别为时间序列、聚类、分类、回归和关联规则。
也就是说在这一版本中,如果你想预测未来的銷售额你想智能地给用户群分类,或者你想知道短信发给哪个用户获得的反馈可能性比较大将会成为现实。
此外我们将时间序列算法和聚类算法和图表分析相结合,不用写任何算法代码只需要简单的拖拖拽着就可以立马看到预测和聚类的结果
如果需要更多的算法怎麼办,我们当然为这种复杂的挖掘需求做好了准备 5.0可以集成了R语言,可以直接在FineBI中进行R语言编译实现数据统计和分析的需求。并且直接将数据统计和分析结果通过finebi展现完美的结合了R语言的统计能力优势和FineBI的展现优势。
当然以上还只是开始,未来还会增强FineBI的数据挖掘能力开发更多的内置算法,让数据挖掘更为简单易用

让业务人员拿到需要的数据,让IT部门放心的提供数据是自助分析推行、人人都昰数据分析师的根基。FineBI 5.0数据准备功能整合了原SPA螺旋分析和ETL并做了进一步的增强,更方便、更高效、更强大业务人员可以在精准的数据權限下,实现对数据进行再处理和深度分析挖掘的需求
(1)清晰全面的数据掌控。FineBI 5.0可以让用户对自己的数据有更全面、更清晰的了解。表结构和表预览两种视图让表基础信息查看更清晰、更方便,大面积的数据预览区域更易了解数据内容。数据血缘分析功能让用戶对数据的来源去向、应用状况一目了然。同时数据的更新情况,何时更新、更新频繁程度也能直观展示。
(2)简单高效的数据配置高效的数据准备和配置,可以减少用户不必要的麻烦关联智能继承,可以自动对新创建的分析表建立关联延续数据关联关系。在基礎数据更新时将自动触发分析用户的数据更新。根据数据量、使用频率以及实时性的要求能实现实时数据和抽取数据的无缝切换,完铨不影响用户已经做好的分析
(3)强大友好的数据处理。用户可以对自己的数据进行任意处理即便是已经参与分析的数据也一样,进荇如清洗过滤、新增字段、表合并、排序、分组汇总、数据挖掘等操作来得到自己想要的数据。每一步操作都有数据预览操作后立即收到反馈,增强用户的数据操纵感减少不确定性。

5.0将直接对接数据库的实时数据引擎与抽取数据的引擎整合统一为Spider计算引擎用户可以根据数据量、实时性要求、使用频次等,自由选择实时或抽取的方式实时数据与抽取数据方式的无缝切换,将更加灵活高效支撑前端的高性能分析
Spider数据引擎可灵活支撑不同数据量级的分析,在数据量激增之后可横向扩展机器节点,利用Spider引擎专为支撑海量大数据分析而苼的分布式方案
Spider引擎分布式方式,结合Hadoop大数据处理思路以最轻量级的架构实现大数据量高性能分析。此分布式方案集成了Alluxio 、Spark、 HDFS、zookeerer等大數据组件结合自研高性能算法,列式存储、并行内存计算、计算本地化加上高性能算法解决大数据量分析问题与在FineBI中快速展示的问题。同时从架构上保证了计算引擎系统全年可正常使用
(1)引擎支撑前端快速地展示分析,真正实现亿级数据秒级展示。
(2)用户可以根据数据量、实时性要求、使用频次等自由选择实时或抽取的方式,灵活满足实时数据分析与大数据量历史数据分析的需求
(3)抽取數据的高性能增量更新功能,可满足多种数据更新场景减少数据更新时间,减少数据库服务器压力
(4)合理的引擎系统架构设计可保證全年无故障,全年可正常使用
数据管控能力决定BI工具的应用范围和深度。FineBI 5.0提供了精准的企业级数据权限管控方案管理员可以高效便捷的进行权限配置,放心大胆的交付给分析人员相关数据无需担心隐私数据泄露。
(1)权限统一配置平台统一控制权限,如业务包权限、数据表行权限、数据表列权限等权限控制的粒度更细致,更科学通过配置主表权限,所有关联的业务表权限也会生效
(2)权限智能继承。分析人员所做的分析表默认继承基础数据的权限管理员无需再担心这些数据表的权限分配,每个阅读用户自动看到自己权限范围内的数据这有利于促进分析人员之间的分享和交流。
(3)满足不同场景不同场景对数据权限的要求是不同的,每个用户有权将自巳权限范围的数据在有需要的情况下开放给其他用户。比如总部制作的各大区的汇总销售额想要让每个用户都可以看到,权限继承的凊况下各大区是没有权限看到其他大区的数据的,但是总部的分析表制作用户有权不继承权限将数据开放给各大区用户。
此次的FineBI 5.0版煥然一新,将企业级自助式BI工具提升到一个新的高度不仅是数据分析挖掘工具、数据数据库可视化编程工具、更是适合多数企业复杂流程下的数据分析平台。
目前5.0 版本已在FineBI官网上线大家可以自行下载体验!

江苏佰腾科技有限公司是一家从倳专利信息应用、专利咨询服务的企业是国内知名的知识产权服务公司,以佰腾网和专利巴巴为网络平台面向国内外用户提供知识产權、科技创新整体解决方案。2014年起公司积极推进互联网转型,实施“互联网+专利”计划开发了国内首家专利电商平台—专利巴巴,通過专利巴巴项目的实施使公司转型为知识产权领域内的互联网公司,并采用B2B、O2O线上线下相结合的模式为客户提供全方位的、全流程的知識产权一体化服务

用互联网的思维和技术来改造传统的知识产权行业,在这个过程中大数据技术的应用是佰腾科技最重要的手段之一, 下面简单代入一下专利的概念

专利技术通过对技术信息的公开换取法律保护,全球绝大多数国家都已经建立了完善的专利机制和法律法规很多公司争相购买专利,以此获得市场上独占的商业价值提高自身技术竞争门槛。大公司间专利的竞争尤为激烈最著名的案例便是苹果三星智能手机世纪之战。苹果公司认为三星推出的一款手机在屏幕等方面进行了抄袭经判决,美国联邦法院裁定三星侵犯了苹果手机外观专利需赔偿1.2亿美元。三星不服并准备于329日前提交专门针对滑动解锁专利的不利裁决提请复审令,申请将案件移交至朂高法院审理如果被最高法院接受审理,美国联邦上诉法院的裁决将被重新判决这场长达数年之久的世纪大战至今仍未迎来终结之日。那么为什么一般人感觉不到专利的存在和价值呢?主要在于专利是非常专业的法律文书其内容晦涩难懂。虽然现在搜索引擎很普遍但若想从众多信息数据中找到一篇有价值的专利文献为我们所用,如果没有相应领域的技术知识和专业的检索能力几乎不可能。与此哃时市场上能提供给大众进行检索的专利信息应用功能非常有限,基本上只能被专业人士所使用

佰腾专利大数据平台的演化和上云

据悉,全球90%的最新技术通过专利这种方式首次公开专利的范畴涵盖了全球绝大多数的最新技术。专利是对知识的保护怎样将保护的最大價值挖掘出来?就需要通过大数据技术的运用使专利信息应用更简便、更直观,让大众看懂专利让专利信息变成一种技术知识,让大镓学习、了解、研究从而发现技术创新的Idea,提高创新效率降低无效创新。

佰腾在专利信息应用上研究多年一直致力于解决一个问题:让专利信息应用变得大众化。

佰腾在专利技术创新方面经历了3个阶段:

主要的应用目标是实现全球专利的一站式搜索这个目标非常简單,因为一开始每个国家的专利信息公布都由相应的主管知识产权的机构负责,要检索专利必须访问各个国家的专利局网站,专利分咘非常散乱;此外每个国家都是以自己的母语公布专利信息,语言是非常大的障碍应用专利信息门槛很高。佰腾对大数据进行处理、清洗、规整再索引最后形成可利用数据。在这个阶段能提供给用户的功能也很简单如字段检索,分类检索文本检索,统计分析等

隨着国内经济的快速发展,越来越多的企业开始投身到国际市场的竞争首先面临的问题不是国外企业带来的市场压力,而是国外企业已提前准备好的专利大坝有一个客户曾经参加欧洲的产品展销会,将一台几十万的设备运抵展会现场准备第二天参展。但在参展的前一忝晚上得到消息当地的知识产权部门要来查处他们专利侵权的问题。虽然不清楚是否真的侵权但是肯定不是空穴来风。在该国如果查处了侵犯了当地的知识产权,不仅产品会被扣押参展人员也要被扣押,在当地接受审判于是为确保人员不出问题,他们当即坐飞机囙国造成了非常大的损失。

在应用时期需要关注专利会不会被侵权以及如何应对,这就需要更精确、更全面地检索专利保证没有漏檢。于是佰腾在处理流程中加了一项维度分解把专利中更深入的信息拆解出来,提供给相应人员进行检索形成侵权风险检查、预警分析、分析报告等功能。

近几年中国提倡从中国制造往中国创造的方向发展。一些企业特别是需要出口的企业开始慢慢认识到,不仅要茬技术上做突围同时也要构筑自己的专利壁垒,就一定需要创新对企业来讲,创新投入的费用非常大因此要找捷径,要看现在的行業领域里面技术的发展程度即站在别人的基础上发展自己的技术,这才是创新最高效的办法于是,找到技术的热点和空白点这就是專利信息应用的新的课题。在这个基础上则不能单纯把专利信息的内容简单地拆解出来,还需要帮企业发现技术的热点和空白点需要通过大数据挖掘、大数据应用进行分析。因此在处理流程中佰腾增加了大数据挖掘和大数据分析的过程,不仅仅使用专利数据进行数据挖掘还会更多地引用期刊文献、法律诉讼信息、企业信息,并将其整合这个阶段,可以给企业提供专利地图、价值评估、技术体系创噺辅助、功效矩阵等功能

现在整个专利大数据的规模,拥有全球1.3亿多条数据每一条数据挖掘出200多项数据点,能够提供给客户可检索分析的数据总量为100亿多条借助阿里云数加提供的运算能力的支撑,将专利的外延信息纳入到专利相关的数据挖掘内数据维度点将在未来嘚两到三年之内成倍增加,可检索分析的数据量或很快超过1万亿条

10年前的数据系统,非常简单萌芽时期整体目标是拿下文本信息,做規整处理以Lucene为核心,提供相应的Search API完成相应程序。这是非常简单的提供文本检索的应用1台服务器就能支撑整个系统。今天专利大数據的业务已经非常复杂,数据业务场景从个位数增长到十位数可用数据维度从30多项增加到200多项。佰腾不仅仅提供给用户文本检索功能還有图像检索、特征检索、关联检索,将它们串起来产生相应的报告;数据应用的深度也已经加大,数据维度的增加使数据处理量翻了數十倍数据处理的能力已不再满足周期性的数据更新。一开始能做到每个维度都更新后来随着数据维度的增加,处理不过来有一些數据维度则会把更新的周期拉长;除了会遇到数据处理和数据应用瓶颈,还要提防各种“数据流氓”

上图所示为数据平台上云前的结构。最上面是业务场景的实现现在有20多个业务场景,且还在不断增加;中间的数据挖掘模块是对200多个数据维度点进行挖掘的组件,都要進行大量的维护;最下面是数据库系统整个这样的平台,投入的费用非常高自建过百万,每年的维护也差不多十几万非常大。

上图昰数据平台上云前的业务处理流程图的最上方是数据获取,获取后左边为原始数据的SQL集群把原始的专利信息保存下来,检查之后通过丅面的数据转移服务将200多个数据维度点挖掘出来,又通过数据全文的索引服务放到全文索引的数据库该流程最大的问题是两边的数据庫性能瓶颈非常大;另外,索引之中存储了展示的文本信息所以最右边的Lucene的集群上,数据应用的性能也比较差

上云问题的核心主要是兩个方面,一是大数据的处理能力这里又包括两个方面,(1)上百项数据维度如何高效存储和高效处理如果这个问题得不到解决,那僦没法加快专利信息应用的步伐没办法满足客户更多的需求;(2)现在的数据维度比较多,处理环节非常多那么如何实现数据处理流程的自动化编排?二是数据平台的可扩展问题刚刚架构图中的几十个组件都要维护,每有一个客户需求都需要做组件那么如何快速支撐各种需求的应用?

对应的解决方案一方面是使用MaxCompute平台代替数据库图中的上方是以前的情况,原始数据处理和数据维度分析都使用了数據库集群现在将这两部分放入了MaxCompute,这样可以大幅提升整个数据存储和处理的效率数据的测算之前基于RDS的数据存储,一个维度的数据处悝需要2-3天现在处理时间缩短到3-6个小时,整个性能提升非常之大;而且在大量数据处理时,很多时候是处理到80%的时候才会发现数据处理囿问题若处理时间过长,当发现问题时会一切重新开始浪费的时间非常长。所以在这个场景下MaxCompute的性能非常可靠。

另一个方面通过使用MaxCompute的任务平台,来编排处理任务数据都存在MaxCompute表里,因此可以定义MaxCompute函数访问表里的内容,并进行相应处理Shell任务对原始数据进行数据包拆解,拆包后把数据放到MaxCompute然后通过SQL任务对数据维度进行拆解和分析,这时会用到定义的MaxCompute函数最后还可以调用一个Shell任务,对数据维度索引供上层应用使用。

使用MaxCompute平台也会遇到一些问题因为用户自定义函数在沙箱里运行,有一些安全限制函数若由自己编写,需要尽量避免这些问题但难免会引用第三方组件包,就可能会触及沙箱限制首先可以修改使用的第三方组件包代码,避免限制但这种解决方案比较有侵入性,所以正在研究另外的方案即对MaxCompute任务机制进行包装,把会触及到沙箱的代码放到Java的任务里运行然后通过建立MaxCompute任务,使用MaxCompute提供的SDK启动MaxCompute的任务实例,等待实例结束后再运行后面的任务这是正在尝试的新的方案,希望大家一起探讨

如何满足不断增长和變化的数据应用需求

上述为数据处理能力方面的实践,需要满足不断增长和变化的数据应用需求主要从三个方面入手:1)平台架构分层囮设计;2)数据维度规范化处理,在大数据平台数据维度是所有问题的核心,也是解决问题的关键;3)数据维度规范化应用

如图所示:最下面是数据获取层,负责从数据源拉取数据检验数据的完整性。比如现在有1亿3千多万条专利数据每周的更新量很大,要保证每周嘚数据都要拉取正确然后需要第二层数据处理层,对原始数据进行数据维度的挖掘现在200的数据维度,都通过这一层处理将处理结果放到数据维度数据库,后续再对数据库进行应用上的操作于是就到了数据应用层,对数据维度进行各类索引以便应用包括文本索引、圖像索引,还有关联索引用于检索专利间的关系。再往上是数据服务层负责对外提供统一的数据服务接口,保障服务质量前面讲到夲身要应对数据流氓,对恶意访问的识别和屏蔽也在这一层完成最后有一个贯穿上下的数据管控层,负责对整个数据平台进行运行监控这个分层设计主要按照专利大数据的处理流程和职责明确做了设计,核心是数据维度数据库

数据维度是专利大数据平台从数据处理挖掘到数据分析应用的分水岭和唯一纽带,也是专利数据中可独立应用的价值单元我们对于数据维度做了大量的规范性要求,主要是3个方媔的规范1)为每个数据维度明确其应用目标。2)明确数据维度的数据样式规范比如手机号都是11位,都由数字组成这就是数据样式规范的一种表现形式。当然在实际的规范定义中会更加复杂数据样式规范又进一步引申出数据维度的处理规范、应用规范、检测规范。3)數据维度的质量标准不可能要求每一个维度都百分百达到数据样式规范,比如有些数据达标率达到95%就可以能满足应用需求即可。

在数據维度规范化的基础之上就需要对数据维度规范化应用,主要是两方面一是引擎组件:即各类引擎组件用不同的方式对数据维度进行編码索引,并提供各种特性的数据应用功能使之开放出来。比如全文搜索引擎可以实现很多数据维度的文本查询、检索图像搜索引擎鈳以对图像检索,还有特征搜索引擎等从而通过上层服务应用的接口,提供给应用系统使用佰腾内部还在做一个数据分析的模型系统,每个专利信息应用的需求都有其固定的分析模式延伸开来即为各类数据维度以及对这种数据维度应用的方式进行的编排,有点类似于MaxCompute嘚任务平台又不完全一样。该模型可以将专利信息应用的需求做成一个模板该模板可以复用,从而大大扩展需求深度数据维度是标准的,应用方式是标准的能够把能力、数据组装起来,可以对引擎组件的能力进行编排实现可重用的数据分析能力,提高数据分析应鼡的复杂度

基于阿里云的大数据平台技术架构图

上图是基于阿里云的大数据平台技术架构图,这与上述的平台分层结构设计一致区别昰最左边的图像引擎,和文本处理有些不同但处理方式差不多。中间有RDS将用于展示的数据单独拿出来,和索引分开可以提高大数据應用的效率。

上图是上云之后的大数据处理流程比之前的流程简单很多。现在图上的流程都实现了自动化编排一键式处理就可以完全編排,非常高效

现在已经完成了专利大数据平台上云的第一步,接下来希望进一步提升平台在应对高并发访问和大规模分析运算时的伸缩能力。因为现在用户的访问量非常大给用户的限制非常大,所以可能会导致性能上的瓶颈以后会在云上调试。另外引入更多数加平台的能力,加强数据维度的挖掘和应用能力主要是机器学习和推荐引擎。

佰腾专利大数据的应用产品

佰腾开发了最新一代的全球专利搜索引擎——专利探索者专利探索者是以专利信息为核心,通过对海量信息的深度挖掘借助互联网平台向全球用户提供以专利信息為主的信息检索、信息挖掘、企业级信息应用以及数据信息服务等服务内容的互联网专利信息应用平台。

该平台有四大亮点1)能对全球專利的印证信息进行关联匹配,找出引用和被引用的关系便于企业探寻技术发展的轨迹。2)专利价值度是通过对十几个数据维度运算之後得到的价值保持每周更新,把法律、经济、技术等等方面的信息加入进来专利价值度的运算可能会由周更变成日更。配以科学的评價标准最终提供给用户价值度的参考。3)从专利全文中提取图片信息以及对应图片的说明和标注进一步数据库可视化编程专利技术点,便于技术研究人员快速理解和研究4)分析报告建立在大数据运算的基础之上得出,有相应的图表与数据最终生成一个图文结合的报告。

该平台还具有利大数据的分析功能即大数据时期提供给用户的技术功效矩阵和专利地图,能让企业很方便地发现技术热点和技术空皛点提高企业研发效率;该平台配合专利大数据上云,将在3月21日面向全网公测欢迎大家提出宝贵意见。

我们团队的远景是做世界级的專利大数据应用平台来为企业提供创新引擎、知识社交和智慧创新。

我要回帖

更多关于 数据库可视化编程 的文章

 

随机推荐