线

Cyrex Analytics帮助您洞察数据价值

通过增强系统性能、降低使用成本以及持续优化用户体验,Cyrex协助您以不同以往的方式掌控数据

Cyrex是什么?
Cyrex是开放的大数据分析平台,包括web应用和核心OLAP引擎两部分,web应用向终端用户提供良好的使用体验,OLAP引擎则为提供高效的数据分析能力和保证用户体验进行支持。 从业务用户角度看,Cyrex是一个B/S架构的BI系统,由于采用了全新的前端架构模式,Cyrex能在浏览器上为终端用户提供不亚于桌面应用的良好操作体验。
Cyrex前端采用单页面应用(SPA,Single Page Web Application)模式,能够提供桌面应用般的操作体验。
OLAP引擎是Cyrex系统的核心,它针对逻辑维度模型提供更强的分析能力,同时在面对海量数据时也能保持各粒度数据聚合运算的秒级实时响应。 OLAP引擎包含三个主要部分:多维数据库内核、维度谱图服务、分布式矢量聚合引擎。
OLAP引擎架构
就像关系型数据库对外提供SQL交互界面一样,OLAP引擎对外提供多维表达式(MDX,Multi-Dimensional Expressions)交互界面,多维数据库内核会首先对MDX进行解析并生成中间结构, 然后语义规则引擎将调用维度谱图服务和矢量聚合引擎来完成最终结果的生成。
维度图谱对Cube、Dimension、Hierarchy、Level、Member、Dimension Role等维度模型的元信息进行管理。
矢量聚合引擎负责底层数据的存储与运算,它向多维数据库内核提供逻辑多维数组的访问接口,以便内核能够支持面向逻辑多维模型的MDX查询, 同时矢量聚合引擎采用的数据非对称拆分和换位索引等算法解决了传统MOLAP中存在的数据膨胀和稀疏维重构等问题。
Cyrex Analytics较传统OLAP的优势
OLAP一般分为三种类型,ROLAP(Relational OLAP)、MOLAP(Multi-Dimensional OLAP)、HOLAP(Hybrid OLAP)。
ROLAP
ROLAP基于关系型数据库表结构,以星型或雪花型结构对数据进行物理存储。
相对于MOLAP,ROLAP不存在稀疏维(应该是稀疏维组合)所导致的数据空洞和膨胀问题,对存储空间的利用率是非常高的, 但ROLAP存在的问题是基于SQL的查询界面并不能与描述业务主题的逻辑多维模型契合,无论是星型还是雪花型架构,外部访问者都仍然需要以二维表结构的思路去面对数据, 并不具备多维数据分析的思考方式。
ROLAP另外的问题是对于粗粒度数据的聚合运算以及即席查询的支持能力不足,由于事实表中存储的大都是明细数据,所以ROLAP在进行粗粒度数据查询时会产生大量SUM函数操作, 导致一次查询耗费大量时间。
即席查询功能则对随机性、探索式、试错性的数据查询能力有较高要求,而ROLAP往往需要针对特定SQL进行专门的优化,很难达到对通用型查询的一次性优化。
ROLAP星型模型
MOLAP
MOLAP对外提供的访问界面能够以真正的逻辑多维度模型来描述数据,相对于ROLAP,MOLAP能够提供更为强大的多维查询分析能力。
可以将MOLAP的事实数据简单的想象成被存放在一个多维数组中,这样对于明细数据的查询可以直接通过内存地址获得,而各粒度汇总数据则可以通过对若干个连续内存块的汇总计算得到。
多维数组的底层数据结构使MOLAP的数据聚合查询能力大大强于ROLAP,但由此带来了数据膨胀的问题,当非常多的维度成员组合所对应的事实数据不存在时多维数组的有效数据密度会非常低。 MOLAP往往采用将稀疏的维度组合变成索引,同时把一个整体的多维数组分割降维成若干个小的多维数组的方式,来解决前述的数据膨胀问题,但这种方式也存在隐患, 当整体上导致数据稀疏的那几个维度改变时,所有的索引和降维数组都要重构。
MOLAP稀疏维索引结构
HOLAP
HOLAP是将ROLAP和MOLAP的特性进行结合,例如:将明细数据存放于类似于ROLAP的事实表中,将一些常用的汇总数据存放在类似于MOLAP的多维数组中。
ROLAP的 R 和MOLAP的 M 表示的是数据模型的描述形态,HOLAP中的 H 则表示的是底层数据的规划方式, ROLAP与MOLAP的区别主要在对外提供的逻辑模型方面,而HOLAP与前两者的不同之处则侧重于对内部非明细数据的汇总及存储方式。
Cyrex Analytics的OLAP技术
Cyrex OLAP是基于MOLAP改进而来,它不会出现传统MOLAP中的数据膨胀以及稀疏维重构等问题, 这是因为Cyrex OLAP采取了一种将总体数据集进行非对称拆分并在分布式架构下进行独立处理的方式,虽然逻辑上的Cube可能是稀疏的, 但是这些稀疏数据并不会实际占用储存空间。
而且,Cyrex OLAP可以做到任何粒度聚合数据的实时秒级运算,完全不需要进行预计算等多余的操作。
分布式矢量聚合计算引擎
Cyrex Analytics适用于任何用户
Cyrex Analytics提供了一个图形化、完全面向业务的交互友好的操作界面,业务人员可以使用自助式分析功能来验证自己的思路, 摆脱了传统BI下需要技术支持才能进行数据分析的模式,任何使用者即使完全不具备技术能力, 也都可以在短时间内使用Cyrex Analytics各项功能轻松的进行数据分析, 包括即席查询、多维查询旋转、切片、切块、聚合、过滤、复杂逻辑以及快速数据可视化开发等。
轻松进行数据分析
Cyrex Analytics的特点
  • 底层的分布式文件存储与数据聚合引擎采用C语言开发,具有很快的运算效率,能够在秒级时间实时响应万亿级多维数据集的聚合运算,无需进行预汇总。
  • 在多维数据分析能力方面进行了强化,Cyrex Analytics引入了维度角色的概念,使代表同一个业务角度的维度能够在同一个Cube中扮演多个不同的角色 (如在物流数据分析中地区维度同时扮演了始发地和目的地两个角色),同时优化了跨Cube查询能力,具备了更加强大的跨行业跨领域分析能力。
  • 在web应用层面,Cyrex Analytics提供了完全面向业务的数据模型,它屏蔽了任何技术细节,将数据集市以面向业务主题的形态呈现给终端用户。
  • 完全图形化的操作界面,任何操作都可以使用鼠标拖拽轻松完成,即使是进行复杂逻辑查询也无需写一行代码。
  • 前所未有的易用性,任何没有数据分析经验的人员均可在十分钟内掌握Cyrex Analytics的初步使用方法,轻松完成从即席查询、多维分析到数据可视化报表的创建。
  • 指标回溯能力,当用户查看最终分析结果时,不仅能看到自定义逻辑的计算结果,还能够清晰了解其计算过程。
Cyrex Analytics轻量化架构
可以部署在单台普通服务器上支持少量数据(小于50亿)的实时分析,也可以在分布式架构下支持万亿级海量数据的实时分析。
可以在企业私有化环境部署以支持用户的高安全性需求,也可以在云端以SaaS形态运行,用以促进数据的开放与融合。

预约演示与咨询

如需进一步了解邦格科技产品及方案,请提交以下信息,我们的专业人员将会与您联系。

联系我们
  • 电话:15222174025
  • 邮箱:support@bgotech.cn
  • 客服QQ:1715258982
  • 加入我们
客户支持
合作伙伴
邦格科技 ©bgotech.cn 津ICP备17008731号