概述
数据仓库软件实现企业数据的统一存储、分布式部署、集中分析和高效访问,是大数据系统的基础平台。具备从GB到PB级别的存储方案,支持Hive、MapReduce等批量计算、Spark内存计算、Impala和spark streaming流式计算等技术方案。
功能特点
-
数据存储支持PB级海量数据的存储和处理,支持SQL和MapReduce的并行处理功能。
-
支持高并发,线性扩展,采用了通用的MPP并行处理架构,在MPP架构中增加节点就可以线性提高系统的存储容量和处理能力用户可根据实施需要进行容量和性能的扩展。
-
高可用性,提供数据库层Mirror机制保护,即每个节点数据在另外的节点中同步镜像,当主节点发生错误时,可以切换到Stand by节点继续服务。
技术优势
-
全功能、多云、大规模并行处理数据平台,满足企业海量数据高并发、高可用性、安全性数据存储计算及服务要求。
-
通过准实时、实时的数据加载方式,实现数据仓库的实时更新,进而实现动态数据仓库(ADW),助力企业敏锐感知市场的变化,加快决策支持反应速度。