云产品线首页 > 产品介绍 > 云产品线

XDATA 大数据库

博瑞得科技  作者:admin  日期:2013-07-18  共有人浏览 

 一、前言

       随着互联网技术的成熟和应用的普及,企业积累的数据量正以指数级速度迅速增长,使得企业面临新的机遇和挑战。

       一方面,数据的不断更新扩张已经超过了现有典型的数据库软件和工具的处理能力,传统的数据管理和分析体系结构已经不能通过扩展规模来适应巨大的数据量;

       另一方面,这些包括个人信息、消费记录在内的海量数据当中,蕴含着大量有价值的信息,可以为企业经营、管理提供参考,推动业务发展和利润增长。因此,如何有效管理和利用这些海量数据,成为企业在新时期竞争成败的关键因素。


二、产品定位

       XDATA BDH是博瑞得综合各种云计算技术及大数据应用案例研发的基于Hadoop的大数据云平台,旨在为企业快速构建大数据存储、处理与分析的综合性平台,助力企业转变运营方式,完成数据资产从成本中心到利润中心的转变,充分利用信息的价值来实现业务优势,以数据驱动业务,实现商业智能。


三、功能介绍


       XDATA DFS:

       基于X86服务器的分布式文件系统,提供高度容错性、高吞吐量和高扩展性的海量数据存储解决方案。单个集群可达4000台服务器,最大支持10亿文件、100PB数据的存储。提供可视化分布式文件资源管理器,支持文件浏览、资源下载、文件在线压缩、文件夹信息统计、文件块跟踪等管理功能,以及Samba/NFS/FTP等多种网盘访问方式,具有构建价格低廉、无宕机平滑扩展、数据多副本高度容错、多服务器并行读写、数据以1:20高比率压缩存储等特点,是海量数据(视频、文本、图片、音频等)存储和处理的首选平台。


       XDATA DATABASE:

       建立在XDATA DFS基础之上,基于Shared Nothing(无共享)架构的分布式、面向列、多维度的数据库系统。支持TB到PB级海量数据存储和查询;提供JDBC/ODBC标准访问接口、数据透视、异构数据查询及聚合、定时和实时作业处理、数据映射管理、数据挖掘等功能;提供可视化的数据库管理配置工具;多驱动支持本地化数据计算;采用分布式索引机制满足更短的请求响应要求。具有良好的数据自动切分和负载均衡能力、查询效率随节点增加线性提高、高性能并发读写、海量数据实时挖掘和智能分析等特点。是为满足用户大数据需求,基于云计算技术和理念打造的高性价比、智能化的新一代分布式数据库管理平台。


       XDATA ETL:

       是高效、图形化、高扩展性的海量数据ETL工具,它可以从不同数据源中抽取、转换大量复杂结构的数据,按用户指定格式装载到目标库中。支持数十种数据库和结构化、半结构化数据;提供快速部署、实时和计划作业处理、多数据源管理、多种方式转换和清洗数据、多数据源批量加载等功能;采用分布式并行处理机制极大的提高了处理能力;通过操作步骤可视化配置、SQL语句支持、可视化调试跟踪等功能满足用户易用性要求。具有数据处理自动分区、负载均衡、处理能力随节点增加线性扩展、处理过程易操作维护、处理算法复用等特点。是为用户提供高质量、高价值数据资产的大数据处理平台。


四、产品特性


       高可用:采用X86服务器构成的标准N+2+1平台架构: N是工作站服务器,支持数据冗余,任一节点宕机不会影响平台正常运行;2是主控服务器,通过双机热备技术保证7*24小时可靠运行;1是冷备服务器,提供元数据定时镜像备份。

       可扩展:具备无宕机弹性扩展能力,单个集群可扩展到4000个节点。

高效率:独创的装载技术确保数据有序、并行、高速入库,单点装载速度大于100GB/小时;分布式智能索引提供良好的负载均衡性能,确保高效率的统计分析。

       高压缩:业界领先的压缩技术,轻量级压缩下数据不膨胀,启动高级压缩可以达到1:20以上的综合压缩比,压缩状态下查询性能不下降。

       高并发:读写无互斥,支持多版本并发控制,边入库边查询,充分利用现代多核CPU资源,并发用户大于2000。

       低成本:采用X86常规服务器存储和处理数据,优秀的平台构架能将成本降为传统方案的十分之一以上;通过按需逐步添加设备即能获得线性能力提升,避免项目前期的一次性大量投入。

       多接口:通过JDBC/ODBC、FTP、WebService等标准接口进行数据查询、分析、传输,向第三方提供丰富的数据共享能力。

       易用性:提供一键部署,可视化集群管理、维护工具,操作集群简单快捷。

       安全性:提供集群、数据库实时监控工具,并能通过网页、邮件方式异常报警,便于分析和感知故障,提前采取措施。

       可复用:提供持续扩充的ETL算法库。能从大量累积的ETL任务中智能抽取典型的数据挖掘场景加入算法库;并通过算法复用、共享,帮助用户更快获取目标数据,提高效率。


五、产品优势

       经客户验证稳定可靠的企业级Hadoop版本。

       全图形化用户操作界面,安装、管理、监控和配置都能可视化完成。

       改进的HDFS文件I/O 算法,数据复制动态调整策略,提高HDFS系统吞吐量。

       支持NFS/FTP等接口,提供简单的HDFS数据加载和访问方式。

       集群根节点高度容错,无单点故障。

       支持各种异构数据源数据。

       支持跨数据中心的镜像数据备份;支持快照功能迅速恢复数据。

       改进的HBase高性能并行计算架构,提供三级索引功能,实现高速的聚合和汇总算法。

       提供JDBC/ODBC标准接口,提供SQL实时查询。

       改进的分布式计算框架(MapReduce),兼顾长短任务调度公平,实现高性能计算;高容错能力,支持任务自动迁移和重试。

       提供ETL工具,支持可视化方式定制数据挖掘算法及计划任务,自动完成挖掘任务。

       提供分布式实时流数据处理架构,支持各种实时应用需求。

       强大的集群监控管理功能,能对集群从硬件资源到程序进程进行全程图形化监控,自动告警功能、运行日报等功能让管理员轻松管理。

       提供高度封装的第三方开发API工具包,提供完整开发指导手册与接口手册,提供大量开发例程,方便应用开发人员开发各项应用。


六、技术支持

       专业咨询服务

       项目立项阶段:架构设计、项目规划、容量设计

       问题分析阶段:分析系统需求、定义数据处理方案、提出集群系统方案、优化方案设计

       功能实现阶段:提供问题解答和咨询


       售后技术支持

       远程7*24电话

       Web 网络支持

 

       现场支持

       产品升级服务

       安装调试服务

分享: