20.1MB
1.32MB
Apache HBase正式版是一款非常专业的Hadoop数据库管理工具,通过它我们可以随时随地读取和访问各种大数据。而且这个软件还可以用来低延迟访问几十亿条记录中的一行,非常强大。
Apache HBase官方软件介绍
Apache HBase是一个Hadoop数据库,是一个分布式、可扩展的大数据存储。当你需要随机实时读写你的大数据时,请使用Apache HBase,这是一个开源的、分布式的、版本化的、非关系数据库,以Google的Bigtable为模型。正如Bigtable利用Google文件系统提供的分布式数据存储一样,Apache HBase在Hadoop和HDFS之上提供了类似Bigtable的功能。软件功能
线性可扩展性。读写一致。
表的自动和可配置切片基于
对区域服务器的自动故障转移支持。
与Hadoop集成,作为源和目标。
易于使用的基于Java的客户端访问API。
对数十亿条记录中的一条线进行低延迟访问。
快速查找大型表格。
节俭网关和restful Web服务支持XML、Protobuf和二进制数据编码选项
可伸缩的基于Jruby(JIRB)的Shell
支持Hadoop指标子系统将指标导出到文件或Ganglia;或者通过JMX
访问接口
1.Native Java API是最常规、最高效的访问方式,适合Hadoop MapReduce作业并行批量HBase表数据。2.HBase Shell,HBase的命令行工具,最简单的界面,适合HBase管理。
3.节俭网关,采用节俭序列化技术,支持C++、PHP、Python等语言,适合其他异构系统在线访问HBase表数据。
4.REST Gateway,支持REST风格的Http API访问HBase,并取消了语言限制。
5.猪,可以用猪拉丁流编程语言来操作HBase中的数据。类似于Hive,本质是编译成MapReduce作业处理HBase表数据,适合数据统计。
6.Hive,目前发布的Hive版本还没有增加对HBase的支持,但是Hive的下一个版本0.7.0会支持HBase,可以使用类似的SQL语言访问。