一、什么是Hbasehadoop的局限性hadoop主要是实现批处理的处理,并且通过顺序方式访问数据要查找数据必须搜索整个数据集,如果要进行随机读写数据,效率低下Hbase是Bigtable的开源java版本,是建立在HDFS之上,提供高可靠性、高性能、列存储、可伸缩、实时读写的NoSQL数据库系统。’Hbase的应用场景1、对象存储 不少的头条类、新闻类的新闻、网页、图片存储在Hbase中,一些病毒公司的病毒库库文件也是存储在hbase中2、时序数据 Hbase之上有OpenTSDB模块,开源满足时序类场景的需求3、推荐画像 用户画像是一个比较大的稀疏矩阵,蚂蚁金服的风控就是构建在Hbase之上4、时空数据 主要是轨迹、气象网格之类,嘀嘀打车的轨迹数据主要就是存在Hbase中的。二、Hbase的安装我们之前搭建的hadoop是3.3.6版本,对应支持的Hbase版本推荐使用Hbase2.5.x,这里笔者选择了Hbase2.5.13的版本。由于Hbase依赖zookeeper作为集群协调器,因此我们需要先安装zookeeper。1、安装zookeeper在node01上安装zookeepertar -zxvf apache-zookeeper-3.7.2-bin.tar.gz -C /usr/local/cd /usr/localmv apache-zookeeper-3.7.2-bin zookeeper #重命名修改zoo.cfg配置cp -rf zoo_sample.cfg zoo.cfg #复制一个配置文件进行修改vi zoo.cfgdataDir=/usr/local/zookeeper/data