大数据时代的来临一方面给企业带来了发展机遇,另一方面也对企业管理大数据带来了不小的挑战,企业的大数据分为两类:海量的结构化数据集和非结构化/半结构化数据集。海量数据给目前的企业数据库架构以及应用带来了很大的应用负载压力,而且实际应用中80%以上都是半结构化、非结构化(文档结构、图结构和键值结构)海量数据集利用传统数据库无法有效地管理,需要新型的NoSQL/NewSQL分布式数据库才能有效的管理,而业界应用最广泛的NOSQL数据库就是HBase,一款基于Hadoop大数据平台的半结构化数据库管理系统。
本次课程培训HBase分布式数据库的原理、技术选型和应用实践。包括用于管理结构化数据、半结构化数据和非结构化数据。并将HBase和键值数据库、文档数据库、列族数据库、图数据库,以及内存数据库进行对比剖析,并讲解在具体项目中如何与其它类型的数据库进行集成调用实现异构、多源的结构化、半结构化和非结构化数据的管理目标。
本课程深入剖析HBase数据库在不同场景下的应用选型,通过基础知识的讲解、关键技术的剖析以及实战应用案例的实践,针对海量结构化数据库和非结构化数据的分布式数据库进行深度剖析,主要包括在:(1)HBase分布式数据库的技术实现原理和应用实战;(2)Hadoop + HBase大数据管理平台的系统架构、部署配置、性能调优、开发运维和应用实践。安排的动手实验操作包括:(1)HBase和Hadoop的集成部署实践操作;(2)HBase依赖的分布式应用服务系统ZooKeeper部署与配置;(3)HBase集群的监控和管理动手操作;(4)HBase性能调优动手操作;(5)HBase大数据管理应用程序开发实战,用程序的方式实现一个管理半结构化JSON数据集和非结构化日志数据集的数据库设计、表结构设计、数据加载、数据查询等项目任务。
培训过程中讲师带着学员搭建HBase数据库集群,讲师所给定的数据集(约500万~4000万条数据记录),将数据加载到对应的HBase数据库中,并对照着实验手册进行命令行操作和API调用完成应用程序源代码的编写操作,完成讲师布置的实操任务。
定制授课+ 实战案例训练+ 互动咨询讨论,共3天 (说明:讲师会提供虚拟机镜像,并把HBase系统提前部署在虚拟机中,学员自带笔记本,并利用镜像启动多台虚拟机构建实验集群)
如果您对本课程感兴趣,课程培训和业务洽谈请联系钟老师13426380794@163.com