课程详情:大数据java加强
学习java中关于Concurrent高并发包、NIO、序列化反序列化(AVRO)、RPC等相关知识,掌握zookeeper、sqoop等大数据领域常用工具原理及使用,为后续大数据课程学习、分布式理论理解打下基础
Hadoop
HDFS:详细讲解HDFS使用方式、存储机制、可靠性保证、上传、下载、删除等实现原理、Java开发Api、开发插件等内容。MapReduce:详细讲解MR理论基础、开发方式、序列化机制、分区机制、Combiner机制、shuffle详细流程、MR案例、MR性能优化等内容。Yarn:介绍Yarn资源协调框架的基本原理、使用及调优。Hadoop是大数据生态中知名的组件,在行业中应用广泛,是学习大数据重要的技术之一
Flume
Flume是大数据生态环境中流行的日志收集框架,基于其灵活的可广泛配置的使用方式及优良的效率被广泛的应用在大数据生产环境中。课程中详细讲解了Flume的Source、Channel、Sink、Selector、Interceptor、Processor等组件的使用。并通过美团应用案例,展示了Flume企业级应用场景的实现方式,并在后续项目中有大量的应用
Hive
Hive是基于Hadoop的数据仓库工具,通过将结构化的数据文件映射为HIVE中的表,并提供类SQL的语法实现数据处理。学习内容包括hive的安装配置、hive的元
数据库、hive的内部表外部表、hive的分区表、hive的分桶表、hive的语法、hive的UDF等内容
Hbase
详细介绍了Hbase使用方式、Hbase逻辑结构、Hbase的理论基础-LSM树、Hbase的实现原理、Hbase表设计原则等内容,从理论到实践讲解Hbase相关知识