企业大数据处理:Spark、Druid、Flume与Kafka应用实践在线阅读
会员

企业大数据处理:Spark、Druid、Flume与Kafka应用实践

肖冠宇
开会员,本书免费读 >

计算机网络数据库8万字

更新时间:2019-01-02 20:36:07 最新章节:9.4 小结

立即阅读
加书架
下载
听书

书籍简介

本书分三部分展开介绍:第一部分(第1章)主要介绍了企业大数据系统的前期准备工作,包括如何构建企业大数据处理系统的软件环境和集群环境。第二部分(第2~7章)首先介绍了Spark的基本原理,Spark2.0版本的SparkSQL、StructuredStreaming原理和使用方法,以及Spark的多种优化方式;然后,介绍了Druid的基本原理、集群的搭建过程、数据摄入过程,以及在查询过程中如何实现Druid查询API;接着介绍了日志收集系统Flume的基本架构和关键组件,以及分层日志收集架构的设计与实践;最后介绍了分布式消息队列Kafka的基本架构和集群搭建过程,以及使用Java语言实现客户端API的详细过程。第三部分(第8~9章)主要介绍了企业大数据处理的两个实际应用案例,分别是基于Druid构建多维数据分析平台和基于JMX指标的监控系统。
品牌:机械工业出版社
上架时间:2017-09-01 00:00:00
出版社:机械工业出版社
本书数字版权由机械工业出版社提供,并由其授权上海阅文信息技术有限公司制作发行

最新章节

肖冠宇
主页

同类热门书

最新上架

  • 会员
    《SQLServer从入门到精通(第5版)》从初学者角度出发,通过通俗易懂的语言、丰富多彩的实例,详细介绍了SQLServer开发所必需的各方面技术。全书分为4篇共19章,内容包括数据库基础、SQLServer数据库环境搭建、创建与管理数据库、操作数据表、SQL基础、SQL函数的使用、SQL数据查询基础、SQL数据高级查询、视图的使用、存储过程、触发器、游标的使用、索引与数据完整性、SQL中
    明日科技编著计算机14.1万字
  • 会员
    本书共3篇:第1篇主要介绍分布式数据库基础理论,包括经典的CAP理论、一致性算法相关的理论、并发控制相关的理论等;第2篇具体介绍Greenplum数据库,从分布式事务、分布式计算和分布式存储3个方面,深入代码层级,讲述分布式理论在工业上的实现;第3篇是总结和展望,介绍云原生数据库和新技术带给Greenplum和数据库管理系统的机遇和挑战。本书打破以理论介绍和架构介绍为主的思路,深入分析工业化的实现
    王凤刚计算机7.1万字
  • 会员
    MySQL数据库是目前全球流行的数据库之一。《MySQL8.0从入门到实战》从入门到实战,系统全面、由浅入深地介绍MySQL数据库应用的各个方面。全书分为8个部分,共18章。第1部分(第1~3章)介绍MySQL的基础知识,包括初识MySQL、数据库设计和数据类型;第2部分(第4~6章)介绍MySQL的基本操作,包括SQL基础操作、MySQL连接查询和数据复制、MySQL基础函数;第3部分(第7、8
    张文亮编著计算机9.7万字
  • 会员
    本书围绕数据挖掘竞赛,讲解了各种类型数据挖掘竞赛的解题思路、方法和技巧,并辅以对应的实战案例。全书共11章。第1章介绍数据挖掘竞赛的背景、意义和现状。从第2章开始,介绍了各种不同类型的数据挖掘竞赛包括结构化数据、自然语言处理、计算机视觉(图像)、计算机视觉(视频)、强化学习。每种类型的数据挖掘竞赛包含理论篇和实战篇:理论篇介绍通用的解题流程和关键技术;实战篇选取比较有代表性的赛题,对赛题的优秀方案
    许可乐编著计算机6.7万字
  • 会员
    时序数据库是一种新型技术,主要用于工业互联网软件建设中。近年来,伴随着物联网技术在智能制造、交通、能源、智慧城市等领域的发展,时序数据库也发展迅速,成为搭建应用的必备数据库之一。《深入理解InfluxDB》从InfluxDB的安装开始,一步步详细介绍InfluxDB的功能及原理,带领读者深入理解以InfluxDB为代表的时序数据库。
    郑强 张伟 刘爽计算机7.6万字
  • 全书以学生成绩管理数据库案例为主线,从建立空数据库开始,逐步讲解数据库中的表、查询、窗体、报表、宏、模块、VBA程序设计与数据库编程等Access2016的主要功能;以图书馆借还书管理数据库项目实训为辅线,结合每章知识设计项目实训内容,帮助读者巩固和加深对所学知识的理解和掌握;以商品销售管理数据库实战演练为扩展训练,帮助读者提高应用数据库技术分析和处理数据的操作技能。本书符合最新版《全国计算机等
    谢萍 周蓉 苏林萍编著计算机13.8万字
  • 会员
    《MySQL从入门到精通(第3版)》从初学者角度出发,通过通俗易懂的语言和丰富多彩的实例,详细介绍了MySQL开发需要掌握的各方面技术。全书共分为4篇22章,包括数据库基础,初识MySQL,使用MySQL图形化管理工具,数据库操作,存储引擎及数据类型,数据表操作,MySQL基础,表数据的增、删、改操作,数据查询,常用函数,索引,视图,数据完整性约束,存储过程与存储函数,触发器,事务,事件,备份与恢
    明日科技编著计算机14万字
  • 会员
    《企业级大数据项目实战:用户搜索行为分析系统从0到1》基于真实业务场景,以项目导向为主线,从0到1全面介绍企业级大数据用户搜索行为分析系统的搭建过程。全书共6章,第1章讲解项目需求与架构设计,详细阐述项目数据流与系统架构;第2章介绍大数据项目开发环境配置,手把手带领读者配置操作系统、Hadoop集群与相关工具,为后续项目实施打下基础;第3~5章逐步实现项目需求,第3章讲解用户行为数据采集模块的开发
    张伟洋计算机9万字
  • 会员
    《数据分析实践:专业知识和职场技巧》从初学者的角度出发,讲解了进阶为高级数据分析师所需的知识和技能,其中既包括数据分析岗位的介绍、发展现状及未来趋势,也包括实际工作中各环节的方法策略、实战案例,还包括职场中的困惑解答及面试指导。阅读本书,并基于本书进一步拓展所需要的知识能,可以帮助读者形成一套成系统、可实战的数据分析方法论。
    姜文哲计算机19.6万字

同类书籍最近更新

  • 会员
    本书采用案例的方式,按照数据库应用系统开发的流程,从应用背景、需求分析、系统设计、系统实现等步骤由浅入深、循序渐进地介绍每个案例的开发实现过程。全书分为8章,第1章介绍数据库系统的基础知识和数据库设计过程。第2章到第8章分别介绍以JSP、ASP.NET、C++和Java等作为前台手段,MicrosoftSQLServer作为后台数据库的系统开发案例。每个案例都提供了经过测试的完整源代码及说明,便于
    周丽娟 骆力明 张树东编著数据库5.2万字
  • 会员
    Pythonistheidealprogramminglanguageforrapidlyprototypinganddevelopingproduction-gradecodesforimageprocessingandComputerVisionwithitsrobustsyntaxandwealthofpowerfullibraries.
    Matthew Rever数据库3.2万字
  • 会员
    PyTorch作为深度学习领域逐渐崛起的新星,其易用性及Python友好性深受广大算法爱好者的喜爱,无论是在学术领域还是在工业领域,PyTorch都已经成为算法研究的首选。本书以深度学习为核心,详细讲解PyTorch技术堆栈,力求使用最直白的语言,带领更多的小白学员入门直至精通深度学习。本书包括10章,前5章主要讲解深度学习中的基本算法及概念,通过使用PyTorch实现经典的神经网络并辅以“加油站
    张敏数据库13.4万字
  • 会员
    本书主要讲解计算机组装基础、选购计算机硬件、选购其他计算机设备、组装计算机、设置BIOS和硬盘分区、安装操作系统和常用软件、计算机系统备份与优化、构建虚拟计算机测试平台、计算机的日常维护、计算机的安全维护、计算机故障基础和排除计算机故障等知识。附录中安排5个组装与维护计算机的综合实训,进一步提高学生对相关知识的应用能力。本书采用由浅入深、循序渐进的方式,以情景导入、案例讲解、项目实训、课后练习和技
    谢娜 谢峰数据库13.5万字
  • 会员
    本书是一本实用性数据库教材,重点突出应用性与新技术,将数据库技术基本原理与应用结合于一体,系统性强,基本概念与原理讲述清楚,同时与SQLServer2008相结合。学完本书后,学生既能掌握数据库基本原理与方法,也能操作与开发数据库应用系统。本书由6篇共20章组成,其中总论篇与基础篇共4章,操作篇共4章,产品篇共6章,工程篇共4章,应用篇共2章,最后的附录是数据库实验指导。本书适合作为普通高等学校计
    徐洁磐数据库22.1万字
  • 会员
    Node.jsisatoolwritteninC,whichallowsyoutouseJavaScriptontheserver-side.HighperformanceonaplatformlikeNode.jsisknowinghowtotakeadvantageofeveryaspectofyourhardware,he
    Diogo Resende数据库3.3万字