
会员
Spark核心技术与高级应用
更新时间:2019-01-01 01:25:42 最新章节:20.4 本章小结
书籍简介
从技术层面上,Spark作为一个快速、通用的大规模数据处理引擎,凭借其可伸缩、基于内存计算等特点,以及可以直接读写HDFS上数据的优势,实现了批处理时更加高效、延迟更低,已然成为轻量级大数据快速处理的统一平台。Spark集成SparkSQL、SparkStreaming、MLlib、GraphX、SparkR等子框架,并且提供了全新的大数据处理方式,让从业者的工作变得越来越便捷。本书从基础讲起,针对性地给出了实战场景;并围绕DataFrame,兼顾在SparkSQL和SparkML的应用。
品牌:机械工业出版社
上架时间:2015-12-01 00:00:00
出版社:机械工业出版社
本书数字版权由机械工业出版社提供,并由其授权上海阅文信息技术有限公司制作发行
最新章节
于俊等
最新上架
- 会员本书是一本介绍分布式数据库基础内容与应用的大数据专业类图书,力求培养读者对分布式数据库的应用技能。本书共11章,采用原理+代码实例+综合案例的编写形式,清晰明了地介绍分布式数据库的原理、基础应用、进阶应用及主流工具的使用方法、应用场景,以理实结合为编写要求,让读者能够轻松学习和掌握分布式数据库的内容。本书可以作为高等院校计算机、网络技术等相关专业的教材,也可以作为数据库相关工作的从业人员的参考用书计算机14万字
- 会员本书是《数据库原理——GaussDB技术及应用》一书配套的辅助教材。全书共分3部分:第一部分为实验指导,共有13个综合实验,每一个实验都是根据教学目标而设计,详细讲述了每一个实验的实验目的、实验任务及实验步骤,从而培养学生掌握关系数据库管理软件技术与应用的技能;第二部分为习题集,是根据主教材各章节内容编写的习题及习题答案,内容广泛,有填空、选择、简答、设计及实验题等多种形式,利求通过对这些习题的训计算机6.9万字
- 会员本书以案例的形式,介绍从思维模型分析到场景实践的数据分析方法。全书围绕“数据分析”与“运营增长”两大关键要素,在系统介绍数据分析思维、数据分析方法、数据采集技能、数据清洗技能等基础知识的同时,以问题为导向,解读运营与增长的关键性业务内容,在获客、激活、留存、变现、自传播循环等各个核心运营环节展开数据分析实战。本书提供案例相关数据集与源码包,适合数据分析、产品运营、市场营销等行业有数据分析具体业务需计算机12万字
- 会员本书以Python数据分析与挖掘的常用技术与真实案例相结合的方式,深入浅出地介绍Python数据分析与挖掘的重要内容。本书共11章,分为基础篇(第1~5章)和实战篇(第6~11章),基础篇包括数据挖掘基础、Python数据挖掘编程基础、数据探索、数据预处理、数据挖掘算法基础等基础知识;实战篇包括6个案例,分别为信用卡高风险客户识别、餐饮企业菜品关联分析、金融服务机构资金流量预测、O2O优惠券使用预计算机13.6万字
- 会员本书旨在向广大有志于投身芯片设计行业的人士及正在从事芯片设计的工程师普及芯片设计知识和工作方法,使其更加了解芯片行业的分工与动向。本书共分9个章节,从多角度透视芯片设计,特别是数字芯片设计的流程、工具、设计方法、仿真方法等环节。凭借作者多年业内经验,针对IC新人关心的诸多问题,为其提供了提升个人能力,选择职业方向的具体指导。本书第1章是对IC设计行业的整体概述,并解答了IC新人普遍关心的若干问题。计算机29.9万字
- 会员MySQL数据库是目前全球流行的数据库之一。《MySQL8.0从入门到实战》从入门到实战,系统全面、由浅入深地介绍MySQL数据库应用的各个方面。全书分为8个部分,共18章。第1部分(第1~3章)介绍MySQL的基础知识,包括初识MySQL、数据库设计和数据类型;第2部分(第4~6章)介绍MySQL的基本操作,包括SQL基础操作、MySQL连接查询和数据复制、MySQL基础函数;第3部分(第7、8计算机9.7万字
- 会员时序数据库是一种新型技术,主要用于工业互联网软件建设中。近年来,伴随着物联网技术在智能制造、交通、能源、智慧城市等领域的发展,时序数据库也发展迅速,成为搭建应用的必备数据库之一。《深入理解InfluxDB》从InfluxDB的安装开始,一步步详细介绍InfluxDB的功能及原理,带领读者深入理解以InfluxDB为代表的时序数据库。计算机7.6万字
同类书籍最近更新
- 会员本书是热销书《SQL基础教程》的作者MICK为志在向中级进阶的数据库工程师编写的一本SQL技能提升指南。全书可分为两大部分。第一部分介绍了SQL语言不同寻常的使用技巧,带领读者重新认识CASE表达式、窗口函数、自连接、EXISTS谓词、HAVING子句、外连接、行间比较、集合运算、数列处理等SQL常用技术,发掘它们的新用法。这部分不仅穿插讲解了这些技巧背后的逻辑和相关知识,而且辅以丰富的示例程序,数据库15万字
- 会员ThisisastepbysteptutorialthatdealswithMicrosoftServer2012reportingtools:SSRSandPowerView.IfyouareaBIdeveloper,consultant,orarchitectwhowishestolearnhowtouseSSRSandPowe数据库3万字
- 会员本书以VisualFoxpro9.0为例,详细介绍了VisualFoxpro9.0的特点、功能以及如何使用VisualFoxpro9.0进行程序设计与项目设计,并按照使用数据库的逻辑顺序,从数据库的交互操作、数据库程序设计和数据库应用系统开发3个方面组织教材内容,精心设计丰富恰当的实例,引导读者循序渐进的掌握数据库的基本理论和数据库应用系统开发的方法。数据库14.3万字
- 会员本书以大学图书馆的OPAC日志数据为例,主要借助日志分析和内容分析方法,对日志记录进行了梳理、编码,并从信息需求的特点、用户的检索策略(提问调整方式与模式)、用户遭遇检索失败的原因、应对及应对效果等角度进行了分析和讨论;在研究发现的基础上,从OPAC系统的完善、图书馆资源的建设、图书馆用户信息素养的提升等方面提出了建议和对策,改善高校图书馆的馆藏资源可获得性,改进高校图书馆系统的服务效能,提高用户数据库13.3万字
- 会员《检索匹配:深度学习在搜索、广告、推荐系统中的应用》主要介绍了深度学习在互联网核心的三大类业务(搜索、广告、推荐系统)检索系统中的应用。书中详细讲述了检索匹配的理论、演进历史,以及在业务中落地一个基于深度学习算法模型的全流程技能,包括业务问题建模、样本准备、特征抽取、模型训练和预测等,并提供了相应的代码。《检索匹配:深度学习在搜索、广告、推荐系统中的应用》共11章,分为四大部分。第1部分(第1~2数据库8.5万字