The Data Wrangling Workshop在线阅读
会员

The Data Wrangling Workshop

计算机网络编程语言与程序设计8.9万字

更新时间:2021-06-18 18:12:06 最新章节:9. Applications in Business Use Cases and Conclusion of the Course

立即阅读
加书架
下载
听书

书籍简介

Whileahugeamountofdataisreadilyavailabletous,itisnotusefulinitsrawform.Fordatatobemeaningful,itmustbecuratedandrefined.Ifyou’reabeginner,thenTheDataWranglingWorkshopwillhelptobreakdowntheprocessforyou.You’llstartwiththebasicsandbuildyourknowledge,progressingfromthecoreaspectsbehinddatawrangling,tousingthemostpopulartoolsandtechniques.ThisbookstartsbyshowingyouhowtoworkwithdatastructuresusingPython.Throughexamplesandactivities,you’llunderstandwhyyoushouldstayawayfromtraditionalmethodsofdatacleaningusedinotherlanguagesandtakeadvantageofthespecializedpre-builtroutinesinPython.Later,you’lllearnhowtousethesamePythonbackendtoextractandtransformdatafromanarrayofsources,includingtheinternet,largedatabasevaults,andExcelfinancialtables.Tohelpyouprepareformorechallengingscenarios,thebookteachesyouhowtohandlemissingorincorrectdata,andreformatitbasedontherequirementsfromyourdownstreamanalyticstool.Bytheendofthisbook,youwillhavedevelopedasolidunderstandingofhowtoperformdatawranglingwithPython,andlearnedseveraltechniquesandbestpracticestoextract,clean,transform,andformatyourdataefficiently,fromadiversearrayofsources.
品牌:中图公司
上架时间:2020-07-29 00:00:00
出版社:Packt Publishing
本书数字版权由中图公司提供,并由其授权上海阅文信息技术有限公司制作发行

最新章节

Brian Lipp Shubhadeep Roychowdhury Dr. Tirthajyoti Sarkar
主页

同类热门书

最新上架

  • 会员
    本书以Python为工具,全面讲解概率论与数理统计的主要内容和多元统计分析常用技术。全书包括13章和4个附录,内容翔实,讲解深入浅出。概率论4章,讲解概率论基础知识,主要是随机变量的相关理论;数理统计4章,主要是样本理论、参数估计和假设检验;回归分析2章,包括一元和多元回归分析及其统计解释;多元统计3章,主要讲解主成分分析和因子分析理论。整书内容简明,易上手,实用性强。本书不需要读者有良好的数学基
    李爽编著计算机20万字
  • 会员
    《Python数据可视化之Matplotlib与Pyecharts实战》以某上市电商企业的客户数据、订单数据、股价数据为基础,循序渐进地介绍Python可视化技术,重点介绍Pandas数据预处理与Matplotlib和Pyecharts在数据可视化应用中的基本功能和使用技巧。全书共分4篇,第1篇(第1~4章)主要介绍Python基础与Pandas数据预处理技术,帮助准备可视化数据;第2篇(第5~7
    王国平编著计算机7.4万字
  • 会员
    本书重点关注和介绍SpringBoot2框架的技术应用。SpringBoot是目前微服务架构使用最为广泛的框架之一,一旦开发人员掌握了该框架的配置和使用技巧,则对于当前微服务应用的开发将得心应手。本书详细介绍了SpingBoot2的开发环境、开发方式、数据库应用、MVC、RESTful、安全及测试等。对于刚开始接触微服务架构、SpringBoot的开发人员来说,这是一本很适合的书籍。本
    李世川编著计算机8.6万字
  • 会员
    本书就Python基础知识和交易策略的基本原理为切入点,由浅入深介绍了如何从零基础使用vn.py搭建自己交易系统。本书从原理着手到代码实践,内容由最基本的Python基础知识与Python中金融分析的常用包,逐步由浅入深介绍常用的指标并将使用vn.py进行实现。本书共分为8章,第1章与第2章介绍vn.py的环境搭建与Python常用的工具包,为后面使用vn.py实现交易策略做准备;第3章与第4章介
    欧阳鹏程编著计算机8.2万字
  • 会员
    《Python网络爬虫与数据分析从入门到实践》从初学者的视角出发,以案例实操为核心,系统地介绍网络爬虫的原理、工具使用与爬取技术,并详细讲解数据分析的各种技巧。本书主要内容包括:Python基础语法,数据分析工具NumPy、Pandas、Matplotlib的使用,网络爬虫库Urllib、BeautifulSoup、Scrapy,正则表达式在网络爬虫中的应用,数据预处理与数据分析方法、中文文本处理
    马国俊计算机9.2万字
  • 会员
    本书系统地介绍了Java语言高级程序设计内容,主要包括Java集合框架、异常处理、输入/输出流、多线程、网络编程、图形用户界面程序设计、泛型、JDBC编程、Java8新特性。本书所有知识点都结合具体实例进行分析,既注重理论介绍,又强调实际应用,从实用的角度精心设计知识结构和代码示例,同时每章后面配有相应习题。本书可作为普通高等院校计算机及相关专业Java程序设计课程的教材,也适合程序开发人员学习
    周化祥 许金元主编计算机8.8万字
  • 会员
    MySQL是世界上最受欢迎的数据库管理系统之一,广泛应用于互联网场景,作为一名开发人员,对MySQL的学习是十分必要的。本书从安装MySQL开始,逐步深入讲解更加复杂的内容,首先宏观地介绍MySQL的体系架构和各种常见的存储引擎以及它们之间的比较,然后介绍MySQL中的索引以及索引的优化,以及连接查询的执行原理,并详细分析了Explain语句的执行结果。接着又介绍MySQL中的事务和锁机制,包括事
    尚硅谷教育编著计算机21.4万字
  • 会员
    计算机视觉是在图像处理的基础上发展起来的新兴学科。OpenCV是一个开源的计算机视觉库,可以实现图像处理、模式识别、三维重建、物体跟踪等算法。本书基于Python,从图像基本原理说起,初步讲解计算机视觉所需的OpenCV知识。本书可作为信息处理、计算机、机器人、人工智能、遥感图像处理、认知神经科学等相关专业的教学用书,也可供相关领域的研究工作者参考。
    洪锦魁计算机10.4万字
  • 会员
    Node.js是一个基于ChromeV8引擎的JavaScript运行环境,用来编写服务器端程序。Node.js是新兴的开发工具,也是目前发展较快的开发工具之一。近几年来,随着Node.js的发展,越来越多的开发人员选择用它构建Web应用。本书较为系统地介绍了目前Node.js应用开发中涉及的基础知识和核心技术,并通过案例介绍了基于Express和Koa框架的项目开发。本书着重实际应用,案例及实
    唐小燕 刘洪武主编计算机10.9万字

同类书籍最近更新

  • 会员
    本书以目前应用比较广泛的ABB工业机器人离线编程仿真软件RobotStudio为平台,以工业机器人激光切割、搬运和码垛为应用案例来介绍离线编程与仿真的方法,以带输送链的工业机器人工作站作为组建工作站的学习项目,遵循“由简入繁、循序渐进”的原则,将知识点分解、融入到简单的案例中,使学生了解工业机器人离线编程与仿真的方法,掌握利用相关建模操作来组建常用工业机器人工作站的方法与步骤。本书内容选择合理、结
    何彩颖程序设计3.3万字
  • 会员
    本书主要围绕html5技术,讲述如何利用html5相关技术开发移动web网站和webapp应用程序。《html5移动web开发指南》共分为四大部分,第一部分主要讲述web技术的发展及html5标准在移动web技术中的应用;第二部分主要介绍html5的新功能和新特性如何在移动设备浏览器中使用及相关展望;第三部分主要介绍目前比较流行的两套javascript移动开发框架,并配备丰富的例子作为实践;第四
    唐俊开 付洪韬 闫国龙 许晓东编著程序设计10.9万字
  • 会员
    本书以零售和电子商务为业务背景,使用Python工具解决业务场景中的数据分析需求。全书涵盖数据采集、数据存储、数据处理、数据分析、数据可视化和数据建模的内容。本书适合零售和电子商务运营人员以及想要从事商业数据分析工作的人员阅读,也可以作为高校和培训机构相关课程的教材。
    零一程序设计5.2万字
  • 会员
    《AIRIOT物联网平台开发框架应用与实战》全面介绍了AIRIOT物联网平台开发框架的产品定位、特性及基础功能模块、二次开发能力、系统集成能力,以及大数据与人工智能应用和典型的项目案例,涉及大量工程应用内容。通过本书的学习,读者可方便地根据实际需求实现基于AIRIOT的物联网应用。《AIRIOT物联网平台开发框架应用与实战》适合作为高等工科院校物联网工程、人工智能、自动化、测控技术与仪器、计算机等
    袁宁主编程序设计7.8万字
  • 会员
    IfyouareadeveloperwhowantstobuildembeddedsystemsusingLinux,thisbookisforyou.Itistheidealguideforyouifyouwanttobecomeproficientandbroadenyourknowledge.Abasicunderst
    Alexandru Vaduva Alex González Chris Simmonds程序设计24.8万字
  • 会员
    本书以云原生(CloudNative)技术为背景,讲述了Serverless的基本原理与实战应用。书中首先探讨Serverless与当前云计算技术和前端技术的关系,随后分别从Serverless的两大能力(FaaS和BaaS)展开,探讨了它们的历史由来和底层原理,并且结合实际应用场景,有针对性地提供了操作指南。本书从手动构建一套基于进程的FaaS架构开始,之后深入剖析云计算服务的内核,阐述其背后的
    杨凯程序设计12.5万字