图灵程序设计丛书:大规模数据处理入门与实战(套装全10册)

图灵程序设计丛书:大规模数据处理入门与实战(套装全10册)pdf,epub,mobi,azw3,txt
作者:Bill Karwin、Ben Forta、舒特、奥尼尔、卡劳、肯维尼斯科、温德尔、扎哈里亚、格鲁斯、Robert Layton、本·斯派维、乔伊·爱彻利维亚、妮哈·纳克海德、格温·沙皮拉托德、帕利诺、本杰明·班福特、珍妮·基姆、埃伦·弗里德曼、科斯塔斯·宙马斯
副标题:大规模数据处理入门与实战(套装全10册)
出版年:2018-8
ASIN:B08JD2DCXV

内容简介

本套装共包含《SQL反模式》、《SQL必知必会(第4版))》、《数据科学实战》、《Spark快速大数据分析》、《数据科学入门》、《Python数据挖掘入门与实践》、《Hadoop安全:大数据平台隐私保护》、《Kafka权威指南》、《Hadoop数据分析》、《Flink基础教程》10本书

  《SQL反模式》是一本广受好评的SQL图书。它介绍了如何避免在SQL的使用和开发中陷入一些常见却经常被忽略的误区。它通过讲述各种具体的案例,以及开发人员和使用人员在面对这些案例时经常采用的错误解决方案,来介绍如何识别、利用这些陷阱,以及面对问题时正确的解决手段。另外,《SQL反模式》还涉及了SQL的各级范式和针对它们的正确理解。   《SQL反模式》适合SQL数据库开发人员与管理人员阅读。
  SQL是使用广泛的数据库语言,几乎所有重要的DBMS都支持SQL。《图灵程序设计丛书:SQL必知必会(第4版)》由浅入深地讲解了SQL的基本概念和语法,涉及数据的排序、过滤和分组,以及表、视图、联结、子查询、游标、存储过程和触发器等内容,实例丰富,便于查阅。新版增加了针对ApacheOpenOfficeBase、MariaDB、SQlite等DBMS的描述,并根据新版本的Oracle、SQLServer、MySQL和PostgreSQL更新了相关示例。   《图灵程序设计丛书:SQL必知必会(第4版)》适合SQL初学者,也可供广大开发及管理人员参考。
  《数据科学实战》脱胎于哥伦比亚大学“数据科学导论”课程的教学讲义,它界定了数据科学的研究范畴,是一本注重人文精神,多角度、全方位、深入介绍数据科学的实用指南,堪称大数据时代的实战宝典。本书旨在让读者能够举一反三地解决重要问题,内容包括:数据科学及工作流程、统计模型与机器学习算法、信息提取与统计变量创建、数据可视化与社交网络、预测模型与因果分析、数据预处理与工程方法。另外,本书还将带领读者展望数据科学未来的发展。
《Spark快速大数据分析》讲解了网络大数据时代应运而生的、能高效迅捷地分析处理数据的工具——Spark,它带领读者快速掌握用 Spark 收集、计算、简化和保存海量数据的方法,学会交互、迭代和增量式分析,解决分区、数据本地化和自定义序列化等问题。
《数据科学入门》本书基于易于理解且具有数据科学相关的丰富的库的Python语言环境,从零开始讲解数据科学工作。具体内容包括:Python速成,可视化数据,线性代数,统计,概率,假设与推断,梯度下降法,如何获取数据,k近邻法,朴素贝叶斯算法,等等。作者借助大量具体例子以及数据挖掘、统计学、机器学习等领域的重要概念,详细展示了什么是数据科学。
《Python数据挖掘入门与实践》作为数据挖掘入门读物,介绍了数据挖掘的基础知识、基本工具和实践方法,通过循序渐进地讲解算法,带你轻松踏上数据挖掘之旅。本书采用理论与实践相结合的方式,呈现了如何使用决策树和随机森林算法预测美国职业篮球联赛比赛结果,如何使用亲和性分析方法推荐电影,如何使用朴素贝叶斯算法进行社会媒体挖掘,等等。本书也涉及神经网络、深度学习、大数据处理等内容。 本书面向愿意学习和尝试数据挖掘的程序员。
《Hadoop安全 大数据平台隐私保护》阐述了Hadoop从早期开放的消费互联网时代到现在作为敏感数据可信平台的演变历程,介绍了包括身份验证、加密、密钥管理和商业实践在内的诸多主题,并在实际环境下加以讨论。第 1章是介绍性内容,随后分为四大部分:第 一部分是安全架构,第 二部分是验证、授权和安全审计,第三部分是数据安全,第四部分是归纳总结。介绍了几个使用案例,融合了书中诸多概念。 《Hadoop安全 大数据平台隐私保护》适合对Hadoop感兴趣的读者,有大数据平台保护需求的读者。
《Kafka权威指南》是关于Kafka的全面教程,主要内容包括:Kafka相对于其他消息队列系统的优点,主要是它如何匹配大数据平台开发;详解Kafka内部设计;用Kafka构建应用的实践;理解在生产中部署Kafka的方式;如何确保Kafka集群的安全。 本书适合Java开发人员、大数据平台开发人员以及对分布式系统感兴趣的读者阅读。
《Hadoop数据分析》提供分布式数据存储和并行计算框架,Hadoop已经从一个集群计算的抽象演化成了一个大数据的操作系统。本书旨在通过以可读且直观的方式提供集群计算和分析的概览,为数据科学家深入了解特定主题领域铺平道路,从数据科学家的视角介绍Hadoop集群计算和分析。本书分为两大部分,* 一部分从非常高的层次介绍分布式计算,讨论如何在集群上运行计算;* 二部分则重点关注数据科学家应该了解的工具和技术,意在为各种分析和大规模数据管理提供动力。
近年来,流处理变得越来越流行。作为高度创新的开源流处理器,Flink拥有诸多优势,包括容错性、高吞吐、低延迟,以及同时支持流处理和批处理的能力。《Flink基础教程》分为6章,侧重于介绍Flink的核心设计理念、功能和用途,内容涉及事件时间和处理时间、窗口和水印机制、检查点机制、性能测评,以及Flink如何实现批处理。 本书面向有兴趣学习如何分析大规模流数据的读者。

图灵程序设计丛书:大规模数据处理入门与实战(套装全10册)pdf,epub,azw3,mobi,txt电子书下载:

链接:https://pan.baidu.com/s/1b2Qo6X25iFqGc9JcitDp5w 提取码:883j
解压密码:zhishikoo点com

本站为非经营类网站,资源全部来源于网络,不制作和存储任何资源,资源版权归原著作权人所有,请于下载后24小时内删除,如涉版权或其他问题请联系affileadmedia#gmail.com,我们将及时撤销相应资源!

(0)
浅瑾浅瑾认证作者

相关推荐

  • 工业软件简史

    作者: 林雪萍出版社: 上海社会科学院出版社出版年: 2021-11-5ISBN: 9787552036930 作者简介 林雪萍,北京联讯动力咨询公司总经理、上海交通大学中国质量发展研究院客座研究员、天津大学兼职教授、南山工业书院发起人。从…

    2024年11月28日
    031
  • 我的大脑好厉害

    作者: 赵思家出版社: 北京联合出版公司出版年: 2022-4ISBN: 9787559661197 作者简介 赵思家牛津大学神经科学博士后,科普作者,知乎神经科学领域大V,46万关注,擅长为充满好奇的读者提供新鲜、有趣又不失严谨的神经科学…

    2024年11月27日
    010
  • 你就是干不过做PPT的

    作者:[日]下地宽也 出版社:湖南文艺出版社 译者:朱悦玮 出版年:2020-4-1 ISBN:9787540481711 作者简介 下地宽也,日本企业的高级培训师,自1992年起对企业工作环境及员工行为(创造性,沟通能力,意识形态等)进行…

    2024年11月26日
    07
  • Android从入门到精通

    作者: 明日科技 出版社:清华大学出版社 出版年: 2012-9-1 ISBN:9787302293156 内容简介 内 容 简 介 《Android从入门到精通》从初学者的角度出发,通过通俗易懂的语言、丰富多彩的实例,详细介绍了Andro…

    2024年11月25日
    09
  • Wireshark数据包分析实战:第2版 – [美]Chris Sanders

    作者: [美]Chris Sanders 出版社:人民邮电出版社 副标题:第2版 原作名:Practical Packet Analysis: Using Wireshark to Solve Real-World Network Prob…

    2024年11月24日
    02
  • 深度探索Linux操作系统 – 王柏生

    作者: 王柏生 出版社:机械工业出版社 副标题:系统构建和原理解析 原作名:深度探索Linux操作系统 出版年: 2013-10-15 ISBN:9787111439011 作者简介 作者巫家民,男,“Tango”是网络笔名。他毕业于印第安…

    2024年11月23日
    01