Python数据科学指南
编辑推荐
本书从讲解如何在数据科学中应用Python开始,陆续介绍了Python的工作环境,如何用Python分析数据,以及数据挖掘的概念,然后又扩展到机器学习。本书还涵盖了缩减原则、集成方法、随机森林、旋转森林和超树等方面的内容,这些都是一个成功的数据科学专家所必需掌握的。
阅读本书,你将学会:
■ 揭示数据科学算法的完整范畴;
■ 高效地掌握和使用numpy、scipy、scikit-learn和matplotlib等Python库;
■ 了解进阶回归方法的建模和变量选择;
■ 进一步彻底理解集成方法的潜在含义及实施;
■ 在各种各样的数值和文本数据集上解决实际问题;
■ 熟悉先进的算法,如梯度提升、随机森林、旋转森林等。
本书特色:
■ 内容明确且易于跟学;
■ 甄选重要的任务与问题;
■ 精心组织编排内容,有效解决问题;
■ 清晰易懂的讲解方式;
■ 书中呈现的解决方案能够直接应用到实际问题中。
内容简介
Python作为一种高级程序设计语言,凭借其简洁、易读及可扩展性日渐成为程序设计领域备受推崇的语言,并成为数据科学家的必读之一。
本书详细介绍了Python在数据科学中的应用,包括数据探索、数据分析与挖掘、机器学习、大规模机器学习等主题。每一章都为读者提供了足够的数学知识和代码示例来理解不同深度的算法功能,帮助读者更好地掌握各个知识点。
本书内容结构清晰,示例完整,无论是数据科学领域的新手,还是经验丰富的数据科学家都将从中获益。
作者简介
Gopi Subramanian是一名数据科学家,他在数据挖掘与机器学习领域有着超过15年经验。在过去的10年中,他设计、构思、开发并领导了数据挖掘、文本挖掘、自然语言处理、信息提取和检索等多个项目,涉及不同领域和商务垂直系统。他在美国和印度的专利局共计申请了10多项专利,并以自己的名义出版了许多书籍。