Python机器学习
内容简介
机器学习与预测分析正在改变企业和其他组织的运作方式,本书将带领读者进入预测分析的世界。全书共13章,除了简要介绍机器学习及Python在机器学习中的应用,还系统讲述了数据分类、数据预处理、模型优化、集成学习、回归、聚类、神经网络、深度学习等内容。本书将机器学习背后的基本理论与应用实践联系起来,通过这种方式让读者聚焦于如何正确地提出问题、解决问题。本书讲解了如何使用Python的核心元素以及强大的机器学习库,同时还展示了如何正确使用一系列统计模型。本书可作为学习数据科学的初学者及想进一步拓展数据科学领域认识的读者的参考书。同样,本书也适合计算机等相关专业的本科生、研究生阅读。
作者简介
Sebastian Raschka,是密歇根州立大学的博士生,他在计算生物学领域提出了几种新的计算方法,还被科技博客Analytics Vidhya评为GitHub上具影响力的数据科学家。他有一整年都使用Python进行编程的经验,同时还多次参加数据科学应用与机器学习领域的研讨会。正是因为Sebastian 在数据科学、机器学习以及Python等领域拥有丰富的演讲和写作经验,他才有动力完成此书的撰写,目的是帮助那些不具备机器学习背景的人设计出由数据驱动的解决方案。
他还积极参与到开源项目中,由他开发完成的计算方法已经被成功应用到了机器学习竞赛(如Kaggle等)中。在业余时间,他沉醉于构建体育运动的预测模型,要么待在电脑前,要么在运动。
首先,我要感谢Arun Ross和Pang-Ning Tan教授,以及那些曾经启发我并激起我在模式分类、机器学习、数据挖掘领域兴趣的人。
我还想借此机会对Python社区和开源包的开发者表示感谢,他们帮助我创建了一个用于科学研究和数据科学的完美开发环境。
在此,还要特别感谢scikit-learn的核心开发人员。作为此项目的一个参与者,我有幸与这些极客合作,他们不仅对机器学习有着深入的了解,同时还都是非常出色的程序员。
后,我还要感谢所有对本书感兴趣的读者,也真心希望我的热情能够感染大家一起加入到Python与机器学习社区中来。