Python数据科学实践指南
编辑推荐
资深大数据工程师多年经验总结,写给新人的大数据入行指南。
广涉大数据技术的各个方面,解密数据科学家的工作内容,通过实战带领读者走进梦想中的职业。
内容简介
本书是一本Python数据科学的入门图书,笔者结合多年工作和指导新人的经验,希望以一条简单的路线来为零基础的读者介绍数据科学。在本书中主要使用Python编程语言,来处理真实的数据,从而满足我们对于未知的好奇。如果读者喜欢其中的某一个领域,可以以此为契机进行深入的学习。
本书分为三大部分,第1~4章是Python基础,在这个部分会介绍阅读本书必须的Python知识,但并不会包含很复杂的编程知识,比如面向对象编程就不是必要的,因为Python支持过程式编程,可以直接编写函数。第5~7章会讲解Python直接提供的数据处理工具,这些工具包括一些易用的数据结构、标准库和第三方工具。学习使用这些工具可以让我们快速地实现某些简单的算法,而不用花费大量的时间“重新发明轮子”,Python在处理数据时的高效在此处体现得淋漓尽致。第8~12章是一些实际的案例操作分解,涉及Python主要擅长的几个领域:统计、爬虫、科学计算、Hadoop&Spark中的集成、图计算等。最后的三个附录分别介绍了一些关于Python的扩展知识,比如如何编写同时兼容Python2和Python3的代码,如何安装完整的Python开发环境,以及一些常用的Python技巧(处理时间、文件I/O等)等。
作者简介
纪路,先进设计与智能计算教育部重点实验室硕士,控制专业,研究生期间主攻机器人方向,对小众编程语言和机器学习有浓厚的兴趣。现在在一家大数据初创公司做数据挖掘工作,略通Python、Scala、JavaScript。由于有学术背景,并且熟悉多种编程范式,经常被委以算法研发的重任。主要负责计算广告相关的算法、社交网络数据挖掘,以及高性能分布式计算平台的开发工作。