深入浅出数据科学
编辑推荐
《深入浅出数据科学》的目的是帮助你掌握数学、编程和商业分析的综合技能。通过本书,你将能够自信地提出并解答复杂的数据问题,从抽象和原始的统计信息发掘并完善可执行的想法。通过将数学和计算机编程技能相结合,你将踏上成为数据科学家的激动人心的旅程。
本书介绍了数据科学的全过程,包括数据准备、数据清洗,以及如何选择有效的数据挖掘策略和技巧,从而深入理解数据科学的方方面面。你将学到数学和统计学的核心知识,以及数据科学家和分析师经常使用的代码。你将了解机器学习,学会用常见的统计学模型分析稠密数据集,创建有说服力的可视化图表,并和他人交流分析结果。
从本书你将学习到:
·理解数据科学的五个核心步骤
·聪明地使用你的数据,仔细地处理它
·填平数学和计算机编程之间的鸿沟
·学会概率论、微积分,以及使用统计模型处理数据,得出切实有效的结果
·生成并评估简单的机器学习模型
·通过分析模型有效性指标,决定机器学习模型的质量
·通过数据可视化向他人分享见解
·理解机器学习模型,并使用机器学习模型进行预测,解决自己的问题
内容简介
数据科学家是目前热门的职业之一。本书全面介绍了成为合格数据科学家所需的知识、技能和工作流程,是一本内容全面的实用性技术图书。
本书分为13章,其中第1~3章介绍数据科学;第4~8章介绍数学知识,包括统计学和概率论;第9章介绍数据可视化;第10~12章介绍机器学习;第13章介绍案例。各个章节内容均由浅入深,同时通过案例和Python代码,使读者掌握实战技能。
本书适合有志于成为数据科学家的师生或业界新手,同时也适合经验丰富的职场老手参考。
作者简介
作者简介
Sinan Ozdemir是一名数据科学家、创业者和教育工作者。Sinan的学术生涯在约翰?霍普金斯大学(The Johns Hopkins University)渡过,主修数学专业。随后他从事教育事业,曾经在约翰?霍普金斯大学和General Assembly公司举办多次数据科学讲座。在此之后,他创立了旨在通过人工智能技术和数据科学力量帮助企业销售团队的创业公司Legion Analytics。
译者简介
张星辰,北京荣之联科技股份有限公司BI 技术顾问,毕业于重庆邮电大学,具有5年数据相关工作经验,熟悉商业智能和数据可视化,通过了微软数据科学专业认证。
中文版审校人
鲜思东,重庆邮电大学教授,硕士生导师,复杂系统智能分析与决策重庆市高校重点实验室副主任,中国商业统计学会理事。现任国际期刊《Advancements in Case Studies》编辑,担任《Knowledge-Based Systems》和《IEEE Transactions on Systems、Man and Cybernetics: Systems》等多个国际期刊的审稿人。
洪贤斌,西交利物浦大学、英国利物浦大学机器学习方向博士生,苏州谷歌开fa者社区组织者。