R数据科学[RforDataScience]
编辑推荐
适读人群 :R数据科学家 R社区领军人物作品,从典型数据科学项目所需工具模型着手,带领读者掌握R语言精华,学会熟练使用多种工具解决各种数据科学难题。 ·探索——以可视化作为R编程起点,再进行重要变量选取、筛选关键观测等重要数据操作,并对数据提出问题且找到答案。 ·处理——导入、整理并转换数据。 ·编程——管道操作的工作原理和替代方式,函数使用规则,如何实现迭代。 ·模型——深刻理解模型背后的数学理论和数据,直观认识统计模型工作原理。 ·沟通——学会R Markdown,让人们快速轻松理解你的工作。
内容简介
本书的目标是教会读者使用重要的数据科学工具,从而为实施数据科学奠定坚实的基础。 读完本书后,你将掌握R语言的精华,并能够熟练使用多种工具来解决各种数据科学难题。每一章都按照这样的顺序组织内容:先给出一些引人入胜的示例,以便你可以整体了解这一章的内容,然后再深入细节。本书的每一节都配有习题,以帮助你实践所学到的知识。 本书适合R数据科学家阅读
作者简介
哈德利·威克姆(Hadley Wickham), RStudio首席科学家,统计学家,斯坦福大学、奥克兰大学、莱斯大学兼职统计学教授。已被下载数百万次的ggplot2等多款知名R包的开发者,一直致力于让普罗大众更容易上手数据分析,被R社区誉为“改变了R的人”。另著有《R包开发》等书。 加勒特·格罗勒芒德(Garrett Grolemund),RStudio数据科学家,知名R培训师,曾受邀在Google、eBay等诸多公司讲授R语言和数据科学,在DataCamp开授的R相关课程备受R开发者喜爱。另著有《R语言入门与实践》。 译者简介 陈光欣,毕业于清华大学并留校工作,主要兴趣为数据分析与数据挖掘。