scikitlearn机器学习:常用算法原理及编程实战
编辑推荐
阿里云栖社区、百度、蒙牛乳业、神州数码等知名公司的6位技术专家力荐 手写识别程序怎么做? 如何实现人脸识别系统? 如何过滤垃圾邮件? 电子商务网站上猜你喜欢的商品是什么原理?如何实现? 电影网站如何去推荐符合用户喜好的电影? 如何利用机器学习对消费者的特性进行细分,从而更好地服务各细分市场的消费者? 银行如何去检测用户的信用卡可能被盗了? …… 通过阅读本书,你将了解这些复杂问题背后的原理,甚至你都可以自己解决这些问题。 本书对读者的数学基础要求低,让读者可以以较低的门槛入门机器学习 本书涵盖机器学习的应用场景、编程步骤、Python开发包、算法模型性能评估,以及八大常用算法原理和七大实战案例演练 本书通过近100幅图,将晦涩难懂的数学概念生动地描述出来 以scikit-learn为核心,结合numpy、pandas和matplotlib开发包讲解 从数值回归到逻辑回归,从文档分类到人脸识别,都提供了实现代码 用通俗易懂的语言介绍机器学习算法,帮助读者理解每个算法的基本原理 帮助读者使用机器学习算法解决实际的工程应用问题 用大量的图示及实战案例介绍如何解决现实生活中的机器学习问题
内容简介
本书通过通俗易懂的语言、丰富的图示和生动的实例,拨开了笼罩在机器学习上方复杂的数学“乌云”,让读者以较低的代价和门槛入门机器学习。 本书共分为11章,介绍了在Python环境下学习scikit-learn机器学习框架的相关知识,涵盖的主要内容有机器学习概述、Python机器学习软件包、机器学习理论基础、k-近邻算法、线性回归算法、逻辑回归算法、决策树、支持向量机、朴素贝叶斯算法、PCA算法和k-均值算法等。 本书适合有一定编程基础的读者阅读,尤其适合想从事机器学习、人工智能、深度学习及机器人相关技术的程序员和爱好者阅读。另外,相关院校和培训机构也可以将本书作为教材使用。 30秒极速了解本书精华内容: 1. 理论基础 机器学习的应用场景 机器学习编程的典型步骤 Python机器学习开发包:numpy、pandas和matplotlib 算法模型性能评估的指标和评估方法 2. 八大常用机器学习算法 k-近邻算法 线性回归算法 逻辑回归算法 决策树 支持向量机 朴素贝叶斯 PCA算法 k-均值算法 3. 七大实战演练案例 糖尿病检测 预测房价 乳腺癌检测 泰坦尼克号幸存者预测 文档类别预测 人脸识别 文档自动分类
作者简介
黄永昌, 2004年毕业于厦门大学自动化系。毕业后一直在夏新电子从事手机系统软件的研发,直至2009年转向Android系统软件开发。熟悉C、Python、Java和JavaScript 等多种开发语言。对数据处理及分析有浓厚的兴趣,于2014年开始学习和研究机器学习及数据挖掘领域的相关知识。2015年加入ABB集团,从事智能家居系统的开发,通过分析服务器及客户端日志数据,为智能家居系统开发智能决策模型。