基于H2O的机器学习实用方法:一种强大的可扩展的人工智能和深度学习技术[PracticalMachineLearningwithH2O]
编辑推荐
适读人群 :从事机器学习、深度学习、人工智能等领域工作的工程技术人员,高等院校相关专业本科生、研究生以及教师 机器学习已逐步成熟。利用H2O软件,可以通过一个简单、易用的开源框架来进行机器学习和数据分析,该软件可支持广泛的操作系统和语言以及大数据规模。本书主要讲授如何使用H2O的学习算法,着重介绍了其中有用的部分以快速获得高效的结果。 如果已熟悉R或Python、了解一些统计知识,并具有一些数据处理的经验,作者Darren Cook将首先介绍H2O的基础知识,然后在不同示例数据集上进行机器学习实践。在此将会学习一些目前常用的机器学习技术,如深度学习、随机森林、无监督式学习和集成学习。 学习如何利用H2O导入、处理和导出数据; 分析机器学习的关键概念,如交叉验证和验证数据集; 应用于包括回归、多项式分类和二项式分类在内的三种不同数据集; 利用H2O通过四种监督式机器学习算法来分析每一个样本数据集; 理解聚类分析和其他无监督式机器学习算法是如何工作的。
内容简介
《基于H2O的机器学习实用方法:一种强大的可扩展的人工智能和深度学习技术》主要介绍了H2O的基本概念和应用。全书共11章,首先介绍了H2O在R和Python下的安装和启动、数据导入/导出和操作以及本书所用的三种不同示例数据集和常用的模型参数。然后分别介绍了随机森林、梯度推进机、线性模型、深度学习和无监督式学习等算法在三种不同数据集中的应用,分析对比了默认算法和改进算法的性能。另外,还讨论了相关其他内容。
作者简介
Darren Cook是一名具有20多年经验的软件开发师、数据分析师和技术总监,从事从金融交易系统到自然语言处理、数据可视化工具以及为一些全球大品牌制作网站等各类相关工作。他精通各种计算机编程语言,包括R、C++、PHP、JavaScript和Python。他在QQ Trend公司工作,这是一家金融数据分析和数据产品公司。 连晓峰,已发表学术论文40余篇,其中被EI收录20余篇;主持项目子课题两项,省部级项目三项,校级项目两项,参与完成项目四项,省部级项目六项;出版教材两部,专著两部,译著四十部;获得国家发明专利两项,实用新型专利一项;现为中国电子学会高级会员,系统仿真学会会员,北京高新技术企业认定委员会专家库专家,《机器人技术与应用》杂志社理事,国家工信部工业和信息化科技人才专家库专家。