Java机器学习
编辑推荐
本书详细讲解机器学习中的高级技术,包括分类、聚类、离群值检测、流学习、主动学习、半监督学习、概率图建模、文本挖掘、深度学习以及大数据批处理与流机器学习。相应的,每一章的示例及现实世界的案例研究展示了如何使用完整的方法论以及目前可用的基于Java的佳工具,来应用刚刚学习的技术。
对于解决各个领域中数据科学方面的问题,以及构建强大的机器学习模型所需要的工具和技术,读完本书之后,你都会有所了解。
通过阅读本书,你将:
?掌握关键的Java机器学习库,通过理论和实践指导,发掘可以解决的每一类问题
?在机器学习的每一个大类中探索强大的技术,如分类、聚类、离群值检测、图建模和文本挖掘
?通过方法论、过程、应用和分析,将机器学习应用到真实的数据
?探索机器学习中有关新近专业化方面的技术和实验,如深度学习、流数据挖掘以及主动和半监督学习
?使用新的工具和方法,建立基于批量和基于流的大数据学习的高性能、实时、自适应预测模型
?对可应用于安全、金融犯罪、物联网和社交网络等领域方面的更强大的AI技术,获得更深入的理解。
内容简介
本书涵盖了机器学习中的经典技术,如分类、聚类、降维、离群值检测、半监督学习和主动学习。同时介绍了近期高深的主题,包括流数据学习、深度学习以及大数据学习的挑战。每一章指定一个主题,包括通过案例研究,介绍前沿的基于Java的工具和软件,以及完整的知识发现周期:数据采集、实验设计、建模、结果及评估。每一章都是独立的,提供了很大的使用灵活性。附带的网站提供了源码和数据。对于学生和数据分析从业员来说,这确实很难得,大家可以直接用刚学到的方法进行实验,或者通过将这些方法应用到真实环境中,加深对它们的理解。
作者简介
Uday Kamath博士是BAE系统应用智能公司的首席数据科学家,专门研究可扩展机器学习,并在反洗钱(AML)、金融犯罪欺诈检验、网络空间安全和生物信息学领域拥有20年的研究经验。Kamath博士负责BAE系统应用智能公司AI部门核心产品的研究分析,这些产品涉及的领域有行为科学、社交网络和大数据机器学习方面。在Kenneth De Jong博士的指导下,他获得了乔治梅森大学的博士学位,他的论文研究聚焦于大数据和自动化序列挖掘的机器学习领域。
Krishna Choppella在BAE系统应用智能公司的角色是作为解决方案架构师,构建工具和客户解决方案。他有20年的Java编程经验,主要兴趣是数据科学、函数编程和分布式计算。