深度学习与计算机视觉:算法原理、框架应用与代码实现
编辑推荐
西门子高级研究员田疆博士作序力荐!Google软件工程师吕佳楠力、英伟达高级工程师华远志、理光软件研究院研究员钟诚博士力荐! 作者拥有超过5年的机器学习研发经验,目前在京东专注于深度学习和计算机视觉算法的研发。 西门子高级研究员田疆博士作序力荐!Google软件工程师吕佳楠、英伟达高级工程师华远志、理光软件研究院研究员钟诚博士力荐! 注重原理和上手实战,让读者不仅能理解算法背后的思想,还能具备独立开发基于深度学习的计算机视觉算法的能力。 原理讲解通俗易懂,能通过图文定性讲解的就尽量不用公式,不可避免要用公式的地方尽量让公式作为图文讲解的辅助手段。 结合常见的应用场景,通过大量有趣、实用的实例和原创代码,带领读者一步步亲自动手,不断提高动手能力。 从第7章开始的所有实例都基于当前流行的深度学习框架Caffe和MXNet,其中包含了作者原创的大量代码和搜集的数据。
内容简介
本书全面介绍了深度学习及计算机视觉中基础的知识,并结合常见的应用场景和大量实例,带领读者进入丰富多彩的计算机视觉领域。作为一本“原理+实践”教程,本书在讲解原理的基础上,通过有趣的实例带领读者一步步亲自动手,不断提高动手能力,而不是枯燥和深奥原理的堆砌。 全书共13章,分为2篇。第1篇基础知识,介绍了人工智能发展历程、计算机视觉概要、深度学习和计算机视觉中的基础数学知识、神经网络及其相关的机器学习基础、卷积神经网络及其一些常见结构,最后对前沿的趋势进行了简单探讨。第2篇实例精讲,介绍了Python基础、OpneCV基础、简单的分类神经网络、图像识别、利用Caffe做回归、迁移学习和模型微调、目标检测、度量学习和图像风格迁移等常见的计算机视觉应用场景。本书从第5章开始包含很多有趣和实用的代码示例。从第7章开始的所有实例都基于当前流行的深度学习框架Caffe和MXNet,其中包含作者原创的大量代码和搜集的数据,这些代码和作者训练好的部分模型已分享到本书github页面上供读者自行下载。 本书适合对人工智能、机器学习、深度学习和计算机视觉感兴趣的读者阅读。阅读本书要求读者具备一定的数学基础和基本的编程能力,并需要读者了解Linux的基本使用。 一分钟了解本书精华内容 引言 深度学习和计算机视觉中的基础数学知识 神经网络和机器学习基础 深度卷积神经网络 Python基础 OpenCV基础 Hello World! 简单的图片分类——手写数字识别 利用Caffe做回归 迁移学习和模型微调 目标检测 度量学习 图像风格迁移
作者简介
叶韵 2007年7月毕业于北京大学信息科学技术学院,获学士学位。2011年4月获得了美国亚利桑那州立大学的电气工程博士学位。拥有超过5年的机器学习研发经验。目前在京东专注于深度学习和计算机视觉算法的研发。加入京东前,曾先后在ProPlus Design Solutions硅谷和北京研发中心任职研发经理,负责统计建模和机器学习算法的研发。后加入西门子中国研究院担任研究员,专注于计算影像和计算机视觉的研究。