OpenACC并行编程实战
编辑推荐
HPC领域资深专家推荐,中国极大OpenACC技术社区创建者撰写,不可多得的OpenACC技术专著 全面讲解OpenACC编程规范、语法的行为机理与设计动机,160个完整示例覆盖众多并行编程场景
内容简介
中国极大OpenACC技术社区创建者撰写,为数不多系统介绍OpenACC的技术专著。全面讲解OpenACC编程规范、语法的行为机理与设计动机,160个完整示例覆盖众多并行编程场景。 全书分10章,按照并行程序开发步骤组织,建议第1遍顺序阅读。 第1章介绍主流加速器产品的硬件架构、主流并行编程模型等,以期读者对并行编程生态有全面了解。 第2章介绍OpenACC语言的设计思路,并列出OpenACC的主要语法供快速查阅。 第3章是本书核心,将大量计算并行化,这是程序提速的根本手段。用大量示例讲述两个计算构件parallel和kernels的行为特点,然后用它并行化Jacobi 迭代。 第4章介绍多种数据管理工具,包含结构化子语copy/create/present、结构化导语data、非结构化导语enter data/exit data/update/declare等,将加速器带来的数据移动时间减少。 第5章介绍routine导语,嵌套调用并行化自定义函数,用来开发大型程序。 第6章讲解用异步队列隐藏数据传输时间、调度多个加速器同时工作等高级特性。 第7章介绍OpenACC与CUDA C/CUDA Fortran和各类库的混合编程。 第8章是所有的运行时函数,以供读者编程查阅。 第9章指导部署开发环境,以便快速上手。 第10章介绍神威?太湖之光的编程模型及其对OpenACC的功能扩展。
作者简介
何沧平,华为高级工程师,NVIDIA认证 CUDA培训师。曾任中科曙光HPC事业部工程师,完成全球天气预报程序并行化项目(加速30倍)和国家气象局天气预报程序并行化项目等,实战经验丰富。精通OpenACC、CUDA Fortran、CUDA C,熟悉OpenMP、MPI编程。2012年初开始关注研究OpenACC,陆续翻译OpenACC 1.0/2.0/2.0a/2.5语言规范以及《CUDA Fortran高效编程实践》,撰写大量在线技术教程,并建立中国*大OpenACC QQ交流群和资源网站,持续推广。