>>> 限时活动!藏宝阁会员买一年送一年 <<<
中创网,网络创业VIP项目全收录!点击查看
12下一页
返回列表 发布新帖
查看: 593|回复: 19

[人工智能&深度学习] 深入理解 GPU 计算: CUDA 编程指南

该用户从未签到

注册时间
2012-9-3
最后登录
2025-12-14

2万

主题

6372

回帖

8万

积分

管理员

2012年到2024年,感谢各位会员朋友的支持!

推广达人宣传达人突出贡献优秀版主荣誉管理论坛元老vip会员

QQ
发表于 2025-11-3 16:47:20 | 查看全部 |阅读模式
QQ_1762159623444.webp


深入理解 GPU 计算: CUDA 编程指南 原价415元,本站会员免费下载学习!


课程简介:
本课程介绍NVIDIA GPU 计算的基本知识, 例如 NVIDIA GPU 计算核心架构, 内存架构, 内存模型和执行模型. 在接下来的课程, 将讲述CUDA编程的技术细节, 特别在最后本课程将详细介绍规约操作. 规约是很重要的操作, 并且实现难度大. 通过本课程, 希望学生可以掌握CUDA编程的基本知识.

-- GPU 计算基本概念
-- CUDA 编程基本概念
-- 网格, 线程块, 线程多层次结构
-- 网格, 线程块与线程到实际问题如何映射
-- 硬件处理器多层次结构
-- GPU 多层次内存: 寄存器, 高速缓存, 共享内存, 全局内存
-- 线程块与线程块如何调度
-- warp 如何划分与调度
-- 全局内存如何管理
-- 共享内存如何使用
-- 如何实现 CUDA 多层次同步: 核函数, 线程块, warp
-- 什么是规约算法
-- 如何设计高效规约算法
-- 如何在warp内构造更小的线程组
-- 如何在warp内实现通信
-- 合作组 (Cooperative Groups)
-- 如何优化CUDA 程序

课程目录:

1 课程介绍.mp4
2 什么是 GPU 计算.mp4
3 GPU 硬件架构综述.mp4
4 处理器空间.mp4
5 内存空间.mp4
6 GPU 计算能力.mp4
7 如何编写 CUDA 程序.mp4
8 如何编译 CUDA 程序.mp4
9 函数修饰符.mp4
10 内存修饰符.mp4
11 内建-内置向量.mp4
12 内建变量.mp4
13 CUDA 编程模型.mp4
14 CUDA 程序执行与硬件映射.mp4
15 程序解析- 向量加法.mp4
16 主机函数- __host__.mp4
17 设备函数- __device__.mp4
18 核函数- __global__.mp4
19 网格.mp4
20 线程块.mp4
21 网格维度- gridDim.mp4
22 线程块维度- blockDim.mp4
23 线程块 ID- blockIdx.mp4
24 线程 ID- threadIdx.mp4
25 线程调度.mp4
26 线程块与线程映射.mp4
27 例子- 向量加法.mp4
28 如何启动核函数.mp4
29 线程执行顺序.mp4
30 GPU 内存介绍.mp4
31 CPU 内存介绍.mp4
32 页锁定内存.mp4
33 GPU 内存如何管理.mp4
34 CPU 内存管理.mp4
35 页锁定内存管理.mp4
36 全局内存管理.mp4
37 例子- 全局内存.mp4
38 什么是共享内存.mp4
39 共享内存冲突.mp4
40 共享内存 Bank.mp4
41 共享内存 bank 冲突- 计算能力 1.x.mp4
42 共享内存 bank 冲突- 计算能力 2.0 及以上.mp4
43 共享内存应用- 加**约.mp4
44 内存拷贝- cudaMemcpy.mp4
45 例子- 内存管理.mp4
46 内存空间类型查询 (Address Space).mp4
47 向量操作.mp4
48 稀疏矩阵存储格式.mp4
49 稀疏矩阵向量乘法 (SpMV).mp4
50 什么是同步.mp4
51 核函数同步.mp4
52 线程块同步.mp4
53 Warp 同步.mp4
54 Warp 同步概述.mp4
55 什么是规约算法- 如何并行.mp4
56 并行规约算法-1- 二叉树算法.mp4
57 并行规约算法-2- 改进 warp divergence.mp4
58 并行规约算法-3- 改进共享内存访问 消除冲突.mp4
59 并行规约算法-4- 改进全局内存访问.mp4
60 并行规约算法-5- warp 内循环展开.mp4
61 并行规约算法-6- 完全循环展开.mp4
62 并行规约算法:成功优化的关键.mp4
63 完整并行规约算法: 三阶段算法与完整代码.mp4
64 并行规约算法应用- 内积.mp4
65 线程调度概述.mp4
66 Warp 投票函数.mp4
67 Warp 匹配函数.mp4
68 Warp 规约操作.mp4
69 Warp 内通信- 交换数据.mp4
70 例子- __activemask.mp4
71 例子- __ballot_sync.mp4
72 例子- __shfl_down_sync.mp4
73 例子- warp 内广播.mp4
74 例子- warp 内 scan 操作 (扫描).mp4
75 例子- warp 内规约操作.mp4
76 Cooperative Groups (合作组).mp4
77 隐式组类型 (内建组类型- 内置组类型).mp4
78 例子- 向量加法-1645693606.mp4
79 显式棋盘组划分 (Tiled Partition).mp4
80 合并组 (Coalesced Groups).mp4
81 例子- 合并组.mp4
82 例子- warp 内广播-1645693728.mp4
83 例子- warp 内广播 2.mp4
84 组划分 (tiled_partition).mp4
85 组划分- labeled_partition.mp4
86 例子- 合并组标记划分.mp4
87 组划分- binary_partition.mp4
88 例子- 合并组二分划分.mp4
89 组同步.mp4
90 网格组同步.mp4
91 规约操作 (Reduce).mp4
92 例子- 规约算法 1.mp4
93 例子- 规约算法 2.mp4
94 例子- 规约算法 3.mp4
95 例子- 规约算法 4.mp4
96 CUDA 程序概述.mp4
97 CUDA 程序优化- 探索并行化.mp4
98 CUDA 程序优化- GPU 内存优化策略.mp4
99 CUDA 程序优化- 指令优化.mp4
配套课程资料.zip


下载地址
游客,如果您要查看本帖隐藏内容请回复


回复

使用道具 举报

该用户从未签到

38

主题

1万

回帖

4683

积分

藏宝阁VIP会员

积分
4683

vip会员

发表于 2025-11-3 16:50:09 | 查看全部
正需要这个谢谢
回复

使用道具 举报

该用户从未签到

0

主题

379

回帖

450

积分

藏宝阁VIP会员

积分
450
发表于 2025-11-3 19:39:04 | 查看全部
不错啊111
回复

使用道具 举报

该用户从未签到

4

主题

510

回帖

1166

积分

藏宝阁VIP会员

积分
1166

vip会员

发表于 2025-11-3 20:01:15 | 查看全部
感谢分享
回复

使用道具 举报

该用户从未签到

5

主题

1157

回帖

1415

积分

藏宝阁VIP会员

积分
1415

vip会员

发表于 2025-11-3 21:55:35 | 查看全部
深入理解 GPU 计算: CUDA 编程指南
回复

使用道具 举报

该用户从未签到

16

主题

1891

回帖

3113

积分

[藏宝阁会员]

积分
3113
发表于 2025-11-3 22:13:40 | 查看全部

我看不错噢 谢谢楼主!三六五网络学院越来越好!
回复

使用道具 举报

该用户从未签到

6

主题

410

回帖

1006

积分

藏宝阁VIP会员

积分
1006
发表于 2025-11-4 09:14:07 | 查看全部
RE: 深入理解 GPU 计算: CUDA 编程指南 [修改]
回复

使用道具 举报

该用户从未签到

0

主题

674

回帖

849

积分

藏宝阁VIP会员

积分
849
发表于 2025-11-4 22:02:58 | 查看全部
aaaaaaaaaaaaaaaaa
回复

使用道具 举报

该用户从未签到

2

主题

839

回帖

3109

积分

藏宝阁VIP会员

积分
3109
发表于 2025-11-5 16:37:37 | 查看全部
正需要这个谢谢
回复

使用道具 举报

该用户从未签到

36

主题

1万

回帖

4775

积分

藏宝阁VIP会员

积分
4775

vip会员

发表于 2025-11-7 14:59:24 | 查看全部
看看,谢谢咯
回复

使用道具 举报

懒得打字嘛,点击右侧快捷回复
您需要登录后才可以回帖 登录 | 注册

本版积分规则

在线咨询
投诉/建议联系

QQ 919733497

未经授权禁止转载,复制和建立镜像,
如有违反,追究法律责任
Copyright © 2012-2025 教程论坛 版权所有 All Rights Reserved. |网站地图
关灯 在本版发帖 QQ客服返回顶部
快速回复 返回顶部 返回列表