티스토리 뷰
__global__ void func(){
printf(
"------------------------------------\n"
"gridDim.x = %d\n"
"gridDim.y = %d\n"
"gridDim.z = %d\n"
"blockIdx.x = %d\n"
"blockIdx.y = %d\n"
"blockIdx.z = %d\n"
"blockDim.x = %d\n"
"blockDim.y = %d\n"
"blockDim.z = %d\n"
"threadIdx.x = %d\n"
"threadIdx.y = %d\n"
"threadIdx.z = %d\n"
"------------------------------------\n",
gridDim.x,
gridDim.y,
gridDim.z,
blockIdx.x,
blockIdx.y,
blockIdx.z,
blockDim.x,
blockDim.y,
blockDim.z,
threadIdx.x,
threadIdx.y,
threadIdx.z);
}
처음에 CUDA 접하면 커널의 Triple chevron 안에 넣는 값에 따라
커널내에서 gridDim, blockIdx, blockDim, threadIdx 값이 어떻게 정의될지 감이 잘 안잡힌다.
감을 잡기 위해서 값을 출력하는 함수를 구현해봤다.
'CUDA' 카테고리의 다른 글
윈도우에서 GPU 전력 제한하기 (2) | 2024.02.12 |
---|---|
[OpenCV, CUDA] Multiple GPUs 시스템에서 OpenCV CUDA 함수 쓸때 유의점 (0) | 2023.09.04 |
CUDA Compute Capabilities 최대 블록 사이즈, 그리드 사이즈 등 확인하는 법 (2) | 2022.09.20 |
CUDA Kernel (0) | 2022.09.20 |
댓글
공지사항
최근에 올라온 글
최근에 달린 댓글
- Total
- Today
- Yesterday
링크
TAG
- cosine
- 단축키
- 백준 1766
- ㅂ
- 인공지능을 위한 선형대수
- FairMOT
- MOT
- 가장 긴 증가하는 부분 수열
- 자료구조
- 백트래킹
- PyCharm
- 백준 11053
- 순열
- 백준
- 위상 정렬 알고리즘
- 파이참
- Lowest Common Ancestor
- 백준 11437
- C++ Deploy
- 문제집
- 이분탐색
- 조합
- LCA
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
글 보관함