chatgpt로 작성한글입니다.분산 환경에서 Non-Tensor 객체 동기화 방법1. 배경문제 상황:분산 학습 환경에서는 각 프로세스가 별도로 계산한 결과를 동기화할 필요가 있습니다.텐서(tensor)는 all_reduce나 all_gather 같은 연산을 통해 쉽게 동기화할 수 있지만, 파이썬의 일반 객체(예: 리스트, 딕셔너리 등)는 이러한 연산을 직접 사용할 수 없습니다.해결 방법:PyTorch는 일반 파이썬 객체도 동기화할 수 있도록 torch.distributed.all_gather_object 함수를 제공합니다.2. torch.distributed.all_gather_object 사용법기능:각 프로세스에서 생성한 파이썬 객체를 한 곳으로 모으는 역할을 합니다.핵심 포인트:각 프로세스가 동기화할..
https://huggingface.co/blog/siglip2 SigLIP 2: A better multilingual vision language encoderMight want to check something: The demo at the bottom hangs with "Uploading 1 file..." and none of the premade examples load or execute. 6 different Javascript console errors are thrown. (Chrome, Mac).huggingface.co 고마워요 구글형님들
self.canvas.bind("", self.on_mouse_wheel) # Windows용 def on_mouse_wheel(self, event): if event.delta > 0: self.zoom_level *= 1.1 else: self.zoom_level *= 0.9 if self.zoom_level 20.0: self.zoom_level = 20.0 self.update_canvas() 원래 위에 처럼 구현돼있었더라면 아래 처럼 구현해야 윈도우, 리눅스 둘다 휠이벤트가 동작한다. # 윈도우: # 리눅스: (wheel up), (wheel down)self.canv..
FROM pytorch/pytorch:2.6.0-cuda12.6-cudnn9-devel# CUDA 라이브러리 경로 환경변수 설정 for onnxruntime-gpuENV LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda/lib64ENV LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/opt/conda/lib/python3.11/site-packages/nvidia/cudnn/lib Dockerfile혹은 안에 컨테이너에서 위와 같이 LD LIB PAHT에 저 두 경로를 추가해주자cudnn 라이브러이 위치들이 이누야샤 사원의 조각마냥 흩뿌려져있어서 lib경로 다 찾아서 추가해줬다.

pytorch 의 official TransformerDecoder 레이어가 포함된 모델을 onnx 변환하려니 아래와 같이 onnx에서 지원하지 않는 연산이라며 오류가 발생했다. aten::_native_multi_head_attention ~ 우회법은 onnx 변환 함수 호출하기전에 torch.backends.mha.set_fastpath_enabled(False) 를 호출해주는 것이다. 이 방법 찾기 전에는 TransformerDecoder 상속 받아서 multi head attention 부분만 custom op로 돌아가게 오버라이딩 해야하나 이런 고민을 했었는데, 저거 호출하고 변환하니 일단은 변환 돼서 안심...

https://github.com/developer0hye/imgdiet GitHub - developer0hye/imgdiet: A Python package for minimizing file size of images with negligible quality lossA Python package for minimizing file size of images with negligible quality loss - developer0hye/imgdietgithub.com 수행시간을 로깅하는 건 때론 유용한 정보를 준다. 그치만 위에 코드처럼 구현하면 코드가 지저분해진다. 수행 시간 측정하는 코드를 데코레이터로 구현함수내에 있는 로깅 코드를 따로 데코레이터로 빼서 보다 가독성을 높였다.
- Total
- Today
- Yesterday
- 조합
- 위상 정렬 알고리즘
- PyCharm
- ㅂ
- 순열
- LCA
- Lowest Common Ancestor
- 백준 1766
- 백준 11437
- 가장 긴 증가하는 부분 수열
- 단축키
- 백준 11053
- 인공지능을 위한 선형대수
- C++ Deploy
- 백트래킹
- 백준
- MOT
- 자료구조
- FairMOT
- 파이참
- 이분탐색
- 문제집
- cosine
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |