티스토리 뷰
https://arxiv.org/abs/2311.09215
ConvNet vs Transformer, Supervised vs CLIP: Beyond ImageNet Accuracy
Modern computer vision offers a great variety of models to practitioners, and selecting a model from multiple options for specific applications can be challenging. Conventionally, competing model architectures and training protocols are compared by their c
arxiv.org


대충 결론만 봄
나중에 다시 읽어보자(과연?)
'Deep Learning' 카테고리의 다른 글
| action detection 이랑 tracking 논문/코드 찾아보는 중 (0) | 2024.04.13 |
|---|---|
| [Python] onnxruntime gpu(device) 에 업로드된 데이터 cpu(host)로 다운로드 안하고 바로 inference 하는 방법 (0) | 2024.04.11 |
| 20240222 YOLOv9 가 공개되다. (0) | 2024.02.22 |
| META V-JEPA (1) | 2024.02.18 |
| Google Magika 파일 종류 인식을 AI로 (0) | 2024.02.18 |
댓글
공지사항
최근에 올라온 글
최근에 달린 댓글
- Total
- Today
- Yesterday
링크
TAG
- 문제집
- LCA
- cosine
- PyCharm
- C++ Deploy
- ㅂ
- 조합
- Lowest Common Ancestor
- 백트래킹
- 백준 11437
- 자료구조
- 위상 정렬 알고리즘
- 가장 긴 증가하는 부분 수열
- 이분탐색
- MOT
- 순열
- 파이참
- FairMOT
- 단축키
- 백준 11053
- 백준 1766
- 백준
- 인공지능을 위한 선형대수
| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | ||||
| 4 | 5 | 6 | 7 | 8 | 9 | 10 |
| 11 | 12 | 13 | 14 | 15 | 16 | 17 |
| 18 | 19 | 20 | 21 | 22 | 23 | 24 |
| 25 | 26 | 27 | 28 | 29 | 30 | 31 |
글 보관함

