D-FINE 모델의 Backbone Network은 무엇일까?

티스토리 뷰

Deep Learning

D-FINE 모델의 Backbone Network은 무엇일까?

developer0hye 2025. 1. 13. 23:00

https://github.com/Peterande/D-FINE

GitHub - Peterande/D-FINE: D-FINE: Redefine Regression Task of DETRs as Fine-grained Distribution Refinement 💥💥💥

D-FINE: Redefine Regression Task of DETRs as Fine-grained Distribution Refinement 💥💥💥 - Peterande/D-FINE

github.com

논문에서 나온 성능만 봤을때 굉장히 인상적인 검출 모델이다.

무슨 백본을 사용했을까?

HGNetV2 를 사용했다고한다.

https://huggingface.co/timm/hgnetv2_b6.ssld_stage1_in22k_in1k

timm/hgnetv2_b6.ssld_stage1_in22k_in1k · Hugging Face

Model card for hgnetv2_b6.ssld_stage1_in22k_in1k A HGNet-V2 (High Performance GPU Net) image classification model. Trained by model authors on mined ImageNet-22k and ImageNet-1k using SSLD distillation. Please see details at https://github.com/PaddlePaddle

huggingface.co

https://github.com/PaddlePaddle/PaddleClas/blob/develop/docs/zh_CN/models/ImageNet1k/PP-HGNetV2.md

PaddleClas/docs/zh_CN/models/ImageNet1k/PP-HGNetV2.md at develop · PaddlePaddle/PaddleClas

A treasure chest for visual classification and recognition powered by PaddlePaddle - PaddlePaddle/PaddleClas

github.com

D-FINE은 N, S, M, L, X사이즈가 있다.

Model	Backbone	#Params	COCO AP	ImageNet Accuracy
D-FINE-N	B0	4M	42.8	77.77
D-FINE-S	B0	10M	48.5	77.77
D-FINE-M	B2	19M	52.3	81.74
D-FINE-L	B4	31M	54.0	83.57
D-FINE-X	B5	62M	55.8	84.75

COCO AP는 Object365 Pretrained아닌 모델 기준이다.

ImageNet Accuracy 는 ImageNet Pretrained 기준 Accuracy다.

YOLOv8이랑 비교하면 어떨까

Model	Backbone	#Params	COCO AP	ImageNet Accuracy
YOLOv8n	YOLOv8n-cls	3.2M	37.3	69.0
YOLOv8s	YOLOv8s-cls	11.2M	44.9	73.8
YOLOv8m	YOLOv8m-cls	25.9M	50.2	76.8
YOLOv8l	YOLOv8l-cls	43.7M	52.9	76.8
YOLOv8x	YOLOv8x-cls	68.2M	53.9	79.0

백본의 ImageNet Accuracy 부터 성능이 크게 비교된다. ImageNet Accuracy가 더 높은 모델이 트랜스퍼 러닝시 더 좋은 성능을 보이는 게 일반적인 경향인걸 생각해보면, D-FINE은 백본부터 강력한 백본을 골랐다고 볼 수 있을 거 같다.

논문을 차근 차근 읽어봐야겠다.

'Deep Learning' 카테고리의 다른 글

semantic segmentation loss survey논문 (0)	2025.01.30
나중에 다시 봐볼 논문 Pointly-Supervised Instance Segmentation (1)	2025.01.22
나의 세 번째 허깅페이스 스페이스 InternVL2_5-8B (0)	2025.01.06
나의 두 번째 허깅페이스 스페이스 InternVL2_5-2B (0)	2025.01.06
InternVL2.5 78B 메모리 사용량은 얼마나 되고 인퍼런스 타임은 어느정도일까 (2)	2025.01.04

공지사항

최근에 올라온 글

최근에 달린 댓글

Total

Today

Yesterday

링크

TAG more

« 2026/08 »
일	월	화	수	목	금	토
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30	31

글 보관함

지속 가능한 꾸준함

티스토리 뷰

D-FINE 모델의 Backbone Network은 무엇일까?

'Deep Learning' 카테고리의 다른 글

티스토리툴바