티스토리 뷰

기타

20230813 SAM 논문 읽다가... weight decay

developer0hye 2023. 8. 13. 00:43

음... 대체로 논문을 보면 weight decay 를 높게 세팅하는 경우가 좀 있는 거 같다. 당장 다른 논문이 생각안나지만, 당장 pytorch adamw 의 weight decay parameter 의 default 값이 0.01 로 세팅 돼있다.

 

 

0.01 이랑 0.1 이란 수치가 높은 값이냐 작은 값이냐는 따질 수 없지만 내가 개인적으로 실험을 해봤을때는 0.01 보다 크게 설정했을때 적어도 validation set 에서는 성능이 저하되는 경우가 많았던 거 같다. 그런데 sam은 wd 값을 0.1 로 세팅했다고 하니 다시 한 번 이에대한 실험을 진행해봐야겠다.

'기타' 카테고리의 다른 글

[ONNX] aten::unflatten 관련 에러  (0) 2023.08.21
20230815 개인 챗지피티 구독 취소  (0) 2023.08.15
누적 방문수 7만 돌파!  (0) 2023.08.09
20230801 최고 월간 방문수 경신  (0) 2023.08.01
20230707 여름 장충 테니스장  (0) 2023.07.07
댓글
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
«   2025/01   »
1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30 31
글 보관함