티스토리 뷰
https://developer0hye.tistory.com/792
ㅎㅎㅎㅎ
저번 글에서 썼다싶이 이번엔 r값을 올려서 학습시켜봤다.
이게 정답이였을까? 아니다!!!
물론 Loss 는 r = 16일때 보다 감소하는 결과를 보이긴했다.
하지만 추론을 해보면 완전 엉망인 값이 나왔다.
원인은 Quantization에 있었다.
https://colab.research.google.com/drive/1whHb54GNZMrNxIsi2wm2EY_-Pvo2QyKh?usp=sharing
예제 코드 보면
모델 Load시에 load_in_4bit이 True로 돼있다.
이렇게 Load한다음에 원래 Qwen2VL 예시 코드로는 잘나오던 샘플(이미지, 프롬프트)를 입력했을때 완전 엉뚱한 값이 나오는 걸 확인했다. 그리고 이걸 False로 변경하자 내가 원하던 Expected Results를 얻을 수 있었다. 그래서! 학습도 저걸 True로 둔채로 학습을 하니 내가 원하는 수준으로 학습이 됐다.
일단 unsloth/LaTeX_OCR데이터셋에 대한 학습은 더이상 안할거다. 왜냐! 내가 학습시키고 싶었던 나만의 커스텀 데이터셋에서 학습이 됨을 확인했기 때문이다. 이제는... Feasibility를 보았으니 데이터를 수집할 차례이다.
https://github.com/unslothai/unsloth/issues/1347
알고보니 unsloth이슈란에 같은 문제를 겪은 사람이 있었다.
'Deep Learning' 카테고리의 다른 글
Qwen2vl 7b 파인튜닝 최적의 하이퍼 파라미터를 찾아서... (2) | 2024.12.05 |
---|---|
runpod 또 추가 결제 가즈앗!!! 장시간 학습시키니 비용이 쭉쭉 나간다. (0) | 2024.12.04 |
unsloth/LaTeX_OCR 로 5 에폭 파인튜닝 시킨 Qwen2VL7b 또한 아쉬울 따름 (0) | 2024.12.01 |
unsloth/LaTeX_OCR 로 1 에폭 파인튜닝 시킨 Qwen2VL7b 는 아쉬울 따름 (0) | 2024.11.30 |
unsloth/LaTeX_OCR 데이터셋 주의사항...? (1) | 2024.11.30 |
댓글
공지사항
최근에 올라온 글
최근에 달린 댓글
- Total
- Today
- Yesterday
링크
TAG
- ㅂ
- 조합
- 가장 긴 증가하는 부분 수열
- C++ Deploy
- Lowest Common Ancestor
- 위상 정렬 알고리즘
- FairMOT
- PyCharm
- LCA
- 문제집
- 백준 11053
- 백준 11437
- 단축키
- 백트래킹
- MOT
- 백준
- 자료구조
- 파이참
- 순열
- 백준 1766
- cosine
- 인공지능을 위한 선형대수
- 이분탐색
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
글 보관함