FLUX로 생성한 이미지로 VLM 별 Image Understanding 능력 비교해보기(ChatGPT, Claude, CLOVA X)
실험 일자: 20241009편의성1. Ctrl + v 로 이미지를 입력할 수 있는가? ChatGPT4o OClaude 3.5 Sonnet OCLOVA X X 2. webp 파일을 입력으로 지원하는가? ChatGPT4o OClaude 3.5 Sonnet OCLOVA X X 결과입력 프롬프트: 이 이미지에 대해 자세히 설명해줘- 모든 VLM에 대해 한국어로 입력해줌 입력 이미지: - CLOVA X는 webp 파일 열어서 윈도우 스크린 캡처 후 jpg로 다시 저장한 이미지를 입력함, OpenCV로 읽어서 재압축하려다가 귀찮아서 안함, 그래서 입력이 나머지 두 VLM간 완전 동일하지 않다는 문제가 있긴함- https://developer0hye.tistory.com/751 이 글에서 소개한 FLUX를 이용해 직..
기타
2024. 10. 9. 17:38
공지사항
최근에 올라온 글
최근에 달린 댓글
- Total
- Today
- Yesterday
링크
TAG
- 가장 긴 증가하는 부분 수열
- 인공지능을 위한 선형대수
- 백트래킹
- 순열
- 백준 1766
- Lowest Common Ancestor
- 위상 정렬 알고리즘
- 파이참
- FairMOT
- 조합
- 백준 11437
- 백준
- C++ Deploy
- 이분탐색
- 문제집
- 단축키
- cosine
- LCA
- 자료구조
- ㅂ
- PyCharm
- MOT
- 백준 11053
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 | 31 |
글 보관함