
실험 일자: 20241009편의성1. Ctrl + v 로 이미지를 입력할 수 있는가? ChatGPT4o OClaude 3.5 Sonnet OCLOVA X X 2. webp 파일을 입력으로 지원하는가? ChatGPT4o OClaude 3.5 Sonnet OCLOVA X X 결과입력 프롬프트: 이 이미지에 대해 자세히 설명해줘- 모든 VLM에 대해 한국어로 입력해줌 입력 이미지: - CLOVA X는 webp 파일 열어서 윈도우 스크린 캡처 후 jpg로 다시 저장한 이미지를 입력함, OpenCV로 읽어서 재압축하려다가 귀찮아서 안함, 그래서 입력이 나머지 두 VLM간 완전 동일하지 않다는 문제가 있긴함- https://developer0hye.tistory.com/751 이 글에서 소개한 FLUX를 이용해 직..

ECCV2024에 "When Pedestrian Detection Meets Multi-Modal Learning: Generalist Model and Benchmark Dataset" 란 제목의 논문이 Accept 된 것을 확인했습니다. https://arxiv.org/pdf/2407.10125 https://github.com/BubblyYi/MMPedestron Multi-Modal 이런 키워드는 고사하고 RGB 도메인의 Human Detection 성능을 보았을때 기존 Vision Foundation Model이라 할 수 있는 InternImage 보다 훨씬 작은 모델 사이즈로 유사한 성능을 보이고 있습니다. https://github.com/developer0hye/yolov8-vs-yolo..

o1-preview가 strawberry의 r을 셀 수 있다고 해서 한 번 입력해봤다. 되..된다!!! 좀 더 짖궂게 입력해봤다.내가 너무 가혹했던 것일까... 정답은 4825개인데 o1-preview는 2,501개라고 답했다. Claude 는?? CLOVA X 는?? 신기하게도 CLOVA X는 strrrrr~rrrawberry를 strawberry로 토큰화시킨것으로 보인다. 호기심에 흥미로 실험해본 것이니 크게 의미를 안두셨으면 좋겠습니다!

https://huggingface.co/black-forest-labs/FLUX.1-dev black-forest-labs/FLUX.1-dev · Hugging FaceFLUX.1 [dev] is a 12 billion parameter rectified flow transformer capable of generating images from text descriptions. For more information, please read our blog post. Key Features Cutting-edge output quality, second only to our state-of-the-art model FLUXhuggingface.co https://huggingface.co/black-for..

https://github.com/developer0hye/yolov8-vs-yolo11/tree/main GitHub - developer0hye/yolov8-vs-yolo11: The average precision per class for the YOLOv8 and YOLO11 pre-trained on the COCO datasThe average precision per class for the YOLOv8 and YOLO11 pre-trained on the COCO dataset - developer0hye/yolov8-vs-yolo11github.com 정리 후 느낀점은 요새 핫한 LLM, VLM 세계에서는 스케일링을 통해 AGI로 향해 가고 있다면(sLLM도 있긴 하지만), YOLO..

https://developer0hye.tistory.com/419 모드리치를 보며...14 학번 입학 당시 모드리치 선수의 플레이가 너무 좋아서, 영어 수업때 영어 이름도 모드리치로 했었는데... 8년이 지난 지금 월드컵에서의 모드리치를 보니 14년도와는 다르게 확실히 나이가 듦developer0hye.tistory.com 약 2년을 더 보낸 내가 잠깐 점검을 해보자면 미국을 다녀왔고, 유럽(영국)에 다녀왔다. 영어는 아직 못한다. 저때보다는 잘하지 않을까?란 생각이 든다. 여전히 내 일을 좋아한다. 그리고 내일이 기대된다. 내 일이 좋으니 내일이 기대된다. 미국 주식은 우상향 했다. 맥북 프로는 없지만 에어는 있다. 결혼도 아직 못했다. 배당금도 월 100은 아직 한참 멀었다. 그렇지만 저때보다는..

여행가기 전 빌드업20240914~20240928 일자에 런던, 옥스포드를 다녀왔습니다. 작년에 20231214~20231229 일자에 뉴욕을 다녀온뒤로 앞으로 여행을 갈때는 최대한 길게 가서 버스와 지하철 이용도를 최소화하고 정말 구석 구석 돌아보며 다양한 음식점에 가보고 미술관, 박물관등 즐길 수 있는 모든 컨텐츠를 모두 즐겨보자라는 마음을 가졌습니다. 올해는 런던, 옥스포드에 2주간 다녀왔습니다. 이렇게 길게 휴가를 내는데 있어서 심리적 부담감이 크기는 했습니다. 긴 휴가를 냄에 있어서 아무런 눈치도 안주신 센터장님, 팀장님, 팀원분들께 감사함을 느꼈습니다. 몇개월간 밤낮없는 근무와 휴일 근무와 집에서도 레이블링, 데이터 검수, 정제, 논문 리딩, 아이디어 생각을 하며 압박감 속에 있었습니다만, 이..

https://github.com/developer0hye/coco-pretrained-yolov8-ap-per-class GitHub - developer0hye/coco-pretrained-yolov8-ap-per-class: The Average Precision per class for the YOLOv8 model pre-trained onThe Average Precision per class for the YOLOv8 model pre-trained on the COCO dataset - developer0hye/coco-pretrained-yolov8-ap-per-classgithub.com mAP만 보기엔 정보가 너무 함축돼있어서 다른 클래스에 대한 여러 메트릭 값을 csv파일로 저장하여..
- Total
- Today
- Yesterday
- 백트래킹
- 백준 1766
- 이분탐색
- 백준
- 문제집
- 파이참
- MOT
- 단축키
- Lowest Common Ancestor
- PyCharm
- 인공지능을 위한 선형대수
- 가장 긴 증가하는 부분 수열
- 백준 11053
- ㅂ
- FairMOT
- 순열
- 백준 11437
- cosine
- 위상 정렬 알고리즘
- C++ Deploy
- LCA
- 조합
- 자료구조
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |