'분류 전체보기' 카테고리의 글 목록 (9 Page)

주변인들이 이직 의사를 묻는다. 어떠한 회사에 가고 싶냐고 묻는다. 원래 회사에서 4x A5000 GPU 서버를 학습용 서버로 사용하고 있었다. 그러다가, 이번 년도에 8x A6000 GPU 서버가 새로 들어와서 학습용 서버로 사용해보고 있다. 정말 할 수 있는 게 확 늘어났음을 느꼈다. 내 생각의 한계와 내가 할 수 있는 작업의 스케일이 하드웨어 스펙에 의존적일 수 밖에 없다는 걸 느꼈다. 데이터 전처리 과정에서도 그렇고 학습에서도 그렇고 해볼 수 있는 게 많아졌다. 이걸 한 번 느끼니 더 좋은 스펙의 서버를 눈치 안보고 비용 걱정없이 마음껏 사용할 수 있으면 더 좋겠다는 생각이 들었다. 예를 들면 8x H100 GPU 서버라던가... 정안되면 8x RTX 6000 Ada 라던가... 사실 지금 8x ..

기타 2024. 10. 12. 00:36

20241011 집 PC에 Ubuntu 설치

새로운 변화를 주고자 기존에 집에서 사용하던 pc에 ubuntu 22.04 를 설치했다. vscode, docker, nvidia-docker 만 설치했다. 카카오톡을 설치할려면 wine이란 거를 같이 설치해야했는데, 한글 호환이 제대로 안되고 호환되게 할려면 이것 저것 설치해야하길래 그냥 설치 안했다. 앞으로 집에서 pc 사용시 온전히 더 집중할 수 있어서 오히려 좋은걸지도 모르겠다. 기존 자료를 하나도 백업 안하고 뒤도 안보고 그냥 밀어버리고 클린하게 재설치했다. 대부분의 개발 환경이 linux에 맞춰져있는데 그동안은 집에서 뭔가를 하려고 하면 os가 윈도우10이다 보니 억지로 wsl로 하고 또 wsl로 하면 하나 둘씩 wsl을 위한 별도의 설정을 따로 해주는 과정이 필요했는데 앞으로 이런 과정이 생..

기타 2024. 10. 11. 00:39

FLUX로 생성한 이미지로 VLM 별 Image Understanding 능력 비교해보기(ChatGPT, Claude, CLOVA X)

실험 일자: 20241009편의성1. Ctrl + v 로 이미지를 입력할 수 있는가? ChatGPT4o OClaude 3.5 Sonnet OCLOVA X X 2. webp 파일을 입력으로 지원하는가? ChatGPT4o OClaude 3.5 Sonnet OCLOVA X X 결과입력 프롬프트: 이 이미지에 대해 자세히 설명해줘- 모든 VLM에 대해 한국어로 입력해줌 입력 이미지: - CLOVA X는 webp 파일 열어서 윈도우 스크린 캡처 후 jpg로 다시 저장한 이미지를 입력함, OpenCV로 읽어서 재압축하려다가 귀찮아서 안함, 그래서 입력이 나머지 두 VLM간 완전 동일하지 않다는 문제가 있긴함- https://developer0hye.tistory.com/751 이 글에서 소개한 FLUX를 이용해 직..

기타 2024. 10. 9. 17:38

돌려보고 싶은데 귀찮아서 망설이고 있는 Human Detection Model MMPedestron (1)

ECCV2024에 "When Pedestrian Detection Meets Multi-Modal Learning: Generalist Model and Benchmark Dataset" 란 제목의 논문이 Accept 된 것을 확인했습니다. https://arxiv.org/pdf/2407.10125 https://github.com/BubblyYi/MMPedestron Multi-Modal 이런 키워드는 고사하고 RGB 도메인의 Human Detection 성능을 보았을때 기존 Vision Foundation Model이라 할 수 있는 InternImage 보다 훨씬 작은 모델 사이즈로 유사한 성능을 보이고 있습니다. https://github.com/developer0hye/yolov8-vs-yolo..

Deep Learning 2024. 10. 7. 22:48

20241007 ChatGPT o1-preview도 아직 r을 잘 못 센다.

o1-preview가 strawberry의 r을 셀 수 있다고 해서 한 번 입력해봤다. 되..된다!!! 좀 더 짖궂게 입력해봤다.내가 너무 가혹했던 것일까... 정답은 4825개인데 o1-preview는 2,501개라고 답했다. Claude 는?? CLOVA X 는?? 신기하게도 CLOVA X는 strrrrr~rrrawberry를 strawberry로 토큰화시킨것으로 보인다. 호기심에 흥미로 실험해본 것이니 크게 의미를 안두셨으면 좋겠습니다!

기타 2024. 10. 7. 21:55

이미지 생성 모델 FLUX 맛보기

https://huggingface.co/black-forest-labs/FLUX.1-dev black-forest-labs/FLUX.1-dev · Hugging FaceFLUX.1 [dev] is a 12 billion parameter rectified flow transformer capable of generating images from text descriptions. For more information, please read our blog post. Key Features Cutting-edge output quality, second only to our state-of-the-art model FLUXhuggingface.co https://huggingface.co/black-for..

Deep Learning 2024. 10. 6. 04:32

YOLOv8, YOLO11 성능 정량적 비교

https://github.com/developer0hye/yolov8-vs-yolo11/tree/main GitHub - developer0hye/yolov8-vs-yolo11: The average precision per class for the YOLOv8 and YOLO11 pre-trained on the COCO datasThe average precision per class for the YOLOv8 and YOLO11 pre-trained on the COCO dataset - developer0hye/yolov8-vs-yolo11github.com 정리 후 느낀점은 요새 핫한 LLM, VLM 세계에서는 스케일링을 통해 AGI로 향해 가고 있다면(sLLM도 있긴 하지만), YOLO..

Deep Learning 2024. 10. 3. 20:51

약 2년전 작성한 글을 보며...

https://developer0hye.tistory.com/419 모드리치를 보며...14 학번 입학 당시 모드리치 선수의 플레이가 너무 좋아서, 영어 수업때 영어 이름도 모드리치로 했었는데... 8년이 지난 지금 월드컵에서의 모드리치를 보니 14년도와는 다르게 확실히 나이가 듦developer0hye.tistory.com 약 2년을 더 보낸 내가 잠깐 점검을 해보자면 미국을 다녀왔고, 유럽(영국)에 다녀왔다. 영어는 아직 못한다. 저때보다는 잘하지 않을까?란 생각이 든다. 여전히 내 일을 좋아한다. 그리고 내일이 기대된다. 내 일이 좋으니 내일이 기대된다. 미국 주식은 우상향 했다. 맥북 프로는 없지만 에어는 있다. 결혼도 아직 못했다. 배당금도 월 100은 아직 한참 멀었다. 그렇지만 저때보다는..

인생 2024. 10. 3. 18:13

20240914~20240928 런던, 옥스포드 여행에 다녀와서... 그런데, 인생 이야기를 곁들인

여행가기 전 빌드업20240914~20240928 일자에 런던, 옥스포드를 다녀왔습니다. 작년에 20231214~20231229 일자에 뉴욕을 다녀온뒤로 앞으로 여행을 갈때는 최대한 길게 가서 버스와 지하철 이용도를 최소화하고 정말 구석 구석 돌아보며 다양한 음식점에 가보고 미술관, 박물관등 즐길 수 있는 모든 컨텐츠를 모두 즐겨보자라는 마음을 가졌습니다. 올해는 런던, 옥스포드에 2주간 다녀왔습니다. 이렇게 길게 휴가를 내는데 있어서 심리적 부담감이 크기는 했습니다. 긴 휴가를 냄에 있어서 아무런 눈치도 안주신 센터장님, 팀장님, 팀원분들께 감사함을 느꼈습니다. 몇개월간 밤낮없는 근무와 휴일 근무와 집에서도 레이블링, 데이터 검수, 정제, 논문 리딩, 아이디어 생각을 하며 압박감 속에 있었습니다만, 이..

인생 2024. 10. 1. 17:23

요새 친구와 돈 계산할때 쓰는 방법 Feat. ChatGPT OCR

아주 편리하다. 이번에 2주 런던, 옥스포드 여행 다녀왔는데 여기서 나온 금액도 챗 선생님께 계산을 맡겼다. 분명 처음에 "오늘자"를 언급했는데 1600원으로 가정해버리는 챗 선생님... 살짝 아쉬웠지만 한 번 지적해주면 되니까 괜찮다.

기타 2024. 10. 1. 16:07

이전 1 ··· 6 7 8 9 10 11 12 ··· 66 다음

이전 다음

공지사항

최근에 올라온 글

최근에 달린 댓글

Total

Today

Yesterday

링크

TAG more

« 2025/04 »
일	월	화	수	목	금	토
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30

글 보관함

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

지속 가능한 꾸준함

티스토리툴바

단축키

내 블로그

블로그 게시글

모든 영역