티스토리 뷰

https://developer0hye.tistory.com/784

 

처음 보는 Parquet

https://huggingface.co/docs/hub/datasets-adding#which-file-format-should-i-use Uploading datasetsUploading datasets The Hub is home to an extensive collection of community-curated and research datasets. We encourage you to share your dataset to the Hub to

developer0hye.tistory.com

 

이런 글을 올렸었다.

 

이래서... 데이터를 처음부터 Parquet으로 올려야되구나! 하며 Parquet 공부하고 Parquet포맷으로 변환해서 꾸역 꾸역 올렸는데 Dataset Viewer에서 이미지 출력이 제대로 안됐다.

 

대체 왜!!! 하며 몇시간을 삽질하다가 대충 읽고 넘긴 튜토리얼이 갑자기 눈에 밟혔다.

 

https://huggingface.co/docs/datasets/image_dataset

 

Create an image dataset

There are two methods for creating and sharing an image dataset. This guide will show you how to: You can control access to your dataset by requiring users to share their contact information first. Check out the Gated datasets guide for more information ab

huggingface.co

 

튜토리얼 대로 차근 차근 하니까 잘됐다. Parquet은 내가 변환하는 게 아니라 허깅페이스에 업로드 될때 알아서 자동변환되는거고!!!!!! README 도 업로드할때 자동으로 작성되는거다!!!!!!

 

수동으로 할 필요가 없었다!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!

 

만약에 정말  제대로 한 거 같은데 업로드가 잘 안된다면 .gitattributes 를 제외하고 huggingface에 올라가 있는 파일, 폴더를 모두 제거하고 업로드 코드를 실행해보자

 

아... 다음번에는 데이터셋 업로드 방법에 대한 글을 작성해야겠다.

 

아래는 내가 성공적으로 업로드한 데이터셋 링크이다.

 

https://huggingface.co/datasets/developer0hye/korocr

 

developer0hye/korocr · Datasets at Hugging Face

["OpenAI", "Playground를", "활용한", "실전", "프롬프트", "작성", "과정", "유튜브/블로그", "제목", "다듬기", "영어", "단어장", "만들기", "채용", "인터뷰", "질문", "생성하기"]

huggingface.co

 

 

VLM 파인튜닝을 위한 데이터셋은 이제 허깅페이스에 업로드하는데 성공했다!

 

https://developer0hye.tistory.com/785

 

Hugging Face Datasets 에 이미지, 텍스트 멀티모달 데이터셋을 업로드 해보"자이아파트"

짱구도 살고 싶은 문화자이sk뷰아파트를 억지로 제목에 녹여봤습니다. 짱구는 한국에서 자기 이미지가 이렇게 소비되는 걸 알긴알까요? 단독 주택에 잘 살고 있는 짱구가 왜 아파트에 살고 싶

developer0hye.tistory.com

 

 

댓글
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
«   2025/01   »
1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30 31
글 보관함