티스토리 뷰
https://github.com/openai/simple-evals
최근 Anthropic 사에서 개발한 Claude3가 벤치마크에서 gpt4를 앞지르는 성능을 보였습니다. 그리고 얼마 안지난 지금 OpenAI에서 gpt4를 업데이트 했다는 소식을 올렸습니다. 새로 업데이트된 gpt4(20240409)가 기록한 수치들을 보면 특히 MATH 벤치마크 결과가 Claude3 보다 좋아보입니다. 각각이 어떤식으로 평가하는지에 대해 저는 하나도 모릅니다.
자 이제 업데이트된 gpt4의 강력한 성능을 봐봅시다.
오... Claude3가 OpenAI에서 개발한 AI모델이라고 자신있게 말하는군요.
자 오늘은 업데이트된 gpt4의 성능을 알아보는 시간을 가졌습니다. 본 포스트가 유익하셨기를 바라며 이만 사라져보겠습니다.
참고로 이런 최신 정보에 관한 정보를 현재의 생성형 ai에게 물어보는 것은 의미가 없습니다(웹브라우징 지시를 내리면 또 다르지만)!
재미로 쓴 글이니 너무 진지하게 받아들이지는 말아주세요 ㅜㅜ
'기타' 카테고리의 다른 글
명령어 한 줄로 유튜브 채널 영상 한 번에 다운로드 받는 법 (1) | 2024.06.30 |
---|---|
MSI GPU LED 로 인해 숙면에 방해 받았던 지난 날들이여 안녕 (1) | 2024.05.06 |
Tesla FSD 12.3.3 Release Note 보다가 흠칫 (0) | 2024.04.02 |
샘 알트먼 낭만 한도 초과 (0) | 2024.04.01 |
반디집 커맨드로 압축하기 (0) | 2024.03.31 |
댓글
공지사항
최근에 올라온 글
최근에 달린 댓글
- Total
- Today
- Yesterday
링크
TAG
- 파이참
- 이분탐색
- 자료구조
- 백준 11437
- 백트래킹
- 백준
- LCA
- 위상 정렬 알고리즘
- 가장 긴 증가하는 부분 수열
- cosine
- 순열
- Lowest Common Ancestor
- PyCharm
- MOT
- FairMOT
- 백준 1766
- C++ Deploy
- ㅂ
- 인공지능을 위한 선형대수
- 문제집
- 단축키
- 백준 11053
- 조합
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
글 보관함