티스토리 뷰

https://opensource.googleblog.com/2024/02/magika-ai-powered-fast-and-efficient-file-type-identification.html

 

Magika: AI powered fast and efficient file type identification

Magika code and model are freely available starting today in Github under the Apache2 License.

opensource.googleblog.com

https://github.com/google/magika

 

GitHub - google/magika: Detect file content types with deep learning

Detect file content types with deep learning. Contribute to google/magika development by creating an account on GitHub.

github.com

 

기존에는 단순히 파일 확장자명이나 파일의 종류를 식별가능한 식별자를 파일에 삽입하고 이 식별자를 읽음으로써 파일의 확장자를 파악하는 게 일반적인 방식이였다고 합니다. 이렇게 되면 매번 새로운 파일 포맷이 나오면 이를 인식 하기위한 코드를 매번 구현해줘야 하는 수고로움이 있을 수 밖에 없습니다. 이를 AI로 하게 되더라도 성능만 보장된다면 학습을 다시 시켜야하는 수고로움은 있으나 코드 보다는 그냥 새로운 파일 포맷의 파일을 학습 시켜주는 편이 코딩보다 편리할 거 같기는 한데요.

 

구글에서 이번에 magika라는 딥 러닝 기반으로 파일 확장자를 인식할 수 있는 라이브러리를 오픈했습니다. 뭘 할 수 있을지 생각해보면 단순히 확장자나 식별자를 바꿔서 파일 종류를 속이려는 시도를 검출할 수 있을 거 같고... 또 식별자를 좀 변경하는 정도는 검출할 수 있을지 않을까 싶습니다. 구글에서도 보안과 관련해서 파일과 밀접한 관련이 있는 gmail, google drive 등의 서비스에서 활용한다고 하네요.

 

파일의 종류를 알 수 있으면 가능한 일에 대해 챗지피티는 이렇게 대답했습니다.

댓글
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
«   2024/05   »
1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30 31
글 보관함