Clicky

Blog Post

AI File Sorter가 존재하는 이유

대부분의 사람들은 폴더가 서서히 혼란스러운 아카이브로 변하는 경험을 합니다. 다운로드가 쌓이고, 스크린샷이 쌓입니다. 문서들은 scan_0021.pdf나 IMG_4928.jpg 같은 이름을 갖게 되고, 사진들은 DSC_0193.JPG 같은 파일 이름으로 저장됩니다. 시간이 지나면 파일 자체가 여전히 존재하더라도 원하는 것을 찾기가 더 어려워집니다.

Share

이는 몇 가지 흔한 위치에서 주로 발생합니다:

  • 다운로드
  • 바탕화면
  • ImagesScreenshots 디렉토리
  • 외장 드라이브 및 NAS 저장소
  • 수년에 걸쳐 모인 대규모 혼합 아카이브

전통적인 파일 정리 도구들은 파일명, 확장자 또는 경직된 폴더 구조 기반의 규칙으로 이를 해결하려고 합니다. 하지만 실제 파일은 거의 깔끔한 규칙에 딱 맞아떨어지지 않습니다. PDF는 계약서일 수도 있고, 강의 노트일 수도 있고, 스캔된 편지일 수도 있습니다. 사진은 풍경일 수도 있고, 영수증일 수도 있고, 스크린샷일 수도 있습니다.

Unorganized folder

현대의 AI 모델들은 파일 내용을 분석하고 그로부터 의미를 추출하는 것을 가능하게 합니다. AI File Sorter는 AI 분석을 메타데이터 및 단순한 휴리스틱과 결합해 파일이 실제로 포함하고 있는 내용에 따라 정리하는 데 이 능력을 실용적으로 활용하기 위해 만들어졌습니다.

애플리케이션은 두 가지 주요 작업을 수행합니다:

파일을 폴더로 분류
명확하고 정규화된 파일 이름 제안

AIFS - Review dialog

파일 유형에 따라 서로 다른 기법이 사용됩니다.

이미지는 비전 모델로 분석하여 내용 파악이 가능합니다. PDF나 오피스 파일 같은 문서는 텍스트를 읽어 분류할 수 있습니다. 오디오와 비디오 파일은 ID3 태그나 MP4 메타데이터 같은 내장 메타데이터를 사용해 일관된 파일명을 생성할 수 있습니다.

모든 파일 유형이 콘텐츠 분석을 필요로 하는 것은 아닙니다. 많은 파일의 경우 메타데이터, 파일명, 확장자 및 실용적인 휴리스틱이 이미 합리적인 카테고리를 제안할 수 있는 충분한 신호를 제공합니다.
목표는 모든 것을 AI로 강제로 처리하는 것이 아니라 각 파일에 가장 적합한 방법을 사용하는 것입니다.

한 가지 중요한 설계 원칙은 안전성입니다. AI File Sorter는 AI를 분석에만 사용합니다. 모델은 읽기 전용 모드로 작동하며 파일을 직접 수정하지 않습니다. 애플리케이션 자체는 제안된 변경사항을 검토하고 승인한 후에만 파일 작업을 수행합니다. 이렇게 하면 워크플로우는 자동화되지만 여전히 완전히 제어됩니다. 명시적인 확인 없이는 아무것도 이동되거나 이름이 바뀌지 않으며, 변경사항은 내장된 Undo 기능을 사용하여 쉽게 되돌릴 수 있습니다.

Folder after sorting

AI File Sorter는 로컬에서 실행되도록 설계되었습니다. 대부분의 워크플로우는 LLaMA, LLaVa 또는 Mistral과 같은 온디바이스 모델을 사용할 수 있으므로 파일, 이미지 및 문서를 어디에도 업로드할 필요가 없습니다. 원하면 원격 API를 사용할 수 있으나 선택 사항입니다.

이 프로젝트의 목표는 단순합니다: 엄격한 규칙 없이, 그리고 자신의 데이터에 대한 제어권을 포기하지 않고, 대규모 파일 모음을 다시 이해하고 유지 관리하기 쉽게 만드는 것입니다 — without rigid rules, and without giving up control over your own data.

댓글 (0)

No comments yet.