매 영상마다 자막을 직접 치느라 업로드가 늦어지는 컨텐츠 크리에이터.
CaptionMate는 AI를 활용해 음성을 텍스트로 전사해 자막 파일 형식(SRT/FCPXML/WebVTT/JSON)으로 만들어, 자막 작업 시간을 획기적으로 줄여주는 앱 입니다.
2025.02.23 ~ 2025.10.14
- WhisperKit 기반 고품질 음성 인식: OpenAI의 Whisper 모델을 사용한 정확한 음성-텍스트 변환
- 다양한 언어 지원: 영어, 한국어 및 기타 다국어 지원
- 온디바이스 고속 처리: 네트워크 없이 빠르고 안전하게 전사
- 단어 단위 타임스탬프: 정확한 자막 동기화를 위한 세밀한 타임스탬프 제공
- 자동 번역: 다양한 언어의 음성을 영문 자막으로 번역하여 제공
- 다양한 자막 형식: SRT, WebVTT, JSON, Final Cut Pro XML 지원
- 실시간 미리보기: 전사 결과를 실시간으로 확인
- 모델 선택: 다양한 Whisper 모델 크기 선택 (tiny, base, small, medium, large)
- 성능 최적화: Neural Engine, CPU, GPU 연산 유닛 설정과 prewarming 기능으로 성능 최적화
- 품질 조절: 압축률, 온도, 타임스탬프 등 세밀한 설정 옵션
- 다국어 지원: 영어, 한국어 언어 설정 지원
- 다크모드 지원: 다크모드 지원
- 보안: 모든 전사는 온디바이스로 처리됩니다. 파일/텍스트는 서버로 전송되지 않습니다.
새로운 개발자를 위한 상세한 설정 가이드는 SETUP.md를 참고하세요.
- macOS: 15.0 이상
- Xcode: 16.0 이상
- Swift: 6.0.3 이상
- Homebrew: 패키지 관리자
- Mint: Swift 패키지 관리자
git clone https://github.com/cho407/CaptionMate.git
cd CaptionMate
./scripts/setup.sh
open CaptionMate/CaptionMate.xcodeprojgit clone https://github.com/cho407/CaptionMate.git
cd CaptionMate
brew install mint
mint bootstrap
open CaptionMate/CaptionMate.xcodeprojPowered by WhisperKit and OpenAI Whisper.
CaptionMate는 MVVM (Model-View-ViewModel) 아키텍처를 기반으로 구축되었습니다:
- Model: 데이터 모델 및 비즈니스 로직
- View: SwiftUI 기반 사용자 인터페이스
- ViewModel: 뷰와 모델 간의 데이터 바인딩 및 상태 관리
- ContentViewModel: 메인 전사 로직 및 상태 관리
- AudioViews: 오디오 재생 및 파형 시각화
- TranscriptionViews: 전사 설정 및 결과 표시
- ModelManagementViews: AI 모델 관리 인터페이스
- 이메일: parfume407@gmail.com
- GitHub Issues: 버그 리포트 및 기능 요청
- Wiki: 프로젝트 위키
CaptionMate는 Apache License 2.0에 따라 배포됩니다. 자세한 내용은 LICENSE 파일을 참조하세요.
🎬 CaptionMate로 더 쉽고 빠른 자막 제작을 경험해보세요!










