이 Repository는 FastAPI를 사용하여 구축된 Image Captioning 및 음성 변환 서비스의 백엔드 부분을 포함하고 있습니다.
- 사용자가 업로드한 이미지에 대한 캡션 생성
- 생성된 캡션을 바탕으로 음성 파일 생성
- Python 3.10 이상
-
Clone the repository:
https://github.com/AI-LeGo/Service-Backend.git
-
Install dependencies:
pip install -r requirements.txt
- FastAPI 서버 실행:
uvicorn main:app --reload --host=0.0.0.0 --port=8000
- 루트 페이지:
GET /- 서비스의 루트 페이지 반환 - 이미지 캡션 생성:
GET /caption- 업로드된 이미지에 대한 캡션 반환 - 이미지 업로드 및 처리:
POST /upload/photo- 이미지 업로드 후 캡션 및 음성 파일 생성 - 음성 파일 요청:
POST /wav/{file_name}- 지정된 파일 이름의 음성 파일 반환
main.py: FastAPI 앱의 주 실행 파일photo/: 업로드된 이미지 저장 폴더template/: 프론트엔드 템플릿 파일tools/: OpenAI API 및 기타 도구 모듈