본 프로젝트는 기상 데이터, 하천 데이터 등 다양한 수문 데이터를 활용하여 AI 모델 기반의 지하수위 변동을 예측하는 것을 목표로 합니다.
안정적이고 지속가능한 수자원 관리를 위해 지하수 함양 특성을 분석하고, 다양한 머신러닝 및 딥러닝 예측 모델을 적용하여 미래의 지하수위를 정밀하게 예측함으로써 효율적인 수자원 정책 수립에 기여하고자 합니다.
- 데이터 전처리: 결측치 처리, 이상치 탐지 및 시계열 데이터 정합
- 피처 엔지니어링:
- 시간 관련 파생변수 생성 (월, 요일, 계절 등)
- 이동 평균 및 누적값 계산을 통한 추세 반영 (강수량, 기온 등)
- 과거 데이터의 영향을 반영하기 위한 지연 변수(Lagged Features) 생성
- 모델링:
SARIMA,TST,SARIMAX등 다양한 예측 모델 적용 및 성능 비교 - 모델 최적화:
Optuna를 이용한 베이지안 하이퍼파라미터 최적화 - 성능 평가: 대회 평가지표인
NSE(Nash-Sutcliffe Efficiency) 및KGE(Kling-Gupta Efficiency) 사용 - 사용 라이브러리:
pandas,numpy,scikit-learn,lightgbm,tensorflow,optuna,plotly