이제 train data는 모두 준비됐다.
정리해보면 독립변수=feature= x는 기상데이터, 지형데이터, 인적데이터가 될 것이고 y는 1 혹은 0이 될 것이다.
train의 경우 target이 1인 산불발생에 관련된 데이터가 1024개 그리고 산불이 발생하지 않은 데이터가 1140개 총 2164개의 데이터로 학습이 진행된다.
test의 경우가 참 애매했다. 우리의 목적이 무엇인가를 다시 생각해봐야한다.
우리의 목적은 산불발생확률을 예측하는 것이다. 따라서 전지역에 대한 산불발생확률을 생성해야한다.
그래서 이전에 말했던 지형의 해상도에 맞게 강원도 전체를 400*278로 나눈 총 11만개 정도의 input을 최종적으로 넣어서 나오는 결과값들이 결과값이다.
아래 그림을 보면 좀 이해가 될 것 같은데, 저 네모 칸들이 총 11만개 정도 있는것이고 학습이 완료된 모델에 저 11만개의 input을 넣어서 강원도 전체 지역에 대한 확률맵을 만드는 것을 최종 목표로 설정하였다.
이제 모델을 구성해보자.
모델은 정형데이터와 이미지 데이터를 입력으로 받아들여서 1 혹은 0으로 예측해야한다.
모델의 경우에는 기상데이터=정형데이터는 mlp레이어를 통해서 학습시키고, 지형&인적데이터=비정형데이터는 conv2d를 이용하여 학습시킨다. 이후 마지막의 featuremap을 concat해서 시그모이드 함수를 거친다.
이렇게 학습한 모델을 저장하여, 최종적으로 11만개의 강원도 전체지역에 대한 특정날짜의 기상데이터와 지형데이터를 넣게되면 전체 강원도에 대한 확률맵이 생성되게 된다.
'프로젝트 > 산불 발생 예측' 카테고리의 다른 글
산불 발생 확률 예측 - 프로젝트 마무리 (0) | 2023.11.21 |
---|---|
산불 발생 확률 예측 - 모델링 준비 (0) | 2023.11.21 |
산불 발생 확률 예측 - 지형,인적 데이터 수집 (0) | 2023.11.21 |
산불 발생 확률 예측 - 인적 데이터 수집 (0) | 2023.11.20 |
산불 발생 확률 예측 - 프로젝트 시작 (0) | 2023.11.20 |