사실 프로젝트의 전체적 구조를 아직 잘 모르겠는 사람도 있겠지만, 우선 마지막 DAY 글에 있는 PPT를 먼저보고 나중에 다시 이 글을 읽는 것이 좋을 것도 같다.
이전에 산불 발생 유무 데이터와 해당 기상데이터까지 수집된 상태이다.
이제는 지형 데이터와 인적 데이터를 수집하였다.
사실 이 과정이 실제 프로젝트 진행할 때는 너무나도 힘들었다. 지형 데이터들의 형식이 tif나 shp라는 생소한 파일형식이며 qgis라는 지리정보프로그램을 이용하여 데이터를 전처리하는 것도 있었는데 너무나도 어려웠고, 파이썬에서 이러한 지리정보를 다루는 예제 같은 것들이 많이 공개되어있지 않아서 겨우 겨우 해낸 것 같다.
1. 지형 데이터 수집
우선 지형데이터는 NDVI(식생지수), 경도, 고도를 이용하였고 인적데이터로는 토지이용도, 인구밀도 데이터를 사용하고자했다.
데이터는 각기 다른 곳에서 수집하였는데, NDVI는 netcdf라는 파일형식으로 nasa에서 가져왔고, 경도 고도 데이터는 환경빅데이터 플랫폼에 공개되어 있는 한국지질자원연구원 출처의 데이터를 수집하였다.
각 데이터를 수집한 뒤, 우리는 강원도 지역만을 대상으로 하기 때문에 전부 강원도 지역만을 잘라줬다.
그러면 아래와 같이 각 지형데이터를 얻을 수 있었고 각 데이터의 해상도는 격자 한칸당 1.2km*1.2km이며 래스터 형식이고 좌표게는 EPSG:4326을 사용하였다.
2. 인적 데이터 수집
우리나라 산불의 대부분의 영향은 인적요인에 의한 것으로 인적요인이 산불 발생 유무에 매우 큰 영향을 끼칠 것이라 생각하였다.
국토교통부에서 제공하는 토지이용도와 인구밀도 데이터를 수집하여 이용하였다.
토지이용도와 인구밀도 데이터 모두 CSV형태로 제공되어 이 또한 QGIS 프로그램을 이용하여 이미지 형식으로 바꿔줬다.
이렇게 데이터를 준비하는데, 우선 전체 데이터를 강원도만으로 잘라내는 것이 너무나도 힘들었다.
파이썬에 raterio나 gdal 등 이러한 래스터 이미지와 shape파일을 다루는 라이브러리들이 있긴 했지만 사용법 등이 잘 안내되어있지 않아서 복잡했다. 아무튼 과정들은 블로그에 기록하는 건 생략했지만 위의 전체 feature들에 대한 이미지들을 해상도를 맞췄다.
'프로젝트 > 산불 발생 예측' 카테고리의 다른 글
산불 발생 확률 예측 - 프로젝트 마무리 (0) | 2023.11.21 |
---|---|
산불 발생 확률 예측 - 모델링 결과 (0) | 2023.11.21 |
산불 발생 확률 예측 - 모델링 준비 (0) | 2023.11.21 |
산불 발생 확률 예측 - 인적 데이터 수집 (0) | 2023.11.20 |
산불 발생 확률 예측 - 프로젝트 시작 (0) | 2023.11.20 |