[논문이야기] 건축물 별 월간 전기/가스 사용량 예측:결합확률분포 모델 기반 예측 ②

160X600_GIAI_AIDSNote
에너지 사용량의 현실적인 예측을 위한 '통계학'
그간 진행돼온 회귀 분석 기반의 에너지 사용량 예측 연구들
에어컨, 난방 사용이 계절별로 다르기에 '월별' 에너지 사용량 추이가 중요

[논문이야기] 건축물 별 월간 전기/가스 사용량 예측:결합확률분포 모델 기반 예측 ①에서 이어집니다.

이전 글에서 언급했듯 에너지원 수급,생산,수송,설비 투자 등에 관한 효율적 의사결정을 위해서는 무엇보다도 에너지 사용량 추정이 정확하게 이뤄져야만 한다. 이번 글에서는 기존 연구들이 어떻게 ‘통계적으로’ 에너지 사용량을 추정했는지 개략적으로 살펴보고, 나아가 ‘계절적 추이’를 반영해야하는 이유를 짚어본다.

factory
사진=Pexels

에너지 사용량을 현실적으로 추정하기 위한 방법, ‘회귀분석’

이상적으로는, 개별 건물의 에너지 사용량의 정확한 추정을 위해서 각 건물 내 냉난방 및 공조시설, 건출 재질 및 구조, 단열 상태, 재실 인원 및 스케줄 등의 상세한 모든 특성들을 분석에 반영하는 것이 맞을 것이다. 이런 방식으로 추정하는 모델을 물리적 모델(Physical Model)로도 부른다.

그러나 물리적 모델을 통한 에너지 사용량 예측은 현실적으로 어렵다. 대부분의 신축 건물의 경우 건설사에서 모든 정보를 공개하고 있지 않기 때문이다. 그나마 하나의 건물만을 대상으로 하는 프로젝트라면 건설사・시공사에 직접 ‘발로 뛰어가며’ 정보를 수집해볼 수 있겠으나, 구・지역 단위의 에너지 사용량을 추정하고자 할 경우 천문학적인 ‘돈’ 낭비를 하게 될 것이다.

따라서 연구자 입장에서는 에너지 사용량을 몇 가지 단순한 건물 속성들에 회귀해 에너지 사용량을 추정하는 통계적 모델(Statistical Model)을 활용하는 것이 최선이다. 다시 말해 종속변수가 개별 건물의 에너지 사용량, 설명변수가 건물의 몇 가지 속성들 (연면적, 용도, 층수, 사용연수, 재질 등) 인 회귀모델(Regression Model)을 만드는 것이다. 이전 글에서도 언급했듯, ‘한국에너지공단의 용도별 단위면적당 에너지 사용량’도 가장 단순한 형태의 회귀 모델(one-variable regression)에 해당한다는 것을 다시 한번 강조한다.

회귀분석을 기반으로 한 기존 에너지 사용량 추정 연구들

회귀 분석(Regression Analysis)은 관찰된 독립 변수들과 종속 변수 사이의 상관관계를 밝혀내는 대표적인 통계적 방법론이다. 연구자는 회귀분석을 사용해 특정 독립 변수의 변화가 ‘얼마 만큼’의 종속 변수의 변화를 견인하는지 통계적으로 검정할 수 있으며, 나아가 독립 변수를 통해 종속 변수의 값을 합리적으로 예측할 수 있다. 물론 합리적인 분석을 담보하기 위해서는 본인 모델이 가우스-마르코프(Gauss-Markov Assumption) 가정을 위배하지 않는지 등의 수학・통계학에 기반한 다양한 고민들이 필요하며, 이에 대한 세부사항은 본 [논문이야기] 후반부에서 다시 언급될 예정이다.

개별 건물들의 월별 전기 사용량 기록 데이터
개별 건물들의 월별 전기 사용량 기록 데이터/출처=건축데이터 민간개방 시스템

개별 건축물의 월별 에너지 사용량을 종속변수로 두는 회귀모델 연구를 위해서는 그 데이터가 필요한데, 국내에서는 비주거용 건물들의 건축물 별 월별 에너지 사용 기록 데이터를 건축데이터 민간개방 시스템(https://open.eais.go.kr/main/main.do) 에서 공개하고 있다. 개별 건축물의 설명변수 자료는 표제부에 기록되어 있으며, 이 역시 건축데이터 민간개방 시스템에서 제공한다. 즉 건축물의 월별 에너지 사용량 데이터와 표제부 데이터를 결합하여 누구나 해당 연구를 수행할 수 있다.

본론으로 다시 돌아와보자. 앞서 언급한 현실적인 ‘비용’ 문제로 인해, 그리고 회귀모델 연구를 위한 데이터 수집이 쉽다는 이유로, 그간 개별 건물의 에너지 사용량 추정을 위한 연구들은 회귀분석 기반 통계적 모델이 주를 이뤘다. 특히 국내에서 수행된 대표적인 연구는 ‘서울시 가정/상업부문 건물에너지 표준모델 개발(김민경 등, 2014)’가 있다. 해당 연구에서는 전기의 월별 사용량을 다양한 설명변수들과 각 월별 더미 변수(dummy, 기존 변수를 특정 기준에 따라 0과 1로 변환한 변수)에 선형회귀(Linear Regression)해 모델을 도출한다. 한편 해외의 대표적인 난방 에너지 추정량 연구에서도 난방기간 내 각 월의 ‘단위 면적 당’ 난방 에너지 사용량을 건축 및 기후 설명변수에 회귀해 모델을 도출한다.

건물 내 전기 가스 사용량의 일반적 계절 추이
건물 내 전기 가스 사용량의 일반적 계절 추이

‘월별’ 에너지 사용량 추이가 중요한 이유

앞서 살펴본 기존 연구들의 한 가지 공통점을 뽑자면, 회귀모델의 종속변수가 ‘연간’ 에너지 사용량이 아닌, ‘월별’ 에너지 사용량이라는 것이다. 이는 에너지 사용량의 계절적 추이를 반영하기 위해서다. 여름에 에어컨을 켜기 때문에 전기 사용량이 타 월 대비 높고, 겨울에 난방을 하기 때문에 가스 사용량이 타월 대비 높다는 것과 같은 맥락이다. 전기 사용량이 7,8월에 크고, 가스 사용량은 12~2월에 크다는 것은 우리에게 놀랍지 않은 사실이다. 실제 대부분의 건물에서 위 그림과 같은 에너지 사용량의 ‘계절적 추이’를 확인할 수 있다.

이같은 이유로, 에너지원 수급 계획 및 에너지 생산 설비의 유지보수 계획 수립에는 계절적 추이를 반영해 각 ‘월 별’ 에너지 수요를 정확히 추정할 수 있어야 한다. 나아가 이를 통해 에너지 소비가 가장 많은 시점에는 에너지원을 충분히 확보해 ‘정전 대란’을 방지해야하며, 에너지 소비가 상대적으로 적은 시점에는 에너지원 재고를 최소화해 정부 예산을 효율적으로 분배할 수 있게끔 해야한다.

그러나 기존 연구들의 에너지 사용량 추정은 현실을 반영하지 못해 정확도가 떨어진다는 이유로 업계에서 제대로 활용되지 못하고 있는 실정이다. 이는 기존 회귀 모델이 월별 에너지 사용량이 2차 모먼트(2nd moment) 계산을 기반으로 한 ‘결합’확률분포 모델이 반영되지 않았기 때문이다. 다음 글에서는 기존 연구의 한계점을 수학・통계적으로 풀어보고, 이를 개선한 모델을 소개한다.

[논문이야기] 건축물 별 월간 전기/가스 사용량 예측:결합확률분포 모델 기반 예측 ③로 이어집니다.