[논문이야기] 건축물 별 월간 전기/가스 사용량 예측:결합확률분포 모델 기반 예측 ④

완전한 2차 모멘트 행렬, 서로 다른 회귀 모델 잔차의 표본상관계수 계산으로 도출 실제 월별 에너지 사용량 간 강한 양의 상관관계 보여 아울러 전기 및 가스 사용량 간 ‘대체’ 관계 있다는 것 확인해

[논문이야기] 건축물 별 월간 전기/가스 사용량 예측:결합확률분포 모델 기반 예측 ③에서 이어집니다.

이전 글(1,2,3)까지를 통해 필자는 에너지 사용량 추정의 필요성, 이와 관련된 기존 연구의 한계, 그리고 이를 개선하기 위해 종국적으로는 서로 다른 식들의 오차항들 간 ‘상관관계(correlation)’, 즉 2차 모멘트 행렬의 계산이 통계 모델에 포함돼야 한다고 설명했다. 이번 글에서는 이 같은 상관관계를 모델에 반영하는 통계적 방법론을 쉽게 풀어본다.

OLS 기반 회귀 모델을 통한 표본상관계수 계산

이전 글들에서도 언급했듯, 필자는 기존의 연구들이 2차 모멘트(2nd moment) 행렬의 비대각 성분(off-diagonal component), 즉 서로 다른 두 회귀식의 오차항 간 ‘공분산’은 추정되지 않는 한계가 있다고 지적했다. 또한 이처럼 상관관계가 반영되지 않음으로 인해, 하나의 건물에 대해 7월과 8월의 전기 사용량 표본이 서로 매우 상이하는 등 상식에 반하는 표본이 추출될 가능성이 있다고도 강조했다.

이 같은 문제를 극복하기 위해, 월별 ‘단위면적 당’ 에너지 사용량을 반응변수(response variable)로, 설명변수(explanatory variable)는 층수, 사용연수, 기온조건, 건물 재질로 하는 회귀모델의 잔차(residual)들에 대해 표본상관계수를 구하는 작업을 거쳐야만 한다. 이때 해당 회귀 모델의 설명 변수는 회귀모델의 수정결정계수(Adjusted R square) 및 건축공학적 도메인으로 선택됐음을 밝힌다.

SUR로 모든 식들을 하나의 큰 행렬로 통합해, 월별 전기/가스 사용량에 대한 회귀 모델의 오차항들 간 상관관계를 계산한다

다시 ‘서로 다른 월의 에너지 사용량 간 상관관계를 모델에 반영해야 한다’는 문제의식으로 돌아와 보자. 이처럼 서로 다른 회귀식들의 오차항 간 강한 상관관계가 예상될 경우, 통계학에서는 하나의 행렬로 통합하여 계수를 추정하는 겉보기 무관 회귀(Seemingly Unrelated Regression, SUR)를 사용한다. 그러나 여기서 한 가지 유의할 점은, 본 논문의 각 월 별 서로 다른 회귀식의 설명변수가 층수, 사용연수, 기온조건, 건물재질로 모두 같은 관계로, 우리는 월 별 단위면적 당 에너지 사용량에 대한 OLS 기반 회귀 모델들의 잔차들 간 표본상관계수를 계산하는 과정만 거치면 된다는 것이다.

실제 계산을 통해 뚜렷하게 나타나는 오차항들 간 상관관계

위 논의를 기반으로, 이제부터는 2021년 1월 – 2021년 12월까지의 실제 건물 데이터(에너지 사용량, 연면적, 건물용도 등)를 통해 실제 서로 다른 월별 가스 사용량들에 대한 회귀식들의 오차항 간 상관관계를 계산해 보고자 한다. 만약 필자의 예상이 맞다면, 서로 다른 두 월의 전기 사용량에 대한 회귀식들의 잔차들끼리는 강한 양의 상관관계가 있어야 한다. 이는 서로 다른 두 월의 가스 사용량 회귀식들의 잔차들끼리도 마찬가지다.

예: 업무시설 용도, $3000m^2$, 전기 사용 건물들에 대한 잔차들의 표본상관계수행렬

실제 계산(위 그림)을 통해, 서로 다른 월의 전기 사용량에 대응하는 모델들의 잔차들 간 표본상관계수는 모두 0.8 이상으로 매우 높다는 것을 확인할 수 있다. 가스에 대해서도 마찬가지로 모든 상관계수가 0.6 이상으로, 전기만큼은 아니지만 높은 상관관계가 나타났다. 이는 하나의 건물 내에서 서로 다른 월의 전기 사용량들 및 가스 사용량들이, 건물 규모 효과 등이 통제된 상태에서도 강한 양의 상관관계를 가짐을 의미한다.

예: 업무시설, 연면적 $3000m^2$ 미만, 전기 및 가스 사용 건물들의 잔차 간 표본상관계수행렬

한편 눈에 띄는 대목은 위 그림에서 보이는 바와 같이 특정 월의 전기와 특정 월의 가스 사용량 간에는 상관계수가 -0.3 수준의 음의 상관관계를 보인다는 것이다. 이는 보일러에 의한 가스 난방과, 전열기구 혹은 냉난방일체형 시스템에어컨에 의한 전기난방이 건물 난방에 대해 서로 대체 관계에 있기 때문으로 분석된다.

[논문이야기] 건축물 별 월간 전기/가스 사용량 예측:결합확률분포 모델 기반 예측 ⑤로 이어집니다.

Similar Posts