서 론
국가 탄소중립 목표 달성을 위해 건물 부문의 에너지 절감은 핵심 과제이며, 이에 따라 제도 강화, 고효율 설비 도입, 운영 관리 최적화 등 다양한 노력이 추진되고 있다. 기존 건물의 운영 데이터를 활용한 증거기반(evidence-based) 분석은 성능 개선 효과를 검증하고, 제도 개선과 그린리모델링 투자 타당성 검토 등 주요 의사결정을 뒷받침함으로써, 에너지 절감 목표 달성을 위한 핵심 수단이다. 이로 인해, 전 세계적으로 양질의 건물 에너지 데이터를 체계적으로 수집하고, 정책적·기술적 근거를 마련하기 위한 과학적이고 정밀한 분석이 필수적 과제로 부각되고 있다(Kim et al., 2019; Long et al., 2020; European Commission, 2023; DESNZ, 2025; Shin et al., 2024).
기존의 건물 에너지 데이터 분석은 상관분석을 통한 변수 간 연관성 검토, 회귀분석을 통한 영향 요인의 정량적 추정, 그리고 최근 기계학습 기반 에너지 사용 예측의 정확도 향상에 초점을 두어왔다. 이러한 접근은 주어진 데이터 내에서 설정한 변수들 간의 통계적 상관성에 기반하여 관찰된 범위 내에서 에너지 사용을 설명 및 예측한다. 한편 에너지 절감 방안을 마련하기 위한 다양한 의사결정 과정에서는 ‘만약 ~라면(what-if)’과 같은 반사실적 질문이 필연적으로 제기된다(Chen et al., 2022). 그러나 상관관계나 단순 예측에 의존하는 접근은 변수 간의 전후 관계나 인과적 구조를 반영하지 못해, 반사실적 질문에 대해 정확한 답을 제시하기 어렵다. 예컨데 ‘만약 단열 성능을 향상시킨다면 건물 에너지 사용량은 얼마나 감소할 것인가?’와 같은, 현재는 관찰되지 않은 반사실적 상황에 대한 데이터 기반 분석을 위해서는 기존의 상관·예측 중심 접근을 넘어서는 새로운 분석 틀이 요구된다.
이러한 배경으로, 건물 에너지 연구에서는 최근 인과추론(Causal inference)이 주목받고 있다. 인과추론은 분석가가 관심을 두는 ‘처치변수(treatment, 원인)’, 그 영향을 받는 ‘결과변수(outcome)’, 그리고 두 변수 모두에 영향을 미쳐 관계를 왜곡시킬 수 있는 ‘교란변수(confounder)’를 명시한다. 이를 바탕으로, ‘처치→결과’, ‘처치↔교란→결과’와 같은 구조적 관계를 명시함으로써, 교란 요인의 영향을 체계적으로 통제하고 정책이나 제도 변화와 같은 반사실적 처치의 순수한 효과(인과 효과)를 정량적으로 추정할 수 있다. 즉, 기존 상관성 기반 접근은 교란변수의 영향이 포함되어 처치와 결과의 관계가 왜곡되어 해석될 수 있는 한계가 있으나, 인과추론은 교란변수를 통제하는 구조적 분석을 통해 처치 여부에 따라 달라지는 결과를 정량적으로 분석할 수 있다.
Pan et al. (2024)는 다영역 연구에서 인과추론의 부재가 유효한 결론 도출을 저해한다고 지적하였다. 특히 목표 추정량의 불명확성, 인과와 예측의 혼동, 교란 미통제 등을 주요 문제로 제시하며, 건축환경 연구 전반에서 인과추론의 도입 필요성을 강조하였다. Kahn et al. (2014)는 상업용 건물을 대상으로 임대 구조가 전력 소비에 미치는 인과적 효과를 분석하였으며, 세입자가 전력 비용을 직접 부담하는 계약이 전력 소비를 약 20% 절감시키는 등 임대 구조가 에너지 사용 행태에 유의한 영향을 미침을 제시하였다. Sun et al. (2024)은 실내 온도와 재실자의 온열감 간 관계 추정에서, 처치와 결과에 대한 인과적 방향성의 가정이 달라질 경우 결과 및 해석이 달라질 수 있음을 보이며, 건물 에너지 및 열쾌적성 연구에서 변수의 인과적 요인을 명확하게 설정하는 것이 필수적임을 강조하였다. Chen et al. (2024)는 설계 단계의 단열 수준과 난방에너지 사용량 간 관계 분석을 통해, 인과 구조를 고려하지 않는다면 높은 예측 성능의 데이터 기반 모델조차 실제와 반대되는 결론을 도출할 수 있음을 보이며 변수 간 구조적 관계 설정이 필수적임을 강조하였다. Mun and Park (2025)는 인공신경망 모델과 인과추론 기반 Double machine learning 모델을 이용해 실내 온도 제어 모델을 각각 구축하여 제어 전략에 따른 모델 간의 결과 차이를 입증하며, 교란 변수 통제의 중요성을 제시하였다. 이처럼 인과추론 활용 연구들이 기존의 통계적 데이터 기반 방법론의 관점을 벗어나 ‘만약 ~라면(what-if)’ 시나리오 분석을 위한 새로운 관점과 필요성을 제시하고 있다. 다만, 아직 건물 에너지 분석 도메인에서 인과적 방법을 적용한 사례가 전체 연구의 6%에 불과하다(Mahdavi and Berger, 2024).
본 연구에서는 준공연도가 건물의 에너지 사용량에 미치는 인과적 효과를 분석한다. 준공연도는 단열 수준, 설비 효율, 건축 기준 강화 등 다양한 성능 개선을 포괄하는 지표로, 신축 건물에서 실제로 에너지 사용이 감소했는지를 실증적으로 확인하는 것은 향후 성능 개선 전략 수립의 중요한 근거가 된다. 이를 위해 국내 762개 사무소 건물을 대상으로 상관분석과 인과추론 분석 결과를 비교한다. 특히, 인과추론 분석에서 준공연도를 제외한 교란변수 통제 효과를 확인하고, 건물 특성별 이질적 인과효과를 도출하였다. 이러한 분석은 ‘만약 신축된다면 에너지 사용은 얼마나 줄어들 것인가’와 같은 현재 발생하지 않은 반사실적 시나리오를 실증적으로 다루는 사례로, 건물 에너지 분석에서 인과추론 접근의 유용성을 보인다.
상관성 vs. 인과성
상관성(correlation)은 두 변수가 함께 변하는 경향을 의미하며, 상관분석, 회귀분석 및 머신러닝 모델의 기초가 된다. 대표적인 지표로는 변수 간 선형적 연관성을 나타내는 상관계수 r, 모델의 설명력을 나타내는 결정계수 R2, 그리고 회귀모형에서 각 변수의 기여도를 나타내는 회귀계수 β가 있으며, 이들은 모두 관찰된 데이터에서 추정된 통계적 관계를 반영한다.
분석 대상이 처치변수 T와 결과변수 Y의 관계라고 하고, 교란변수 X가 존재한다고 가정할 때, 상관성 기반 접근은 T와 Y의 관계를 조건부 확률 로 추정하며, 이는 수식 (1)과 같다(Pearl, 2009).
반면 인과추론은 변수들 간의 계층적·구조적 관계를 고려하여, 처치변수 T, 결과변수 Y, 그리고 교란변수 X의 인과적 방향성을 명시한다. 인과성(Causation)은 단순히 관찰된 조건부 확률을 기반으로 한 상관성을 넘어서, 교란변수 X의 영향을 보정한 상태에서 T가 Y 에 미치는 인과적 효과를 추정해 “만약 T를 인위적으로 변화시킨다면 𝑌는 어떻게 달라질 것인가?”라는 질문에 답하는 것을 목표로 한다. Pearl (2009)은 이러한 개입(intervention)을 수학적으로 표현하기 위한 도구로 ‘do-연산자’를 제안하였으며, 인과적 효과는 수식 (2)와 같이 정의된다.
즉, 인과성(수식 (2))을 상관성(수식 (1))과 비교해 보았을 때, 교란변수 X의 원래 분포 P(X)를 통해 사용하여, T가 바뀌더라도 X는 바뀌지 않은 상태로 유지되도록 보정하는 것이다. 이로 인해, T→Y의 순수한 효과를 추정할 수 있다.
한편, 인과추론에서 추정되는 인과효과는 평균 인과효과(Average Treatment Effect, ATE)와 조건부 평균 인과효과(Conditional Average Treatment Effect, CATE)로 구분된다(Imbens and Rubin, 2015). ATE는 전체 집단을 대상으로 처치가 결과에 미치는 평균적인 효과를 의미한다. 그러나 건물의 에너지 사용은 규모, 지역, 설비와 같은 다양한 특성에 따라 달라지므로, 평균값만으로는 충분히 설명되지 않을 수 있다. 이러한 이질성을 반영하기 위해 CATE가 활용되며, 이는 특정 조건(예: 연면적 그룹, 기후 지역, 난방 방식 등)을 가진 집단에서의 효과를 추정한다. 따라서 ATE는 전체적 경향을 보여주는 지표라면, CATE는 건물 특성별 맞춤형 인과적 분석 결과를 제공한다.
본 연구에서는 Causal Forest Double Machine Learning (CausalForestDML) 알고리즘을 기반으로 인과추론을 수행하였다. CausalForestDML은 교란변수의 영향을 받는 부분을 제거한 뒤, 남은 변동으로 처치와 결과의 인과효과를 추정한다. CausalForestDML은 랜덤 포레스트 구조를 활용해 비선형적 패턴과 변수 간 상호작용을 반영할 수 있어 유연하고 이질적 인과효과를 도출하는데 유리하다.
사례연구
본 연구에서는 준공연도와 사무소 건물의 냉난방 에너지 사용량 간 인과 효과를 건물 특성별로 제시하여 신축에서의 절감 효과를 규명하고자 한다. 이를 위해, 다음 세 개의 건물 데이터셋을 연계하여 분석에 이용하였다: 건축물대장(MOLIT, 2024), 기상청 데이터(KMA, 2019), 한국건설기술연구원 ‘데이터넷 프로젝트’(Shin et al., 2024)에서 구축된 2019년도 에너지 사용량 데이터.
건축물대장 중 표제부를 통해 건물의 연면적, 용도와 준공연도 등 건물의 특성을 수집하였고, 기상 데이터에서 외기온도를 난방 및 냉방 도일(Heating/cooling degree-days)로 변환하여 기후 조건을 반영하였다(기준온도=18℃). 이때 기상 데이터와 건물 간 연계를 위해, 건물의 위치를 기준으로 Haversine 거리를 이용해 최근접 기상관측소와 매칭하였다(Sinnott, 1984). 또한, 총 난방 에너지 사용량 대비 전기 및 가스의 비율이 각각 80%이상에 해당하는 대상에 대해 전기 난방 및 가스 난방으로 난방 시스템 유형을 구분하였으며, 냉방 시스템의 경우, 전기 냉방에 해당하는 건물로만 선정하였다. 분석 대상은 단일 건물 필지, 연면적 100 m2, 1995년 이후 준공된 사무소 건물(주용도: 업무시설)을 조건으로 하여, 762개 사무소 건물로 선정하였다.
Table 1은 사무소 건물의 주요 변수 정의와 통계 요약치를 정리한 것으로, 본 연구에서 수행한 인과추론 분석을 구성하는 처치변수(treatment), 결과변수(outcome), 교란변수(confounder)의 범위와 특성을 보인다. 처치변수는 준공연도로 설정하였으며, 분석 대상 762개 건물의 중앙값은 2004년, 범위는 1995년부터 2017년까지이다. 결과변수인 난방 및 냉방 EUI는 각각 난방 및 냉방 에너지 사용량을 단위면적당으로 환산하여 정의하였다. 난방 EUI의 중앙값은 26 kWh/m2/yr(범위: 9–160 kWh/m2/yr), 냉방 EUI의 중앙값은 8 kWh/m2/yr(범위: 0.4–43 kWh/m2/yr)이다.
교란변수는 비주거 건물의 설계 기준의 분류 항목을 참고하여, 연면적, 지역 및 난방 시스템으로 고려하였다. 연면적은 건물 규모를 대표하는 지표로, 중앙값은 1,265 m2 (136-5,032 m2)이다. 지역별 기후 요인을 반영한 HDD와 CDD의 중앙값은 각각 2,554℃·day (1,669–3,215℃·day) 및 945℃·day (698–997℃·day)로 나타났다. 난방 시스템은 전기식과 가스식 두 유형으로 구분하였으며, 전체 건물 중 전기식이 636개, 가스식이 126개였다. 모든 건물은 전기식 냉방 시스템을 사용하였으므로 냉방 시스템에 대해서는 별도의 구분을 적용하지 않았다.
Figure 1은 변수들의 분포를 나타낸 것으로, 건물 특성이 넓은 범위에 걸쳐 분포함을 보여준다. 이는 사무소 건물의 다양한 규모와 기후 조건, 시스템 특성이 고르게 포함되어 있어, 인과분석에 적합한 표본 구성을 이루고 있음을 의미한다. 준공연도에 대한 난방 및 냉방 에너지 사용량의 인과추론을 위한 CausalForestDML 모델은 각각 구축하였다.
Table 1.
Variable description
결 과
Table 2는 사무소 건물의 준공연도와 난방 및 냉방 EUI 간의 관계에 대해, 상관계수와 평균 인과효과(ATE)를 정량화한 결과다. 여기서, 상관계수는 준공연도와 냉난방 EUI 간 단순 선형회귀모형으로 도출하였다. 난방 EUI의 경우, 준공연도와의 상관계수는 –0.76 kWh/m2/yr로, 신축 건물일수록 난방에너지 사용량이 감소하는 경향을 보였다. 그러나 ATE는 –0.09 kWh/m2/yr로, 단순 상관계수 대비 효과의 크기가 줄었다. 냉방 EUI의 경우, 준공연도와의 상관계수는 0.05 kWh/m2/yr로 미미하였으나, ATE는 0.09 kWh/m2/yr로 증가하는 것으로 나타났다. 이러한 상관계수와 인과효과 간 차이는 준공연도와 냉난방 EUI 간의 관계가 연면적, 기후 조건 등 다양한 교란 요인의 영향을 받기 때문이다. 단순 상관분석에서는 이러한 교란 요인을 통제할 수 없어, 준공연도의 영향이 과대 혹은 과소 추정될 가능성이 있다. 반면 인과효과 분석은 교란요인의 영향을 통계적으로 제거한 상태에서 준공연도가 냉난방 EUI에 미치는 순수한 효과를 추정한다. 즉, 인과추론은 단순 상관분석에서 발생할 수 있는 편향을 제거함으로써 보다 신뢰성 있는 인과적 효과를 제시한다.
Table 2.
Correlation vs. causation between year built and EUI
| Correlation | Causation (ATE) | |
| year built vs. heating EUI | -0.76 kWh/m2/yr | -0.09 kWh/m2/yr |
| year built vs. cooling EUI | 0.05 kWh/m2/yr | 0.09 kWh/m2/yr |
Figure 2는 사무소 건물 준공연도의 난방 EUI에 대한 조건부 평균 인과효과(CATE)를 연면적, 난방시스템, 지역별 기후의 조건에 따라 분석한 것으로, 여기서, CATE의 값은 각 조건마다 ‘신축일수록 에너지 사용량이 얼마나 달라지는가’를 나타낸다. Figure 2(a)은 연면적 그룹 조건부 평균 인과효과로, 500 m2 미만 소형 건물은 CATE가 +1.04 kWh/m2/yr로 나타나, 최근 준공일수록 난방 에너지 사용량이 오히려 증가하는 경향을 보였다. 반면, 500-3,000 m2와 3,000 m2 이상 건물은 각각 -0.27 kWh/m2/yr, -0.18 kWh/m2/yr로, 신축일수록 난방 에너지 사용량이 감소하였다. 본 결과는 소형 사무소 건물의 경우 최근 준공에도 불구하고 에너지 성능 개선 효과가 뚜렷하지 않으며, 오히려 사용량이 증가한 것을 의미한다. 이는 온실가스 감축 정책과 규제가 대형 건물에 초점이 맞춰져 전체 건물의 90% 이상을 차지하는 1,000 m2 미만의 소형 건물에 대한 정책과 규제가 공백 영역임을 고려하면(Kim et al., 2022), 본 발견은 소형 건물에서 관찰된 성능 개선 효과의 한계가 정책적·제도적 맥락과도 맞닿아 있음을 시사한다.
Figure 2의 (b)는 난방시스템 유형별 준공연도의 난방 EUI에 대한 CATE로, 전기식과 가스식 난방을 구분하여 분석하였다. 두 유형 모두 음의 CATE가 나타나 신축 건물일수록 난방에너지 사용량을 절감하는 경향을 보였다. 특히 가스식 건물(-0.35 kWh/m2/yr)의 절감 효과가 전기식(-0.26 kWh/m2/yr)보다 더 크게 나타나, 난방 시스템 유형에 따라 에너지 성능 개선 차이가 존재함을 보여준다. 여기서, 가스식 건물이 전기식보다 더 큰 절감 효과를 보인 것은 최근 신축 건물에서의 고효율 설비 보급 확대와 효율 기준 강화 정책의 반영, 그리고 시스템 유형과 건물 규모·운영 특성의 상관성이 함께 작용한 결과일 수 있으며, 이에 대해서는 추가적인 데이터 기반 확인이 필요하다.
Figure 2의 (c)는 지역별 외기 온도를 반영하는 HDD를 조건으로 정량화한 CATE다. 모든 지역에서 음의 CATE가 확인되어 신축 건물일수록 난방에너지 사용량이 감소한 것을 확인할 수 있다. 특히 인천(-0.36 kWh/m2/yr)과 부산(-0.33 kWh/m2/yr)에서 감소폭이 가장 크게 나타났으며, 서울과 수원도 –0.20 ~ -0.28 kWh/m2/yr 수준의 유사한 절감 효과를 보였다. 다만, 지역별 효과 크기가 HDD와 반드시 비례하지는 않는데, 이는 신축에 따른 난방에너지 사용량의 변화에 있어, 건물 특성, 운영 형태 등 기후 외적 요인이 함께 작용함을 알 수 있다.
냉방에 대한 인과효과 역시 건물 특성에 따라 차이를 보였다. Figure 3는 사무소 건물 준공연도의 냉방 EUI에 대한 CATE를 연면적과 지역별로 제시한다. Figure 3의 (a)는 연면적 그룹에 따른 결과로, 500 m2 미만 소형 건물의 CATE는 -0.03 kWh/m2/yr로 나타나, 만약 동일한 조건의 구축 건물을 신축으로 대체할 경우 냉방 에너지 사용량이 0.03 kWh/m2/yr 감소하는 것으로 추정되었다. 그러나, 500-3,000 m2 및 3,000 m2 이상 건물의 CATE는 각각 +0.10 kWh/m2/yr, +0.13 kWh/m2/yr로 나타나, 동일 조건에서 신축으로 전환될 경우 냉방에너지 사용량이 증가할 것으로 추정된다. 이는 앞서 도출된 난방에너지에 대한 CATE 결과(Figure 2(a))와 반대되는 결과로, 기밀성 강화, 냉방 설비 보급 확대 등 기술적, 정책적 요인이 복합적으로 작용했을 가능성이 있으며, 이에 대한 추가적 검토가 요구된다.
Figure 3의 (b)는 지역별 결과로, 모든 지역에서 양의 CATE가 나타나, 만약 해당 지역의 구축 건물이 신축으로 대체된다면 냉방에너지 사용량은 평균적으로 0.10~0.13 kWh/m2/yr 증가할 것으로 추정되었다. 부산(0.13 kWh/m2/yr)과 서울(0.12 kWh/m2/yr)에서 증가폭이 상대적으로 크게 나타났으나, 다른 지역도 0.10~0.12 kWh/m2/yr 범위의 유사한 값을 보였다. 이는 냉방도일(CDD) 차이와 무관하게 신축이 구축 건물보다 냉방에너지 사용량이 증가하는 인과적 결과임을 시사한다. 이러한 결과는 ‘최근 준공일수록 냉방 사용이 증가한다’는 단순 상관관계의 관찰이 아니라, 교란요인을 통제한 상태에서 신축이라는 처치가 실제로 냉방부하를 증가시키는 반사실적(what-if) 시나리오의 정량적 추정으로 해석한다.
한편, 준공연도가 사무소 건물의 에너지 사용에 미치는 인과효과는 난방과 냉방에서 상반된 경향을 보였으며, 건물의 규모, 난방시스템, 지역 조건에 따라 효과가 이질적으로 나타났다. 이러한 발견은 신축 건물의 성능 개선 효과를 일률적으로 해석하기보다는, 규모·지역·설비 특성에 맞춘 맞춤형 개선 전략이 필요함을 시사한다.
결 론
본 연구는 인과추론을 활용하여 국내 762개 사무소 건물을 대상으로 준공연도가 난방 및 냉방 에너지 사용량에 미치는 인과적 영향을 정량적으로 규명하였다. 상관성과 인과효과를 비교한 결과, 교란변수를 통제하지 않은 단순 상관관계에서는 신축 건물의 냉방 에너지 사용이 증가하는 경향이 두드러졌으나, 인과효과 분석에서는 이러한 경향이 건물 규모와 기후, 설비 특성에 따라 달라짐을 확인하였다. 특히 난방의 경우 대부분 신축 건물에서 사용량이 감소하였으나, 냉방은 신축 소형 건물에서만 감소하며 중·대형 건물과 대부분의 지역에서 신축 건물이 구축 건물보다 더 많은 에너지를 소비하는 것으로 나타났다. 이는 기밀성 강화나 냉방설비 보급 확대 등 구조적 요인에 기인한 부분적 인과효과임을 보여준다.
이러한 결과는 ‘신축일수록 냉방 사용이 증가한다’는 기존의 통계적 인식이 보편적 현상이라기보다는, 교란 요인을 통제한 상태에서의 조건부 요인에 따라 달라지는 인과적 패턴임을 시사한다. 따라서 향후 건물정책과 제도 설계에서는 신축 건물의 냉방 증가 현상을 일률적으로 해석하기보다, 규모·기후·설비 유형에 따른 이질적 인과효과를 고려한 맞춤형 개선 전략이 요구된다. 즉, 본 연구는 교란요인을 통제한 인과추론이 건물 에너지 연구에서 단순 통계 분석을 넘어 정책 설계의 근거를 제공하는 실증적 도구로 활용될 수 있음을 입증하였다.
한편, 본 연구는 관측 가능한 변수에 기반한 분석으로, 사용자 행태와 같은 비관측 요인을 충분히 반영하지 못한 한계가 있다. 인과추론이 보다 유용하게 활용되기 위해서는 변수 설정과 구조적 관계에 대한 전문가 검증과 인과 발견(causal discovery) 기법을 통한 정교한 구조 규명이 뒷받침되어야 하며, 이를 통해 더욱 신뢰성 있는 의사결정 도구로 자리매김할 수 있을 것이다.





