서 론
정부는 공공데이터의 제공 및 이용 활성화에 관한 법률 제21조(공공데이터 포털의 운영)에 따라 다양한 행정 데이터를 수집하고 개방해야 하며, 이를 위해 공공데이터 포털을 운영 중에 있다. 따라서, 건축물대장 정보, 토지 정보, 업종별 인허가 정보, GIS 폴리곤 정보, 기상 정보 등 다양한 데이터를 공공데이터 포털을 통해 누구나 이용할 수 있다. 이러한 방대한 데이터를 건물 단위로 연결하여 분석할 수 있다면 기존의 단편적 데이터를 활용하였을 때보다 종합적으로 현상을 파악하여 결론을 도출할 수 있을 것이다. 예를 들면, 건축물대장 데이터를 월별 에너지 데이터와 지방행정 인허가 데이터를 연결할 수 있다면, 건물 내 입주 업종 구성까지 고려한 합리적 성능 평가가 가능할 것이다. 아쉽게도 전술한 공공데이터는 부처 업무 수행에 따른 행정 데이터로써 타 정보와의 연계가 고려되어 있지 않다.
Kim (2013)에 따르면 건축행정정보의 전략적 가치는 상당하다. 공공데이터 분류격자(FAST Matrix) 관점으로 건축행정정보, 즉 건축물대장은 ‘전략적(strategic)’ 위치를 점하는데, 이는 기반 정보로써 타분야로의 확장과 파생에 중요한 역할을 한다. Figure 1은 공공데이터 간의 연관성을 나타낸다. 건축정보를 중심으로, 환경, 재난방재, 주거복지, 도시계획, 에너지 등의 여러 주제 데이터들이 건축정보와 높은 관련성을 가지며, 밀접한 상호 관계를 형성하고 있음을 나타낸다. 이는 건축정보가 공공데이터 시스템에서 중요한 중심 역할을 하고 있음을 강조한다(Kim, 2013).

Figure 1.
Correlation between Architectural Administrative Information and Public Data (Kim (2013) Re-citation)
이러한 맥락에서, ‘데이터넷 프로젝트’가 시작되었다(`23.4~`26.12)(Kim et al., 2024). 프로젝트의 목적은 크게 두 가지이다. 첫 번째는 건물 부문에서 탄소중립을 가속화하기 위해 국가 차원의 건물에너지 소비와 이의 영향인자 정보의 유지·관리 틀(framework)를 설계하는 것이며, 두 번째는 건물의 에너지 사용량 수준을 증거 기반으로 판단하고자 함이다. 즉, 파편화된 에너지 영향 요인을 통합하고 이를 바탕으로 객관적 건물 에너지 소비 평가를 지원하는 기반을 구축한다. 이러한 기반 시스템은 정부의 데이터기반 2025 탄소중립 이행 촉진에 그 역할을 기대할 수 있다(Korean Government, 2023). 본 논문에서는 연구 배경과 데이터의 수집 및 연결에 대해 중점적으로 다룬다.
배 경
건물부문 탈탄소화의 중요성
2015년 파리에서 열린 제21차 유엔기후변화협약 당사국총회(COP21)에서 당사국은 파리협정을 채택하였다. 파리협정에서는 NDC (Nationally Determined Contribution)를 5년마다 현재 수준보다 진전된 목표로 갱신하고, 이행 보고 하도록 되어있다(Korean Government, 2021a). 이에 정부는 국가 주도의 탄소중립 이행을 위해 2021년 10월 관계부처 합동으로 2030 국가 온실가스 감축목표(NDC) 상향안과 2050 탄소중립 시나리오 안을 발표하였다(Korean Government, 2021a; 2021b). 탄소중립 시나리오에 따르면 건물부문에 할당된 2050 탄소중립 및 2030 NDC 목표를 달성하기 위해서는 2030년까지 32.8%, 2050년까지 88.1%의 온실가스를 감축해야 한다. 하지만 전체 건물은 약 730만 동으로써, 시나리오 목표에 맞춰 탄소중립을 달성하는 것은 쉽지 않다.
대부분의 온실가스 감축 정책과 규제는 대형 건물, 신축 건물에 초점이 맞춰져 있으며 이는 매우 적은 수치이다. 전체 건물의 90% 이상을 차지하는 1,000㎡ 미만의 소형 건물에 대한 정책과 규제는 공백 영역이다(Kim et al., 2022). 소규모 건물은 공공 및 상업용 건물의 88.7%, 주거용 건물의 96.7%를 차지하며, 소규모 건물의 일종인 근린생활시설은 건물 부문 에너지의 43%를 소비한다(Green Together, 2012). 건물부문에서 탄소중립을 달성하기 위해서는 이러한 소외된 영역의 문제를 해결하는 것이 중요하다. 이러한 맥락에서는 건물의 에너지 사용 수준 적절성을 판단할 수 있는 가늠자(benchmark) 또는 성능지표를 기반으로 건물을 선별하고 현황을 관리해야 한다(Kim et al., 2019; Choi and Yoon, 2024; Choi et al., 2024). 데이터넷 프로젝트는 이러한 거시적 목적을 위해 이행되는 제도 및 정책지원을 위해 건물 에너지 소비와 관련된 파편화된 행정 데이터을 연결하고, 고차원적인 건물 특징을 추출하여 데이터 기반의 에너지 소비수준 평가 방법론의 정립에 기여하려는 목표를 갖는다.
건물에너지 소비 성능 분석에서 데이터의 중요성
건물에서 소비된 에너지의 적정 수준을 판단하기 위해서는 이와 관련된 영향인자를 살펴보아야 한다. 영향인자는 주로 (1) 기후 특성 정보(온습도, 일사 등), (2) 건물 물리 특성 정보(형태, 형상, 규모, 열 물성치, 창 면적비 등), (3) 설비 성능 정보(설비 부하, 설비 효율, 사양, 계통), (4) 운영 특성 정보(공간 및 기기 활용), (5) 활동 특성 정보(영업, 매출), (6) 사용자 특성 정보(나이, 성별, 행동양식), (7) 사회·문화·경제적 특성 정보, (8) 주변공간 특성 정보 등 8가지로 구분된다(Figure 2)(Yoshino et al., 2017).
산재된 다양한 데이터를 연계하려는 목적은 건물 에너지 소비수준의 적절성을 합리적으로 판단하기 위해서이다. 건물 에너지 소비수준의 벤치마킹은 대상 건물의 에너지 효율을 객관적으로 평가하기 위해 동종(peer) 건물군과의 비교를 기반으로 수행된다. 이는 평가의 공정성과 신뢰성을 확보하기 위해 피평가 집단의 동질성이 전제되어야 함을 의미한다. 실제로 기존의 많은 건물 에너지 벤치마킹 연구들이 EUI (Energy Use Intensity)를 이용한 동종 건물 간의 비교를 통해 벤치마킹을 수행해왔다(Kim et al., 2019). 이러한 방식은 평가 대상 건물의 에너지 효율을 보다 정밀하고 의미있게 분석할 수 있게 한다. 따라서, 본 연구에서는 “다른 모든 것들이 동등하다면” (ceteris paribus)의 전제 하의 비교 평가를 수행하고자 한다. 예를 들면, 건물A와 건물B의 에너지 성능 차이를 알고자 할 때, “에너지 성능 특성(단열 등)” 이외의 다른 모든 요인을 동등하게 설정하여 에너지 사용량(kWh/㎡)을 비교하고자 함이다. 이렇게 비교될 때 A와 B의 사용량 차이가 비로소 의미가 있다. 요약하면, 건물의 에너지 순성능 평가를 위하여 에너지 사용량에 영향을 미치는 교란요인 및 잠재요인(Figure 2의 X1-X8)을 최대한 통제하고자 하려는 것이다.
데이터 수집 및 연결
데이터 셋 선정
데이터 셋 선정을 위해 우선순위와 검토항목을 설정하고 단계별 선별 과정을 진행하였다. 우선순위 1은 국가 부처별 공개된 데이터 중 건물/지번/대지에 매칭이 가능한 정보인지 여부이다. 건축물대장 표제부를 기준으로 단독형 건물의 경우 건물 단위, 단지형 건물의 경우 대지 단위로 최소 매칭 단위를 설정하였으며, 정제 및 가공을 통한 매칭 가능성을 검토하였다. 우선순위 2는 건물 에너지 소비와의 관련성으로, Yoshino et al. (2017)이 제시한 IEA EBC annex 53의 영향인자 프레임워크를 참고하였다. 본 연구에서는 social factor를 세분화하여 socio-economical factor와 socio-demographic factor로 구분하였다(Figure 2). 마지막으로 각 인자가 어떠한 측면에서 에너지 소비와 관련성이 있는지에 대하여 검토하였다. 기상 데이터는 냉난방 부하 측면에서, 건물 물리적 특성은 단열성능 측면에서, 설비시스템은 에너지 효율 측면에서, 건물유형과 운영 및 활동 데이터는 사용 패턴 측면에서, 사회경제적 데이터, 인구통계학적 데이터 및 주변환경 데이터는 사용 행태 측면에서 냉난방 및 조명, 환기 등 에너지 사용에 영향을 미칠 것으로 예상된다.
데이터 수집
한국부동산원은 지난 10년간 건축물대장 정보와 건물의 에너지 사용량 청구 데이터를 결합한 국가건물에너지 통합DB를 구축하고 유지관리 해오고 있다(Seok et al., 2017; Ji et al., 2020). 국가건물에너지 통합DB는 주소, 면적, 용도 등의 정보를 제공하는 건축물대장 DB와 월별 에너지요금 청구서 DB라는 두 가지 DB를 통합하여 전국의 건물정보와 연계된 에너지 소비량 정보를 제공한다(Figure 3). 해당 DB는 전국의 약 730만동의 건물에 연결된 약 5천만개의 개별 계량기에서 추출한 약 62억 5천만 건의 전기, 가스, 지역난방 사용량으로 구성되어 있다. 이러한 정보는 전국 건물의 계량비별 에너지 소비 패턴을 분석할 수 있어, 에너지 사용 현황 및 패턴 등에 대한 거시적 통찰력을 제공한다. 데이터넷 프로젝트는 최근에 공개되었거나 부분적으로 공개된 공공 데이터를 건물단위에서 통합·연결하는 것을 목표로 하며, 데이터넷 프로젝트에서는 다양한 데이터를 통합하기 위한 기준 정보(base table)로써 국가건물에너지 통합 DB를 활용한다.
연구단은 Table 1과 같이 파편화된 에너지 소비 영향인자 데이터 중 17개의 필수 데이터를 선별하였다. 필수 데이터 선별은 앞서 언급한 우선순위 1,2와 검토항목을 고려하였으며, 그 절차는 아래와 같다.
Stage 1. 국내 부처별 공개데이터 검토
Stage 2. 데이터 매칭 가능성 검토 : 정제, 가공 등을 통한 매칭 가능여부 확인
Stage 3. 활용 데이터 선정 및 EBC annex 53 8개 카테고리 할당 : 현재 수준에서 매칭 가능한 최대한의 데이터를 연계
Stage 4. 카테고리 세분화(Re-categorized factors)
해당 절차에 따라 Table 1과 같이 파편화된 에너지 소비 영향인자 데이터 중 17개의 필수 데이터를 선별하였다. 17개의 데이터는 건축물대장 및 에너지 소비량 정보(국가건물에너지 통합 DB)와 에너지 소비에 영향을 미치는 영향인자 정보(공공데이터 및 행정데이터)로 구성된다. 데이터넷 프로젝트에서는 영향인자로 일반적인 건물 관련 데이터를 수집하는 것 외에도, 공동주택, 의료시설, 교육시설, 영유아시설, 교육시설, 문화시설, 업무시설 등 주요 에너지 소비를 차지하는 건물 용도와 관련된 데이터를 수집하는데 중점을 두었다.
Table 1.
Required datasets
데이터 연결
국가건물에너지 통합DB와 같이 건물 에너지 사용량 정보와 건축물대장을 연결하여 분석하는 것은 국가 에너지 원단위 통계 산출(Kim et al., 2019), 표준 베이스라인 산출(MOLIT, 2020) 등 그 쓰임새가 상당하다. 다만, “다른 모든 것들이 동등하다면” 의 전제 하에서 비교 평가하기 위해서는 더 많은 정보가 필요하다. 이러한 맥락에서, 건물에서 소비되는 에너지를 보다 종합적으로 이해하기 위해 Total Energy Use in Buildings (IEA EBC annex 53), Building Energy Epidemiology (IEA EBC annex 70) 등 이론 고찰을 위한 연구가 수행된 바 있다(Hamilton et al., 2013; Yoshino et al., 2017). 한편 주요 선진국은 국가 차원에서 정부 주도로 건물 에너지 관련 정보를 연결하고 있다. 미국의 SEED (Long et al., 2020), 영국의 NEED (DESNZ, 2024), 유럽의 DBL (European Commission, 2023), 및 BSO (European Commission, 2024) 등이 대표적이다.
데이터넷 프로젝트는 건물에너지 소비 관련된 영향인자 정보를 국가 레벨에서 연결하고 에너지 소비 수준을 좀 더 객관적으로 판단하려는 목적을 갖는다. 연결 기준 데이터(base table)은 건축물대장이다. 선별된 영향인자 데이터(Table 1)를 연결하기 위해 건축물대장 고유번호로 식별 가능한 경우, 주소(지번 및 도로명)로 식별 가능한 경우, 그 외 건물명 등과 같이 의미론적으로 식별가능한 경우로 구분하여 매칭을 실시한다. 매칭의 수준에 따라 정매칭, 부매칭으로 구분할 수 있다. 정매칭의 경우 건축물 대장과 대상 정보 간 1:1로 매칭되는 경우이며, 부매칭은 1:N으로 매칭되는 경우이다.
데이터 통합 과정은 단순한 데이터 매칭을 넘어, 건물의 에너지 소비 특성을 이해하기 위한 필요 정보를 정제하고 처리하는 과정을 포함한다. 이 과정은 Y = f(X)로 구조로 표현되며, 여기서 Y는 정제된 에너지 DB를, X는 연결되고 정제된 건물 관련 영향인자 데이터를 의미한다. 데이터 통합 과정에서 정제되고 처리되는 주요 요소는 정제된 에너지 DB, 공간 정보, 정제된 건물 정보, 건물 유형 정보이다. 정제된 에너지 DB는 에너지 데이터를 분석하고 정제하여, 용도별 에너지 사용량을 분리하고, 월별 에너지 소비 데이터와 기상 데이터를 활용해 일별 소비량을 추정한다. 또한, 날씨 영향을 보정한 에너지 소비 데이터를 산출하며, 난방 및 냉방 성능 지표를 도출한다. 공간정보는 건물의 위치, 모양, GIS 데이터를 통합하고, 건물의 형태, 음영, 일사 지표를 도출한다. 정제된 건물 정보는 건물 내 다중 용도 공간과 공조 공간의 비율을 분석하며, 건물 유형의 경우 에너지 소비에 영향을 미치는 운영, 활동 요인을 검토하고 에너지 소비 상관관계를 분석한다. 이러한 종합적인 접근은 건물 에너지 소비와 소비 영향인자 간 복잡한 관계를 체계적으로 이해할 수 있게 한다.
현재 17개의 필수 데이터 항목 중 건축물대장 데이터, 도로명 전자지도 건물 폴리곤, 지방행정 인허가 정보, 에너지 고지서 데이터 등 13개의 데이터셋의 수집이 완료되었으며, 연결 및 통합 작업이 진행 중이다(Figure 4). 수집된 데이터는 크게 공통 데이터와 용도 특화 데이터로 나뉘며, 공통데이터는 건축물대장 데이터, 월별 에너지 사용량 정보, 지방행정 업종 인허가 정보, 기상청 종관기상관측 정보, 도로명 전자지도, 건축물 인허가정보로 구성된다. 각 데이터는 건축물대장 데이터와 연결되며, 건축물대장의 건축물 정보와 월별 에너지 사용량 정보의 에너지 데이터의 연결을 통해 건물 에너지 데이터베이스를 구성한다. 용도 특화 데이터는 의료시설, 교육시설, 문화시설, 영유아시설, 공동주택, 업무시설로 나뉘며 건물 에너지 데이터베이스와 연결된다(Figure 5). 공통 데이터와 용도 특화 데이터의 통합은 다양한 건물 용도에 따른 에너지 소비 패턴을 심층적으로 분석할 수 있는 토대를 제공한다.
Table 2는 교육연구시설의 통합된 데이터의 예시를 보여준다. 공통 데이터에는 건물의 기본 정보와 월별 에너지 사용량이 포함되며, 용도특화 데이터에는 해당 용도의 특성을 반영하는 세부 정보가 포함된다. 교육연구시설의 경우 학년별 학생 수, 학급당 학생 수, 교사 수, 연간 수업일수, 급식 현황, 교육 지원시설 현황 등의 정보가 포함되어 있다. 이러한 통합 데이터는 건물 유형별 특성과 에너지 소비 패턴 간의 관계를 분석하는데 활용된다.
Table 2.
Example of integrated building information: Education Institution Case
결 론
운영단계에서의 건물 에너지 성능 규제는 데이터와 증거를 기반해야 한다. 단순히 다소비라는 이유만으로 집중 관리되고 페널티를 받는 것은 불합리할 수 있다. 반대로 옥내 주차장 면적이 상당하여, 에너지원단위가 작다는 이유로 제외되거나 수혜를 받는 것 또한 재고가 필요하다. 에너지 소비에는 여러 가지 맥락이 존재하기 때문이다.
이러한 배경에서 본 연구는 전수 관점에서 건축물과 에너지, 영향인자 데이터간 연결과 통합을 위한 기반을 구축하는 것을 목적으로 하였다. 이를 위해 건축물대장을 기준으로 하여 총 17개의 데이터셋을 선정하고, 이 중 13개의 데이터셋(건축물대장, 도로명 전자지도 건물 폴리곤, 지방행정 인허가 정보 등)을 수집하여 연결 및 통합 작업을 수행하였다. 데이터 통합 과정에서는 여러 가지 기술적 어려움이 존재한다. 부처별로 상이한 데이터 형식과 주소체계, 데이터 수집 주기와 업데이트 시점의 불일치 문제 등이 있었다. 이를 해결하기 위해 정매칭(주소와 건축물대장이 1:1로 매칭)과 부매칭(1:N 매칭) 방식을 구분하여 적용하고, 에너지 소비 특성 분석을 위한 데이터 정제 및 처리 과정을 수행하였다.
즉, 개별 건물 단위로 파편화된 데이터셋을 연결하여, 이를 기반으로 에너지 소비 수준에 대해 다각도로 살펴보고 그 수준에 대해 올바른 판단을 할 수 있는 방법론을 창출하는 학술적 생태계를 지원하려는 것이다. 향후 이러한 데이터 통합 체계가 고도화되고 표준화된다면, 현재의 데이터 연계 과정에서 발생하는 어려움들이 상당 부분 해소될 것으로 기대된다. 본 연구를 통해 정책적 의사결정의 지원도구가 마련된다면 에너지 성능 평가 패러다임에 큰 변화를 가져올 수 있을 것으로 기대한다.