서 론
의료시설 데이터 구축
연구대상
데이터수집 및 전처리
의료시설 에너지 사용 특성 분석
의료기관 유형별 에너지 사용량 분석
에너지 사용 관련 변수의 상관관계 분석
에너지 사용량 분석 회귀모델 도출
기존 연구와의 영향변수 비교
결 론
서 론
전 세계적으로 기후 변화와 에너지 자원의 고갈에 대한 우려가 커지면서, 에너지 효율 향상은 중요한 사회적 과제로 떠오르고 있다. 특히, 의료시설은 환자의 치료를 목적으로 상시 운영이 요구되는 특성상 난방, 냉방, 조명, 각종 의료 장비의 지속적인 가동으로 인해 에너지 소비가 매우 크다(Singer and Tschudi, 2009). 따라서 객관적인 에너지 성능 평가에 기반한 의료시설의 에너지 관리와 효율화는 필수적이며, 이를 통해 장기적으로 의료 서비스의 질을 유지하면서도 에너지 소비를 줄이는 데 기여할 수 있다.
에너지 사용량 회귀모델을 이용한 건물의 에너지 성능 평가는 기존 연구 및 정책에서 널리 사용되고 있다. 대표적으로 미국 환경보호청(U.S. EPA, 2021)에서는 연간 에너지 사용량을 연면적으로 나눈 EUI (Energy Use Intensity)를 종속변수로 하는 다중회귀분석 모델을 평가에 활용한다. 의료시설에 대해서도 조사 기반 데이터를 통해 단위면적당 근무자수, 병상수, MRI 대수 및 냉방도일, 난방도일 등을 독립변수로 하는 회귀모델을 도출하여 평가에 적용하고 있다. Kim et al. (2023)은 국내 종합병원 일부를 대상으로 한 설문 및 현장 조사 데이터를 바탕으로 연간 에너지 사용량을 종속변수로 하는 에너지 성능 평가용 회귀모델을 도출하였다. 이러한 모델을 개발할 때에는 일반적으로 단계적 회귀 방법을 사용하여 통계적으로 유의미한 변수만 남겨 모델의 설명력을 높인다(Kim et al., 2014).
일반적으로 설문 또는 현장 조사 등에 기반한 데이터는 신뢰성이 높지만 데이터 수집 과정에 많은 시간이 소요되어, 전체 건물을 대상으로 데이터를 수집하기에는 한계가 있다. 따라서 일부 샘플 건물을 대상으로 진행한 기존 모델의 대표성을 보완하고 개발된 모델의 지속적인 업데이트 및 관리가 가능하도록 할 필요가 있다. 이에 본 연구에서는 국내 대다수의 건물 또는 시설에 대해 정기적 업데이트가 이루어지고 있는 공공데이터를 활용하여 국내 의료시설의 에너지 성능 평가에 참고할 수 있는 에너지 사용량 분석 회귀모델을 도출하고자 한다. 특히 의료시설 유형 중 기존 연구에서 다루었던 종합병원 뿐만 아니라 의료법에 따른 다양한 의료시설 유형을 대상으로 에너지 사용 특성을 분석하고, 연간 에너지 사용량을 종속변수로 설정하여 단계적 회귀분석을 통해 설명력을 높인 모델을 구축하고자 한다.
의료시설 데이터 구축
연구대상
「의료법」 제3조에 따르면‘의료기관’은 다음 3개로 분류된다(MOHW, 2025).
① 의사, 치과의사, 한의사가 주로 외래환자를 대상으로 의료행위를 하는 ‘의원급 의료기관’
② 조산사가 조산과 임산부 및 신생아를 대상으로 보건활동과 교육ㆍ상담을 하는 ‘조산원’
③ 의사, 치과의사, 한의사가 주로 입원환자를 대상으로 의료행위를 하는‘병원급 의료기관’
‘병원급 의료기관’은 병상 수, 진료과목, 인력․시설․장비 등의 수준에 따라 병원, 치과병원, 한방병원, 요양병원, 정신병원, 종합병원 등 6개 유형으로 다시 세분된다. 「건축법 시행령」 별표 1에 따르면 의원급 의료기관과 조산원은 제1종 근린생활시설에 해당하며, ‘병원급 의료기관’은 의료시설에 해당한다(MOLIT, 2025).
본 연구에서는 건축법상 의료시설에 해당하는 ‘병원급 의료기관’ 6개 유형을 대상으로 하되, 종합병원 중 중증질환에 대하여 고도의 의료행위를 전문적으로 하는 상급종합병원은 제외하였다. 또한, 건축물대장을 기준으로 대표 필지에 2개 이상의 건물이 있는 집합건축물은 향후 연구에서 다루고자 하며, 먼저 대표 필지에 단일 건물이 위치한 일반건축물로 한정하여 분석하였다.
데이터수집 및 전처리
연구대상인 의료시설에 대해 한국부동산원이 제공하고 있는 건축물대장의 표제부 및 층별개요, 2022년도 에너지 사용량 데이터와 건강보험심사평가원에서 제공하고 있는 2022년도 병원정보서비스, 2023년도 의료기관별 상세정보서비스 중 시설정보 등의 공공데이터를 수집하여 전처리한 후 분석에 활용하였다. 이 공공데이터 세트는 건물 및 의료기관의 특성과 에너지 사용량 예측에 필요한 주요 변수를 포함하고 있으며, 본 연구에 사용된 변수는 Table 1과 같다.
Table 1.
Overview of building variables and data source
연구대상으로 설정한 ‘병원급 의료기관’이면서 일반건축물에 해당하는 건축물 중 에너지 사용량 데이터가 있는 유효 데이터를 추출하기 위해 Figure 1에 제시된 데이터 전처리 및 병합 절차를 수행하였다. 먼저, 건축물대장에서 표제부 PK만 존재하며 총괄표제부 PK가 없는 데이터를 추출하고, 대장구분코드명이 ‘일반’으로 표기된 건축물 중 연면적, 용적률산정용연면적, 대지면적, 지상층수가 모두 0보다 큰 데이터를 선별하였다. 이후, 지상층수와 지하층수를 합산하여 층수라는 변수를 생성하고, 승용승강기수와 비상용승강기수를 합산하여 승강기수라는 새로운 변수를 추가로 생성하였다.
건축물대장 층별개요에 제시된 각 층의 주용도코드명에 따른 면적 정보를 바탕으로 1개의 표제부 PK에서 의료시설이 차지하는 주용도 비율이 90% 이상인 표제부 PK를 추출하였다. 이후, 2022년도 에너지 사용량 데이터에서 12개월 전기 사용량이 모두 기록된 데이터를 추출하였으며, 전기, 가스, 지역난방 사용량의 사용량을 모두 합산하여 연간 에너지 사용량을 산출하였다. 마지막으로, 병원정보서비스 및 시설정보 데이터에서는 표제부 PK만 존재하고 총괄표제부 PK가 없는 데이터를 선별하고, 1개의 표제부 PK에 2개 이상의 암호화 요양기호코드가 존재하거나 의사 수가 없는 경우를 제외하였다. 또한, 여러 종류의 병상수를 합산하여 병상수라는 변수를 생성하고, 의료법에 따른 병상수 최소 기준을 반영해 추출하였다. 이러한 과정을 통해 최종적으로 949개의 의료기관 데이터를 도출하였다.
의료시설 에너지 사용 특성 분석
의료기관 유형별 에너지 사용량 분석
의료법에서 정의된 의료기관의 유형에 따라 병상수, 진료과목, 인력・시설・장비 등 제공하는 의료 서비스의 특성 등이 달라지기 때문에, 의료기관 유형별로 에너지 사용량을 분석할 필요가 있다. Figure 2는 각 유형별 연간 에너지 사용량 분포를 나타낸다. 전체적으로 에너지 사용량 데이터가 왼쪽에 주로 몰려 있는 양의 왜도(positive skew)를 보이고 있으나, 상대적으로 개수가 적은 정신병원과 치과병원은 이러한 분포 패턴에서 벗어남을 알 수 있다. 정신병원의 경우 쌍봉분포(bimodal distribution)를 보여 특정 특성을 공유하는 두 집단으로 나뉠 가능성을 보이지만 표본 수(47개)가 적어 부분집단의 차이가 그대로 반영된 결과일 가능성이 크다. 따라서 추가 군집 세분화보다 표본 확충과 데이터 대표성 확보가 우선이다.
Table 2는 병원 유형별 연간 에너지 사용량과 주요 변수들에 대한 기술통계를 보여준다. 변수 전반에서 데이터 분포의 비대칭성이 확인되며, 이는 의료기관 간의 규모와 운영 특성 차이에 따른 것으로 해석할 수 있다. 예를 들어, 연면적과 연간 에너지 사용량은 종합병원에서 가장 높은 평균값을 보이며, 분포 역시 넓게 퍼져 다양한 규모와 특성을 나타낸다. 반면, 치과병원의 경우 표본 수가 17개로 적어 최소 기준 30개를 충족하지 못해 상관관계 분석 및 회귀모델 도출 시 제외하였다.
Table 2.
Descriptive statistics
또한, 요양병원과 병원은 전체 데이터에서 각각 45.7%와 33.3%를 차지하며 주요 분석 대상임을 나타낸다. 이때, 병원과 요양병원의 평균 연면적 차이가 크지 않음에도 불구하고, 평균 연간 에너지 사용량은 병원에서 더 높게 나타났다는 점이다. 이는 단순히 시설 규모만으로는 에너지 사용량을 설명하기 어렵고, 의료 서비스 제공 방식, 인력 구성, 운영 특성 등 다른 요인들이 영향을 미침을 시사한다.
병원의 인력 및 시설을 대표하는 변수인 평균 의사수는 종합병원, 한방병원, 병원, 치과병원, 요양병원, 정신병원 순으로 나타났으며, 평균 병상수는 종합병원, 요양병원, 정신병원, 병원, 한방병원, 치과병원 순으로 나타났다.
에너지 사용 관련 변수의 상관관계 분석
의료시설의 에너지 사용량에 영향을 미치는 주요 요인을 파악하기 위해, 에너지 사용량과 9개의 주요 변수 간 상관관계 분석을 수행하였다. 또한 변수 간 상관계수를 비교하여 중복된 정보를 제공하는 변수를 제외하였으며, 최종적으로 932개의 의료시설 데이터를 분석에 활용하였다. Table 3은 연간 에너지 사용량과 각 변수 간의 상관계수를 제시하며, 각 변수의 유의확률(p-value)을 함께 나타낸다. 종합병원은 모든 변수에서 유의한 상관관계를 보였으며, 대부분 0.6 이상의 비교적 높은 상관관계를 나타냈다. 반면, 정신병원은 다른 병원 유형에 비해 유의한 상관관계를 보이는 변수가 적고 전반적인 상관 수준도 낮았다.
Table 3.
Results of correlation analysis
연면적은 모든 병원 유형에서 0.6 이상의 상관관계를 보였으며, 종합병원(0.92), 한방병원(0.92)에서 특히 강한 양의 상관관계를 나타냈다. 또한, 면적 관련 다른 변수들(용적률산정연면적, 대지면적)에 비해 일관적으로 높은 값을 보여, 에너지 사용량을 가장 잘 설명할 수 있는 변수임을 확인하였다.
층수 관련 변수(층수, 지하층수, 지상층수)는 전반적으로 다른 변수에 비해 상관관계가 낮았으며, 병원 유형에 따른 차이도 크게 나타났다. 층수는 종합병원에서 상관계수 0.69로 강한 상관관계를 보였고, 한방병원(0.57), 병원(0.43)에서도 중간 수준의 유의한 상관관계를 보였다. 요양병원과 한방병원에서는 지하층수가 층수보다 약간 더 높은 상관관계를 보였으나, 전반적으로 층수가 에너지 사용량에 더 일관된 영향을 미치는 변수로 판단되어 층수 관련 변수 중에서는 층수를 최종 변수로 채택하였다.
승강기 관련 변수(승강기수, 승용승강기수, 비상용승강기수)는 층수 관련 변수보다 높은 상관관계를 보였으나, 병원 유형에 따라 유사한 양상이 나타났다. 비상용승강기수는 대부분의 병원 유형에서 상관계수가 0.2 이하로 낮아 상관관계가 부족했으며, 승용승강기수 또한 병원 유형별 상관관계가 일정하지 않았다. 반면, 승강기수는 승용 및 비상용 승강기를 통합한 변수로, 병원 유형 간 일관되고 강한 상관관계를 보였다. 특히 종합병원(0.81), 한방병원(0.75), 요양병원(0.61)에서 높은 상관관계를 나타내어 에너지 사용량을 설명하는 데 적합한 변수로 판단되었으며, 이에 따라 최종적으로 승강기수를 대표 변수로 선정하였다.
의사수는 종합병원(0.85)과 한방병원(0.90)에서 특히 높은 상관관계를 보여 대부분의 병원 유형에서 에너지 사용량에 강한 영향을 미치는 변수로 나타났다. 병상수는 종합병원(0.77)에서 가장 높은 상관관계를 보였으며, 정신병원, 요양병원, 병원에서도 중간 수준의 상관관계를 확인하였다.
종합적으로, 에너지 사용량 분석을 위한 주요 변수로 연면적, 층수, 승강기수, 의사수, 병상수를 선정하였으며, 정신병원에서는 승강기수가 유의하지 않아 제외하였다.
에너지 사용량 분석 회귀모델 도출
상관분석을 통해 선정된 5개의 변수를 독립변수로 설정한 후, F-검정을 기준으로 변수의 유의성을 단계적으로 검토하여 투입·제거하는 단계적 회귀(stepwise regression) 방법을 적용해 병원 유형별 회귀모델을 구축하였다. Table 4에 따르면 모든 유형에서 모델의 F-검정 p-value가 0.05 미만으로 통계적 유의성이 확보되었고, Durbin–Watson 통계량은 1.5–2.5 범위로 잔차의 자기상관은 없는 것으로 확인되었다(Eum et al., 2018). 또한 모든 독립변수의 t-검정이 5% 유의수준에서 유의하였다. 일반적으로 VIF가 10을 초과하면 다중공선성이 의심되나, 본 연구의 모든 변수는 10 이하로 나타나 공선성 문제는 없었다(Lee et al., 2015; Eum et al., 2018). 한편 연면적, 층수, 승강기수 등은 모두 건물 규모와 관련된 요소이지만, 본 연구에서는 각각을 규모, 형태, 운영 행태를 반영하는 상호보완적 변수로 판단하여 모두 채택하였다. 이들 간 상관이 존재하더라도 모델 내에서 통계적으로 다중공선성은 확인되지 않았으며, 이는 변수들이 중복된 설명이 아니라 보완적 설명 구조로 작용한 결과로 해석된다.
Table 4.
Results of multiple regression analysis
병원 유형별로 회귀모델 도출 결과를 상세히 살펴보면, 공통적으로 연면적과 의사수가 정신병원을 제외하고 에너지 사용을 설명하는 핵심변수로 작용했다. 연면적은 건물의 냉·난방 부하 증가나 이용 인원 증가와 같은 물리적 요인을, 의사 수는 진료활동 증가로 인한 장비 및 조명 사용 증가 등과 같은 운영적 요인을 반영한다고 볼 수 있다. 특히 이 두 변수는 대부분 병원 유형에서 표준화 회귀계수(Beta) 기준으로도 높은 값을 보여주었는데, 표준화 회귀계수는 각 변수의 단위 차이를 제거하고 상대적인 영향력을 비교할 수 있게 해주는 지표로, 영향력이 큰 요인을 파악하는 데 유용하다. 이러한 결과는 연면적과 의사수가 병원 에너지 소비 모델에서 기본적인 설명 틀로 작용함을 시사한다.
구체적으로, 한방병원은 연면적(Beta=0.54)과 의사수(Beta=0.44) 두 변수만으로도 0.89으로 높은 설명력(Adj.R2)을 보였다. 이는 한방병원이 건물 규모와 운영 특성이 유사하여, 에너지 소비가 복잡한 변수 없이도 규모와 진료활동만으로 설명될 수 있음을 보여준다
반면 정신병원은 유일하게 의사수만이 유의했고, 설명력(R2)은 0.41로 가장 낮았다. 특히 다른 병원들과 다르게 연면적이 제외된 것은 공간 규모보다 진료 활동의 영향이 크다는 뜻이다. 다만 Figure 2의 쌍봉형 분포와 47개 소표본에 따른 부분집단의 차이가 모델의 일관성을 낮춰 설명력이 떨어졌을 가능성이 있다.
종합병원과 병원은 공통적으로 연면적, 의사수, 승강기수 세 가지 변수가 모두 선택되었으나, 각 변수의 영향력 크기와 방향성에서 뚜렷한 차이를 보였다. 종합병원의 경우 설명력(Adj.R2)이 0.92로 매우 높았으며, 연면적의 표준화 회귀계수는 0.95로 의사수는 0.39에 비해 약 2.4배 높은 영향력을 보였다. 특히 승강기수는 에너지 사용량과 0.81의 양의 상관관계를 보였으나, 다변량 분석에서는 표준화 회귀계수가 –0.35로 음의 방향으로 나타났다. 이는 연면적과 승강기수 간 높은 상관관계(상관계수 0.92)로 인해 규모 정보를 중복 설명하는 현상으로 판단된다. 또한 VIF(연면적 7.62, 승강기수 6.89)는 심각하지는 않으나 공선성이 존재함을 시사한다. 이에 다변량에서는 연면적·의사수 효과를 통제한 조건부 관계가 추정되며 억제효과(suppression)가 발생한 것으로 보인다(Kim and Kim, 2020). 따라서 승강기수가 많을수록 사용량이 감소한다는 직접적인 인과관계가 아닌, 규모 및 활동 수준을 보정한 통계적 결과로 해석할 수 있다.
이에 반해 병원의 설명력(Adj.R2)은 0.65로 중간 수준이며, 변수별 영향력은 연면적(Beta= 0.48), 의사수(Beta=0.36), 승강기수(Beta=0.16) 순으로 나타났다. 이 중 연면적의 영향력은 여전히 가장 높았으나 종합병원에 비해 상대적으로 낮아졌고, 승강기 수가 양(+)의 영향을 보인 점은 종합병원과는 반대 양상이다. 이는 승강기수가 늘수록 설비부하 증가가 상대적으로 크게 작용해 에너지 사용이 증가했을 가능성이 크다.
요양병원은 다른 병원 유형들과 달리 병상수와 층수가 추가로 주요 변수로 채택되어 총 4개의 변수가 회귀모델에 포함되었으며, 설명력(Adj.R2)은 0.60으로 중간 수준이었다. 연면적(Beta=0.50)과 의사수(Beta=0.46)의 영향력은 다른 병원과 유사하게 높았으며, 층수(Beta=0.10)는 수직 동선 증가로 인한 에너지 사용을, 병상수(Beta=-0.15)는 병상이 많을수록 에너지가 덜 소비되는 경향을 보여주었다. 이는 병상수가 많아도 실제 가동되지 않는 병상이 많거나, 병상 가동률이 낮은 병원이 분석 대상에 포함된 결과일 가능성이 크다. 따라서 이 결과는 병상당 에너지 효율이 향상되었다기보다는, 사용되지 않는 병상이 존재하는 비효율적인 공간 운영 특성이 반영된 결과로 해석된다.
기존 연구와의 영향변수 비교
본 연구는 연면적, 층수, 승강기수, 의사수, 병상수를 주요 변수로 하여 병원 유형별 회귀모델을 도출하였고, 이는 Table 5의 기존 연구와 뚜렷한 차별성을 갖는다. U.S. EPA (2021)는 면적당 인력, 가동 병상수, MRI 대수 등 활동·장비 지표의 밀집에 더해 냉방도일과 난방도일 같은 기후 지표를 결합하여 활동 강도와 기후 요인을 동시에 설명한다. 반면 Kim et al. (2023)은 국내 종합병원에 대해 비교적 적은 가동 병상수와 수술실수 두 독립변수만으로도 0.86의 높은 설명력을 보였다.
Table 5.
Comparison of energy consumption regression models for hospitals
| Reference | Target | N | Dependent variable | Independent variables | R2 | Adj.R2 |
| U.S. EPA (2021) | Hospital | 135 |
Source EUI (kBtu/ft2) |
1. Number of full-time equivalent workers per 1,000ft2 2. Number of staffed beds per 1,000ft2 3. Number of MRI machines per 1,000ft2 4. Cooling degree days 5. Heating degree days | 0.22 | 0.21 |
|
Source energy (kBtu) | 0.96 | - | ||||
| Kim et al. (2023) |
General hospital (150 to 999 beds) | 43 | Final energy (MWh, 2017) |
1. Number of staffed beds 2. Number of operating rooms | 0.86 | - |
이와 같이 기존 연구에서는 병상수가 일관되게 사용되었으나, 본 연구에서는 요양병원을 제외한 다수 유형에서 병상수가 최종 변수로 선택되지 않았다. 연면적과 의사수가 각각 규모와 활동 강도를 충분히 대리했을 가능성이 크고, 본 데이터의 병상수는 가동 병상이 아닌 허가 병상수이므로 운영 실태를 정밀하게 반영하지 못했을 가능성이 있다. 대신 본 연구의 종합병원 모델은 Kim et al. (2023)과 달리 연면적, 의사수, 승강기수를 함께 채택하여 더 0.92의 설명력을 보였고, 규모·활동·수직 동선이라는 구조적 요인을 동시에 포착했다는 점에서 의의가 있다.
향후 과제로는 본 연구에 포함되지 않은 기후 지표, 장비 보유 현황, 특정 진료공간 수 등 운영 특성을 나타내는 변수를 공공데이터와 추가 병합하고, 병상 지표는 총 병상수 대신 가동 병상수로 대체하며, 면적 대비 인력·장비 등의 밀집도와 같은 파생 지표를 도입해 유형별 설명력을 더욱 정교화할 필요가 있다.
결 론
본 연구는 공공데이터만으로 국내 병원급 의료시설의 에너지 사용 영향 인자를 유형별로 규명하고, 실무 적용이 가능한 회귀모델을 제시하였다. 치과병원을 제외한 932개 표본을 대상으로 연간 에너지사용량을 종속변수로 설정하여 단계적 회귀를 수행한 결과, 대부분의 유형에서 연면적과 의사수가 일관된 핵심 변수로 확인되었다. 유형별 설명력은 종합병원 0.92, 한방병원 0.89, 병원 0.65, 요양병원 0.60, 정신병원 0.41이었다. 종합병원·병원에서는 승강기수가 추가 설명력을 제공하였고, 요양병원에서는 병상수와 층수가 보조 변수로 작동하였다. 한편 종합병원에서 승강기수가 단변량 상관에서는 양(+)이지만 회귀계수는 음(–)으로 추정된 것은 연면적과의 높은 상관에 따른 억제효과로, 직접적인 인과관계로 해석하기 어렵다.
실무적 함의는 다음과 같다. (1) 연면적·의사수를 기본 지표로 삼아 유형별 에너지 수준을 비교·예측할 수 있다. (2) 유형 특성에 따라 승강기·층수·병상 등 수직동선·수용력 지표를 보조적으로 반영하면 개선 포인트를 구체화할 수 있다. (3) 공공데이터 기반 회귀모델은 정기적 업데이트와 대규모 비교에 적합하다.
본 연구의 한계로는 코로나19로 인한 비정상적 운영의 영향을 최소화하기 위해 확보 가능한 최신 연도인 2022년 단일 연도 자료만을 사용한 점, 운영 지표의 단순화(총 병상수, 장비 가동률 미포함)와 부분 집단 차이(특히 정신병원)가 있다. 이를 개선하기 위해 향후 연구에서는 다연도 데이터를 확보하여 시계열적 안정성을 검증하고, 가동병상·수술·검사실 수, 장비 보유 및 가동률, 환자구성 등 운영 지표와 냉·난방도일 등 기후 지표를 추가 병합하여 면적 대비 인력·장비 밀집도와 같은 파생지표를 도입하고자 한다. 아울러 표본을 확대하고 군집·계층 모델을 적용하여 부분 집단 차이를 축소함으로써 예측력과 해석 가능성을 동시에 높일 필요가 있다.




