서 론
방법론
주요 인자 분석 프로세스
날씨 민감형 기저분리 방법론(SED)
랜덤 포레스트 회귀
SHAP 분석
예측 변수 선정
건물 운영 및 열적 특성 변수
건물 형상 변수
기계 설비 변수
결과 및 결론
랜덤 포레스트 모델 결과
SHAP 전체 효과
주요 변수 해석
결 론
서 론
건물에너지 벤치마킹은 건물이 에너지를 효율적으로 사용하고 있는지를 유사 건물군의 에너지소비량과 비교를 통해 상대적으로 평가하는 방법론으로(Chung, 2011), 미국 7개 주에서 벤치마킹 방법론을 활용하여 건물 에너지 절약을 독려한 사례들을 통해 건물의 총 에너지 소비량이 3%에서 8%까지 감소될 수 있음이 확인되었다(Mims et al., 2017). 일반적으로 벤치마킹 방법론에 사용되는 성능지표로 연간 단위면적당 총에너지 소비량(총에너지 EUI) 이 사용되고 있으며(Nikolaou et al., 2011), 건물에너지 소비량 추정 모델로 다중선형회귀와 같은 단순한 회귀 방법이 활용되어 왔다(Chung, 2011).
총에너지 EUI는 데이터의 취득이 쉬운 총에너지소비량과 건물 연면적을 통해 간단히 계산될 수 있어 실용적인 지표라는 장점을 가진다. 반면, 건물이 연중 일관적으로 사용하는 기저부하 뿐 아니라 냉난방 부하를 함께 포함하고 있다는 단점을 가져, 에너지소비 성능지표를 ‘총’이 아닌 기저 및 냉난방으로 분리할 필요성이 강조되고 있다(Kim et al., 2019). 이러한 맥락에서 건물의 총에너지 소비량을 기저 및 냉난방 소비량으로 분리하기 위한 다양한 연구가 진행되고 있다(Yoon, 2018; Kim et al., 2023a). 또한, 건물에너지 시뮬레이션 데이터를 활용한 민감도 분석을 통해 기저, 냉방, 난방에 영향을 주는 주요 인자가 다르다는 점이 확인되었으나(Zhu et al., 2022), 현재까지 에너지 벤치마킹의 맥락에서 실측 건물에너지 데이터를 활용한 기저 및 냉난방 소비의 주요 인자를 파악하는 연구는 부족한 실정이다.
현재까지 다양한 연구들을 통해 건물 운영(Truong et al., 2021), 기후 특성(Jeong and Chae, 2022; Kim et al., 2023b), 건물 형상 지표(Olu-Ajayi et al., 2022; Jeun et al., 2022) 등의 변수 각각이 건물의 에너지소비 예측에 미치는 영향이 보고되었다. 하지만, 건물 운영, 기후 특성, 건물 형상 등의 다양한 변수들을 모두 고려한 종합적 에너지 소비 분석 연구는 활발히 이루어지지 않고 있으며, Ding and Liu (2020)는 올바른 건물 에너지 추정을 위해서는 이러한 다양한 측면의 에너지 소비 영향 변수들이 종합적으로 고려해야 함을 강조하였다. 이에 따라, 본 연구는 공공데이터의 수집이 용이한 교육시설을 대상으로 다양한 예상 영향 인자에 관한 정보를 수집하고, 머신 러닝 모델을 활용하여 기저와 난방으로 분리된 성능지표인 단위면적당 기저 및 난방 에너지 소비 추정에 주요한 인자를 파악하고자 한다.
방법론
주요 인자 분석 프로세스
Figure 1은 교육시설의 에너지 소비 주요 인자 분석 프로세스를 도식으로 보여준다. 교육시설 에너지 소비 추정은 국토교통부 및 교육부에서 제공되는 공공 데이터 수집, 머신 러닝 모델을 활용한 기저 및 난방소비량 추정 모델 개발, 그리고 추정 모델의 해석이라는 세 단계로 이루어진다. 예측 변수는 국토교통부 및 교육부의 공공데이터를 통해 수집되었다. 수집된 데이터의 전처리 후 주소 정보를 기준으로 서울시 소재의 초등학교 84개와 중학교 2개가 매칭되었다. 예측 모델로는 랜덤 포레스트 회귀를 활용하였으며 랜덤 포레스트 모델의 해석으로 SHAP 방법론을 활용하였다.
날씨 민감형 기저분리 방법론(SED)
본 연구에서는 한국부동산원의 필지 별 계량기별 총 에너지소비량 데이터를 기저, 냉방, 난방에너지 소비량을 분리하기 위해 SED (simplified weather-related energy disaggregation) 방법론(Kim et al., 2022)을 활용하였다. SED 방법론에서 월 기저부하는 봄과 가을의 최소 월 에너지소비량의 평균으로 계산되며, 냉방 및 난방에너지 소비량은 각각 여름과 겨울 기간동안 기저부하를 초과하여 소비하는 에너지로 계산된다. SED 방법론은 이와 같은 단순한 가정과 계산을 통해 기저에너지 소비량을 효과적으로 분리할 수 있다는 장점을 가지지만, 일반적으로 기저부하로 이해되는 조명부하나 기기부하 등의 에너지소비량 이외에도 연중 일정하게 유지되기만 한다면 어떤 종류의 에너지소비량도 기저부하로 계산될 수 있다는 한계점을 가진다(Yun and Sohn, 2011).
Figure 2는 교육시설의 방학을 제외한 연간 총 에너지 소비량, 그리고 SED 알고리즘을 통해 계산된 연간 기저, 냉방, 난방에너지별 EUI를 박스 도표로 나타낸 그림이다. 86개 교육시설에서 단위공조면적당 총 에너지 소비량은 평균 26.1 kWh/m2으로, 단위공조면적당 기저, 냉방, 난방 소비량은 각각 평균 18.1, 0.6, 7.3 kWh/m2으로 나타났다. 기저와 난방에 비해 냉방 소비량이 0에 가까이 낮게 나타났기 때문에 에너지 소비 추정은 단위공조면적당 기저에너지 소비량과 단위공조면적당 난방에너지 소비량에 대해서만 진행하였다.
랜덤 포레스트 회귀
랜덤 포레스트 모델은 머신 러닝 기반 회귀 방법론으로, 다수의 트리 모형으로 구성된 앙상블 학습 기법을 통해 예측을 수행한다(Segal, 2004). 랜덤 포레스트 모델은 각각의 트리 모형의 학습에 활용되는 샘플과 예측변수를 배깅(bagging) 방법론을 통해 무작위로 추출하며, 따라서 샘플과 예측변수의 부분집합으로 학습된 다수의 트리 모형을 활용함에 따라 일반화에 강하다는 강점을 가진다. 또한 예측을 수행하기 위해 다양한 예측변수를 조건으로 하는 노드들이 차례로 고려되면서 예측변수와 종속변수 간 비선형성과 예측변수 사이의 교호작용을 고려할 수 있다는 장점이 있다. 기저 및 난방소비량 추정에 주요한 변수를 파악하기 위해서는 비선형성과 교호작용을 모두 반영할 수 있는 통계 모델을 활용하는 것이 효과적이므로 랜덤 포레스트 모델을 추정 모델로 선정하였다.
랜덤 포레스트 모델의 교차 검증 방법론으로는 Leave-one-out 교차 검증(이하 LOOCV)을 활용하였다. LOOCV는 모든 샘플을 한 번씩 교차 검증의 테스트 샘플로, 나머지 샘플을 모델 학습에 활용하는 방식으로 샘플의 수만큼 교차검증을 실시한다. 교차검증된 모델의 예측 정확도는 LOOCV 교차검증에서 샘플의 수만큼 얻어지는 예측 값과 각 샘플의 실측 값을 활용한 R2로 계산되었다.
SHAP 분석
SHAP (SHapely Additive exPlanations) 방법론은 게임 이론에 기반하여 통계 모델의 예측을 해석하는 방법론으로, 예측 값의 평균으로 나타나는 기대 값(expected value)을 기준으로 각 샘플에서 독립변수가 예측에 갖는 전체 효과(SHAP value) 및 상호작용 효과(Interaction value)를 제공한다. 랜덤 포레스트 모델에서 변수의 중요도를 계산하기 위해 주로 활용되는 MDI (Mean Decrease in Impurity) 방법론이나 순열 변수 중요도(Permutation importance)와 다르게 SHAP 방법론은 각 독립변수가 갖는 전체 효과를 샘플 별로 확인할 수 있어 독립변수와 예측 사이의 추세를 설명 가능하다는 장점을 가진다(Lundberg et al., 2018).
예측 변수 선정
건물의 에너지 소비에는 기후, 건물 열적 특성, 기계 설비, 건물 운영, 건물 형상 등의 다양한 요인이 영향을 미치는 것으로 알려져 있으며(Borgstein et al., 2016)올바른 건물 에너지 소비 추정을 위해서는 이러한 다양한 측면의 정보를 모두 고려해야만 한다(Ding and Liu, 2020). 국토교통부 및 교육부의 공공데이터로부터 수집할 수 있는 학교 건물의 건물 운영, 건물 열적 특성, 건물 형상 및 기계 설비 관련 정보 중 에너지 소비에 유의한 영향을 미칠 것으로 예상된 10개의 변수들은 Table 1에 나열되어 있다. 에너지 소비 추정에 빈번하게 사용되는 건물 피복 변수는 가용 공공데이터가 부재하다는 점에서, 그리고 기후 변수는 에너지 소비 추정 대상이 서울시로 한정되어 기후적인 차이가 유의미하지 않다는 점에서 제외되었다.
Table 1.
List of predictors used for the prediction of base energy use intensity and heating energy use intensity of school buildings
Category | Predictor | Description | Reference |
Bldg. Use & Operation | Num. of people1) (m-2) | Number of students, teachers, nutritionist | |
… | Num. of dormitory residents1) (m-2) | ||
… | Public / Private | Public : 0, Private : 1 | Ref 1, Ref 2 |
… | Num. of swimming pools | ||
Bldg. thermal characteristic | Date of establishment | Establishment date of school building | Ref 3 |
Bldg. shape | S/A | Building envelope area per air-conditioned area | Ref 4 |
… | Building orientation (°) | Ref 5 | |
… | Average floor height (m) | Building height / number of floors | |
Mechanical system | Gas consumption ratio | gas consumption ratio of total / heating EUI | Ref 7, Ref 8 |
… | District cooling & heating consumption ratio | District cooling & heating consumption ratio of total / heating EUI | |
Ref1. (Jang et al., 2022), Ref 2. (Lee et al., 2014), Ref 3. (Byun et al., 2023), Ref 4. (Parasonis and Keizikas, 2010), Ref 5. (Choi and Chang, 2013), Ref 6. (Lee and Park, 2016), Ref 7. (Shin and Park, 2023) |
건물 운영 및 열적 특성 변수
학교의 건물 운영 및 열적 특성과 관련된 정보는 교육부의 학교알리미(Schoolinfo, 2024)를 통해 수집되었다. 학교알리미는 교육부에서 정한 공시 기준에 따라 ‘학사/학생’, ‘재정/시설/설비’, ‘보건/복지’의 세 분류에 대한 35개의 공시항목을 제공하며, 공시항목에 따라 제공되는 정보 중 건물의 운영과 관련되며 에너지 소비에 유의할 것으로 판단되는 변수들로 ‘총원’, ‘기숙사 재실인원’, ‘수영장 수’, ‘설립구분(공/사립)’, ‘설립일’의 5개 변수를 선정하였다. 총원과 기숙사 재실인원은 공조면적으로 정규화되어 단위공조면적 당 학교 건물을 사용하는 인원의 수에 대한 정보를 반영하며, 특히 총원 정보는 재학 학생 수와 교원 수, 급식실 직원 수를 합하여 계산되었다. 수영장은 교육청의 초등학교 수영교육 매뉴얼에 적정 실내온도 및 적정 수온을 유지하도록 명시되어 있다는 점, 그리고 수영장에 샤워실이 포함한다는 점에서 급탕 및 냉난방 에너지 소비량에 영향을 미칠 것으로 판단되어 영향 인자로 고려되었다. 공립 및 사립 학교를 구분하는 범주형 변수인 설립구분 정보는 사립 학교가 공립 학교에 비해 신재생에너지 설치 비율이 낮고(Jang et al., 2022)에너지 소비량이 높다는 점에서 (Lee et al., 2014)고려되었다. 설립일 정보는 건물의 노후 정도를 대변함과 동시에 건물의 건축 시기에 따라 다른 건축물 에너지절약설계기준이 적용되었으므로 건물 외피의 열관류율을 간접적으로 설명할 수 있다(Byun et al., 2023)는 점에서 열적 특성 관련 변수로 고려되었다.
건물 형상 변수
학교의 건물 형상 정보는 건물의 형상에 따라 건물의 에너지 소비량이 바뀔 수 있다(Parasonis and Keizikas, 2010)는 점에서 에너지 소비 추정에 중요하며, 서울시 GIS 데이터를 통해 계산된 단위공조면적당 외피면적, 평균 층고, 건물방향의 세 가지 변수가 건물 형상 정보로 포함되었다. 단위공조면적당 외피면적은 냉방 및 난방이 필요한 면적 대비 건물이 외기와의 접촉으로 열을 교환하는 면적의 양을 설명한다는 점에서 냉난방 에너지 부하와 밀접한 관계를 가진다. 평균 층고 정보는 단위공조면적당 외피면적 변수가 공조부피가 아닌 공조면적만을 고려한다는 점에서 갖는 한계를 보완하기 위해 추가되었으며, 건물의 높이를 지상 층 수로 나누어 계산되었다. 건물 방향 정보 또한 태양 복사에너지가 건물 파사드 및 창호에 미치는 입사각을 결정한다는 점에서 에너지 소비에 유효한 차이를 만드는 것으로 보고되었다(Choi and Chang, 2013)는 점에서 예상 영향 인자로 고려되었다.
기계 설비 변수
학교의 기계 설비와 관련한 변수는 교육부 및 국토교통부의 공공데이터 모두에서 제공되고 있지 않아 학교시설의 냉난방 및 조리시설 정보를 간접적으로 반영할 수 있는 대체 변수를 기계 설비 변수로 활용할 필요성이 있다. 본 연구에서는 기저에너지 및 난방에너지 소비 중 가스에너지의 사용량 비율을 설명할 수 있는 가스사용량 비율 변수를 기계 설비 변수로 활용하였다.
교육시설의 냉난방 설비 현황을 분석한 연구에서, 전국 교육시설 중 80% 이상의 학교가 전기히트펌프(이하 EHP) 및 가스히트펌프(이하 GHP)를 냉난방기기의 주기종으로 활용되는 것으로 확인되었다(Lee and Park, 2016). 또한 같은 연구에서 난방 및 온수에 사용되는 에너지원은 전력이 44.9%, 도시가스가 37.2%로 편차가 크지 않았으며, 특히 대전시의 교육시설에 대한 전수조사 결과 GHP가 EHP와 함께 활용되는 학교가 전체의 36%로 보고되었다. 이는 냉난방 에너지 사용량에 포함되는 가스사용량이 냉난방기기 중 가스난방설비의 규모를 간접적으로 나타낼 수는 지표로 활용될 수 있음을 의미한다.
기저에너지 소비의 경우, 서울시 9개 시범학교의 에너지소비 분석 결과 기저부하 중 전기기기에 해당하는 WiFi 라우터나 타블렛 PC 등 디지털/통신 설비의 전력 사용량이 전체 에너지 부하의 18%를, 급식실에서 도시가스를 사용하는 조리 설비가 세척 설비와 함께 12%의 에너지 부하를 차지하는 것으로 확인되었다(Shin and Park, 2023). 이를 통해, 교육시설의 경우 급식 여부 및 규모에 따라 기저부하에 주요한 차이가 있을 수 있음을 알 수 있다. 본 연구에서는 기저소비량 중 가스사용량 비율을 급식용 조리설비의 규모를 간접적으로 나타낼 수 있는 지표로 활용하여, 급식 규모가 기저소비량에 미치는 영향도 추가적으로 분석하고자 한다.
결과 및 결론
랜덤 포레스트 모델 결과
서울시 소재 86개 교육시설을 대상으로 랜덤 포레스트 모델을 활용하여 단위공조면적당 에너지소비량을 추정하였다. 예측 정확도인 R2는 LOOCV 교차검증을 통해 얻은 86개 건물 각각의 예측 값과 실측 값을 통해 계산되었으며, 예측 정확도로 단위공조면적당 총에너지 소비량 추정에서 0.64의 R2, 기저소비량 추정과 난방소비량 추정에 대해서 0.60의 R2를 보였다. 이는 국외 대표적 건물 에너지 벤치마킹 사례인 Energy Star Portfolio Manager (ESPM)가 350개의 교육시설을 대상으로 0.21의 R2 수준을 보인 것과 비교하여 높은 수준이다(EnergyStar, 2018). 국내의 경우, 에너지효율등급 인증을 받은 교육시설 대상으로 단위면적당 총에너지 소비량 예측 모델이 주로 개발되었으며, 사용된 예상 인자에 따라 0.057에서 0.778 사이의 평균 R2를 보였다(Kim et al., 2023b). 이러한 기존 사례들과 비교하면, 모든 교육시설에 대해 취득 가능한 공공 데이터만을 활용한 본 연구의 예측 정확도는 유의미한 수준으로 판단된다. 특히, 총 에너지소비 뿐 아니라 기저 및 난방으로 분리된 에너지 소비량을 추정한다는 점에 본 연구의 가치가 있다.
SHAP 전체 효과
Figure 3은 10개의 예측 변수 각각의 86개 샘플에 대한 SHAP 전체 효과를 나타낸 것이다. 기저소비량 추정과 난방소비량 추정 모두에서 가장 중요한 2개의 변수는 가스사용량 비율과 수영장이었으며, 두 변수 모두 예측 값과 양의 상관관계를 가졌다. 가스사용량 비율은 기저소비량 추정 값을 최대 30 kWh/m2만큼, 난방소비량 추정 값을 최대 20 kWh/m2 만큼 증가시킬 수 있는 것으로 확인되었다. 가스사용량 비율과 가스사용량 비율의 SHAP 전체 효과는 양의 상관관계를 보였으며, 기저소비량 및 난방소비량 추정에서 가스사용량 비율의 역할은 다음 절에서 후술하였다.
수영장은 기저소비량 추정과 난방소비량 추정 모두에서 가스사용량 비율 다음으로 중요한 변수로 파악되었다. 수영장이 있는 학교는 그렇지 않은 학교와 비교하여 기저소비량 예측값은 최소 12.7 kWh/m2에서 최대 22.3 kWh/m2, 난방소비량 예측 값은 최소 1.3 kWh/m2에서 5.6 kWh/m2만큼 증가시키는 것으로 나타났다. 이는 수영장 시설이 일정한 기온과 수온을 유지해야 하며 샤워장을 포함하기 때문에 급탕 및 냉난방 부하를 증가시키는 것으로 이해할 수 있다.
기저소비량 추정에서 3번째로 유의미한 변수가 단위공조면적당 총원으로 나타난 반면, 난방소비량 추정에서 3번째로 유의미한 변수는 건물이 외기에 열을 뺏기는 면적의 상대적 크기를 설명하는 단위공조면적당 외피면적으로 나타났다. 기저소비량에서 총원 다음으로 중요하게 나타난 예측변수 순서는 설립일, 단위공조면적당 외피면적, 평균 층고, 설립유형, 건물방향, 기숙사 재실인원, 그리고 지역 냉난방 비율이었다. 난방소비량의 경우 단위공조면적당 외피면적 다음으로 중요한 변수들은 차례로 설립일, 건물방향, 평균 층고, 단위공조면적당 총원, 설립유형, 지역 냉난방 비율, 그리고 기숙사 재실인원으로 확인되었다.
주요 변수 해석
난방소비량 예측에 대한 가스사용량 비율과 SHAP 전체 효과 산점도 그래프(a) 및 기저소비량 예측에 대한 가스사용량 비율과 SHAP 전체 효과 산점도 그래프(b)는 Figure 4에서 확인할 수 있다. 가스사용량 비율과 가스사용량 비율의 SHAP 전체 효과 산점도 그래프는 기저 추정과 난방 추정에서 유사한 경향성을 보이며, 가스사용량 비율이 40%에서 100% 사이일 때에 양의 상관관계를, 가스사용량 비율이 0% 또는 100%일 때에 낮은 SHAP 전체효과를 가진다.
난방소비량 추정 경우인 Figure 4의 (a)를 보면 대부분 건물의 가스사용량 비율이 40%에서 100% 미만에 해당되며 가스사용량 비율과 해당 변수의 SHAP 전체효과 사이의 상관관계는 피어슨 상관계수 0.89 수준으로 강한 양의 상관관계를 보였다. 이 구간에서 SHAP 전체 효과는 가스사용량 비율이 증가함에 따라 -5.0 kWh/m2에서 11.3 kWh/m2까지 증가한다. SHAP 전체 효과는 모델의 예측 값을 얼마나 바꿀 수 있는지를 예측 평균을 기준으로 설명하므로, 가스사용량 비율이 증가함에 따라서 난방소비량의 예측 값이 3.56 kWh/m2에서 19.86 kWh/m2까지 총 16.3 kWh/m2만큼 증가하는 것으로 해석할 수 있다. 하지만, 전반적 트렌드와 달리, 가스 사용량이 0% 및 100%인 14개 학교의 경우, 난방소비량 예측값이 평균값보다 낮게 나타났다. 해당 건물들을 구글 맵을 통해 확인하였을 때 모두 신재생에너지를 활용하는 건물로 확인되나, 학교 건물의 신재생에너지 활용 여부는 공공데이터로 제공되지 않아 추가 독립 변수로 활용되지 못하였다.
기저소비량 추정 경우인 Figure 4의 (b)를 보면, 건물 가스사용량 비율이 대부분 40%에서 100% 미만에 해당되며, 가스사용량 비율과 해당 변수의 SHAP 전체효과는 피어슨 상관계수 0.92 수준의 강한 양의 상관관계를 보였다. 이 구간에서는 가스사용량 비율이 증가함에 따라 -11.4 kWh/m2에서 9.9 kWh/m2까지 증가하는 SHAP 전체효과를 가졌다. 이는 가스사용량 비율이 기저소비량의 예측 값을 21.3 kWh/m2만큼 높일 수 있음을 의미한다. 난방소비량 추정 경우에서 가스사용량 비율이 0% 또는 100%인 14개 학교는 기저소비량 추정에서 동일하게 0% 또는 100%의 가스사용량 비율을 보였다. 이를 통해 신재생에너지를 활용하여 기저에너지 소비를 일정 부분 충당될 수 있음을 확인할 수 있었으나, 공공데이터에서의 신재생에너지 정보 부재로 이 부분이 모델에는 반영되지 못한 한계점이 있다.
결 론
본 연구에서는 86개의 서울시 소재 초, 중, 고등학교의 단위공조면적당 기저 및 난방에너지 소비량을 머신 러닝 모델인 랜덤 포레스트 모델로 추정하고, 추정된 모델을 SHAP 전체효과를 활용해 해석하였다. 그 과정을 통해, (1) 기저 및 난방소비량 추정을 위해 건물 운영, 건물 열적 특성, 건물 형상, 기계 설비 등 다양한 종류의 변수들이 공공데이터를 활용하여 수집 계산되었고, (2) 이를 통한 기저 및 난방소비량 추정 모델의 예측 정확도가 모두 0.60으로 나타났으며, (3) 예측 변수 중 가스사용량 비율 변수의 중요도가 가장 높았고, (4) 해당 변수는 기저소비량 추정에서 급식 조리 가스에너지의 양을, 난방소비량 추정에서 가스난방 설비의 규모를 간접적으로 설명할 수 있을 것으로 기대되었다. 공공데이터를 통해 취득한 다양한 예측 변수들을 함께 활용하여 교육시설의 기저 및 난방 에너지 소비 추정의 주요 인자를 파악하는 것은 기저 및 냉난방에 따라 구별된 에너지 벤치마킹 방법론을 개발하기 위해 필수적이라는 점에 본 연구 결과의 가치가 있다.
한편, 건물의 설비 정보가 공공데이터에서 부재하다는 점에서 간접 변수로 선택된 가스사용량 비율 변수는 기저 및 난방소비량 추정 모두에서 중요 변수로 확인되었음에도, 해당 변수가 기저 및 난방소비량 예측에 미치는 영향을 정확히 해석하기에는 정보의 한계가 있다. 가스사용량 비율이 0% 또는 100%로 나타나는 건물은 구글 맵을 통해 확인하였을 때 모두 신재생에너지를 활용하는 건물로 확인되나, 학교 건물의 신재생에너지 활용 여부는 공공데이터로 제공되지 않는 실정이다. 기계설비 변수가 건물의 에너지소비 추정에 가장 중요한 정보로 확인된 만큼 건물의 기계설비 종류, 신재생에너지 활용 여부 등의 추가적인 정보가 공공데이터로 수집 및 제공될 필요가 있다.