분석 방법론
각 지표가 어떤 데이터에서 어떻게 계산되는지 설명합니다.
1. 데이터 출처와 갱신 주기
모든 거래 데이터는 국토교통부 실거래가 공개시스템의 매매 신고분에서 가져옵니다. 주 1회(월요일 오후 9시 KST) 자동 수집되어 사이트 전체가 새 데이터로 다시 빌드됩니다. 구·월 단위로 중복을 제거(8개 필드 기준 dedupe)하여 같은 거래가 두 번 집계되지 않도록 합니다.
2. ㎡당 평균 거래가
단지별·자치구별 비교 시 평형이 섞이면 "더 큰 단지가 더 비싸 보이는" 왜곡이 생깁니다. 이를 줄이기 위해 본 사이트의 모든 평균가는 다음과 같이 계산합니다.
㎡당 가격 = 거래가(만원) ÷ 전용면적(㎡)
평균 ㎡당 = 거래별 ㎡당 가격의 산술평균
전용면적이 0이거나 누락된 거래는 집계에서 제외합니다.
3. 거래량
신고된 거래 건수를 그대로 사용합니다. 단, 다음은 제외합니다.
- 샘플 데이터(API 키 미설정 시 삽입되는 행)
- 단지명·전용면적이 비어있는 행
4. 전월 / 전년 동월 대비 변동률
변동률(%) = (이번 달 평균 − 비교월 평균) ÷ 비교월 평균 × 100
표본이 작을수록 노이즈가 커지므로, 단지 단위 랭킹의 경우 각 기간 최소 3건 이상 거래된 단지만 비교 대상에 포함합니다.
5. 평형대 4분류
| 구분 | 전용면적 | 특징 |
|---|---|---|
| 소형 | ~60㎡ | 1~2인 가구·신혼·투자 수요 |
| 중소형 | 60~85㎡ | 국민주택규모. 보편적 |
| 중형 | 85~135㎡ | 가족형. 학군·생활편의 영향 큼 |
| 대형 | 135㎡~ | 거래량 적음. 단가 분산 큼 |
6. 자치구별 랭킹
서울 25개 자치구의 ㎡당 평균가를 최근 12개월 거래 기준으로 정렬합니다. 순위는 모든 자치구가 같은 평형 분포라고 가정하지 않으므로, 각 구별 평형 구성 차이가 가격 차이의 일부를 설명할 수 있습니다.
7. 멱등 빌드
같은 입력 데이터에서 빌드를 두 번 돌리면 정확히 같은 결과가 나오도록 설계했습니다. 모든 집계 SQL 은 결정적이며, 임의값·시간 의존성이 없습니다.