[논문이야기] 이 많은 따릉이들은 어디서 왔을까? 2편 – 초록

4개년 따릉이 이용 데이터와 날씨 데이터를 활용해 따릉이 이동 경로 파악 및 효용성 극대화 방안 모색
시간대별·대여소별 수요 예측을 통해 불필요한 자전거 재배치 줄여
루베인 알고리즘 기반 대여소 클러스터링으로 자전거 재배치 시 이동 거리 최소화

지난 1편에서는 공공 자전거 사업의 고질적인 적자 문제를 해결하기 위해 따릉이 재배치 효율화의 필요성을 강조하며, 그 핵심 원인이 특정 대여소로의 과도한 쏠림 현상임을 밝혔습니다.

이를 분석하기 위해 따릉이 이용자들의 시간적 패턴과 서울시 내 쏠림 현상이 심각한 지역 분석을 통해, 주요 업무지구 출퇴근 시간대 따릉이 이동 패턴을 집중적으로 살펴봤습니다. 그 결과 마곡지구를 비롯해 G밸리, 성수동, 여의도, 잠실 등 5개 주요 업무지구에서 따릉이 쏠림 현상이 두드러짐을 확인했었습니다.

이들 지역에서는 출근 시간에 주거지역에서 업무지구로 따릉이가 집중되고, 퇴근 시간에는 반대로 업무지구에서 주거지역으로 흩어지는 패턴을 보였으며, 특히 20~30대 직장인의 이용량이 많은 출퇴근 시간대에 따릉이 대여·반납 불균형이 심화되는 것을 관찰할 수 있었습니다.

지난해 평일·주말 따릉이 대여·반납 최대 대여소집계 기간2021년 112월
평일·주말 따릉이 대여·반납 최대 대여소

따라서 지금까지 살펴본 내용을 종합하면, 따릉이 재배치의 핵심은 출퇴근 시간대 대규모 업무지구에서 발생하는 따릉이 대여·반납 불균형 해소에 있다고 볼 수 있습니다. 특히 따릉이 이용자들이 출퇴근 시 동일한 교통수단을 이용하는 경향이 높다는 점을 고려할 때, 오후 시간대 수요 폭증이 예상되는 지역에 집중적으로 따릉이를 재배치하는 것이 효율적일 것입니다. 즉 “과잉보다는 부족을 예측하는 것”이 따릉이 재배치 효율화의 핵심 전략이라고 할 수 있습니다.

이 많은 따릉이들은 어디서 왔을까? 2편 진행 내용

1편에서는 따릉이 이동 패턴을 예측하는 데 집중했다면, 2편에서는 4개년 데이터 분석을 통해 실제 따릉이 이동 경로를 시각적으로 파악하고, 이를 바탕으로 따릉이 효용성을 극대화할 방안을 모색하고자 합니다.

먼저 따릉이 대여량과 날씨와의 상관관계를 분석할 계획입니다. 당연하게도 따릉이 대여량은 날씨의 영향을 크게 받습니다. 예를 들어 화창한 날에는 따릉이 이용량이 증가하고, 비 오는 날에는 감소하는 경향이 있습니다. 이러한 날씨와 따릉이 대여량의 관계를 분석해 SARIMAX 모델의 외부 변수로 활용하면, 날씨 변화에 따른 따릉이 수요를 예측하고 재배치 계획에 반영할 수 있습니다.

이후 각 대여소와 시간대별 따릉이 이용량을 예측해 부족/과잉 정도를 나타내는 ‘따릉이 Index’를 선보일 예정입니다. 이를 통해 재배치가 필요한 대여소 수를 최소화해 효율성을 높일 것입니다. 또한, 루베인 알고리즘을 활용해 유사한 이용 패턴을 보이는 대여소들을 그룹화해 자전거 재분배 이동 거리를 줄이고, 효과적인 재배치 전략을 수립할 계획입니다.

2편 목차

Part1 : 따릉이 대여량과 날씨 데이터와의 상관관계 분석

  • 따릉이 대여량과 날씨 데이터와의 상관관계 분석 (마곡나루역 2번출구역 대여소)
  • 따릉이 대여량과 시간적 상관관계 분석 (마곡나루역 2번출구역 대여소)
  • 요일 별 따릉이 이용건수 분석

Part2 : 자전거 수요 예측 SARIMAX Modeling

  • 4개년 따릉이 대여소 반납량 데이터 소개 (19~23년)
  • STL Decomposition → Residual Modeling: SARIMAX 적용 결과
  • 따릉이 수요 예측 SARIMAX Modeling 및 따릉이 재배치 효율화 Logic

Part3 : 자전거 이용 수요 예측의 공간적 & 시간적 평형상태 시각화

  • 출 퇴근 시간 변화에 따른 공간적 평형상태 시각화
  • 따릉이 1-Day Index Range에 따른 따릉이 비용 효율화 Solution
    : 실질적인 D Index의 활용법 및 시간적 평형상태 시각화
  • 따릉이 K-Means Clustering을 통한 최적 K값 분석
    : Clustering 수에 따른 공간적 평형상태 분석
  • 공간적 & 시간적 평형상태 이론 제시
    : D-Index와 K-Means Clustering의 적용

Part4 : Louvain 알고리즘을 사용한 따릉이 공간적 평형상태 구현 최적화

  • 따릉이 공간적 평형상태 구현을 위한 Clustering 적용 Idea
    : Community Detection Algorithm을 사용 → Modularity의 개념을 이용
    : Modularity란?
  • Louvain 알고리즘 소개
    : Louvain 알고리즘 Concept
  • Louvain 알고리즘을 사용한 Clustering 결과
    : Louvain 알고리즘을 이용한 따릉이 대여소 Community Detection 결과
    : Clustering 성능 비교 (K-means vs Louvain)

[논문이야기] 이 많은 따릉이들은 어디서 왔을까? ⑤로 이어집니다