Transcript 교통혼잡도 분석
부산시 교통센터 강연 부산시 교통분야 Big Data 적용 사례 빅 데이터 처리 플랫폼 연구센터 부산대학교 교수 홍봉희 목차 Big Data 적용 사례 교통데이터 기반 교통 속도 예측 교통데이터 기반 교통 정체 판별 교통데이터 기반 교통 혼잡도 분석 CCTV 영상 기반 교통량 및 차량 속도 산출 1 교통데이터 기반 교통 속도 예측 2 연구 목표 과거 교통 빅데이터 기반의 교통 속도 예측 모든 도로는 다양한 형태의 시공간 패턴을 보임 미래의 교통 속도를 예측하기 위해 시공간 패턴을 가지는 과거 교통 데이 터를 이용하여 교통 상황 분석 및 예측 ChangePoint Analysis 요일에 따른 속도 변화가 큼 Correlation Analysis 요일에 따른 속도 변화가 일정함 Monte Carlo Simulation Analysis <요일별 도로 패턴들> <필터링 알고리즘> 3 <예측 생성> 유사 패턴 검색 및 제거 ChangePoint 분석을 통한 과거 데이터 제거 도로 공사 전후의 교통 속도(평균 속도, 변화량)가 전체적으로 변함 급변하는 데이터의 이전 패턴들을 모두 제거 Speed 2014. 12. 16 고속도로 공사 완료 (남해 고속도로) 2014. 04. 21 ~ 25 2014. 12. 22 ~ 26 & 2015. 01. 12 ~ 16 4 Time 교통 예측 시스템 아키텍처 Big data processing tools으로 구성된 교통 예측 시스템 아키텍처 R, Hive, RHive, Hadoop 등의 Big data processing tools 이용 5 예측 결과 필터링 알고리즘 기반의 과거 데이터 선정을 통한 예측 결과 비교 변화율 변화율 필터링 알고리즘을 사용하였을 때, 출근 시간에서의 오차를 제외하면 높은 일치율을 보임 <필터링 알고리즘을 사용하지 않은 예측값과 실제값의 비교> < 필터링 알고리즘을 사용한 예측값과 실제값의 비교 > 6 교통데이터 기반 교통 정체 판별 7 개요 과거 교통 정체패턴을 이용한 교통정체 예측 현재 교통 정체의 확산 지역 예측 현재 교통 정체의 해소 시점 예측 앞으로 악화되는 정체인지? 혹은 풀리는 정체인지? 운전자 위치 8 정체 구간 8 데이터 분석 교통정체 데이터 분석 분석 범위 공간적 범위: 동서고가도로 (8부두 교차로 → 서부산 IC) 시간적 범위: 10일 (2013년 4월 30일 ~ 5월 9일) 상습정체 구간 분석 데이터 차트 가시화 히트맵 차트 표현 예시 정체영역 데이터가 없는 구간 00:00 선형 차트 표현 예시 정체의 공간적 길이2) 03:00 06:00 09:00 정체의 시간적 길이1) 12:00 15:00 18:00 21:00 1)정체의 24:00 2013.04.30(화) 2013.05.01(수) X축: 서부산 IC ← 8부두 교차로 시간적 길이: 특정 지점에서 발생한 정체의 시작 시점부터 소멸 시점 또는 현재까지의 시간 2) 정체의 공간적 길이: 단위 시간 동안 정체가 발생한 연속 구간 길이 9 예측 기법 교통 정체 예측 기법 현재 교통 정체의 시간적 길이 동안의 공간적 길이가 유사한 과거 교통 정체 패턴 을 이용한 예측 예시 현재 정체 패턴은 과거 정체 패턴 1과 유사함 현재 정체는 30분 동안 지속되다가 차츰 완화되어 40분 후에 해소 될 것으로 예측 혼잡 도로 길이 (km) 혼잡 도로 길이 (km) 30분 40분 (시작 시간) 과거 정체 패턴 1 시간 (종료 시간) 혼잡 도로 길이 (km) 30분 20분 (시작 시간) 과거 정체 패턴 2 시간 (종료 시간) 30분 (시작 시간) 시간 (현재 시간) 현재 정체 패턴 필요 기술 실시간으로 교통정체 데이터의 특성(시공간 연속성, 시간적 길이, 공간적 길이)을 분석하여 시공간 교통정체 패턴 생성 기법 실시간으로 교통정체 패턴간의 유사성 비교 기법 10 예측 절차 과거 데이터 기반의 교통 정체 해소 예측을 위한 절차 과거/현재 교통정체의 시공간 패턴 구축 현재 교통정체와 유사한 과거 정체 시공간 패턴 추출 및 현재 교통정체와의 결합 향후 교통정체의 변화 정보 및 해소 시점 계산 ① 과거 정체 패턴 및 현재 교통 정체 패턴 구축 시간 시간 현재 정체 패턴 과거 정체 패턴 교통 데이터 11 ② 유사 과거 패턴 추출 및 현재 패턴과의 결합 혼잡 구간의 길이 (km) 혼잡 구간의 길이 (km) 혼잡 구간의 길이 (km) 기울기 : 정체 변화율 유사 과거 패턴 결합 정체해소시점 현재 시점 시간 ③ 정체 변화 및 해소시점 계산 SW아키텍처 유사패턴 탐색기 현재 교통정체 패턴과 유사한 과거 교통정체 패턴을 탐색하여 정체해소 시점 예측 정체패턴 생성기 교통데이터로부터 시공간 교통정체 패턴을 생성 12 가시화 지도상에 구간(link)단위로 정체 발생 시간대별 line 표현 정체의 변화(확산/유지/축소)에 따른 line 색상 변화 시간 정체 구간 시간 정체 구간 3:00 VDS04→VDS05 3:30 VDS05→VDS07 3:10 VDS04→VDS06 3:40 VDS06→VDS08 3:20 (현재 시점) VDS04→VDS07 3:50 (정체해소시점) VDS07→VDS08 현재 정체 정보 예측 된 정체 정보 가시화 VDS08 두 노드간의 구간(link) VDS07 VDS06 VDS05 노드 VDS04 3:50 3:40 3:30 3:00 3:10 현재 시점 정체 확산 정체 유지 정체 축소 13 Summary Info. 충렬대로 교통 정체 정보 - 안락교차로를 지나 안락지하도에서 3:00에 정체가 시작 되었음 - 현재 20분째 정체가 지속 되고 있음 - 현재의 정체는 수안역 부근까지 확산 될 예정임 - 현재 정체는 30분 후인 3:50에 소멸 될 예정임 교통데이터 기반 교통 혼잡도 분석 14 교통혼잡도 정의 교통혼잡도란? 자동차들이 상호 간섭되어 교통량이 도로 수용량에 근접되었을 때 나타나 는 자동차간의 상호작용으로 인한 자동차의 연속적인 지연 및 운행비용의 발생현상을 말한다. 차량의 이동 속도는 도로 수용량 근접에 영향을 줌 차량의 이동 속도가 낮을수록 도로 수용량에 근접하고, 차량의 이동 속도가 높 을수록 도로 수용량에서 멀어짐 (도로 수용량은 도로 링크 한 구간에 얼마나 많은 차량들이 존재하는지를 의미 함) 소통 원활 도로 (차량의 이동 속도가 빠름) 정체 도로 (차량의 이동 속도가 느림) 15 교통혼잡도 계산 관련 문건 국내 혼잡 기준표 운영주체 한국도로공사 (고속도로) 한국건설기술연구원 (국도) 서울도시고속도로 교통관 리센터 (도시부 고속도로) 정의 지표 소통원활 70km/h 이상 서행 30~70km/h 정체 30km/h 미만 소통원활 40km/h 이상 서행 20~40km/h 정체 20km/h 미만 소통원활 50km/h 이상 서행 30~50km/h 정체 30km/h 미만 ref.소통관리 지표 개발을 위한 기존 혼잡지표의 국내 적용성 평가 연구, 한국도로학회 논문집, 2008년 9월, pp.119-128 16 속도 속도 속도 교통혼잡도 계산 관련 문건 혼잡시간 기반 혼잡 지표 LMID(Lane-Mile Duration Index) 고속도로 혼잡의 지리적 범위와 체류시간을 함께 사용한 지표 각 도로 구간별 혼잡한 도로연장에 혼잡한 체류시간을 곱하여 합계를 구 한 값을 사용 FCI(Freeway Congestion Index) LMID를 이용하여 서로 다른 고속도로간의 상호비교를 위해 전체 도로연장으로 나누는 지표 ref.소통관리 지표 개발을 위한 기존 혼잡지표의 국내 적용성 평가 연구, 한국도로학회 논문집, 2008년 9월, pp.119-128 17 교통혼잡도 분석을 위한 원시 데이터 데이터 수집 시스템 개인 차량의 이동 속도 정보를 DSRC 시스템으로 수집 DSRC란? 단거리 전용 통신 시스템으로 톨게이트나 도로변에 설하여 자동차에 탑재 한 단말 장치와 수십 m의 거리에서 양방향 무선 통신을 통하여 다량의 정 보를 순차적으로 교환 한다. 원시 데이터 Type DATE: 속도 수집 시간(년도, 월, 일, 시간) Link ID: 고유 링크 식별을 위한 ID LANE: 링크의 차선수 SPEED: 링크의 속도 <부산시 교통 원시 데이터 예시> ※ 데이터 출처: 부산광역시 교통정보서비스센터 18 교통혼잡도 집계 방법 교통혼잡도 집계 일 단위 집계 시간 1시간 링크별 3시간 구별 6시간 교차로별 12시간 링크셋 별 … 시간 24시간(일 별) 요일별 누적 집계 주별 월별 개절별 (4분기) 년별 19 40개의 집계 테이블 교통혼잡도 분석 도구 빅데이터 분석 도구인 하둡을 이용한 병렬 처리 최종 결과물 Split map combine Split or <13011.., 혼잡지수 50> map combine Split reduce reduce map 시간/공간 분할 그룹핑 20 … 부산시 원시 데이터 Split <동래구, 혼잡지수 30> <금정구, 혼잡지수 10> map combine 교 통 데 이 터 reduce … 부 산 시 <13012.., 혼잡지수 50> 교통혼잡도 분석 – 출/퇴근 시간대 집계 (06~09/16~21) 질의. 9월 30일에 출/퇴근 시간 가장 혼잡한 도로 Top10? 9월 30일 6~9시(출근), 18~21시(퇴근) 까지 교통혼잡 3시간 집계 출근길 시간 오전 6~9시 퇴근길 도로명 링크ID 혼잡점수 순 위 1 양운로 1380055700 4628 1 5080 2 양운로 1380057300 4628 2 1350009200 5080 3 양운로 1380062100 4628 3 만덕대로 1370002601 5080 4 양운로 1380063700 4628 4 만덕대로 1370002800 5080 5 양운로 1380069700 4628 5 학장로 1440014200 4768 6 양운로 1380074100 4628 6 학장로 1440018600 4768 7 양운로 1380076800 4628 7 낙동대로 1390000200 4756 8 양운로 1380077400 4628 8 낙동대로 1390001000 4416 9 수영로 1430020700 4612 9 낙동래로 1390001800 4416 10 젊음의 거리 1340022600 4488 10 도로명 링크ID 혼잡점수 순 위 충렬대로 1350007800 5080 충렬대로 1350008400 만덕대로 시간 오후 18~21시 21 교통혼잡도 분석 – 출/퇴근 시간대 집계 (06~09/16~21) 질의. 9월 30일에 출/퇴근 시간 가장 혼잡한 도로 Top10? 9월 30일 6~9시(출근), 18~21시(퇴근) 까지 교통혼잡 3시간 집계 출근길 시간 오전 6~9시 도로명 링크ID 혼잡점수 순 위 충렬대로 1350007800 5080 1 충렬대로 1350008400 5080 2 만덕대로 1350009200 5080 3 만덕대로 1370002601 5080 4 만덕대로 1370002800 5080 5 학장로 1440014200 4768 6 학장로 1440018600 4768 7 낙동대로 1390000200 4756 8 낙동대로 1390001000 4416 9 낙동래로 1390001800 4416 10 22 교통혼잡도 분석 – 출/퇴근 시간대 집계 (06~09/16~21) 질의. 9월 30일에 출/퇴근 시간 가장 혼잡한 도로 Top10? 9월 30일 6~9시(출근), 18~21시(퇴근) 까지 교통혼잡 3시간 집계 퇴근길 시간 오후 18~21시 도로명 링크ID 혼잡점수 순 위 양운로 1380055700 4628 1 양운로 1380057300 4628 2 양운로 1380062100 4628 3 양운로 1380063700 4628 4 양운로 1380069700 4628 5 양운로 1380074100 4628 6 양운로 1380076800 4628 7 양운로 1380077400 4628 8 수영로 1430020700 4612 9 젊음의거 리 1340022600 4488 10 23 교통혼잡도 분석 결과 질의. 9월 30일 구별 혼잡도 9월 30일 0시~24시까지 교통혼잡 집계 구의 혼잡도 = 각 구의 혼잡 점수 /부산시의 전체 혼잡점수 * 100 결과 권역코드 구명 135 시간 혼잡점수 순위 동래구 2299636 1 138 해운대구 2255472 2 142 연제구 1205084 3 134 부산진구 1074588 4 143 수영구 991964 5 140 금정구 976976 6 137 북구 843236 7 144 사상구 782084 8 139 사하구 781744 9 136 남구 773612 10 131 서구 773612 11 141 강서구 700240 12 130 중구 453232 13 132 동구 398924 14 145 기장군 294364 15 9월1일 00~24시 강서구 중구 동구 5% 3% 3% 기장군 2% 서구 5% 영도구 0% 동래구 15% 남구 5% 해운대구 15% 사하구 5% 사상구 6% 북구 7% 연제구 8% 금정구 수영구 7% 7% <각 구별 일일 혼잡도>부산진구 <각 구별 일일 혼잡 점수> 7% 24 CCTV 영상 기반 교통량 및 차량속도 산출 25 개요 영상검지기 vs. CCTV 영상검지기 CCTV 카메라 • 카메라가 설치되면 각도는 고정이 되어 전방 약 200m~400m 지역 안에서만 검지 • 노견 상에 정체 차량이나 영상 범위 이외의 지 역에서의 지∙정체 상황은 파악 불가능 • 좌, 우, 상, 하로 회전을 하는 panning과 tilting, zooming 기능으로 전방 2km 이상까 지 관측 가능 • 노견을 비롯하여 도로 상의 고장으로 인한 정 체 차량이나 사고에 의한 지∙정체 상황을 파악 영상검지기 CCTV 카메라 26 개요 CCTV 영상을 활용한 교통량 및 차량 속도 산출 차량의 속도와 상관없이 차량 인식 픽셀의 색상(H), 채도(S), 명도(V) 변화 값을 이용하여 교통량 및 차량의 속 도를 산출 차량인식 차량속도 교통량 픽셀 HSV 값 추출 CCTV 영상 27 차량인식 및 교통량, 차량속도 산출 차량인식을 위한 Pixel 선정 Pixel 선정 케이스 데이터 연산량의 문제 All pixel Q) 1시간 동안의 교통량 처리량은? 데이터 연산량의 문제점 Area pixel A) 720*480*3600 = 1,244,160,000 ->약 12억 개의 픽셀 데이터를 처리 데이터 연산량의 문제점 Line pixel 차량 인식을 위한 pixel 선정 중 가장 적합함 Point pixel 선정한 pixel이 이상치(Outlier)일 가능성이 있음 All pixel Area pixel Line pixel 28 Point pixel 차량인식을 위한 Pixel 선정 Line pixel 도로상에 수직선을 Line으로 선정 해당 수직선에 대해 시간에 따른 픽셀의 HSV 값 변화에 대해 히트맵 (HeatMap)을 그려 차량을 인식 A B t1 t2 t3 차량이 지나갈 때 29 t4 t 데이터 분석 데이터 분석 방법 히트맵(HeatMap) 수직선(A-B) Line1~4에 대하여 프레임 수 동안의 색상, 채도, 명도의 변화 값을 표현 3차원 그래프 수직선의 픽셀 대표값(평균) 3개를 샘플링하여 프레임 수 동안의 색상, 채도, 명도의 값을 표현 히트맵(HeatMap) 3차원그래프 A 121 118 117 115 111 107 95 91 87 85 84 82 80 78 76 77 77 79 79 79 79 81 81 82 82 82 83 82 82 82 82 82 82 83 84 85 85 85 87 89 B 111 104 99 89 86 84 86 84 83 82 79 78 77 76 76 77 78 79 79 79 80 80 82 82 81 80 80 81 81 81 80 81 83 85 86 88 89 89 92 92 90 88 87 85 83 82 79 77 75 74 73 73 73 73 81 79 79 79 79 80 79 78 79 79 78 78 78 79 81 82 83 85 87 89 91 91 92 94 94 94 84 83 80 79 79 80 81 82 82 82 82 82 82 81 80 79 79 78 77 78 79 80 80 79 79 80 81 83 85 87 87 89 92 93 94 96 96 97 93 95 81 81 80 81 82 81 80 80 80 79 78 78 78 78 78 78 78 79 78 78 79 81 81 84 86 87 88 90 91 93 91 94 96 97 100 99 98 98 95 93 81 81 82 81 79 78 78 78 78 77 76 77 79 79 79 79 79 79 82 84 85 85 86 89 89 94 93 97 98 100 101 103 99 100 96 97 95 95 102 103 81 79 78 78 78 78 76 78 81 82 80 77 77 77 81 86 88 86 84 86 91 96 100 101 102 103 104 104 104 103 101 103 102 102 106 112 118 118 104 88 75 75 76 77 80 84 81 77 76 79 84 88 89 87 84 89 94 99 102 103 104 105 108 106 105 105 105 104 104 105 113 116 111 104 100 100 105 107 103 101 75 77 78 78 81 81 81 84 85 83 83 87 93 98 104 104 105 105 107 108 109 110 110 108 102 102 109 108 103 102 101 102 106 108 107 106 108 108 113 110 81 81 82 83 85 86 85 89 92 94 95 95 95 97 102 103 102 103 105 105 104 104 105 104 104 106 108 109 110 109 103 100 101 99 102 107 102 99 103 106 84 85 87 90 92 94 98 98 98 100 102 102 101 101 104 103 103 103 104 107 108 109 111 109 106 107 110 108 104 100 103 103 105 106 104 103 105 106 111 106 95 98 100 102 103 103 107 107 104 104 105 104 102 103 104 105 105 105 107 107 106 107 100 104 104 105 109 110 106 103 106 105 102 102 104 105 106 106 106 108 106 107 107 109 110 109 108 107 106 106 106 105 105 104 104 104 104 105 105 105 105 104 105 107 107 108 108 107 105 103 104 102 102 105 107 108 108 104 104 103 108 108 107 107 107 105 106 108 109 108 107 105 104 104 102 101 101 102 106 107 107 106 106 107 106 105 106 104 103 105 103 103 101 101 103 106 105 104 105 103 114 113 110 110 112 113 109 109 109 108 108 106 106 105 102 102 104 105 106 106 106 106 106 106 109 111 107 105 105 104 102 101 103 101 105 105 107 105 104 101 113 113 112 112 111 110 110 110 110 109 107 105 105 105 103 104 105 105 105 104 105 108 103 104 106 107 104 102 101 101 101 100 101 103 105 104 104 106 105 102 117 116 116 115 113 112 110 111 110 107 104 103 105 105 102 102 104 106 105 105 106 107 107 107 106 106 106 105 105 105 102 102 102 103 102 103 104 104 106 104 117 116 115 114 113 112 110 108 108 109 107 103 103 106 104 104 104 105 106 106 105 104 107 106 105 104 103 103 103 102 102 102 102 102 102 102 103 104 105 103 117 116 115 113 112 112 112 110 109 109 107 104 102 103 102 104 105 105 106 107 108 109 107 106 105 104 103 103 103 102 102 102 102 102 102 102 103 104 107 105 117 116 115 113 111 110 111 109 108 107 105 104 103 102 103 104 105 106 107 107 107 108 105 104 104 103 103 102 102 102 102 101 100 99 100 102 104 106 103 102 116 116 115 114 112 112 110 109 109 108 105 103 103 103 103 104 105 107 107 107 106 105 105 104 104 103 103 102 102 102 102 101 100 99 100 102 104 106 104 103 114 113 113 111 110 110 110 109 108 107 105 104 103 103 104 105 107 107 107 107 107 107 105 104 104 103 103 102 102 102 101 101 101 101 102 102 103 103 104 103 115 114 112 112 111 111 111 109 109 108 106 104 104 103 103 104 105 107 107 107 106 106 105 104 104 103 103 102 102 102 101 101 101 101 102 102 103 103 108 105 115 114 114 113 111 111 111 109 109 108 106 104 104 103 103 104 105 107 107 107 106 106 105 104 104 103 103 102 102 102 101 101 101 101 102 102 103 103 108 105 115 114 113 112 112 111 110 110 109 108 106 104 103 103 103 103 104 105 106 106 106 106 105 104 104 103 103 102 102 102 101 101 101 101 102 102 103 103 108 105 118 118 118 117 115 114 112 110 108 105 103 102 102 102 103 104 105 105 105 105 105 104 104 104 104 104 104 103 103 102 101 100 100 101 102 102 102 103 102 102 119 118 118 117 116 114 112 110 109 107 103 101 102 102 102 103 103 104 104 103 103 103 105 106 106 105 105 105 104 103 103 102 101 101 102 103 103 103 102 103 118 118 118 117 113 111 111 110 108 106 105 103 102 101 102 103 104 105 106 105 105 104 106 105 104 104 104 104 103 102 101 101 100 101 102 103 104 104 103 103 117 117 117 116 113 112 111 110 108 106 105 103 102 101 102 103 104 105 106 105 105 104 106 105 104 104 104 104 103 102 101 101 100 101 102 103 104 104 103 103 118 117 116 116 115 114 112 111 109 107 106 104 103 102 103 104 104 105 106 107 106 105 106 105 104 104 104 104 103 102 101 101 100 101 102 103 104 103 102 102 t(프레임 수) 수직선(A-B)에 대한 프레임(t) 동안의 데이터 변화 30 픽셀 대표값 3개 샘플링(상, 중앙, 하) 데이터 분석 실험 대상 차량 대수 : 1대 Line 종류 : 수직선 Line 길이 : 40pixel 프레임 수 : 30프레임 0프레임 29프레임 31 데이터 분석 실험 결과(Line1) 명도의 히트맵 결과에서 차량의 이동에 따른 값 변화가 뚜렷하게 나타남 3차원 그래프를 통해 차량이 이동할 땐 점이 흩어지는 반면 이동하지 않을 땐 점이 모이는 특징이 있음 명도 명도 채도 명도 채도 색상 색상 32 채도 색상 데이터 분석 실험 결과(Line2) 색상, 채도 히트맵에서는 차량의 이동에 따른 변화가 불규칙한 반면, 명도 에서는 차량이 지나감에 따라 뚜렷하게 변화가 나타남 명도 명도 명도 채도 채도 색상 색상 33 채도 색상 데이터 분석 실험 결과(Line3) Line 1, 2의 결과와 마찬가지로 명도의 히트맵에서 차량을 인식 3차원그래프에서는 차량이 Line을 지나감에 따라 점이 흩어지는 특징을 보임 명도 명도 명도 채도 채도 색상 색상 34 채도 색상 데이터 분석 실험 결과(Line4) 명도의 히트맵에서는 차량이 이동할 때 비교적 규칙적인 변화의 특징을 보임 3차원 그래프에서는 앞의 결과와 마찬가지로 차량이 없을 땐 점이 모이고, 차량이 지나갈 땐 점이 흩어지는 특징이 있음 명도 명도 채도 색상 명도 채도 색상 35 채도 색상 감사합니다. 36