오늘은 프로젝트 3일차이다. 어제 1차적으로 시각화를 해봤는데, 엔진 크기별 평균 연비 그래프에서 특이점을 발견해서 도메인 공부를 하면서 원인을 분석하고 적합한 시각화 툴이 뭔지 고민했다.
그래프에서 특이점 발견
엔진 크기별 평균 연비를 시각화한 라인플롯에서 전체적으로는 엔진 크기가 클수록 연비가 낮아지는 경향을 보인다.
하지만 7L 엔진에서 연비가 상대적으로 높게 나타나는 현상을 확인할 수 있었다. 그 원인을 찾기 위해 우선 7L 엔진인 차량 데이터만 추출해보았다.
🔎 원인 분석 - 7L 엔진에서 연비가 상대적으로 높게 나타나는 현상
- 엔진 크기가 7L인 차량 데이터가 8개밖에 없다.
- 작은 표본 크기 데이터의 평균은 통계적으로 신뢰성이 떨어진다.
- 7L 엔진 차량들은 모두 쉐보레 코베트 모델이다.
- 모든 데이터가 쉐보레 코베트라는 특정 모델에 집중되어 있어, 7L 엔진 전체를 대표하지 못한다.
- 코베트의 특수한 설계(경량화, 공기역학적 최적화)가 해당 구간의 연비를 끌어올렸을 가능성
- 모델: 2006-2013년(C6) 쉐보레 코베트
- C6 Z06의 경우 일반 대형차 대비 약 500-700kg 경량화되어 연비에 상당한 개선 효과를 가져왔다.
- 📎 참고자료: https://www.turnerchevy.net/blogs/4845/2024-chevrolet-corvette-specs-unveiling-the-performance-and-features#:~:text=lightweight construction plays a pivotal role
평균의 문제점
위의 원인 분석을 통해 알 수 있듯이 '평균'을 사용하게 되면 이상치에 민감하게 반응하고, 소표본에서 불안정해져 데이터의 분포를 제대로 반영하지 못 한다는 한계가 있었다. 따라서 전체적인 경향을 더 잘 나타낼 수 있는 다른 시각화 방법을 생각해보았다.
엔진 크기 구간화
찾아보니 차량을 분류하는 기준은 국가별로 달라서 주관적이지만, 차량의 크기별로 분류를 했을 때 해당하는 배기량(엔진 크기)이 어느 정도 정해져 있었다. 그래서 그 기준을 사용하되, 데이터 불균형 문제를 보완하기 위해 사분위수 기반으로 나눈 구간을 참고해서 아래와 같이 엔진 크기를 5구간으로 나누었다.
구간명 | 범위 |
소형 | ~1.5L |
중소형 | 1.6 ~ 2.0L |
중형 | 2.1 ~ 3.0L |
대형 | 3.1 ~ 4.0L |
초대형 | 4.0L~ |
📎 참고: https://ko.wikipedia.org/wiki/자동차_분류
박스플롯
각 구간별 데이터 분포와 이상치를 종합적으로 분석하기 위해 박스플롯으로 시각화하였다.
🔹 엔진 크기 - 연비
- 엔진 크기가 증가할수록 연비가 명확하게 감소하는 패턴
- 중앙값이 순차적으로 하락(37→33→29→25→21 mpg)
- 중형(2.1~3.0L) / 대형(3.1~4.0L) 구간 상위 이상치 다수 존재
- 이상치 데이터의 대부분이 하이브리드 시스템이 적용된 차량
- ’MODEL’ 컬럼 분석 -> 중형은 47%, 대형은 76%가 하이브리드 차량
- 하이브리드 차량은 같은 엔진 크기여도 내연기관과 전기모터의 시너지 효과로 연비가 현저히 향상된다.
- 이상치 데이터의 대부분이 하이브리드 시스템이 적용된 차량
🔹 엔진 크기 - 배출량
- 엔진 크기가 증가할수록 배출량이 명확하게 증가하는 패턴
- 연비 그래프와 정반대의 분포
💡친환경 차량 개발을 위해서는 작은 크기의 엔진을 사용하는 것이 좋을 것이다!
💬 같은 데이터여도 어떤 시각화 기법을 사용하느냐에 따라 다르게 해석할 수도 있고, 새로운 인사이트를 얻을 수도 있다는 것을 알 수 있었다. 데이터 형태와 분포마다 적합한 그래프를 선택하는 것이 중요한 것 같은데 아직 그 기준을 뚜렷하게 모르겠으니.. 여러가지 시도를 해보면서 공부해야겠다.
'프로젝트 > 기초 프로젝트' 카테고리의 다른 글
[ 기초 프로젝트 ] 결론 도출 및 회고 (0) | 2025.06.16 |
---|---|
[ 기초 프로젝트 ] 그래프 수정 및 인사이트 도출 (4) | 2025.06.13 |
[ 기초 프로젝트 ] 인사이트 도출 (0) | 2025.06.12 |
[ 기초 프로젝트 ] 데이터 탐색 및 시각화 (0) | 2025.06.10 |
[ 기초 프로젝트 ] 주제 선정 및 기획서 작성 (2) | 2025.06.09 |