1. 평균이란 무엇일까?
평균은 여러 숫자들의 합을 그 숫자들의 개수로 나눈 값입니다. 쉽게 말해, 모든 숫자들의 중간 값을 의미합니다.
예를 들어 5, 7, 9 세의 세 자녀가 있다면, 자녀들의 나이의 평균은 (5 + 7 + 9) / 3 = 7세입니다.
1) 평균의 장점
가) 데이터의 중심 경향을 간단하게 파악할 수 있습니다.
시험 점수, 설문 조사 결과, 생산량 등 다양한 데이터의 전반적인 수준을 파악하는 데 유용합니다.
예를 들어, 온라인 쇼핑몰에서 판매되는 제품의 평균 평점을 통해 제품의 전반적인 인지도를 파악할 수 있습니다.
데이터를 요약하고 비교할 수 있습니다.
나) 여러 그룹의 데이터를 비교하거나 시간 경과에 따른 변화를 파악하는 데 활용할 수 있습니다.
예를 들어, 각 학년별 평균 체육 점수를 비교하여 학년별 체력 수준을 파악하거나, 연도별 평균 소득을 비교하여
소득 수준 변화를 파악할 수 있습니다.
다) 대량의 데이터를 다룰 때 편리하게 활용할 수 있습니다.
수백, 수천 개의 데이터를 다룰 때 대표적인 값을 쉽게 파악하는 데 유용합니다.
예를 들어, 날씨 데이터 분석에서 수백 개의 기온 데이터를 평균하여 지역의 평균 기온을 파악할 수 있습니다.
2) 평균의 한계
-모든 숫자들의 값을 반영하지 못합니다.
-극단적인 값 (최고값, 최저값)에 의해 영향을 받을 수 있습니다.
-데이터의 분포를 정확하게 나타내지 못할 수 있습니다.
-데이터의 분포가 넓거나 극단적인 값이 존재하는 경우 데이터를 대표하기 어렵습니다.
3) 평균의 함정
평균의 함정은 평균만으로는 데이터의 전체적인 그림을 파악하기 어렵고 데이터의 다양성을 찾지 못할 수 있습니다.
평균에만 의존하면 잘못된 판단을 내릴 수 있으며 특히 평균을 산출한 사람의 의도에 따라 판단하게 되는 문제가 발생할 수
있습니다.
코끼리의 전체 모습을 보아야 하는데 다리만 보고 기둥이라고 판단할 수 있는 것입니다.
가) 시험 점수: 한 학급의 시험 평균이 80점이라고 해서 모든 학생이 80점을 받았다는 의미는 아닙니다.
일부 학생들은 90점 이상을 받았을 수도 있고, 70점 이하를 받았을 수도 있습니다.
또한 시험 평균점만 보고 자신의 학력 수준을 과소평가하거나 과대평가 한는 오류가 발생 할 수 있습니다.
시험 평균점은 학생들의 학력 수준을 단순히 비교하는 데 제한적이며, 개인의 학습 성과와 노력 정도를
정확하게 반영하지 못할 수 있습니다. 개인의 학업 성취도는 시험 점수뿐 아니라 과제, 참여도, 개인별 평가
등을 종합적으로 고려해야 합니다.
나) 대학교 평균 입학률: 높은 평균 입학률만 보고 특정 대학교의 교육 수준이 뛰어나다고 오해하거나,
자신의 진학 가능성을 낮게 평가할 수 있습니다.
평균 입학률은 특정 대학교의 경쟁 수준을 나타내는 지표이지만, 교육 수준이나 학생들의 만족도를
직접적으로 보여주는 것은 아닙니다.
대학교의 교육 프로그램, 교수진, 학생 환경, 취업률 등 다양한 요소들을 종합적으로 고려하며
진학 결정을 내려야 합니다.
다) 소득 분포: 한 나라의 평균 소득이 높다고 해서 모든 사람들이 풍요로운 삶을 살고 있다는 의미는 아닙니다.
일부 사람들은 매우 높은 소득을 가지고 있을 수도 있고, 일부 사람들은 매우 낮은 소득을 가지고 있을
수도 있습니다.
높은 평균 소득 수치만 보고 자신이 가난하다고 생각하거나, 사회적 불평등이 심각하다고 오해할 수 있습니다.
평균 소득은 소득 분포를 고려하지 않아 상위 고소득층의 영향을 크게 받습니다.
중위 소득, 빈곤율, 지니계수 등 다른 지표를 함께 살펴보아야 소득 분포와 불평등 수준을 정확하게 파악할
수 있습니다.
라)경제 성장율: 높은 경제 성장률만 보고 경제가 발전했다고 판단하거나, 개인의 경제적 어려움을 무시할 수 있습니다.
실업률, 물가 상승률, 소득 분포 변화 등 다른 지표들을 함께 고려해야 개인의 경제적 처지와 삶의 질 향상
여부를 평가하도록 하여야 합니다.
마)주택 가격: 한 지역의 평균 주택 가격이 5억원이라고 해서 모든 주택이 5억원에 거래된다는 의미는 아닙니다.
저렴한 주택도 있고, 고가 주택도 있을 수 있습니다.
특정 숫자에 고정되어 그것이 기준이라고 판단하는 것은 다양한 판단을 포기하는 것입니다.
2.평균과 함께 균형 있게 볼 수 있는 중간값
중간값은 데이터를 오름차순 또는 내림차순으로 정렬했을 때 중앙에 위치하는 값입니다.
데이터 개수가 짝수인 경우, 중앙에 위치하는 두 값의 평균을 중간값으로 합니다.
1) 중간값 활용
가) 극단적인 값에 영향을 받지 않고 데이터의 중심 경향을 파악:
설문 조사 결과, 소득 분포, 주택 가격 등 데이터의 분포가 넓거나 극단적인 값이 존재하는 경우 평균값은 왜곡되는
경우가 많으므로 중간값을 활용하는 것이 적절합니다.
예를 들어, 소득 분포 데이터에서 중간값을 통해 중위 소득을 파악하고, 소득 불평등 정도를 분석할 수 있습니다.
나) 순서 있는 데이터 분석: 대기 시간, 처리 시간, 생산 순서 등 데이터가 순서대로 정렬되어 있는 경우 중간값을
활용하는 것이 효과적입니다.
예를 들어, 고객센터 대기 시간 데이터에서 중간값을 통해 고객이 평균적으로 얼마나 기다려야 하는지를 파악할 수
있습니다.
다) 데이터의 분포 파악:
사분위수(4개그룹으로 나눈 각각 평균값), 백분위수 등 다른 통계 지표와 함께 중간값을 활용하여 데이터의 분포
특징을 파악할 수 있습니다.
예를 들어, 시험 점수 데이터에서 사분위수와 함께 중간값을 활용하여 학생들의 점수 분포를 파악하고,
상위 그룹과 하위 그룹의 비율을 분석할 수 있습니다.
2)평균값과 중간값의 차이점
기준
|
평균값 | 중간값 |
계산 방식 | 모든 데이터 값들의 합을 데이터 개수로 나눔 | 데이터를 오름차순 또는 내림차순으로 정렬하여 중앙에 위치하는 값을 선택 |
특징 | * 모든 데이터 값을 반영합니다. * 데이터의 중심 경향을 나타냅니다. * 극단적인 값 (최고값, 최저값)에 영향을 받을 수 있습니다. * 데이터의 분포를 정확하게 나타내지 못할 수 있습니다. |
* 극단적인 값 (최고값, 최저값)에 영향을 받지 않습니다. * 데이터의 분포를 나타내는 데 유용합니다. * 데이터 개수가 짝수인 경우 두 개의 값을 평균해야 하기 때문에 계산 방식이 다소 복잡할 수 있습니다. |
장점 | * 데이터를 요약하고 비교하는 데 유용합니다. * 대량의 데이터를 다룰 때 편리하게 활용할 수 있습니다. |
* 극단적인 값에 영향을 받지 않아 데이터의 중심 경향을 정확하게 나타낼 수 있습니다. * 순서 있는 데이터에 적용하기 용이합니다. |
단점 | * 극단적인 값에 영향을 받아 데이터의 중심 경향을 정확하게 나타내지 못할 수 있습니다. * 데이터의 분포를 정확하게 나타내지 못할 수 있습니다. |
* 데이터 개수가 짝수인 경우 두 개의 값을 평균해야 하기 때문에 계산 방식이 다소 복잡할 수 있습니다. * 0에 가까운 값들이 많거나 극단적인 값들이 있는 경우 중간값이 데이터의 실제적인 중심 경향을 나타내지 못할 수 있습니다. |
활용 상황 | * 데이터의 중심 경향을 간단하게 파악하고 싶을 때 * 데이터를 요약하고 비교하고 싶을 때 * 대량의 데이터를 다룰 때 |
* 극단적인 값에 영향을 받지 않고 데이터의 중심 경향을 파악하고 싶을 때 * 순서 있는 데이터를 분석하고 싶을 때 * 데이터의 분포를 파악하고 싶을 때 |
3. 평균의 함정을 피하는 방법
1) 왜곡된 인식 방지
평균값만 보고 현실을 판단하면 데이터의 실제 모습을 숨기고 왜곡된 인식을 초래할 수 있습니다.
예를 들어, 높은 평균 소득 수치만 보고 자신이 가난하다고 생각하거나, 낮은 범죄율만 보고 사회가 안전하다고 오해할 수 있습니다.
2) 데이터 출처 및 방법 확인
누가, 어떻게 데이터를 수집했는지 명확하게 제시되어 있는지 확인합니다.
데이터 수집 방식에 따라 결과에 편향이 있을 수 있습니다.
신뢰할 수 있는 출처의 데이터인지 확인이 필요 합니다.
3) 제시된 평균이 무엇을 의미하는지 이해
평균값은 어떤 범위의 데이터를 대상으로 계산되었는지 확인 합니다.
평균값이 높다고 해서 모든 대상이 그 수준인 것은 아닙니다.
데이터의 분포와 특징을 고려하여 평균값을 해석해야 합니다.
4) 비판적 사고
통계에 대한 무조건 적인 신뢰가 아닌 객관적 시각 필요
통계 정보를 비판적으로 분석하고 해석
다양한 정보를 참고하여 판단
5) 기준점 지정(상대적 개념보다 절대적 개념)
평균연봉은 소수의 고소득자에 의해 크게 끌어올려질 수 있습니다.
다들 부자처럼 사는것 같고 내가 뒤쳐지는 것 같이 보는 것은 소수의 고소득자를 기준으로 판단하는 오류로
기준점에 따른 상대적인 비교이며 왜곡된 것입니다.
나 자신이 기준점이며 절대적 개념으로 연봉과 과거 연봉 대비 증가율등 개인의 성장에 집중 합니다.
자신의 판단 기준을 가지고 정보를 평가하는 객관성이 필요
6) 개인의 가치관 및 목표 설정
평균값은 개인의 가치관, 목표, 상황을 반영하지 못합니다. 따라서 평균의 함정에서 벗어나 자신의 가치관 및 목표를 설정해야 합니다. 예를 들어, 높은 평균 연봉만 보고 성공적인 삶을 추구하기보다는, 자신이 중요하게 생각하는 가치와 목표를 설정하고 이를 위해 노력하는 것이 중요합니다.
4. 마무리
우리는 평균에 속지 않도록 주의해야 합니다.
우리 주변은 뉴스, 기사, 통계 등 다양한 정보로 가득 차 있습니다.
이러한 정보들을 이해하고 평가하기 위해서는 많은 자료에서 핵심인 부분을 뽑아내기 위해서는 통계 지표를 활용하는 것이 일반적입니다. 그러나 가장 흔히 사용되는 통계 지표 중 하나인 전체 집단에서 평균을 산출하는 것은 "평균의 함정"
이라는 문제점을 가지고 있습니다.
예) A:100, B:12, C:10, D:8, E:6이라면 5명의 평균은 27.2입니다. 5명이기에 우리는 평균이 일반적이지 않고 왜곡된 것을 바로 알아볼수 있지만 수만, 수십만이 된다면 우리는 알아채기 쉽지 않습니다.
평균값은 데이터를 요약하고 비교하는데 유용한 지표이지만, 앞에서 예시로 살펴본 27.2의 평균값만 단독으로 사용하면
데이터의 전체적인 분포와는 다른 왜곡된 판단을 하게 되고 오해의 소지가 발생할 수 있습니다.
따라서 우리는 평균의 함정에서 벗어나 다양한 통계 지표를 활용하고, 데이터 출처 및 방법을 확인하고, 자신의 경험과 상황을 고려하며, 비판적 사고를 가지고 정보를 분석해야 합니다.
이를 통해 우리는 왜곡된 현실 인식을 방지하고, 올바른 판단 및 의사 결정을 내리고, 개인의 가치관 및 목표를 설정하며, 우리의 삶에서 누군가의 의도에 휘둘리는 것이 아닌 자신의 기준에 따라 정보를 활용할 수 있는 자유민이며 자본주의 사회의 진정한 구성원이 될 수 있을 것입니다.