본문 바로가기
아빠/취미

데이터 분석 - 엑셀 활용

by SiKi's 2024. 7. 8.

요즘 엑셀로 데이터 분석하는 방안을 여러가지로 알아보고 있다.

 

그러다 엑셀에서 데이터 분석을 위한 도구를 제공하고 있는걸 알았고 추가 방법은 아래 순서와 같다.

파일 > 옵션 > 추가기능 > 관리 >이동 > '분석도구' 체크 > 확인

추가하고 나면 위의 파란박스 처럼 나오게 된다.

다시 엑셀을 열어보면 아래와 같이 '데이터' 메뉴에서 '데이터 분석' 버튼이 활성화 된다.

 

버튼을 누르면 '통계 데이터 분석' 창이 보이는데 여기에서 그나마 가장 많이 활용할 만한것이 '기술 통계법'과 '히스토그램'이 있다. 사실 '히스토그램'은 차트에도 있기 때문에 '기술 통계법'만 살짝 알아보면..

 

 

아래와 같이 평균부터 통계에 필요한 각종 데이터를 보여준다. 물론 이것들은 엑셀에서 바로 수식적용하여 구할 수도 있다.

 

정규분포를 따르는지 판단하는 방법은 보통 히스토그램으로 나타내어 종 모양의 분포를 보이는지 확인한다. 정규분포는 좌우대칭이며 중앙이 가장 높은 종 모양을 보인다. 그리고 엑셀에서 기술 통계량을 이용한 방법이 있다.

- 왜도(Skewess) : 분포의 비대칭 정도를 나타내는 지표, 왜도가 0에 가까울수록 정규분포에 가깝다.

- 첨도(Kurtosis) : 분포의 뾰족한 정도를 나타내는 지표, 첨도가 3에 가까울수록 정규분포에 가깝다.

 

위에 나온 기술적 통계를 보면 왜도는 -0.915 음수 값을 가지며 이는 데이터 분포가 왼쪽으로 치우쳐 있음을 나타낸다. 즉, 작은값들이 더 많고 큰 값들은 적다는 의미이다.

첨도는 1.107로 3보다 작으면 정규 분포보다 완만한 형태를 띠고 있다는 것을 의미한다.

 


여기까지만 하면 '히스토그램'과 데이터 분포가 어떠한지 대충 감은 잡을 수 있다. 하지만 좀 더 욕심을 내자면...나도 히스토그램과 정규분포 그래프가 겹치게 만들고 싶었다.

해보고 나서 말하지만.. 삽질 참 많이 했다. 결국엔 해외 유투버가 만들어놓은 영상으로 해결이 되었다. 키는 엑셀에서 제공하는 히스토그램 차트, 데이터 분석 툴을 그대로 쓰면 안된다. 꺽은선으로 히스토그램 차트처럼 만들고 추가로 정규분포 데이터를 삽입하여 2개의 차트가 겹치게 보이는 효과를 주는 것이다. 

 

계급을 나누어 데이터의 빈도수를 체크 (히스토그램)한 뒤, 동일한 계급으로 NORM.DIST 함수로 정규분포의 확률 밀도 함수를 만든다.

 

사실 꺽은선에서 막대그래프를 어떻게 만드는지가 참 궁금했는데 아래 영상 보면 금방 해결된다.

하..몇시간을 여기에 버린건지;; 졸리다. 두서없더라도 용서를..

 

 

반응형