카테고리 없음

Excel로 상관계수를 구하는 2가지 방법을 해설! [CORREL 함수]

DKel 2021. 8. 21. 21:09
반응형
상관계수란?
Excel의 데이터 분석에서는 정보가 되는 2개의 숫자를 기본으로 하여 각각 상관계계가 있는지를 상관계수를 내어 확인할 수 있습니다.
그 요구방법에는 Excel의 데이터분석에서 상관기능을 사용하는 방법과 Correl함수·Pearson함수를 사용하는 방법의 2가지가 있습니다.
숫자의 결과는, 1에서 -1사이가 됩니다.
1에 가까운 과정의 상관관계로 상관성이 있으며, 어느 쪽이 증가하면 다른 쪽도 증가하게 됩니다.
-1에 가까운 것과 부의 상관관계로, 어느 한 쪽의 숫자가 늘어나면 다른 한 쪽도 줄어든다는 것입니다.
0은 상관성이 없어요.
예로서 고객의 성별이나 연령에 따른 인원수와 매출 상품의 수, 기온과 계절별 상품의 매출 수 등 데이터를 분석하여 상관성이 있는지를 확인할 수 있습니다.
Excel에서 상관계수를 구하는 두 가지 방법
이제부터 Excel에서 상관계수를 구하는 두 가지 방법을 소개하겠습니다.
하나는, 데이터 분석의 상관 기능을 사용하는 방법, 다른 하나는 Correl 함수나 Pearson 함수를 사용하는 방법입니다.
어느 쪽에서도 상관계수를 구할 수 있기 때문에 사용하기 쉬운 방법을 시도해 봅시다.
데이터 분석의 상관관계 기능을 사용하다
엑셀(Excel) 데이터에 ′데이터 분석′을 표시하다
엑셀의 데이터에 [데이터 분석] 표시가 나와 있지 않은 경우에는 먼저 표시한 후 사용합니다.
「파일」→「옵션」을 클릭합니다.
「ad-in」을 클릭해, 아래에 있는 관리 박스를 「Excel ad-in」이라고 하고 나서 「설정」을 누릅니다.
「분석 툴」에 체크를 하고 OK를 누릅니다.
「데이터」탭에 「데이터 분석」이라고 표시되었습니다.
여기서부터 실제로 데이터 분석을 사용해 보겠습니다.
데이터 분석을 쓰다
「데이터」탭의 「데이터 분석」을 클릭합니다.
데이터 분석의 다이얼로그 상자가 나오면 「상관」을 선택해 OK를 누릅니다.
2가지 분석하고자 하는 데이터 범위를 선택합니다.
여기에서는 집객 수와 계절 지수의 숫자를 선택합니다.
상관 대화 상자에서 입력 범위가 설정됩니다.
열이나 행을 확인하고 출력처도 정했으면 OK를 누르세요.
상관계수를 구할 수 있었습니다.
Correl 함수, Pearson 함수를 사용한다.
지금부터는 Excel 함수를 사용해서 값을 구하겠습니다.
Correl 함수와 Pearson 함수 2개를 이용합니다만, 모두 같은 결과가 됩니다.
상관계수를 내고 싶은 셀을 선택하고 ′= Correl(배열1, 배열2)′이라고 입력합니다.
엔터를 눌러야죠
그림의 배열 1과 배열 2의 상관계수를 구한 결과, 0.997이 되었습니다.
0.997이라는 숫자는 1에 가깝기 때문에 플러스 상관관계가 있다는 뜻입니다.
상관성이 있는지 없는지는 이 도표에서 판단할 수 있습니다.
Correl 함수와 Pearson 함수의 차이점
Correl 함수는 2개 데이터의 상관성이 있는지 확인합니다.
Pearson(피어슨) 함수는 피어슨의 적률 상관계수인 r의 값을 구합니다.
어느 함수를 사용하든 결과의 숫자는 같아집니다.
피어슨의 적률 상관계수는 이쪽 식으로 값을 구할 수 있습니다만 Excel의 Pearson 함수로 간단히 할 수 있습니다.
셀에 「= Pearson(열 1, 열 2)」이라고 입력해, Enter 를 누릅니다.
결과는 Correl 함수와 같은 숫자가 됩니다.
이 그림에서는 0.8068이 되어 플러스 상관성이 있다고 판단할 수 있습니다.
Correl 함수의 경우와 마찬가지로 1에서 1 사이의 숫자가 나오므로 상관관계가 있는지 없는지를 어느 쪽으로 판단할 수 있습니다.
이와 같이 Pearson 함수에서도 상관계수를 구할 수 있었습니다.
반응형