Как да се изчисли коефициентът на линейна корелация

Автор: Eric Farmer
Дата На Създаване: 7 Март 2021
Дата На Актуализиране: 1 Юли 2024
Anonim
Gen5: Complete Tutorial
Видео: Gen5: Complete Tutorial

Съдържание

Коефициентът на корелация (или коефициент на линейна корелация) се обозначава като "r" (в редки случаи като "ρ") и характеризира линейната корелация (тоест връзката, която се дава от някаква стойност и посока) на две или повече променливи. Стойността на коефициента е между -1 и +1, тоест корелацията може да бъде както положителна, така и отрицателна. Ако коефициентът на корелация е -1, има перфектна отрицателна корелация; ако коефициентът на корелация е +1, има перфектна положителна корелация. В противен случай има положителна корелация между двете променливи, отрицателна корелация или липса на корелация. Коефициентът на корелация може да се изчисли ръчно, с безплатни онлайн калкулатори или с добър графичен калкулатор.

Стъпки

Метод 1 от 4: Изчисляване на коефициента на корелация ръчно

  1. 1 Събиране на данни. Преди да започнете да изчислявате коефициента на корелация, изучете тези двойки числа. По -добре ги запишете в таблица, която може да бъде подредена вертикално или хоризонтално. Етикетирайте всеки ред или колона с "x" и "y".
    • Например, дадени са четири двойки стойности (числа) на променливите "x" и "y". Можете да създадете следната таблица:
      • x || y
      • 1 || 1
      • 2 || 3
      • 4 || 5
      • 5 || 7
  2. 2 Изчислете средната аритметична стойност "x". За да направите това, добавете всички стойности x и след това разделете резултата на броя на стойностите.
    • В нашия пример има четири стойности за променливата "x". За да изчислите средната аритметична стойност "x", добавете тези стойности и след това разделете сумата на 4. Изчисленията се записват, както следва:
    • μх=(1+2+4+5)/4{ displaystyle mu _ {x} = (1 + 2 + 4 + 5) / 4}
    • μх=12/4{ displaystyle mu _ {x} = 12/4}
    • μх=3{ displaystyle mu _ {x} = 3}
  3. 3 Намерете средното аритметично "y". За да направите това, следвайте същите стъпки, тоест добавете всички стойности на y и след това разделете сумата на броя на стойностите.
    • В нашия пример са дадени четири стойности на променливата "y". Добавете тези стойности и след това разделете сумата на 4. Изчисленията ще бъдат записани, както следва:
    • μy=(1+3+5+7)/4{ displaystyle mu _ {y} = (1 + 3 + 5 + 7) / 4}
    • μy=16/4{ displaystyle mu _ {y} = 16/4}
    • μy=4{ displaystyle mu _ {y} = 4}
  4. 4 Изчислете стандартното отклонение "x". След като изчислите средните стойности на "x" и "y", намерете стандартните отклонения на тези променливи. Стандартното отклонение се изчислява по следната формула:
    • σх=1н1Σ(хμх)2{ displaystyle sigma _ {x} = { sqrt {{ frac {1} {n-1}} Sigma (x- mu _ {x}) ^ {2}}}}
    • В нашия пример изчисленията ще бъдат написани така:
    • σх=141((13)2+(23)2+(43)2+(53)2){ displaystyle sigma _ {x} = { sqrt {{ frac {1} {4-1}} * ((1-3) ^ {2} + (2-3) ^ {2} + ( 4-3) ^ {2} + (5-3) ^ {2})}}}
    • σх=13(4+1+1+4){ displaystyle sigma _ {x} = { sqrt {{ frac {1} {3}} * (4 + 1 + 1 + 4)}}}
    • σх=13(10){ displaystyle sigma _ {x} = { sqrt {{ frac {1} {3}} * (10)}}}
    • σх=103{ displaystyle sigma _ {x} = { sqrt { frac {10} {3}}}}
    • σх=1,83{ displaystyle sigma _ {x} = 1,83}
  5. 5 Изчислете стандартното отклонение "y". Следвайте стъпките, описани в предишната стъпка. Използвайте същата формула, но включете стойностите y.
    • В нашия пример изчисленията ще бъдат написани така:
    • σy=141((14)2+(34)2+(54)2+(74)2){ displaystyle sigma _ {y} = { sqrt {{ frac {1} {4-1}} * ((1-4) ^ {2} + (3-4) ^ {2} + ( 5-4) ^ {2} + (7-4) ^ {2})}}}
    • σy=13(9+1+1+9){ displaystyle sigma _ {y} = { sqrt {{ frac {1} {3}} * (9 + 1 + 1 + 9)}}}
    • σy=13(20){ displaystyle sigma _ {y} = { sqrt {{ frac {1} {3}} * (20)}}}
    • σy=203{ displaystyle sigma _ {y} = { sqrt { frac {20} {3}}}}
    • σy=2,58{ displaystyle sigma _ {y} = 2,58}
  6. 6 Запишете основната формула за изчисляване на коефициента на корелация. Тази формула включва средните стойности, стандартните отклонения и броя (n) на двойки числа от двете променливи. Коефициентът на корелация се обозначава като "r" (в редки случаи като "ρ"). Тази статия използва формула за изчисляване на коефициента на корелация на Пиърсън.
    • ρ=(1н1)Σ(хμхσх)(yμyσy){ displaystyle rho = наляво ({ frac {1} {n-1}} вдясно) Sigma наляво ({ frac {x- mu _ {x}} { sigma _ {x}} } вдясно) * вляво ({ frac {y- mu _ {y}} { sigma _ {y}}} вдясно)}
    • Тук и в други източници количествата могат да се означават по различни начини. Например, някои формули съдържат „ρ“ и „σ“, докато други съдържат „r“ и „s“. Някои учебници дават различни формули, но те са математически аналози на горната формула.
  7. 7 Изчислете коефициента на корелация. Изчислили сте средните стойности и стандартните отклонения на двете променливи, така че можете да използвате формулата за изчисляване на коефициента на корелация. Припомнете си, че "n" е броят на двойките стойности за двете променливи. Други стойности са изчислени по -рано.
    • В нашия пример изчисленията ще бъдат написани така:
    • ρ=(1н1)Σ(хμхσх)(yμyσy){ displaystyle rho = наляво ({ frac {1} {n-1}} вдясно) Sigma наляво ({ frac {x- mu _ {x}} { sigma _ {x}} } вдясно) * вляво ({ frac {y- mu _ {y}} { sigma _ {y}}} вдясно)}
    • ρ=(13){ displaystyle rho = наляво ({ frac {1} {3}} надясно) *}[(131,83)(142,58)+(231,83)(342,58){ displaystyle наляво ({ frac {1-3} {1.83}} right) * left ({ frac {1-4} {2.58}} right) + left ({ frac {2 -3} {1,83}} вдясно) * вляво ({ frac {3-4} {2,58}} вдясно)}
         +(431,83)(542,58)+(531,83)(742,58){ displaystyle + наляво ({ frac {4-3} {1.83}} right) * left ({ frac {5-4} {2.58}} right) + left ({ frac { 5-3} {1,83}} вдясно) * вляво ({ frac {7-4} {2,58}} вдясно)}]
    • ρ=(13)(6+1+1+64,721){ displaystyle rho = наляво ({ frac {1} {3}} вдясно) * наляво ({ frac {6 + 1 + 1 + 6} {4.721}} вдясно)}
    • ρ=(13)2,965{ displaystyle rho = наляво ({ frac {1} {3}} надясно) * 2.965}
    • ρ=(2,9653){ displaystyle rho = наляво ({ frac {2,965} {3}} надясно)}
    • ρ=0,988{ displaystyle rho = 0,988}
  8. 8 Анализирайте резултата. В нашия пример коефициентът на корелация е 0.988. Тази стойност по някакъв начин характеризира даден набор от двойки числа. Обърнете внимание на знака и големината на стойността.
    • Тъй като стойността на корелационния коефициент е положителна, има положителна корелация между променливите "x" и "y". Тоест, с увеличаване на стойността на "x", стойността на "y" също се увеличава.
    • Тъй като стойността на коефициента на корелация е много близка до +1, стойностите на променливите "x" и "y" са силно свързани. Ако поставите точки на координатната равнина, те ще бъдат разположени близо до някаква права линия.

Метод 2 от 4: Използване на онлайн калкулатори за изчисляване на коефициента на корелация

  1. 1 Намерете калкулатор в Интернет, за да изчислите коефициента на корелация. Този коефициент често се изчислява в статистиката. Ако има много двойки числа, е почти невъзможно ръчно да се изчисли коефициентът на корелация. Следователно има онлайн калкулатори за изчисляване на коефициента на корелация. В търсачката въведете „калкулатор на коефициента на корелация“ (без кавички).
  2. 2 Въвеждане на данни. Проверете инструкциите на уебсайта, за да въведете правилните данни (двойки числа). Наложително е да въведете съответните двойки числа; в противен случай ще получите грешен резултат. Не забравяйте, че различните уебсайтове имат различни входни формати.
    • Например, на http://ncalculators.com/statistics/correlation-coefficient-calculator.htm стойностите на променливите x и y се въвеждат в два хоризонтални реда. Стойностите са разделени със запетаи. Тоест в нашия пример стойностите "x" се въвеждат така: 1,2,4,5, а стойностите "y" по следния начин: 1,3,5,7.
    • На друг сайт, http://www.alcula.com/calculators/statistics/correlation-coefficient/, данните се въвеждат вертикално; в този случай не бъркайте съответните двойки числа.
  3. 3 Изчислете коефициента на корелация. След като въведете данните, просто кликнете върху бутона „Изчисляване“, „Изчисляване“ или подобен, за да получите резултата.

Метод 3 от 4: Използване на графичен калкулатор

  1. 1 Въвеждане на данни. Вземете графичен калкулатор, отидете в режим на статистическо изчисление и изберете командата "Редактиране".
    • Различните калкулатори изискват натискане на различни клавиши. Тази статия разглежда калкулатора Texas Instruments TI-86.
    • Натиснете [2 -ри] - Stat (над бутона +), за да влезете в режим на статистическо изчисление. След това натиснете F2 - Редактиране.
  2. 2 Изтрийте предишните записани данни. Повечето калкулатори съхраняват въведените от вас статистически данни, докато не ги изтриете. За да избегнете объркване на стари данни с нови, първо изтрийте всяка съхранена информация.
    • Използвайте клавишите със стрелки, за да преместите курсора и да маркирате заглавието „xStat“. След това натиснете Clear и Enter, за да изчистите всички стойности, въведени в колоната xStat.
    • Използвайте клавишите със стрелки, за да маркирате заглавието „yStat“. След това натиснете Изчистване и Enter, за да изчистите всички стойности, въведени в колоната yStat.
  3. 3 Въведете първоначалните данни. Използвайте клавишите със стрелки, за да преместите курсора към първата клетка под заглавието „xStat“. Въведете първата стойност и натиснете Enter. В долната част на екрана се показва „xStat (1) = __“, като въведената стойност замества интервал. След като натиснете Enter, въведената стойност ще се появи в таблицата и курсорът ще се премести на следващия ред; това ще покаже „xStat (2) = __“ в долната част на екрана.
    • Въведете всички стойности за променливата "x".
    • След като въведете всички стойности за x, използвайте клавишите със стрелки, за да преминете към колоната yStat и въведете стойностите за y.
    • След като въведете всички двойки числа, натиснете Изход, за да изчистите екрана и да излезете от режима на агрегиране.
  4. 4 Изчислете коефициента на корелация. Той характеризира колко близо са данните до определена права линия. Графичният калкулатор може бързо да определи подходящата права линия и да изчисли коефициента на корелация.
    • Щракнете върху Stat - Calc. На TI -86 натиснете [2 -ри] - [Стат] - [F1].
    • Изберете функцията Линейна регресия. На TI-86 натиснете [F3] с надпис „LinR“. Екранът ще покаже реда "LinR _" с мигащ курсор.
    • Сега въведете имената на две променливи: xStat и yStat.
      • На TI-86 отворете списъка с имена; за да направите това, натиснете [2 -ри] - [Списък] - [F3].
      • Наличните променливи се показват в долния ред на екрана. Изберете [xStat] (вероятно ще трябва да натиснете F1 или F2, за да направите това), въведете запетая и след това изберете [yStat].
      • Натиснете Enter, за да обработите въведените данни.
  5. 5 Анализирайте резултатите си. С натискане на Enter екранът ще покаже следната информация:
    • y=а+бх{ displaystyle y = a + bx}: това е функцията, която описва линията. Моля, обърнете внимание, че функцията не е написана в стандартен вид (y = kx + b).
    • а={ displaystyle a =}... Това е y-координатата на пресечната точка на правата линия с оста y.
    • б={ displaystyle b =}... Това е наклонът на линията.
    • corr={ displaystyle { text {corr}} =}... Това е коефициентът на корелация.
    • н={ displaystyle n =}... Това е броят на двойките числа, използвани при изчисленията.

Метод 4 от 4: Обясняване на основните понятия

  1. 1 Разберете концепцията за корелация. Корелацията е статистическата връзка между две величини. Коефициентът на корелация е числова стойност, която може да бъде изчислена за всеки два набора от данни. Стойността на коефициента на корелация винаги се намира в диапазона от -1 до +1 и характеризира степента на връзка между две променливи.
    • Например, като се има предвид ръстът и възрастта на децата (около 12 години). Най -вероятно ще има силна положителна корелация, тъй като децата с възрастта стават по -високи.
    • Пример за отрицателна корелация: наказателни секунди и време, прекарано в тренировки по биатлон, тоест колкото повече спортист тренира, толкова по -малко наказателни секунди ще бъдат присъдени.
    • И накрая, понякога има много малка връзка (положителна или отрицателна), като например между размера на обувката и математическите резултати.
  2. 2 Спомнете си как се изчислява средната аритметика. За да изчислите средната аритметична стойност (или средната стойност), трябва да намерите сумата от всички тези стойности и след това да я разделите на броя на стойностите. Не забравяйте, че средната аритметична стойност е необходима за изчисляване на коефициента на корелация.
    • Средната стойност на променлива се обозначава с буква с хоризонтална лента над нея. Например, в случай на променливите "x" и "y", техните средни стойности се означават, както следва: x̅ и y̅. Средната стойност понякога се обозначава с гръцката буква „μ“ (mu). За да напишете средната аритметична стойност на стойностите на променливата "x", използвайте обозначението μх или μ (x).
    • Например, като се имат предвид следните стойности за променливата "x": 1,2,5,6,9,10. Средната аритметична стойност на тези стойности се изчислява, както следва:
      • μх=(1+2+5+6+9+10)/6{ displaystyle mu _ {x} = (1 + 2 + 5 + 6 + 9 + 10) / 6}
      • μх=33/6{ displaystyle mu _ {x} = 33/6}
      • μх=5,5{ displaystyle mu _ {x} = 5,5}
  3. 3 Обърнете внимание на важността на стандартното отклонение. В статистиката стандартното отклонение характеризира степента, до която числата са разпръснати спрямо средната им стойност. Ако стандартното отклонение е малко, числата са близки до средната стойност; ако стандартното отклонение е голямо, цифрите са далеч от средната стойност.
    • Стандартното отклонение се обозначава с буквата "s" или гръцката буква "σ" (сигма). Така стандартното отклонение на стойностите на променливата "x" се обозначава, както следва: sх или σх.
  4. 4 Запомнете символа за операцията за сумиране. Символът за сумиране е един от най -често срещаните символи в математиката и показва сумата от стойности. Този символ е гръцката буква "Σ" (главна сигма).
    • Например, ако са дадени следните стойности на променливата "x": 1,2,5,6,9,10, тогава Σx означава:
      • 1 + 2 + 5 + 6 + 9 + 10 = 33.

Съвети

  • Коефициентът на корелация понякога се нарича "коефициент на корелация на Пиърсън" на името на своя разработчик Карл Пиърсън.
  • В повечето случаи, когато коефициентът на корелация е по -голям от 0,8 (положителен или отрицателен), има силна корелация; ако коефициентът на корелация е по -малък от 0,5 (положителен или отрицателен), се наблюдава слаба корелация.

Предупреждения

  • Корелацията характеризира връзката между стойностите на две променливи. Но не забравяйте, че корелацията няма нищо общо с причинно -следствената връзка. Например, ако сравните ръста и размера на обувките на хората, вероятно ще намерите силна положителна връзка. Като цяло, колкото по -висок е човекът, толкова по -голям е размерът на обувката. Но това не означава, че увеличаването на височината води до автоматично увеличаване на размера на обувките или че по -големите крака ще доведат до по -бърз растеж. Тези количества са просто взаимосвързани.