Изчислете ковариацията

Автор: Judy Howell
Дата На Създаване: 2 Юли 2021
Дата На Актуализиране: 1 Юли 2024
Anonim
Изчислете ковариацията - Съвети
Изчислете ковариацията - Съвети

Съдържание

Ковариацията е статистическо изчисление, за да направи връзката между два набора от данни по-прозрачна. Да предположим например, че антрополозите изследват височината и теглото на популация в рамките на определена култура. За всеки човек в проучването височината и теглото могат да бъдат показани с двойка данни (x, y). Тези стойности могат да се използват в стандартна формула за изчисляване на ковариационната връзка. Тази статия първо обяснява изчисленията за определяне на ковариацията на набор от данни. След това ще бъдат обсъдени два други автоматизирани начина за определяне на резултата.

Стъпвам

Метод 1 от 4: Изчислете ковариацията на ръка, използвайки стандартната формула

  1. Научете стандартната формула за ковариация и нейните части. Стандартната формула за изчисляване на ковариацията е Σ(хiхср)(уiуср)/(н1){ displaystyle Sigma (x_ {i} -x _ { text {avg}}) (y_ {i} -y _ { text {avg}}) / (n-1)}Изградете таблицата си с данни. Преди да започнете, е полезно да съберете данните си. Създайте таблица, състояща се от пет колони. Трябва да декларирате всяка колона, както следва:
    • х{ displaystyle x}Изчислете средната стойност на x точките от данни. Този примерен набор от данни съдържа 9 числа. За да намерите средната стойност, съберете ги и разделете сумата на 9. Това дава резултат 1 + 3 + 2 + 5 + 8 + 7 + 12 + 2 + 4 = 44. Когато разделите това на 9, получавате средната стойност 4.89. Това е стойността, която ще използвате като x (avg) за предстоящите изчисления.
    • Изчислете средната стойност на точките от данни y. Тази колона y трябва също да се състои от 9 точки от данни, които съвпадат с точките от данни x. Определете средната стойност от тях. За този примерен набор от данни това става 8 + 6 + 9 + 4 + 3 + 3 + 2 + 7 + 7 = 49. Разделете това общо на 9, за да получите средно 5.44. Ще използвате 5.44 като стойност на y (avg) за предстоящите изчисления.
    • Изчислете стойностите (хiхср){ displaystyle (x_ {i} -x _ { text {avg}})}}Изчислете стойностите (уiуср){ displaystyle (y_ {i} -y _ { text {avg}})}}Изчислете продуктите за всеки ред с данни. Попълвате редовете на последната колона, като умножавате числата, които сте изчислили в двете предишни колони на (хiхср){ displaystyle (x_ {i} -x _ { text {avg}})}}Намерете сумата от стойностите в последната колона. Тук влиза символът Σ. След като извършите всички изчисления досега, добавете резултатите заедно. За този примерен набор от данни сега трябва да имате девет стойности в последната колона. Съберете тези девет числа заедно. Обърнете внимателно дали дадено число е положително или отрицателно.
      • Сумата от този примерен набор от данни трябва да се добави до -64,57. Запишете тази сума в интервала в долната част на колоната. Това е стойността на числителя на стандартната формула за ковариация.
    • Изчислете знаменателя на формулата за ковариация. Числителят на стандартната формула за ковариация е стойността, която току-що изчислихте. Знаменателят е представен с (n-1) и е с един по-малък от броя на двойките данни във вашия набор от данни.
      • В този примерен проблем има девет двойки данни, така че n е 9. Следователно стойността на (n-1) е равна на 8.
    • Разделете числителя на знаменателя. Последната стъпка при изчисляването на ковариацията е разделяне на числителя, Σ(хiхср)(уiуср){ displaystyle Sigma (x_ {i} -x _ { text {avg}}) (y_ {i} -y _ { text {avg}})}Забележете какви са повтарящите се изчисления. Ковариацията е изчисление, което трябва да направите на ръка няколко пъти, за да разберете смисъла на резултата. Ако обаче ще използвате рутинно ковариация за интерпретиране на данни, тогава се нуждаете от по-бърз и по-автоматизиран начин за получаване на резултатите. Досега може би сте забелязали, че с нашия сравнително малък набор от данни от само девет двойки данни, изчисленията се състоят от две средства, осемнадесет отделни изваждания, девет умножения, едно събиране и накрая друго деление. Това са 31 относително малки изчисления, за да се намери решението. По пътя рискувате да пропуснете отрицателни знаци или да копирате резултатите неправилно, така че отговорът вече да не е верен.
    • Създайте работен лист за изчисляване на ковариацията. Ако сте запознати с Excel (или друга програма за изчисление), можете лесно да създадете таблица за определяне на ковариацията. Маркирайте заглавията на петте колони, както направихте за изчисленията на ръка: x, y, (x (i) -x (avg)), (y (i) -y (avg)) и Product.
      • За да опростите именуването, наречете третата колона нещо като "x разлика" и четвъртата колона "y разлика", стига да помните значението на данните.
      • Ако таблицата започва в горния ляв ъгъл на работния лист, клетка A1 ще бъде обозначена с x, докато останалите етикети продължават до клетка E1.
    • Въведете точките за данни. Въведете стойностите на данните в двете колони x и y. Не забравяйте, че редът на точките с данни има значение, така че трябва да съпоставяте всяко y със съответната стойност на x.
      • Стойностите x започват в клетка A2 и продължават до броя точки от данни, от които се нуждаете.
      • Стойностите y започват в клетка B2 и продължават до необходимия брой точки от данни.
    • Определете средните стойности на стойностите x и y. Excel изчислява средните за вас много бързо. В първата празна клетка под всяка колона с данни въведете формулата = СРЕДНА (A2: A ___). Попълнете празното място с номера на клетката, който съответства на последната ви точка от данни.
      • Например, ако имате 100 точки с данни, клетките от A2 до A101 се запълват, така че в клетката въвеждате = СРЕДНА (A2: A101).
      • За y данните въведете формулата = СРЕДНА (B2: B101).
      • Не забравяйте, че формула в Excel започва със знак "=".
    • Въведете формулата за колоната (x (i) -x (avg)). В клетка C2 въведете формулата за изчисляване на първото изваждане. Тази формула става: = A2 -___. Попълнете празното място с адреса на клетката, съдържащ средната стойност на данните x.
      • Например от 100 точки с данни средната стойност ще бъде в клетка A103, така че вашата формула става: = A2-A103.
    • Повторете формулата за точките с данни (y (i) -y (avg)). Следвайки същия пример, той влиза в клетка D2. Формулата става: = B2-B103.
    • Въведете формулата за колоната „Продукт“. В петата колона въведете в клетка E2 формулата, за да изчислите произведението на двете предходни клетки. След това става: = C2 * D2.
    • Копирайте формулите, за да попълните таблицата. Досега сте програмирали само първите няколко точки от данни в ред 2. С помощта на мишката маркирайте клетки C2, D2 и E2. Поставете курсора върху малкото поле в долния десен ъгъл, докато се появи знак плюс. Щракнете и задръжте бутона на мишката и плъзнете мишката надолу, за да разширите избора и да попълните цялата таблица с данни. Тази стъпка автоматично ще копира трите формули от клетки C2, D2 и E2 в цялата таблица. Таблицата трябва автоматично да се попълва с всички изчисления.
    • Програмирайте сумата от последната колона. Нуждаете се от сумата на артикулите в колоната „Продукт“. В празната клетка непосредствено под последната точка от данни в тази колона въведете формулата: = SUM (E2: E ___). Попълнете празното място с адреса на клетката на последната точка от данни.
      • В примера със 100 точки с данни тази формула влиза в клетка E103. Тип: = SUM (E2: E102).
    • Определете ковариацията. Можете също така да накарате Excel да извърши окончателното изчисление вместо вас. Последното изчисление в клетка E103 в нашия пример представлява числителя на формулата за ковариация. Точно под тази клетка въведете формулата: = E103 / ___. Попълнете празното място с броя точки с данни, които имате. В нашия пример това е 100. Резултатът е ковариацията на вашите данни.

Метод 3 от 4: Използване на онлайн кавариатори за ковариация

  1. Потърсете онлайн кавакулатори за ковариация. Различни училища, компании или други източници имат уебсайтове, които много лесно изчисляват стойностите на ковариацията. Използвайте термина за търсене „кавариатор на ковариация“ в търсачката.
  2. Въведете вашите данни. Прочетете внимателно инструкциите на уебсайта, за да сте сигурни, че въвеждате информацията правилно. Важно е вашите двойки данни да се поддържат в ред, в противен случай генерираният резултат ще бъде неправилна ковариация. Уебсайтовете имат различни стилове на въвеждане на данни.
    • Например на уебсайта http://ncalculators.com/statistics/covariance-calculator.htm има хоризонтално поле за въвеждане на x стойности и второ хоризонтално поле за въвеждане на y стойности. Трябва да въведете данните си, разделени със запетаи. По този начин наборът от данни x, изчислен по-рано в тази статия, следва да бъде въведен като 1,3,2,5,8,7,12,2,4. Данните за годината са 8,6,9,4,3,3,2,7,7.
    • На друг сайт, https://www.thecalculator.co/math/Covariance-Calculator-705.html, ще бъдете помолени да въведете данните x в първото поле. Данните се въвеждат вертикално, с по един елемент на ред. Следователно записът на този сайт изглежда така:
    • 1
    • 3
    • 2
    • 5
    • 8
    • 7
    • 12
    • 2
    • 4
  3. Изчислете резултатите си. Привлекателното при тези онлайн изчисления е, че след въвеждане на данните обикновено трябва само да щракнете върху бутона „Изчисли“ и резултатите ще се покажат автоматично. Повечето сайтове ще ви предоставят междинни изчисления на x (avg), y (avg) и n.

Метод 4 от 4: Интерпретиране на резултатите от ковариацията

  1. Потърсете положителна или отрицателна връзка. Ковариацията е единично статистическо число, което показва връзката между един набор от данни и друг. В примера, споменат във въведението, се измерват височината и теглото. Бихте очаквали, че докато хората растат, теглото им също ще се увеличи, което ще доведе до положителна ковариация. Друг пример: Да предположим, че се събират данни, които показват броя на часовете, които някой тренира голф, и резултата, който той или тя постига. В този случай очаквате отрицателна ковариация, което означава, че с увеличаване на броя на тренировъчните часове голф резултатът ще намалее. (В голфа по-нисък резултат е по-добър).
    • Помислете за примерния набор от данни, изчислен по-горе. Получената ковариация е -8,07. Знакът минус означава, че с увеличаване на стойностите x стойностите на y са склонни да намаляват. Можете да видите, че това е вярно, като разгледате някои от стойностите. Например, стойностите x на 1 и 2 съответстват на y стойностите на 7, 8 и 9. Стойностите x на 8 и 12 са свързани съответно със стойностите y на 3 и 2 .
  2. Интерпретирайте величината на ковариацията. Ако броят на ковариационния резултат е голям, или голямо положително число, или голямо отрицателно число, тогава можете да интерпретирате това като два елемента от данни, които са силно свързани, или по положителен, или по отрицателен начин.
    • Ковариацията -8.07 на примерния набор от данни е доста голяма. Имайте предвид, че данните варират от 1 до 12. Значи 8 е доста голям брой. Това показва доста силна връзка между наборите данни x и y.
  3. Разберете липсата на връзка. Ако резултатът ви е ковариация, равна или много близка до 0, можете да заключите, че точките от данни не са свързани. Тоест увеличаването на едната стойност може, но не трябва да води до увеличаване на другата. Двата термина са свързани почти произволно.
    • Да предположим, че свързвате размерите на обувките с оценките на изпита. Тъй като има толкова много фактори, които влияят на оценките на изпитите на студента, може да се очаква резултат на ковариация близо до 0. Това показва, че почти няма връзка между двете стойности.
  4. Вижте връзката графично. За да разберете визуално ковариацията, можете да нанесете точките си с данни на графика x, y. Когато го направите, трябва да видите доста лесно, че точките, макар и не точно в права линия, са склонни да се приближават до клъстер по диагонална линия отгоре вляво в долния десен ъгъл. Това е описанието на отрицателна ковариация. Можете също така да видите, че стойността на ковариацията е равна на -8.07. Това е доста голям брой в сравнение с точките с данни. Големият брой предполага, че ковариацията е доста силна, което можете да установите от линейната форма на точките с данни.
    • За да преминете през това отново, прочетете статии за изчертаване на точки в координатна система в wikiHow.

Предупреждения

  • Ковариацията има ограничено приложение в статистиката. Често това е стъпка към изчисляване на коефициентите на корелация или други концепции. Внимавайте с прекалено смели интерпретации, базирани на ковариантност.