Как да се изчислят емисиите

Автор: Janice Evans
Дата На Създаване: 23 Юли 2021
Дата На Актуализиране: 1 Юли 2024
Anonim
Эти тайные цифры денежного кода принесут деньги в кошелек. Первые деньги уже через 48 часов
Видео: Эти тайные цифры денежного кода принесут деньги в кошелек. Первые деньги уже через 48 часов

Съдържание

В статистиката отклоненията са стойности, които рязко се различават от другите стойности в събрания набор от данни. Отклонението може да показва аномалии в разпределението на данните или грешките при измерването, така че отклоненията често се изключват от набора от данни. Като елиминирате отклоненията от набора от данни, можете да стигнете до неочаквани или по -точни заключения. Следователно е необходимо да може да се изчисляват и оценяват отклоненията, за да се гарантира правилното разбиране на статистиката.

Стъпки

  1. 1 Научете се да разпознавате потенциални отклонения. Потенциалните отклонения трябва да бъдат идентифицирани, преди да се изключат отклоненията от набора от данни. Отклоненията са стойности, които са много различни от повечето от стойностите в набора от данни; с други думи, отклоненията са извън тенденцията на повечето ценности. Това е лесно да се намери в таблици със стойности или (особено) в графики. Ако стойностите в набора от данни са начертани, отклоненията ще лежат далеч от повечето други стойности. Ако например повечето от стойностите попадат на права линия, тогава отклоненията лежат от двете страни на такава права линия.
    • Например, помислете за набор от данни, представящ температурите на 12 различни обекта в една стая. Ако 11 обекта са приблизително 70 градуса, но дванадесетият обект (вероятно пещ) е 300 градуса, тогава бърз поглед върху стойностите може да покаже, че пещта е вероятно издухване.
  2. 2 Сортирайте данните във възходящ ред. Първата стъпка при определяне на отклоненията е да се изчисли средната стойност на набора от данни. Тази задача е значително опростена, ако стойностите в набора от данни са подредени във възходящ ред (от най -малкия до най -големия).
    • Продължавайки с горния пример, помислете за следния набор от данни, представящ температурите на множество обекти: {71, 70, 73, 70, 70, 69, 70, 72, 71, 300, 71, 69}. Този комплект трябва да бъде подреден, както следва: {69, 69, 70, 70, 70, 70, 71, 71, 71, 72, 73, 300}.
  3. 3 Изчислете медианата на набора от данни. Медианата на набор от данни е стойността в средата на набора от данни. Ако наборът от данни съдържа нечетен брой стойности, медианата е стойността преди и след която има същия брой стойности в набора от данни. Но ако наборът от данни съдържа четен брой стойности, тогава трябва да намерите средноаритметичната стойност на двете средни стойности. Обърнете внимание, че при изчисляване на отклоненията медианата обикновено се нарича Q2, тъй като тя се намира между Q1 и Q3, долните и горните квартили, които ще дефинираме по -късно.
    • Не се страхувайте да работите с набори от данни, които имат четен брой стойности- средната аритметична стойност на двете средни ще бъде число, което не е в набора от данни; това е нормално. Но ако двете средни стойности са едно и също число, тогава средната аритметична стойност е равна на това число; това също е в реда на нещата.
    • В горния пример средните 2 стойности са 70 и 71, така че медианата е ((70 + 71) / 2) = 70,5.
  4. 4 Изчислете долния квартил. Тази стойност, наричана Q1, е под която се намират 25% от стойностите на набора от данни. С други думи, това е половината от стойностите до медианата. Ако има четен брой стойности от набора от данни преди медианата, трябва да намерите средноаритметичната стойност на двете средни стойности, за да изчислите Q1 (това е подобно на изчисляването на медианата).
    • В нашия пример 6 стойности са разположени след медианата и 6 стойности- преди нея. Това означава, че за да изчислим долния квартил, трябва да намерим средната аритметика на двете средни стойности на шестте стойности, които лежат преди медианата. Тук средните стойности са 70 и 70. Така Q1 = ((70 + 70) / 2) = 70.
  5. 5 Изчислете горния квартил. Тази стойност, наричана Q3, е над която лежат 25% от стойностите на набора от данни. Процесът за изчисляване на Q3 е подобен на процеса за изчисляване на Q1, но тук се вземат предвид стойностите след медианата.
    • В горния пример двете средни стойности на шестицата след медианата са 71 и 72. Така че Q3 = ((71 + 72) / 2) = 71,5.
  6. 6 Изчислете интерквартилния диапазон. Изчислявайки Q1 и Q3, е необходимо да се намери разстоянието между тези стойности. За да направите това, извадете Q1 от Q3. Стойността на интерквартилния диапазон е изключително важна за определяне на границите на стойностите, които не са отклонения.
    • В нашия пример Q1 = 70 и Q3 = 71,5. Интерквартилният диапазон е 71,5 - 70 = 1,5.
    • Имайте предвид, че това важи и за отрицателните стойности Q1 и Q3. Например, ако Q1 = -70, тогава интерквартилният диапазон е 71,5 -(-70) = 141,5.
  7. 7 Намерете "вътрешните граници" на стойностите в набора от данни. Отклоненията се определят чрез анализ на стойностите- независимо дали попадат в т. Нар. „Вътрешни граници“ и „външни граници“. Стойност извън „вътрешните граници“ се класифицира като „незначителни извънредни стойности“, докато стойност извън „външните граници“ се класифицира като „значителна външна стойност“. За да намерите вътрешните граници, трябва да умножите интерквартилния диапазон с 1,5; резултатът трябва да се добави към Q3 и да се извади от Q1. Двете намерени числа са вътрешните граници на набора от данни.
    • В нашия пример интерквартилният диапазон е (71,5 - 70) = 1,5. По -нататък: 1,5 * 1,5 = 2,25. Това число трябва да се добави към Q3 и да се извади от Q1, за да се намерят вътрешните граници:
      • 71,5 + 2,25 = 73,75
      • 70 - 2,25 = 67,75
      • По този начин вътрешните граници са 67.75 и 73.75.
    • В нашия пример само температурата на пещта - 300 градуса - се намира извън тези граници и може да се счита за незначителна емисия. Но не прибързвайте със заключенията - трябва да определим дали тази температура е значително отклонение.
  8. 8 Намерете "външните граници" на набора от данни. Това се прави по същия начин, както за вътрешните граници, с изключение на това, че интерквартилният диапазон се умножава по 3 вместо 1,5. Резултатът трябва да се добави към Q3 и да се извади от Q1. Двете намерени числа са външните граници на набора от данни.
    • В нашия пример умножете интерквартилния диапазон с 3: 1.5 * 3 = 4.5. Изчислете външните граници:
      • 71,5 + 4,5 = 76
      • 70 - 4,5 = 65,5
      • Така че външните граници са 65,5 и 76.
    • Всички стойности, които попадат извън външните граници, се считат за значителни емисии. В нашия пример температура на пещта от 300 градуса се счита за значително издухване.
  9. 9 Използвайте качествена оценка, за да определите дали отклоненията трябва да бъдат изключени от набора от данни. Описаният по -горе метод ви позволява да определите дали някои стойности са отклонения (незначителни или значими). Не се заблуждавайте обаче - стойност, която е класифицирана като извънреден, е само „кандидат“ за изключение, което означава, че не е нужно да го изключвате. Причината за отклонението е основният фактор, влияещ върху решението за изключване на отклонението. По правило се изключват отклонения, възникнали поради грешки (при измервания, записи и т.н.). От друга страна, отклоненията, свързани не с грешки, а с нова информация или тенденция, обикновено се оставят в набора от данни.
    • Също толкова важно е да се оцени ефектът на отклоненията върху медианата на набора от данни (независимо дали те го изкривяват или не). Това е особено важно, когато правите изводи от медианата на набор от данни.
    • В нашия пример е изключително малко вероятно фурната да се загрее до температура от 300 градуса (освен ако не вземем предвид естествените аномалии). Следователно може да се заключи (с висока степен на сигурност), че такава температура е грешка в измерването, която трябва да бъде изключена от набора от данни. Освен това, ако не изключите отклонението, медианата на набора от данни ще бъде (69 + 69 + 70 + 70 + 70 + 70 + 71 + 71 + 71 + 72 + 73 + 300) / 12 = 89,67 градуса, но ако изключите отклонението, медианата ще бъде (69 + 69 + 70 + 70 + 70 + 70 + 71 + 71 + 71 + 72 + 73) / 11 = 70,55 градуса.
      • Отклоненията обикновено са резултат от човешка грешка, така че отклоненията трябва да бъдат изключени от наборите от данни.
  10. 10 Разберете важността на (понякога) отклоненията, останали в набора от данни. Някои извънредни стойности трябва да бъдат изключени от набора от данни, тъй като се дължат на грешки и технически проблеми; други отклонения трябва да бъдат оставени в набора от данни. Ако например несъответствие не е резултат от грешка и / или осигурява ново разбиране на явлението, което се тества, то трябва да се остави в набора от данни. Научните експерименти са особено чувствителни към отклоненията - като погрешно елиминирате отклонение, може да пропуснете някаква нова тенденция или откритие.
    • Например, ние разработваме ново лекарство за увеличаване на размера на рибите в рибарството. Ще използваме стария набор от данни ({71, 70, 73, 70, 70, 69, 70, 72, 71, 300, 71, 69}), но този път всяка стойност ще представлява теглото на рибата (в грамове) след поглъщане експериментално лекарство. С други думи, първото лекарство води до увеличаване на теглото на рибите до 71 g, второто лекарство - до 70 g и т.н. В тази ситуация 300 е значителна разлика, но не трябва да го изключваме; ако приемем, че не е имало грешки при измерването, тогава подобен изход е значителен успех в експеримента. Лекарството, което увеличи теглото на рибата до 300 грама, действа много по -добре от другите лекарства; следователно 300 е най -важната стойност в набора от данни.

Съвети

  • Когато се открият отклонения, опитайте се да обясните тяхното присъствие, преди да ги изключите от набора от данни. Те могат да показват грешки в измерването или аномалии в разпределението.

Какво ти е необходимо

  • Калкулатор