Как да оценим статистическата значимост

Автор: Randy Alexander
Дата На Създаване: 2 Април 2021
Дата На Актуализиране: 26 Юни 2024
Anonim
Что такое значение p? /Простая статистика/
Видео: Что такое значение p? /Простая статистика/

Съдържание

Тестването на хипотези се ръководи от статистически анализ. Статистически значимата увереност се изчислява, като се използва p стойност - която показва вероятността за наблюдаван резултат, когато определена (нулева хипотеза) е вярна. Ако р стойността е по-малка от нивото на значимост (обикновено 0,05), експериментаторът може да заключи, че има достатъчно доказателства, за да отхвърли нулевата хипотеза и да допусне обратната хипотеза. Използвайки прост t-тест, можете да изчислите р-стойността и да определите значимостта между две различни групи данни.

Стъпки

Част 1 от 3: Настройте експериментите си

  1. Определете вашата хипотеза. Първата стъпка в оценката на статистическата значимост е идентифицирането на въпросите, на които да отговорите, и декларирането на вашата хипотеза. Хипотезата е изложение на емпиричните данни и възможни несъответствия в популацията. Всеки експеримент има нулева и обратна хипотеза. Като цяло ще сравните две групи, за да видите дали са еднакви или различни.
    • Като цяло хипотезата не е (H0) потвърждават, че няма разлика между двете групи данни. Пример: Учениците, които четат материала преди урока, не получават по-добри крайни оценки.
    • Обратната хипотеза (Hа) противоречи на нулевата хипотеза и е твърдение, което се опитвате да подкрепите с вашите емпирични данни. Например: Учениците, които четат материала преди урока, всъщност получават по-добри крайни оценки.

  2. Изберете нивото на значимост, за да определите степента на разлика, която може да се разглежда като значима в данните. Нивото на значимост (известно още като алфа) е прагът, който сте избрали, за да определите значението. Ако р стойността е по-малка или равна на дадено ниво на значимост, данните се считат за статистически значими.
    • Като общо правило нивото на значимост (или алфа) обикновено се избира на ниво 0,05 - което означава, че вероятността да се наблюдава разликата, видяна в данните, е случайна само 5%.
    • Колкото по-високо е нивото на доверие (и следователно, колкото по-ниска е р-стойността), толкова по-значими са резултатите.
    • Ако се изисква повече увереност, намалете р-стойността до 0,01. Ниска р-стойност често се използва в производството за откриване на дефекти на продукта. Високата степен на надеждност е от решаващо значение, за да се приеме, че всяка част ще функционира както трябва.
    • За повечето експерименти, основани на хипотези, е допустимо ниво на значимост от 0,05.

  3. Решете дали да използвате тест с една или две опашки. Едно от предположенията за t-тест е, че вашите данни са в нормално разпределение. Нормалното разпределение ще формира камбанна крива с центриране на по-голямата част от наблюденията. T-тестът е математически тест, който проверява дали вашите данни попадат от външната страна на нормалното разпределение, над или отдолу, в „горната“ част на кривата.
    • Ако не сте сигурни дали данните са над или под контролната група, използвайте двустранен тест. Тя ви позволява да проверите значимостта и в двете посоки.
    • Ако знаете каква е очакваната посока на вашите данни, използвайте тест с една опашка. В горния пример очаквате, че резултатите на ученика ще се подобрят. Следователно използвате теста с една опашка.

  4. Определете размера на пробата със силов анализ. Силата на теста е способността да се наблюдава очаквания резултат с даден размер на пробата. Общият праг за сила (или β) е 80%. Анализът на силите може да бъде доста сложен без предварителни данни, защото се нуждаете от информация за очакваното средно между групите и техните стандартни отклонения. Използвайте онлайн анализ на силата, за да определите оптималния размер на извадката за вашите данни.
    • Изследователите често извършват проучване с малка предпоставка, за да информират анализа на силата и да решат размера на извадката, необходим за голямо и цялостно проучване.
    • Ако няма средства за извършване на сложни предпоставки, преценете възможните средни стойности въз основа на четене на статии и изследвания, които други хора може да са направили. Това може да ви даде добър старт при определяне на размера на извадката.
    реклама

Част 2 от 3: Изчисляване на стандартното отклонение

  1. Определете формулата за стандартно отклонение. Стандартното отклонение измерва разсейването на данните. Той ви дава информация за идентичността на всяка точка от данни в извадката. Когато започнете за първи път, уравненията могат да изглеждат доста сложни. Стъпките по-долу обаче ще ви помогнат лесно да разберете процеса на изчисление. Формулата е s = √∑ ((xi - µ) / (N - 1)).
    • s е стандартното отклонение.
    • ∑ показва, че ще трябва да съберете всички събрани наблюдения.
    • хi всеки представлява стойността на вашите данни.
    • µ е средната стойност на данните за всяка група.
    • N е общият брой наблюдения.
  2. Усреднете броя на наблюденията във всяка група. За да изчислите стандартното отклонение, първо трябва да изчислите средната стойност на наблюденията за всяка отделна група. Тази стойност е символизирана с гръцката буква mu или µ. За да направите това, просто добавете наблюденията и разделете на общия брой наблюдения.
    • Например, за да намерим средната оценка на групата, която чете документа преди класа, нека разгледаме някои данни. За улеснение ще използваме набор от данни от 5 точки: 90, 91, 85, 83 и 94 (по 100-бална скала).
    • Съберете всички наблюдения: 90 + 91 + 85 + 83 + 94 = 443.
    • Разделете горната сума на броя на наблюденията N (N = 5): 443/5 = 88.6.
    • Средният резултат за тази група е 88,6.
  3. Извадете средната стойност от всяка наблюдавана стойност. Следващата стъпка включва част (xi - µ) от уравнението. Извадете средната стойност от всяка наблюдавана стойност. С горния пример имаме пет изваждания.
    • (90 - 88,6), (91 - 88,6), (85 - 88,6), (83 - 88,6) и (94 - 88,6).
    • Изчислената стойност е 1,4; 2.4; -3,6; -5,6 и 5,4.
  4. Каретирайте горните разлики и ги съберете. Всяка нова току-що изчислена стойност сега ще бъде на квадрат. Тук отрицателният знак също ще бъде премахнат. Ако след тази стъпка или в края на изчислението се появи отрицателен знак, може би сте забравили да направите горната стъпка.
    • В нашия пример сега ще работим с 1.96; 5,76; 12,96; 31.36 и 29.16.
    • Съберете тези квадрати заедно: 1,96 + 5,76 + 12,96 + 31,36 + 29,16 = 81,2.
  5. Разделете на общия брой наблюдения минус 1. Разделянето на N - 1 помага да се компенсира изчислението, което не се извършва върху популацията като цяло, а се базира на извадка от всички ученици.
    • Извадете: N - 1 = 5 - 1 = 4
    • Разделяне: 81,2 / 4 = 20,3
  6. Вземете квадратния корен. След като се раздели на броя на наблюденията минус 1, вземете квадратния корен от получената стойност. Това е последната стъпка при изчисляване на стандартното отклонение. Някои статистически програми ще ви помогнат да извършите това изчисление след импортирането на оригиналните данни.
    • С горния пример стандартното отклонение на оценката в края на семестъра на учениците, които четат документа преди час, е: s = √20,3 = 4,51.
    реклама

Част 3 от 3: Определяне на статистическа значимост

  1. Изчислете дисперсията между вашите две групи наблюдения. До този момент примерът е разглеждал само една група наблюдения. За да сравните две групи, очевидно се нуждаете от данни и от двете. Изчислете стандартното отклонение на втората група наблюдения и го използвайте за изчисляване на дисперсията между двете експериментални групи. Формулата за изчисляване на дисперсията е: sд = √ ((s1/ Н1) + (s2/ Н2)).
    • Сд е отклонението между групите.
    • С1 е стандартното отклонение на групи 1 и N1 е размерът на група 1.
    • С2 е стандартното отклонение на групи 2 и N2 е размерът на група 2.
    • В нашия пример, нека кажем, че данните от група 2 (ученици, които не са чели текста преди клас) имат размер 5 и стандартно отклонение 5,81. Дисперсията е:
      • Сд = √ ((s1) / Н1) + ((s2) / Н2))
      • Сд = √(((4.51)/5) + ((5.81)/5)) = √((20.34/5) + (33.76/5)) = √(4.07 + 6.75) = √10.82 = 3.29.
  2. Изчислете t-резултата на данните. T-статистиката ви позволява да конвертирате данни във форма, която е сравнима с други данни. Стойността t също ви позволява да извършите t-тест, тест, който ви позволява да изчислите вероятността от статистически значима разлика между двете групи. Формулата за изчисляване на t-статистиката е: t = (µ1 – µ2)/Сд.
    • µ1 е средната стойност за първата група.
    • µ2 е средната стойност за втората група.
    • Сд е дисперсията между наблюденията.
    • Използвайте по-голямото средно като µ1 за да не се получи отрицателна t-статистика.
    • За нашия пример, да предположим, че наблюдаваното средно за група 2 (които не са прочели предишната статия) е 80. t-резултатът е: t = (µ1 – µ2)/Сд = (88,6 – 80)/3,29 = 2,61.
  3. Определете степента на свобода на пробата. Когато се използва t-статистиката, степента на свобода се определя въз основа на размера на извадката. Съберете броя на наблюденията за всяка група и след това извадете две. В горния пример степента на свобода (d.f.) е 8, защото има 5 проби в първата група и 5 проби във втората група ((5 + 5) - 2 = 8).
  4. Използвайте таблица t, за да оцените значимостта. Таблици с t-стойности и степени на свобода могат да бъдат намерени в стандартна статистика или онлайн. Намерете реда, който съдържа степените на свобода на данните и р-стойността, която съответства на t-статистиката, която имате.
    • При степени на свобода 8 и t = 2,61 p-стойността за едностранен тест е между 0,01 и 0,025. Тъй като избраното ниво на значимост е по-малко или равно на 0,05, нашите данни са статистически значими. С тези данни ние отхвърляме нулевата хипотеза и приемаме обратната хипотеза: учениците, които четат материала преди класа, имат по-високи крайни резултати.
  5. Помислете за провеждане на допълнителни изследвания. Много изследователи извършват предпоставки с няколко показателя, за да разберат как да проектират по-голямо проучване. Правенето на други изследвания с повече показатели ще увеличи доверието ви във вашите заключения. реклама

Съвети

  • Статистиката е голямо и сложно поле. Вземете курс за тестване на статистически хипотези в гимназия или университет (или по-високо), за да разберете статистическата значимост.

Внимание

  • Този анализ се фокусира върху t-теста, за да провери разликата между двете стандартни популации на разпределение. В зависимост от сложността на данните може да се наложи друг статистически тест.