Как да оценим статистическата значимост: 15 стъпки (със снимка) - Съвети

Видео: Что такое значение p? /Простая статистика/

Съдържание

Стъпки
Съвети
Внимание

Тестването на хипотези се ръководи от статистически анализ. Статистически значимата увереност се изчислява, като се използва p стойност - която показва вероятността за наблюдаван резултат, когато определена (нулева хипотеза) е вярна. Ако р стойността е по-малка от нивото на значимост (обикновено 0,05), експериментаторът може да заключи, че има достатъчно доказателства, за да отхвърли нулевата хипотеза и да допусне обратната хипотеза. Използвайки прост t-тест, можете да изчислите р-стойността и да определите значимостта между две различни групи данни.

Стъпки

Част 1 от 3: Настройте експериментите си

Определете вашата хипотеза. Първата стъпка в оценката на статистическата значимост е идентифицирането на въпросите, на които да отговорите, и декларирането на вашата хипотеза. Хипотезата е изложение на емпиричните данни и възможни несъответствия в популацията. Всеки експеримент има нулева и обратна хипотеза. Като цяло ще сравните две групи, за да видите дали са еднакви или различни.
- Като цяло хипотезата не е (H₀) потвърждават, че няма разлика между двете групи данни. Пример: Учениците, които четат материала преди урока, не получават по-добри крайни оценки.
- Обратната хипотеза (H_а) противоречи на нулевата хипотеза и е твърдение, което се опитвате да подкрепите с вашите емпирични данни. Например: Учениците, които четат материала преди урока, всъщност получават по-добри крайни оценки.
Изберете нивото на значимост, за да определите степента на разлика, която може да се разглежда като значима в данните. Нивото на значимост (известно още като алфа) е прагът, който сте избрали, за да определите значението. Ако р стойността е по-малка или равна на дадено ниво на значимост, данните се считат за статистически значими.
- Като общо правило нивото на значимост (или алфа) обикновено се избира на ниво 0,05 - което означава, че вероятността да се наблюдава разликата, видяна в данните, е случайна само 5%.
- Колкото по-високо е нивото на доверие (и следователно, колкото по-ниска е р-стойността), толкова по-значими са резултатите.
- Ако се изисква повече увереност, намалете р-стойността до 0,01. Ниска р-стойност често се използва в производството за откриване на дефекти на продукта. Високата степен на надеждност е от решаващо значение, за да се приеме, че всяка част ще функционира както трябва.
- За повечето експерименти, основани на хипотези, е допустимо ниво на значимост от 0,05.
Решете дали да използвате тест с една или две опашки. Едно от предположенията за t-тест е, че вашите данни са в нормално разпределение. Нормалното разпределение ще формира камбанна крива с центриране на по-голямата част от наблюденията. T-тестът е математически тест, който проверява дали вашите данни попадат от външната страна на нормалното разпределение, над или отдолу, в „горната“ част на кривата.
- Ако не сте сигурни дали данните са над или под контролната група, използвайте двустранен тест. Тя ви позволява да проверите значимостта и в двете посоки.
- Ако знаете каква е очакваната посока на вашите данни, използвайте тест с една опашка. В горния пример очаквате, че резултатите на ученика ще се подобрят. Следователно използвате теста с една опашка.
Определете размера на пробата със силов анализ. Силата на теста е способността да се наблюдава очаквания резултат с даден размер на пробата. Общият праг за сила (или β) е 80%. Анализът на силите може да бъде доста сложен без предварителни данни, защото се нуждаете от информация за очакваното средно между групите и техните стандартни отклонения. Използвайте онлайн анализ на силата, за да определите оптималния размер на извадката за вашите данни.
- Изследователите често извършват проучване с малка предпоставка, за да информират анализа на силата и да решат размера на извадката, необходим за голямо и цялостно проучване.
- Ако няма средства за извършване на сложни предпоставки, преценете възможните средни стойности въз основа на четене на статии и изследвания, които други хора може да са направили. Това може да ви даде добър старт при определяне на размера на извадката.
реклама

Част 2 от 3: Изчисляване на стандартното отклонение

Определете формулата за стандартно отклонение. Стандартното отклонение измерва разсейването на данните. Той ви дава информация за идентичността на всяка точка от данни в извадката. Когато започнете за първи път, уравненията могат да изглеждат доста сложни. Стъпките по-долу обаче ще ви помогнат лесно да разберете процеса на изчисление. Формулата е s = √∑ ((x_i - µ) / (N - 1)).
- s е стандартното отклонение.
- ∑ показва, че ще трябва да съберете всички събрани наблюдения.
- х_i всеки представлява стойността на вашите данни.
- µ е средната стойност на данните за всяка група.
- N е общият брой наблюдения.
Усреднете броя на наблюденията във всяка група. За да изчислите стандартното отклонение, първо трябва да изчислите средната стойност на наблюденията за всяка отделна група. Тази стойност е символизирана с гръцката буква mu или µ. За да направите това, просто добавете наблюденията и разделете на общия брой наблюдения.
- Например, за да намерим средната оценка на групата, която чете документа преди класа, нека разгледаме някои данни. За улеснение ще използваме набор от данни от 5 точки: 90, 91, 85, 83 и 94 (по 100-бална скала).
- Съберете всички наблюдения: 90 + 91 + 85 + 83 + 94 = 443.
- Разделете горната сума на броя на наблюденията N (N = 5): 443/5 = 88.6.
- Средният резултат за тази група е 88,6.
Извадете средната стойност от всяка наблюдавана стойност. Следващата стъпка включва част (x_i - µ) от уравнението. Извадете средната стойност от всяка наблюдавана стойност. С горния пример имаме пет изваждания.
- (90 - 88,6), (91 - 88,6), (85 - 88,6), (83 - 88,6) и (94 - 88,6).
- Изчислената стойност е 1,4; 2.4; -3,6; -5,6 и 5,4.
Каретирайте горните разлики и ги съберете. Всяка нова току-що изчислена стойност сега ще бъде на квадрат. Тук отрицателният знак също ще бъде премахнат. Ако след тази стъпка или в края на изчислението се появи отрицателен знак, може би сте забравили да направите горната стъпка.
- В нашия пример сега ще работим с 1.96; 5,76; 12,96; 31.36 и 29.16.
- Съберете тези квадрати заедно: 1,96 + 5,76 + 12,96 + 31,36 + 29,16 = 81,2.
Разделете на общия брой наблюдения минус 1. Разделянето на N - 1 помага да се компенсира изчислението, което не се извършва върху популацията като цяло, а се базира на извадка от всички ученици.
- Извадете: N - 1 = 5 - 1 = 4
- Разделяне: 81,2 / 4 = 20,3
Вземете квадратния корен. След като се раздели на броя на наблюденията минус 1, вземете квадратния корен от получената стойност. Това е последната стъпка при изчисляване на стандартното отклонение. Някои статистически програми ще ви помогнат да извършите това изчисление след импортирането на оригиналните данни.
- С горния пример стандартното отклонение на оценката в края на семестъра на учениците, които четат документа преди час, е: s = √20,3 = 4,51.
реклама

Част 3 от 3: Определяне на статистическа значимост

Изчислете дисперсията между вашите две групи наблюдения. До този момент примерът е разглеждал само една група наблюдения. За да сравните две групи, очевидно се нуждаете от данни и от двете. Изчислете стандартното отклонение на втората група наблюдения и го използвайте за изчисляване на дисперсията между двете експериментални групи. Формулата за изчисляване на дисперсията е: s_д = √ ((s₁/ Н₁) + (s₂/ Н₂)).
- С_д е отклонението между групите.
- С₁ е стандартното отклонение на групи 1 и N₁ е размерът на група 1.
- С₂ е стандартното отклонение на групи 2 и N₂ е размерът на група 2.
- В нашия пример, нека кажем, че данните от група 2 (ученици, които не са чели текста преди клас) имат размер 5 и стандартно отклонение 5,81. Дисперсията е:
  - С_д = √ ((s₁) / Н₁) + ((s₂) / Н₂))
  - С_д = √(((4.51)/5) + ((5.81)/5)) = √((20.34/5) + (33.76/5)) = √(4.07 + 6.75) = √10.82 = 3.29.
Изчислете t-резултата на данните. T-статистиката ви позволява да конвертирате данни във форма, която е сравнима с други данни. Стойността t също ви позволява да извършите t-тест, тест, който ви позволява да изчислите вероятността от статистически значима разлика между двете групи. Формулата за изчисляване на t-статистиката е: t = (µ₁ – µ₂)/С_д.
- µ₁ е средната стойност за първата група.
- µ₂ е средната стойност за втората група.
- С_д е дисперсията между наблюденията.
- Използвайте по-голямото средно като µ₁ за да не се получи отрицателна t-статистика.
- За нашия пример, да предположим, че наблюдаваното средно за група 2 (които не са прочели предишната статия) е 80. t-резултатът е: t = (µ₁ – µ₂)/С_д = (88,6 – 80)/3,29 = 2,61.
Определете степента на свобода на пробата. Когато се използва t-статистиката, степента на свобода се определя въз основа на размера на извадката. Съберете броя на наблюденията за всяка група и след това извадете две. В горния пример степента на свобода (d.f.) е 8, защото има 5 проби в първата група и 5 проби във втората група ((5 + 5) - 2 = 8).
Използвайте таблица t, за да оцените значимостта. Таблици с t-стойности и степени на свобода могат да бъдат намерени в стандартна статистика или онлайн. Намерете реда, който съдържа степените на свобода на данните и р-стойността, която съответства на t-статистиката, която имате.
- При степени на свобода 8 и t = 2,61 p-стойността за едностранен тест е между 0,01 и 0,025. Тъй като избраното ниво на значимост е по-малко или равно на 0,05, нашите данни са статистически значими. С тези данни ние отхвърляме нулевата хипотеза и приемаме обратната хипотеза: учениците, които четат материала преди класа, имат по-високи крайни резултати.
Помислете за провеждане на допълнителни изследвания. Много изследователи извършват предпоставки с няколко показателя, за да разберат как да проектират по-голямо проучване. Правенето на други изследвания с повече показатели ще увеличи доверието ви във вашите заключения. реклама

Съвети

Статистиката е голямо и сложно поле. Вземете курс за тестване на статистически хипотези в гимназия или университет (или по-високо), за да разберете статистическата значимост.

Внимание

Този анализ се фокусира върху t-теста, за да провери разликата между двете стандартни популации на разпределение. В зависимост от сложността на данните може да се наложи друг статистически тест.