Как да намерим режима на набор от числа

Автор: John Stephens
Дата На Създаване: 1 Януари 2021
Дата На Актуализиране: 1 Юли 2024
Anonim
Прохождение God of War (2022) PC – 12: Клад Фафнира
Видео: Прохождение God of War (2022) PC – 12: Клад Фафнира

Съдържание

В статистиката режим на набор от числа е числата се появяват най-често в тази популация. Наборът от данни не трябва да има само един режим - ако две или повече стойности се считат за най-често срещани, тогава този набор от данни може да бъде извикан бимодален (два режима) или мултимодални (multimode) - с други думи, всички най-често срещани стойности са режимът на набора. За подробности относно определянето на режима на набор от данни вижте стъпка 1 по-долу, за да започнете.

Стъпки

Метод 1 от 2: Намерете режима на набор от данни

  1. Избройте номерата във вашия набор от данни. Режимите често се получават от набори от статистически точки от данни или от списък с числови стойности. Така че, за да намерите режим, трябва да имате набор от данни, който да търсите. Трудно е да се изчислят стойностите на режима само чрез визуализация, с изключение на наборите от данни, които са твърде малки, така че в повечето случаи най-мъдрият начин е да напишете (или въведете) зададените от вас данни. . Ако работите с хартия и молив, просто напишете стойностите в набора си от данни по ред, докато използвате калкулатор, може да се наложи да използвате програма на Excel.
    • Процесът на намиране на режима на набор от данни е по-лесен за разбиране, когато е илюстриран с пример. В този раздел нека използваме следния набор от стойности като пример: {18, 21, 11, 21, 15, 19, 17, 21, 17}. В следващите стъпки ще намерим режима на тази колекция.

  2. Сортирайте числата от най-малките до най-големите. Разумно е да подредите стойностите на набора от данни във възходящ ред. Въпреки че това не е задължително, това улеснява процеса на намиране на режима, тъй като групира подобни стойности рамо до рамо. За големи масиви от данни това е наистина необходимо, тъй като е трудно да се категоризират дългите списъци и да се запомни колко пъти всеки номер се появява в списъка и може да доведе до грешки.
    • Ако работите с хартия и молив, записването може да спести време в дългосрочен план. Прегледайте набора от числа, за да видите кое число е най-малкото и след като го намерите, стартирайте новия набор от данни с това най-малко число, последвано от второто, третото най-малко и т.н. Уверете се, че сте написали всяко число, равно на броя пъти, когато се е появило в оригиналния набор от данни.
    • С калкулатора можете да сортирате списъци със стойности от малки до големи само с няколко щраквания
    • В горния пример, след сортирането на новия ни списък ще бъде: {11, 15, 17, 17, 18, 19, 21, 21, 21}.

  3. Пребройте броя на повторенията на всяко число. Следващата стъпка е да преброите колко пъти всяко число се появява в комплекта.Намерете стойността, която се среща най-често в набора от данни. За сравнително малки набори от данни, чиито точки са сортирани във възходящ ред, намирането на "клъстери" с подобни стойности и преброяването на появите им е относително просто.
    • Ако работите с хартия и молив, запомнете броя си, запишете колко пъти всяка стойност се появява във всяка група от еднакви числа. Ако използвате програма за десктоп Excel, можете да направите същото, като ги напишете в полето до тях или като използвате една от функциите на програмата, за да преброите точките от данни.
    • В нашия пример ({11, 15, 17, 17, 18, 19, 21, 21, 21}), 11 се появява веднъж, 15 се случва веднъж, 17 се случва два пъти, 18 се случва веднъж. веднъж, 19 се появяват веднъж и 21 се появи три пъти. 21 е най-честата стойност в този набор от данни.

  4. Определете стойността, която се среща най-често. Когато знаете колко повторения възниква всяка стойност, намерете стойността с най-много повторения. Това е режимът на вашия набор от данни. Отбележи, че В даден набор от данни може да има повече от един режим. Ако две стойности имат равни най-много повторения в популацията, тогава множеството е бимодален (два режима), ако има три такива стойности, тогава комплектът е тримодален (три режима) и т.н.
    • В горния пример ({11, 15, 17, 17, 18, 19, 21, 21, 21}), тъй като 21 се среща най-много, 21 е режимът.
    • Ако една стойност повече от 21 също се появява три пъти (като в комплекта има допълнителни 17), след това 21 и този номер и двете ще бъде режимът.
  5. Не бъркайте режима със средната или средната стойност. Три статистически понятия, които често се споменават заедно, са средно, медиана и режим. Тъй като тези понятия имат подобни звучащи имена и тъй като в набор от данни стойността понякога може да бъде затворена. повече от един роли в тези числа, така че е лесно да ги объркате. Независимо от това дали вашият набор от данни има режими или не, той винаги има медиана или средна стойност. Важно е да се разбере, че тези три концепции са напълно независими една от друга. Виж отдолу:
    • Означава на набор от данни е средната стойност на този набор. За да намерите средната стойност, добавете всички стойности в набора заедно, след което разделете сумата на броя на членовете в набора. Например първоначалният набор от числа ({11, 15, 17, 17, 18, 19, 21, 21, 21}), средната стойност ще бъде 11 + 15 + 17 + 17 + 18 + 19 + 21 + 21 + 21 = 160/9 = 17.78. 9 означава, че в комплекта има 9 цифри.

    • Медиана на набор от данни е "средното число", което разделя малките и големите стойности на този набор на две равни половини. Вземете примера по-горе, ({11, 15, 17, 17, 18, 19, 21, 21, 21}) 18 е медиана, защото е средното число - има точно четири числа по-големи от него и четири числа по-малко от него. Имайте предвид, че ако броят на стойностите в набора е четен, тогава медианата е средната аритметична стойност на двете средни числа.

    реклама

Метод 2 от 2: Намиране на режим в специални случаи

  1. В наборите от данни, където всяка стойност има равен брой повторения, няма режим. Ако стойностите в даден набор се срещат същия брой пъти, този набор от данни няма режим, тъй като нито едно число не се появява повече от което и да е друго. Например наборите от данни, в които всяка стойност се среща само веднъж, нямат режим. Същото важи и за набори от данни със стойности, които се срещат два пъти, три пъти и т.н.
    • Ако променим примерния набор от данни на {11, 15, 17, 18, 19, 21}, така че всяка стойност да се появява само веднъж, сега този набор от данни Няма режим. Същото е, ако променим набора от данни така, че всяка стойност да се появява два пъти: {11, 11, 15, 15, 17, 17, 18, 18, 19, 19, 21, 21}.
  2. Режимите на нечислови набори от данни могат да бъдат намерени по същия начин, както при наборите от цифрови данни. Като цяло повечето набори от данни са Количествено - те съдържат цифрови данни. Някои набори от данни обаче съдържат информация, която не е представена като число. В тези случаи "режим" все още е най-често срещаната стойност в този набор от данни, точно както в числовия набор от данни. В тези случаи намирането на режима е възможно, докато средното или средното не е възможно.
    • Вземете пример в биологичното проучване за идентифициране на дървесните видове в региона. Наборът от данни за видовете дървета в региона е {Bang, Phuong, Bang, Thong, Bang, Bang, Phuong, Phuong, Thong, Bang}. Този тип набор от данни се нарича набор от данни Име тъй като точките с данни се разграничават само въз основа на името им. Режимът на набора от данни е Банг защото се появява най-много (пет пъти, докато Phuong се появява три пъти и Thong два пъти).
    • В горния пример не можете да изчислите средната стойност или средната стойност, тъй като точките от данни не са числови.
  3. За симетрични разпределения с режим режимът, средната стойност и медианата съвпадат. Както беше отбелязано по-горе, режимът, медианата и / или средната стойност могат да бъдат еднакви при определени обстоятелства. В случаите, ако функцията за плътност на набора от данни формира перфектно симетрична крива с един режим (напр. Крива на Гаус или крива "във формата на камбана"), тогава режимът, средната стойност и медианата ще бъдат същата стойност. Тъй като функцията за разпределение ще нанесе относителната поява на точките от данни, естественият режим ще бъде в средата на симетричната крива на разпределение, тъй като това е най-високата точка на графиката и съответства на стойността. най - известен. Тъй като наборът от данни е симетричен, тази точка на графиката ще съответства на медианата (средната стойност на набора от данни) и средната стойност (средната стойност на набора от данни).
    • Да разгледаме следния пример {1, 2, 2, 3, 3, 3, 4, 4, 5}. Ако начертаем разпределението на този набор от данни, получаваме крива на симетрия с височина 3 при x = 3 и надолу до 1 при x = 1 и x = 5. Тъй като 3 е цената лечение най-често, това е режимът. Тъй като средната 3 стойност на набора има 4 стойности от двете страни, 3 също медиана. И накрая, средната стойност на популацията е 1 + 2 + 2 + 3 + 3 + 3 + 4 + 4 + 5 = 27/9 = 3, което означава, че 3 също е средно.
    • Изключение от това правило е, че симетричните набори от данни имат повече от един режим - в този случай, тъй като има само една медиана и средна стойност за този набор от данни, и двата режима няма да съвпадат с останалите точки. .
    реклама

Съвети

  • Можете да имате повече от един режим.
  • Ако всички числа се показват само веднъж, няма режим.

От какво имаш нужда

  • Хартия, молив и гума