дисперзија вредности случајне променљиве око њене очекиване вредности From Wikipedia, the free encyclopedia
Стандардна девијација је у статистици апсолутна мера дисперзије у основном скупу. Она говори, колико у просеку елементи скупа одступају од аритметичке средине скупа. Означава се грчким словом сигма, σ.[1] Ниска стандардна девијација указује на то да вредности имају тенденцију да буду близу средње вредности (која се назива и очекиваном вредношћу) скупа, док висока стандардна девијација указује да су вредности распоређене у ширем опсегу.
Стандардна девијација може бити скраћено записана као СД, а најчешће је представљена у математичким текстовима и једначинама малим грчким словом сигма σ, за стандардну девијацију популације, или латиничним словом , за стандардну девијацију узорка.
Стандардна девијација случајне променљиве, узорка, статистичке популације, скупа података или расподеле вероватноће је квадратни корен њене варијансе. Она је алгебарски једноставнија, иако у пракси мање робустна, од просечног апсолутног одступања.[2][3] Корисна особина стандардне девијације је да је, за разлику од варијансе, изражена у истој јединици као и подаци.
Формула за израчунавање стандардне девијације је: ;
где је:
- број елемената у скупу
μ - аритметичка средина скупа
- -ти члан скупа ( =1,2,...,)
Стандардна девијација у узорку нам говори колико у просеку елементи узорка одступају од аритметичке средине узорка. Израчунава се по формули:
где је:
- број елемената у узорку
(икс-бар) - аритметичка средина узорка
- i-ти члан узорка (i =1,2,...,n)
У пракси, често се претпоставља да су подаци из приближно нормално расподељене популације. Ако је та претпоставка оправдана, онда се око 68% вредности налази у интервалу од плус-минус једне стандардне девијације од аритметичке средине, око 95% вредности се налази у интервалу од плус-минус две стандардне девијације, а око 99,7% се налази унутар плус-минус 3 стандардне девијације. Ово је познато као Правило 68-95-99,7, или емпиријско правило.
Интервали поверења су следећи:
σ | 68,26894921371% |
2σ | 95,44997361036% |
3σ | 99,73002039367% |
4σ | 99,99366575163% |
5σ | 99,99994266969% |
6σ | 99,99999980268% |
7σ | 99,99999999974% |
За нормалну расподелу, две тачке на кривој које су удаљене једну стандардну девијацију од криве су такође и превојне тачке.
Претпоставимо да је целокупна популација од интереса осам ученика у одређеном одељењу. За коначан скуп бројева, стандардна девијација популације се налази узимањем квадратног корена просека квадрата одступања вредности одузетих од њихове просечне вредности. Оцене одељења од осам ученика (тј. статистичке популације) су следећих осам вредности:
Ових осам тачака података имају средњу вредност (просек) од 5:
Прво се израчуна одступања сваке тачке података од средње вредности и квадрирају се резултати:
Варијанса је средња вредност ових вредности:
а стандардна девијација популације је једнака квадратном корену варијансе:
Ова формула важи само ако осам вредности са којима је започето чине комплетну популацију. Ако су вредности уместо тога биле случајни узорак извучен из неке велике родитељске популације (на пример, било је 8 ученика насумично и независно изабраних из класе од 2 милиона), онда се дели са 7 (што је − 1) уместо са 8 (што је n) у имениоцу последње формуле, а резултат је У том случају, резултат оригиналне формуле би био називан стандардна девијација узорка и означава са уместо са Дељење са − 1 уместо са даје непристрасну процену варијансе веће родитељске популације. Ово је познато као Беселова корекција.[4][5] Грубо речено, разлог за то је да се формула за варијансу узорка ослања на израчунавање разлика запажања од средње вредности узорка, а сама средња вредност узорка је конструисана да буде што је могуће ближа запажањима, тако да би само дељење са потценило варијабилност.
Ако је популација од интереса приближно нормално распоређена, стандардна девијација даје информације о пропорцији запажања изнад или испод одређених вредности. На пример, просечна висина одраслих мушкараца у Сједињеним Државама је око 70 инча (177,8 ), са стандардном девијацијом од око 3 инча (7,62 ). То значи да већина мушкараца (око 68%, под претпоставком нормалне дистрибуције) има висину унутар 3 инча (7,62 ) од средње вредности (67–73 инча (170,18–185,42 )) – једна стандардна девијација – и скоро сви мушкарци (око 95%) има висину унутар 6 инча (15,24 ) од средње вредности (64–76 инча (162,56–193,04 )) – две стандардне девијације. Ако је стандардна девијација нула, онда би сви мушкарци били високи тачно 70 инча (177,8 ). Ако би стандардна девијација била 20 инча (50,8 ), онда би мушкарци имали много варијабилнију висину, са типичним распоном од око 50–90 инча (127–228,6 ). Три стандардне девијације чине 99,7% популације узорка која се проучава, под претпоставком да је дистрибуција нормална или у облику звона (погледајте правило 68-95-99,7 или емпиријско правило за више информација).
Нека је μ очекивана вредност (просек) случајне променљиве X са густином :
Стандардна девијација σ од X је дефинисана као што се може показати једнаким са
Користећи речи, стандардна девијација је квадратни корен варијансе од X.
Стандардна девијација дистрибуције вероватноће је иста као и случајна променљива која има ту дистрибуцију.
Немају све случајне променљиве стандардну девијацију. Ако дистрибуција има велике репове који иду до бесконачности, могуће је да стандардна девијација не постоји, јер интеграл можда неће конвергирати. Нормална дистрибуција има репове који иду у бесконачност, али њена средња вредност и стандардна девијација постоје, јер се репови довољно брзо смањују. Парето расподела са параметром има средњу вредност, али не и стандардну девијацију (слободно говорећи, стандардна девијација је бесконачна). Кошијева расподела нема средњу вредност, ни стандардну девијацију.
У случају када X поприма случајне вредности из коначног скупа података x1, x2, …, x, при чему свака вредност има исту вероватноћу, стандардна девијација је
или, користећи запис сумирања,
Ако, уместо да имају једнаке вероватноће, вредности имају различите вероватноће, нека x1 има вероватноћу 1, x2 има вероватноћу 2, …, x има вероватноћу . У овом случају, стандардна девијација ће бити
Стандардна девијација континуиране случајне променљиве X реалне вредности са функцијом густине вероватноће је
и где су интеграли дефинитивни у односу на x у распону преко скупа могућих вредности случајне променљиве X.
У случају параметарске породице дистрибуција, стандардна девијација се може изразити у смислу параметара. На пример, у случају лог-нормалне дистрибуције са параметрима μ и σ2, стандардна девијација је
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.