Nézzük mérésére vonatkozó valószínűségi változók (h
Konfidencia intervallum - intervallum, ami fedezi az ismeretlen értékét a becsült megoszlása a paraméter egy előre meghatározott valószínűség (általában arra utal, hogy minden mérhető érték).
Értékelése egy elosztó paraméter megbízhatósági intervallummal az úgynevezett intervallum becslés.
A fő előnye, intervallumbecslését - képes jellemezni a bizalom a számított paraméterek a forgalmazás. Például, azt mondhatjuk, „A 95% -os valószínűséggel az átlagos értéke a normális eloszlás az én adatok lesznek a tartományban 100-102, vagy, ahogy felírható ,.
Miért van szükség egy intervallum becslés? Tegyük fel, hogy szeretnénk megtudni a kérelem feldolgozása bármilyen webes szolgáltatást. Ahhoz, hogy ezt elérjük, hogy bizonyos mérések: következetesen kéréseket küldhetnek, választ kap kéréseket, rögzíti az időt a küldő és a kérelem kézhezvételét válasz (otlika idő). Ahogy talán már észre az előző rekordot, során a mérés, akkor kap egy csomó különböző reakcióidőt. Egyes értékek gyakrabban fordulnak elő, néhány - kevésbé. Mindez arra utal, hogy van dolgunk egy véletlen változó. Egy véletlen változó eloszlása van törvény, amely által számos paraméter. eloszlás paraméterei nem tudjuk, de tudjuk értékelni őket alapján a rendelkezésre álló minta (a mérési eredményeket). Például értékelése a normális eloszlás szórása minta eltérés.
Azonban a vizsgálat - is egy valószínűségi változó. Ez könnyen látható, ha fut az adatgyűjtési programja az első rekord újra. Kapsz körülbelül ugyanazokat az adatokat, de ennek ellenére ők más lesz, és így a minta eltérés más lesz. Más szóval, ez a becslés (vagy ahogy ők mondják, statisztikák) függ az adott mintában.
Szerint a központi határeloszlás-tétel, ha nagy számú mérést a kiértékelési paraméter eloszlás eloszlás közel a normális. Ezért minél több lesz egy minta, minta eltérés közelebb van a diszperziós (paraméter) a normális eloszlás törvény! De mikor hagyja abba? Egyértelmű, hogy ha teszünk 10.000 mérést, akkor elég (bizalmat 99,9999%) lesz képes pontosan felmérni a valós értékeket a paraméterek a forgalmazás, de gyakran ez nem lehetséges. Segítség jön intervallum becslés.
Azt mondják: „Nem akarjuk, hogy 10.000 mérés, de ez elég ahhoz, hogy bizalommal Becslésünk az eloszlás paramétereit 95% -kal.” Miután megbízhatósági intervallum számítás is lehet, hogy a 95% -os megbízhatósági elég csupán 50 mérés. Jelentős energia-megtakarítás és források!)
Jelöljük a valószínűsége a bizalmat. vagy a megbízhatóság, illetve a bizalmat (Eng megbízhatósági szinten.) - annak a valószínűsége, hogy a tényleges mért érték legyen a megbízhatósági intervallum. Az érték maga az úgynevezett szignifikanciaszint. Matematikailag ezt írhatjuk:
,
ahol - az igazi érték a becsült tartomány, - alacsonyabb érték a tartomány, - a felső.
Kíváncsi vagyok, mi már találkoztunk korábban is nevezték el a szignifikancia szintjét, de annak a valószínűségét jelzi elutasítását a null hipotézist.
Tehát, minél több, annál alacsonyabb a megbízhatósági szint és a szűkebb a megbízhatósági intervallum. Általában elég, akkor a megbízhatósági szint egyenlő lesz 95%.
Különböző eloszlása a különböző lehetőségeket, és ennek megfelelően az építési intervallum becslések ezen paraméterek eltérőek.
A konfidencia intervallumok a normális eloszlás
Lássuk, hogy néz ki egy megbízhatósági intervalluma a várható normális eloszlás ismert szórás (ne felejtsük, a szórás - a négyzetgyöke a szórás). Felmerül a kérdés, hogyan lehet tisztában a szórás? Ez a jellemző a véletlenszerű változó definiálható, például a termelés bármely termék műszaki eljárással biztosítani kell egy előre meghatározott standard deviáció. Ebben a helyzetben, a megbízhatósági intervallum alapján szerkesztett véletlenszerűen kiválasztott segít meghatározni -, hogy a termék gyártása standard. folyamatot.
, ahol n - a minta mérete, - a minta azt jelenti, és a legérdekesebb, - kvantilise a standard normális eloszlás (normális eloszlás egy elvárás mat = 0, szórása = 1) egy adott valószínűség.
Nem adunk minden számítás, hogy miért olyan által meghatározott megbízhatósági intervallum. Több elolvashatja az [1] (p. 50-55).
Hadd magyarázzam megint quantile. Kvantilis - ez olyan érték, amely egy véletlen szám nem haladja meg az előre meghatározott valószínűsége. Kvantilis - inverze az eloszlási függvény, azaz a .
Statisztikák a kis minták
Abban az esetben, ha a szórás nem ismert, és a minta mennyisége nem haladja meg a 10-30 értékeket használjuk a t-statisztika az értékelési érték eloszlás paramétere. t-statisztika számítják ki kvantilise a t-eloszlás (Student-féle eloszlás, lásd az első része ennek a sorozatnak a rekordok.), és határozza meg egyetlen paramétert - a fokú szabadságot. Normális eloszlás, ahol - a minta térfogata.
Ezután az intervallum becslés mat. elvárások a következők lesznek:
, ahol - Student együttható (a t érték kvantilis statisztikák érdekében, hogy a számát a szabadsági fokok df = n - 1), - a mintavételi variancia.
Megbízhatósági intervallumok exponenciális eloszlás
Miután a korábbi rekordot, megpróbáltam egy másik elosztása a rendelkezésre álló adatok - exponenciális. Kiderült, hogy ez jobban megfelel, mint az Erlang eloszlás. A mérési eredmények megtalálható az alábbi ábrát, és a mellékelt fájlban ipython notebook. Úgy tűnik, ez történik, mivel az a tény, hogy az eloszlás ezen konkrét adatokat nem marad farok.
Ezért továbbra is a mi például megtaláljuk a megbízhatósági intervallum paraméter az exponenciális eloszlás. By the way, ha használják az exponenciális eloszlás a számítások a sorbanállási elmélet, a paraméter az úgynevezett „intenzitás érkezési sorrend”, és ő azt jelentette volna, az átlagos átvétel időpontjában az új kérelmek időegység alatt.
Az értékelés az inverze a számtani közép minta, azaz
.