Nézzük mérésére vonatkozó valószínűségi változók (h

Konfidencia intervallum - intervallum, ami fedezi az ismeretlen értékét a becsült megoszlása ​​a paraméter egy előre meghatározott valószínűség (általában arra utal, hogy minden mérhető érték).

Értékelése egy elosztó paraméter megbízhatósági intervallummal az úgynevezett intervallum becslés.

A fő előnye, intervallumbecslését - képes jellemezni a bizalom a számított paraméterek a forgalmazás. Például, azt mondhatjuk, „A 95% -os valószínűséggel az átlagos értéke a normális eloszlás az én adatok lesznek a tartományban 100-102, vagy, ahogy felírható ,.

Miért van szükség egy intervallum becslés? Tegyük fel, hogy szeretnénk megtudni a kérelem feldolgozása bármilyen webes szolgáltatást. Ahhoz, hogy ezt elérjük, hogy bizonyos mérések: következetesen kéréseket küldhetnek, választ kap kéréseket, rögzíti az időt a küldő és a kérelem kézhezvételét válasz (otlika idő). Ahogy talán már észre az előző rekordot, során a mérés, akkor kap egy csomó különböző reakcióidőt. Egyes értékek gyakrabban fordulnak elő, néhány - kevésbé. Mindez arra utal, hogy van dolgunk egy véletlen változó. Egy véletlen változó eloszlása ​​van törvény, amely által számos paraméter. eloszlás paraméterei nem tudjuk, de tudjuk értékelni őket alapján a rendelkezésre álló minta (a mérési eredményeket). Például értékelése a normális eloszlás szórása minta eltérés.

Azonban a vizsgálat - is egy valószínűségi változó. Ez könnyen látható, ha fut az adatgyűjtési programja az első rekord újra. Kapsz körülbelül ugyanazokat az adatokat, de ennek ellenére ők más lesz, és így a minta eltérés más lesz. Más szóval, ez a becslés (vagy ahogy ők mondják, statisztikák) függ az adott mintában.

Szerint a központi határeloszlás-tétel, ha nagy számú mérést a kiértékelési paraméter eloszlás eloszlás közel a normális. Ezért minél több lesz egy minta, minta eltérés közelebb van a diszperziós (paraméter) a normális eloszlás törvény! De mikor hagyja abba? Egyértelmű, hogy ha teszünk 10.000 mérést, akkor elég (bizalmat 99,9999%) lesz képes pontosan felmérni a valós értékeket a paraméterek a forgalmazás, de gyakran ez nem lehetséges. Segítség jön intervallum becslés.

Azt mondják: „Nem akarjuk, hogy 10.000 mérés, de ez elég ahhoz, hogy bizalommal Becslésünk az eloszlás paramétereit 95% -kal.” Miután megbízhatósági intervallum számítás is lehet, hogy a 95% -os megbízhatósági elég csupán 50 mérés. Jelentős energia-megtakarítás és források!)

Jelöljük a valószínűsége a bizalmat. vagy a megbízhatóság, illetve a bizalmat (Eng megbízhatósági szinten.) - annak a valószínűsége, hogy a tényleges mért érték legyen a megbízhatósági intervallum. Az érték maga az úgynevezett szignifikanciaszint. Matematikailag ezt írhatjuk:
,
ahol - az igazi érték a becsült tartomány, - alacsonyabb érték a tartomány, - a felső.

Kíváncsi vagyok, mi már találkoztunk korábban is nevezték el a szignifikancia szintjét, de annak a valószínűségét jelzi elutasítását a null hipotézist.

Tehát, minél több, annál alacsonyabb a megbízhatósági szint és a szűkebb a megbízhatósági intervallum. Általában elég, akkor a megbízhatósági szint egyenlő lesz 95%.

Különböző eloszlása ​​a különböző lehetőségeket, és ennek megfelelően az építési intervallum becslések ezen paraméterek eltérőek.

A konfidencia intervallumok a normális eloszlás

Lássuk, hogy néz ki egy megbízhatósági intervalluma a várható normális eloszlás ismert szórás (ne felejtsük, a szórás - a négyzetgyöke a szórás). Felmerül a kérdés, hogyan lehet tisztában a szórás? Ez a jellemző a véletlenszerű változó definiálható, például a termelés bármely termék műszaki eljárással biztosítani kell egy előre meghatározott standard deviáció. Ebben a helyzetben, a megbízhatósági intervallum alapján szerkesztett véletlenszerűen kiválasztott segít meghatározni -, hogy a termék gyártása standard. folyamatot.

, ahol n - a minta mérete, - a minta azt jelenti, és a legérdekesebb, - kvantilise a standard normális eloszlás (normális eloszlás egy elvárás mat = 0, szórása = 1) egy adott valószínűség.

Nem adunk minden számítás, hogy miért olyan által meghatározott megbízhatósági intervallum. Több elolvashatja az [1] (p. 50-55).

Hadd magyarázzam megint quantile. Kvantilis - ez olyan érték, amely egy véletlen szám nem haladja meg az előre meghatározott valószínűsége. Kvantilis - inverze az eloszlási függvény, azaz a .

Statisztikák a kis minták

Abban az esetben, ha a szórás nem ismert, és a minta mennyisége nem haladja meg a 10-30 értékeket használjuk a t-statisztika az értékelési érték eloszlás paramétere. t-statisztika számítják ki kvantilise a t-eloszlás (Student-féle eloszlás, lásd az első része ennek a sorozatnak a rekordok.), és határozza meg egyetlen paramétert - a fokú szabadságot. Normális eloszlás, ahol - a minta térfogata.

Ezután az intervallum becslés mat. elvárások a következők lesznek:

, ahol - Student együttható (a t érték kvantilis statisztikák érdekében, hogy a számát a szabadsági fokok df = n - 1), - a mintavételi variancia.

Megbízhatósági intervallumok exponenciális eloszlás

Miután a korábbi rekordot, megpróbáltam egy másik elosztása a rendelkezésre álló adatok - exponenciális. Kiderült, hogy ez jobban megfelel, mint az Erlang eloszlás. A mérési eredmények megtalálható az alábbi ábrát, és a mellékelt fájlban ipython notebook. Úgy tűnik, ez történik, mivel az a tény, hogy az eloszlás ezen konkrét adatokat nem marad farok.

Ezért továbbra is a mi például megtaláljuk a megbízhatósági intervallum paraméter az exponenciális eloszlás. By the way, ha használják az exponenciális eloszlás a számítások a sorbanállási elmélet, a paraméter az úgynevezett „intenzitás érkezési sorrend”, és ő azt jelentette volna, az átlagos átvétel időpontjában az új kérelmek időegység alatt.

Az értékelés az inverze a számtani közép minta, azaz
.

Hozzászólás navigáció