A kibocsátás kiszámítása
A kibocsátási statisztikákban - ezek olyan értékek, amelyek élesen különböznek az összeszerelt adatkészlet más értékeitől. A kibocsátás az adatelosztásban vagy a mérés hibáiban való anomáliákat jelezhet, így gyakran a kibocsátás kizárásra kerül az adatkészletből. A kibocsátás kizárása az adatkészletből, váratlan vagy pontosabb következtetésekre juthat. Ezért szükséges, hogy képes legyen kiszámítani és értékelni a kibocsátásokat a statisztikai adatok megfelelő megértésének biztosítása érdekében.
Lépések
egy. Ismerje meg, hogy felismerje a potenciális kibocsátásokat. Mielőtt megszünteti a kimenő értékeket az adatkészletből, meg kell határozni a potenciális kibocsátásokat. A kibocsátások olyan értékek, amelyek nagyon eltérőek a legtöbb értéktől az adatkészletben - más szavakkal, a kibocsátás a legtöbb érték trendjén kívül esik. Könnyen észlelhető az értékek vagy (különösen) az ütemtervekben. Ha az adatkészletben szereplő értékek az ütemezésen vannak, akkor a kibocsátások messze a legtöbb más értéktől fekszenek. Ha például az értékek többsége előre halad, akkor a kibocsátás az ilyen közvetlen mindkét oldalán fekszik.
- Például vegye figyelembe a 12 különböző objektum hőmérsékletét ábrázoló adatkészletet a szobában. Ha a 11 objektumnak körülbelül 70 fokos hőmérséklete van, de a tizenkettedik tárgy (esetleg a kemence) 300 fokos hőmérséklete van, majd az értékek gyors megtekintése azt mutathatja, hogy a kemence valószínűleg kibocsátás.

2. Rendezze az adatokat növekvő. Az első lépés a kibocsátás meghatározásakor az adatkészletek kiszámítása. Ez a feladat nagymértékben egyszerűsíthető, ha az adatkészlet értékei emelkednek (kisebb mértékben).

3. Számítsa ki a medián adatkészletet. A medián adatkészlet az adatkészlet közepén található érték. Ha az adatkészlet páratlan számú értéket tartalmaz, a medián az az érték, amelyhez és utána ugyanazok az értékek találhatók az adatkészletben. De ha az adatkészlet egyenletes értéket tartalmaz, akkor meg kell találnia a két közepes érték aritmetikai átlagát. Megjegyezzük, hogy ha kiszámítása medián kibocsátás általában feltüntetve, Q2, mivel ez az érték a Q1 és Q3 - alacsonyabb és a felső negyedek, hogy mi határozza meg később.

4. Kiszámítja az alsó negyedét. Ez az érték Q1-nek jelöli, amely alatt az adatok 25% -a az adatkészletből származik. Más szóval, a medián előtt található értékek fele. Ha a medián egyenletes számú értéket jelent az adatkészletből, meg kell találnia az átlagos aritmetikai két átlagos értéket a Q1 kiszámításához (ez hasonló a medián számításhoz).

öt. Számítsa ki a felső kvartilt. Ez a érték Q3-nak jelölt, amely fölött az adatok 25% -a az adatkészletből származik. A Q3 kiszámításának folyamata hasonló a Q1 kiszámításának folyamatához, de itt a medián után található értékek tekintik.

6. Számítsa ki az ESCKELTER tartományt. A Q1 és Q3 kiszámítása, meg kell találnia az értékek közötti távolságot. Ehhez levonja a Q1-t a Q3-tól. A lekötözés értéke rendkívül fontos az olyan értékek meghatározásához, amelyek nem kibocsátás.

7. Keressen "belső határokat" értékek az adatkészletben. A kibocsátásokat az értékek elemzésével határozzák meg - függetlenül attól, hogy esnek-e az úgynevezett "belső határok" és "külső határok" határain belül. A "belső határok" alatt álló érték "jelentéktelen kibocsátás", míg a "külső határok" mögötti érték "jelentős kibocsátás". A belső határok megkereséséhez hozzá kell adnia az escarocate tartományt 1,5-vel - az eredményt a Q3-hoz kell hozzáadni, és a Q1-től levonni kell. A két talált szám a belső adathatár határok.


nyolc. Keresse meg a "Külső határok" adatkészletet. Ez ugyanúgy történik, mint a belső határok, kivéve, hogy a kapcsolódási tartomány 3-mal, és nem pedig 1,5. Az eredményt a Q3-hoz kell hozzáadni, és kivonják a Q1-től. A két szám megtalálható a külső adatállomány határok.


kilenc. Minőségi értékelést használjon annak megállapítására, hogy megszüntesse-e az adatkészletből származó kibocsátást. A fent leírt módszer lehetővé teszi, hogy meghatározza, hogy néhány kibocsátás (jelentéktelen vagy jelentős). Azonban nem tévedve - a kibocsátásnak minősített érték csak egy "jelölt", hogy kivételt, vagyis nem köteles kizárni. A kibocsátás kialakulásának oka a kibocsátás kizárására vonatkozó határozatot érintő fő tényező. Rendszerként a hiba miatt (mérésekben, nyilvántartásokban és így tovább) keletkeznek, kizárták a kibocsátásokat. Másrészt a hibákhoz kapcsolódó kibocsátások, hanem az új információkkal vagy trendekkel általában az adatkészletben hagyják el.

10. Számítsa ki az adatkészletben maradt fontosságot (néha) kibocsátásokat. Egyes kibocsátást ki kell zárni az adatkészletből, mivel okai hibák és technikai problémák - más kibocsátásokat kell hagyni az adatkészletben. Ha például a kibocsátás nem egy hiba és / vagy a vizsgálati jelenség új megértését eredményezi, akkor az adatkészletben kell maradnia. A tudományos kísérletek különösen érzékenyek a kibocsátásra - a kibocsátás megszüntetése hibásan, kihagyhat néhány új trendet vagy nyílást.
Tippek
- Ha a kibocsátás megtalálható, próbálja meg magyarázni jelenlétüket, mielőtt kizárná őket az adatkészletből. Ezek jelezhetik a mérési hibákat vagy anomáliákat az elosztásban.
Amire szükséged van
- Számológép