A kibocsátás kiszámítása

A kibocsátási statisztikákban - ezek olyan értékek, amelyek élesen különböznek az összeszerelt adatkészlet más értékeitől. A kibocsátás az adatelosztásban vagy a mérés hibáiban való anomáliákat jelezhet, így gyakran a kibocsátás kizárásra kerül az adatkészletből. A kibocsátás kizárása az adatkészletből, váratlan vagy pontosabb következtetésekre juthat. Ezért szükséges, hogy képes legyen kiszámítani és értékelni a kibocsátásokat a statisztikai adatok megfelelő megértésének biztosítása érdekében.

Lépések

  1. A kép kiszámítása outliers 1. lépés
egy. Ismerje meg, hogy felismerje a potenciális kibocsátásokat. Mielőtt megszünteti a kimenő értékeket az adatkészletből, meg kell határozni a potenciális kibocsátásokat. A kibocsátások olyan értékek, amelyek nagyon eltérőek a legtöbb értéktől az adatkészletben - más szavakkal, a kibocsátás a legtöbb érték trendjén kívül esik. Könnyen észlelhető az értékek vagy (különösen) az ütemtervekben. Ha az adatkészletben szereplő értékek az ütemezésen vannak, akkor a kibocsátások messze a legtöbb más értéktől fekszenek. Ha például az értékek többsége előre halad, akkor a kibocsátás az ilyen közvetlen mindkét oldalán fekszik.
  • Például vegye figyelembe a 12 különböző objektum hőmérsékletét ábrázoló adatkészletet a szobában. Ha a 11 objektumnak körülbelül 70 fokos hőmérséklete van, de a tizenkettedik tárgy (esetleg a kemence) 300 fokos hőmérséklete van, majd az értékek gyors megtekintése azt mutathatja, hogy a kemence valószínűleg kibocsátás.
  • A kép kiszámítása outliers 2. lépés
    2. Rendezze az adatokat növekvő. Az első lépés a kibocsátás meghatározásakor az adatkészletek kiszámítása. Ez a feladat nagymértékben egyszerűsíthető, ha az adatkészlet értékei emelkednek (kisebb mértékben).
  • A fenti példák folytatása, tekintse meg az alábbi adatkészletet, amely több objektum hőmérsékletét ábrázolja: {71, 70, 73, 72, 71, 71, 72, 72, 71, 71, 72, 71, 72, 72, 71. Ezt a készletet a következőképpen kell megrendelni: {69, 69, 70, 70, 70, 70, 71, 71, 71, 72, 73, 300}}.
  • A kép kiszámítása outliers 3. lépés
    3. Számítsa ki a medián adatkészletet. A medián adatkészlet az adatkészlet közepén található érték. Ha az adatkészlet páratlan számú értéket tartalmaz, a medián az az érték, amelyhez és utána ugyanazok az értékek találhatók az adatkészletben. De ha az adatkészlet egyenletes értéket tartalmaz, akkor meg kell találnia a két közepes érték aritmetikai átlagát. Megjegyezzük, hogy ha kiszámítása medián kibocsátás általában feltüntetve, Q2, mivel ez az érték a Q1 és Q3 - alacsonyabb és a felső negyedek, hogy mi határozza meg később.
  • Ne félj dolgozni olyan adatkészletekkel, amelyekben egyenletes számú érték - az átlagos aritmetika két átlagos érték lesz az adatkészletben nem szereplő szám. De ha két átlagos érték azonos szám, akkor az aritmetikai átlag egyenlő ezzel a számmal, ez a dolgok sorrendjében is.
  • A fenti példában az átlagos 2 érték 70 és 71, így a medián egyenlő ((70 + 71) / 2) = 70,5.
  • A kép kiszámítása outliers 4. lépés
    4. Kiszámítja az alsó negyedét. Ez az érték Q1-nek jelöli, amely alatt az adatok 25% -a az adatkészletből származik. Más szóval, a medián előtt található értékek fele. Ha a medián egyenletes számú értéket jelent az adatkészletből, meg kell találnia az átlagos aritmetikai két átlagos értéket a Q1 kiszámításához (ez hasonló a medián számításhoz).
  • Példánkban 6 érték a medián és a 6 érték után található - hozzá. Ez azt jelenti, hogy az alsó kvartilis kiszámításához meg kell találnunk a hat érték két átlagát, amely a medián felé fekszik. Itt az átlagos értékek 70 és 70. Így Q1 = ((70 + 70) / 2) = 70.
  • A kijelölt kép kiszámítása outliers 5. lépés
    öt. Számítsa ki a felső kvartilt. Ez a érték Q3-nak jelölt, amely fölött az adatok 25% -a az adatkészletből származik. A Q3 kiszámításának folyamata hasonló a Q1 kiszámításának folyamatához, de itt a medián után található értékek tekintik.
  • A fenti példában két átlagos érték a medián után fekvő hat értékből 71 és 72. Így Q3 = ((71 + 72) / 2) = 71,5.
  • A kép kiszámítása outliers 6. lépés
    6. Számítsa ki az ESCKELTER tartományt. A Q1 és Q3 kiszámítása, meg kell találnia az értékek közötti távolságot. Ehhez levonja a Q1-t a Q3-tól. A lekötözés értéke rendkívül fontos az olyan értékek meghatározásához, amelyek nem kibocsátás.
  • A Q1 = 70 és Q3 = 71,5. A kerekes tartomány 71,5 - 70 = 1,5.
  • Ne feledje, hogy ez vonatkozik a Q1 és a Q3 negatív értékeire. Például, ha Q1 = -70, akkor a kapcsolódási tartomány 71,5 - (-70) = 141,5.
  • A kép kiszámítása outliers 7. lépés
    7. Keressen "belső határokat" értékek az adatkészletben. A kibocsátásokat az értékek elemzésével határozzák meg - függetlenül attól, hogy esnek-e az úgynevezett "belső határok" és "külső határok" határain belül. A "belső határok" alatt álló érték "jelentéktelen kibocsátás", míg a "külső határok" mögötti érték "jelentős kibocsátás". A belső határok megkereséséhez hozzá kell adnia az escarocate tartományt 1,5-vel - az eredményt a Q3-hoz kell hozzáadni, és a Q1-től levonni kell. A két talált szám a belső adathatár határok.
  • Példánkban az Intercomite termékcsalád egyenlő (71,5 - 70) = 1,5. Következő: 1.5 * 1,5 = 2,25. Ezt a számot a Q3-hoz kell hozzáadni, és kivonja azt a Q1-től, hogy megtalálja a belső határokat:
  • 71.5 + 2.25 = 73,75
  • 70 - 2,25 = 67,75
  • Így a belső határok 67,75 és 73,75.
  • Példánkban csak a kemence hőmérséklete - 300 fok - e határokon kívül esik, és kisebbnek tekinthető. De ne rohanjon a következtetésekkel, meg kell határozni, hogy ez a hőmérséklet jelentős kibocsátás. A kép kiszámítása outliers lépés 7Bullet2
  • A kép kiszámítása outliers 8. lépés
    nyolc. Keresse meg a "Külső határok" adatkészletet. Ez ugyanúgy történik, mint a belső határok, kivéve, hogy a kapcsolódási tartomány 3-mal, és nem pedig 1,5. Az eredményt a Q3-hoz kell hozzáadni, és kivonják a Q1-től. A két szám megtalálható a külső adatállomány határok.
  • Példánkban többszöröztük meg az escarotic tartományt 3: 1,5 * 3 = 4.5. Számítsa ki a külső határokat:
  • 71.5 + 4,5 = 76
  • 70 - 4.5 = 65,5
  • Így a külső határok 65,5 és 76.
  • A külső határokon kívüli bármely érték jelentős kibocsátásnak számít. Példánkban a kemence hőmérséklete - 300 fokos - jelentős kibocsátásnak számít.A kép kiszámítása outlierek 8Bullet2
  • A kép kiszámítása outlierek 9. lépés
    kilenc. Minőségi értékelést használjon annak megállapítására, hogy megszüntesse-e az adatkészletből származó kibocsátást. A fent leírt módszer lehetővé teszi, hogy meghatározza, hogy néhány kibocsátás (jelentéktelen vagy jelentős). Azonban nem tévedve - a kibocsátásnak minősített érték csak egy "jelölt", hogy kivételt, vagyis nem köteles kizárni. A kibocsátás kialakulásának oka a kibocsátás kizárására vonatkozó határozatot érintő fő tényező. Rendszerként a hiba miatt (mérésekben, nyilvántartásokban és így tovább) keletkeznek, kizárták a kibocsátásokat. Másrészt a hibákhoz kapcsolódó kibocsátások, hanem az új információkkal vagy trendekkel általában az adatkészletben hagyják el.
  • Ugyanilyen fontos, hogy becsülje meg a kibocsátások hatását a medián adatkészletre (akár torzítják, akár nem). Ez különösen fontos, ha következtetéseket hoz létre a medián adatkészlet alapján.
  • Példánkban rendkívül valószínűtlen, hogy a kemence 300 fokos hőmérsékletre melegszik (ha csak nem veszi figyelembe a természetes anomáliákat). Ezért megállapítható (nagy bizalmi részesedéssel), hogy az ilyen hőmérséklet mérési hiba, amelyet az adatkészletből kizárni szeretné. Továbbá, ha nem zárja ki a kibocsátást, a medián adatkészlet egyenlő (69 + 69 + 70 + 70 + 70 + 72 + 73 + 300) / 12 = 89,67 fok, de ha kizárja a kibocsátást, a mediánt egyenlő (69 + 69 + 70 + 70 + 70 + 71 + 71 + 71 + 72 + 73) / 11 = 70,55 fok.
  • A kibocsátások általában az emberi hibák eredménye, ezért a kibocsátásokat ki kell zárni az adatkészletekből.
  • A kép kiszámítása outliers 10. lépés
    10. Számítsa ki az adatkészletben maradt fontosságot (néha) kibocsátásokat. Egyes kibocsátást ki kell zárni az adatkészletből, mivel okai hibák és technikai problémák - más kibocsátásokat kell hagyni az adatkészletben. Ha például a kibocsátás nem egy hiba és / vagy a vizsgálati jelenség új megértését eredményezi, akkor az adatkészletben kell maradnia. A tudományos kísérletek különösen érzékenyek a kibocsátásra - a kibocsátás megszüntetése hibásan, kihagyhat néhány új trendet vagy nyílást.
  • Például új gyógyszert dolgozunk ki a halak méretének növelésére. A régi adatkészletet ({71, 70, 73, 70, 70, 70, 70, 72, 71, 300, 71, 69}) fogjuk használni, de ezúttal sok hal (grammban) lesz Kísérleti gyógyszer. Más szavakkal, az első gyógyszer a 71 g-ig terjedő halak tömegének növekedéséhez vezet, a második gyógyszer - akár 70 g, és így tovább. Ebben a helyzetben a 300 jelentős kibocsátás, de nem szabad kizárnunk - ha feltételezzük, hogy nincs mérési hibák, akkor az ilyen kibocsátás jelentős siker a kísérletben. A kábítószer, amely növeli a haltömegig, akár 300 gramm, szignifikánsan jobb, mint a többi gyógyszer - Ilyen módon a 300 a legfontosabb érték az adatkészletben.
  • Tippek

    • Ha a kibocsátás megtalálható, próbálja meg magyarázni jelenlétüket, mielőtt kizárná őket az adatkészletből. Ezek jelezhetik a mérési hibákat vagy anomáliákat az elosztásban.

    Amire szükséged van

    • Számológép
    Hasonló publikációk