Kako izračunati emisije
U statistici emisije - ove su vrijednosti koje se oštro razlikuju od ostalih vrijednosti u sastavljenom skupu podataka. Emisija može ukazivati na anomalije u distribuciji podataka ili pogreškama u mjerenju, tako da su emisije iz podataka često isključene iz skupa podataka. Isključite emisiju iz skupa podataka, možete doći do neočekivanih ili preciznih zaključaka. Stoga je potrebno moći izračunati i ocjenjivati emisije kako bi se osiguralo pravilno razumijevanje statističkih podataka.
Korake
jedan. Naučite da prepoznate potencijalne emisije. Prije nego što uklonite odlazne vrijednosti iz skupa podataka, treba odrediti potencijalne emisije. Emisije su vrijednosti koje su vrlo različite od većine vrijednosti u skupu podataka - drugim riječima, emisije leže izvan trenda većine vrijednosti. Lako je otkriti u tablicama vrijednosti ili (posebno) na rasporedu. Ako su vrijednosti u skupu podataka na rasporedu, tada će emisije biti daleko od većine drugih vrijednosti. Ako, na primjer, većina vrijednosti leže naprijed, a zatim emisiju leže na obje strane takvog direktnog.
- Na primjer, razmotrite skup podataka koji predstavljaju temperaturu od 12 različitih objekata u sobi. Ako 11 objekata ima temperaturu od približno 70 stepeni, ali dvanaesti objekt (možda peć) ima temperaturu od 300 stepeni, a zatim brzo gledanje vrijednosti može pokazati da je peć vjerovatno emisija.
2. Organizirajte podatke uzlazno. Prvi korak prilikom određivanja emisija je izračun set podataka. Ovaj je zadatak u velikoj mjeri pojednostavljen ako se vrijednosti u skupu podataka nalaze uzlazno (od manjeg na više).
3. Izračunajte medijan skup podataka. Medijan skup podataka je vrijednost u sredini skupa podataka. Ako skup podataka sadrži neparni broj vrijednosti, srednja vrijednost je vrijednost koja se i nakon čega se isti broj vrijednosti nalazi u skupu podataka. Ali ako se skup podataka sadrži parni broj vrijednosti, onda morate pronaći aritmetički prosjek dvije srednje vrijednosti. Imajte na umu da se prilikom izračuna srednjih emisija obično označava kao Q2, jer leži između Q1 i Q3 - donjih i gornjih četvrtina koje ćemo kasnije definirati.
4. Izračunajte donje četvrtine. Ova vrijednost navedena kao Q1, ispod koje se nalazi 25% vrijednosti iz skupa podataka. Drugim riječima, polovina je vrijednosti smještenih pred medijanom. Ako Medijan leži još broj vrijednosti iz skupa podataka, morate pronaći prosječne aritmetičke dvije prosječne vrijednosti za izračunavanje Q1 (to je slično izračunavanju srednjeg sredstva).
pet. Izračunajte gornji kvartil. Ova vrijednost naznačena kao Q3, iznad koje se nalazi 25% vrijednosti iz skupa podataka. Proces izračunavanja Q3 sličan je procesu izračunavanja Q1, ali ovdje se smatra vrijednostima koje se nalaze nakon srednjeg.
6. Izračunajte opseg Esckelter. Izračunavanje Q1 i Q3, morate pronaći udaljenost između tih vrijednosti. Da biste to učinili, odbijte Q1 iz Q3. Vrijednost intermopozicije je izuzetno važna za određivanje granica vrijednosti koje nisu emisije.
7. Pronađite "unutarnje granice" vrijednosti u skupu podataka. Emisije se određuju kroz analizu vrijednosti - da li padaju ili ne u granica tzv. "Unutrašnjih granica" i "vanjskih granica". Vrijednost koja je podvrgnuta "unutrašnjim granicama" klasificirana je kao "beznačajna emisija", dok vrijednost iza "vanjskih granica" klasificira se kao "značajna emisija". Da biste pronašli unutrašnje granice, morate dodati ESCarotic raspon za 1,5 - rezultat se mora dodati u Q3 i odbiti iz Q1. Pronađena su dva broja koja su interne granice podataka.
osam. Pronađite "vanjske granice" set podataka. To se vrši na isti način kao i za unutarnje granice, osim što se međusobno prenose pridruživanje pomnoženo sa 3, a ne 1,5. Rezultat se mora dodati u Q3 i oduzmiti od Q1. Pronađena su dva broja koja su vanjska postavljena podatkovna granica.
devet. Koristite kvalitativnu procjenu kako biste utvrdili da li će ukloniti emisiju iz skupa podataka. Gore opisana metoda omogućava vam da utvrdite da li su neke emisije (beznačajne ili značajne). Međutim, ne varanje - vrijednost klasificirana kao emisija samo je "kandidat" za izuzetak, odnosno niste dužni da ga isključite. Razlog pojave emisije glavni je faktor koji utječe na odluku o isključivanju emisije. U pravilu, emisije koja nastaju zbog pogreške (u mjerenjima, zapisima i tako dalje) su isključena. S druge strane, emisije vezane za pogreške, već s novim informacijama ili trendom, u pravilu, ostavljaju u skupu podataka.
10. Izračunajte važnost (ponekad) emisiju ostavljene u skupu podataka. Neke emisije moraju biti isključene iz skupa podataka, jer su njihovi razlozi pogreške i tehnički problemi - ostale emisije moraju se ostaviti u skupu podataka. Ako, na primjer, emisija nije rezultat pogreške i / ili daje novo razumijevanje testnog fenomena, tada se mora ostaviti u skupu podataka. Naučni eksperimenti su posebno osjetljivi na emisiju - eliminirajući emisiju greškom, možete preskočiti neki novi trend ili otvaranje.
Savjeti
- Kad se nađu emisije, pokušajte objasniti njihovu prisutnost prije nego što ih isključite iz skupa podataka. Oni mogu ukazivati na greške u mjerenjima ili anomalije u distribuciji.
Sta ti treba
- Kalkulator