Kako izračunati emisije

U statistici emisije - ove su vrijednosti koje se oštro razlikuju od ostalih vrijednosti u sastavljenom skupu podataka. Emisija može ukazivati ​​na anomalije u distribuciji podataka ili pogreškama u mjerenju, tako da su emisije iz podataka često isključene iz skupa podataka. Isključite emisiju iz skupa podataka, možete doći do neočekivanih ili preciznih zaključaka. Stoga je potrebno moći izračunati i ocjenjivati ​​emisije kako bi se osiguralo pravilno razumijevanje statističkih podataka.

Korake

  1. Slika pod nazivom Izračunajte odmetnike 1. korak 1
jedan. Naučite da prepoznate potencijalne emisije. Prije nego što uklonite odlazne vrijednosti iz skupa podataka, treba odrediti potencijalne emisije. Emisije su vrijednosti koje su vrlo različite od većine vrijednosti u skupu podataka - drugim riječima, emisije leže izvan trenda većine vrijednosti. Lako je otkriti u tablicama vrijednosti ili (posebno) na rasporedu. Ako su vrijednosti u skupu podataka na rasporedu, tada će emisije biti daleko od većine drugih vrijednosti. Ako, na primjer, većina vrijednosti leže naprijed, a zatim emisiju leže na obje strane takvog direktnog.
  • Na primjer, razmotrite skup podataka koji predstavljaju temperaturu od 12 različitih objekata u sobi. Ako 11 objekata ima temperaturu od približno 70 stepeni, ali dvanaesti objekt (možda peć) ima temperaturu od 300 stepeni, a zatim brzo gledanje vrijednosti može pokazati da je peć vjerovatno emisija.
  • Slika pod nazivom Izračunajte odmetnike korak 2
    2. Organizirajte podatke uzlazno. Prvi korak prilikom određivanja emisija je izračun set podataka. Ovaj je zadatak u velikoj mjeri pojednostavljen ako se vrijednosti u skupu podataka nalaze uzlazno (od manjeg na više).
  • U nastavku gore primjer, razmotrite sljedeće skup podataka, koji predstavljaju temperature od nekoliko objekata: {71, 70, 73, 70, 70, 71, 72, 72, 71, 71, 72, 71, 72, 72, 71. Ovaj komplet mora biti naručen na sljedeći način: {69, 69, 70, 70, 70, 70, 71, 71, 71, 72, 73, 300}.
  • Slika pod nazivom Izračunajte Odmetnike Korak 3
    3. Izračunajte medijan skup podataka. Medijan skup podataka je vrijednost u sredini skupa podataka. Ako skup podataka sadrži neparni broj vrijednosti, srednja vrijednost je vrijednost koja se i nakon čega se isti broj vrijednosti nalazi u skupu podataka. Ali ako se skup podataka sadrži parni broj vrijednosti, onda morate pronaći aritmetički prosjek dvije srednje vrijednosti. Imajte na umu da se prilikom izračuna srednjih emisija obično označava kao Q2, jer leži između Q1 i Q3 - donjih i gornjih četvrtina koje ćemo kasnije definirati.
  • Ne bojte se raditi sa skupom podataka u kojima će se parni broj vrijednosti - prosječne aritmetičke dvije prosječne vrijednosti biti broj koji nije u skupu podataka je normalan. Ali ako su dvije srednje vrijednosti isti broj, aritmetički prosjek je jednak ovom broju, također je u redoslijedu stvari.
  • U gornjem primjeru prosječne 2 vrijednosti su 70 i 71, tako da je medijan jednak ((70 + 71) / 2) = 70,5.
  • Slika pod nazivom Izračunajte Odmetnike Korak 4
    4. Izračunajte donje četvrtine. Ova vrijednost navedena kao Q1, ispod koje se nalazi 25% vrijednosti iz skupa podataka. Drugim riječima, polovina je vrijednosti smještenih pred medijanom. Ako Medijan leži još broj vrijednosti iz skupa podataka, morate pronaći prosječne aritmetičke dvije prosječne vrijednosti za izračunavanje Q1 (to je slično izračunavanju srednjeg sredstva).
  • U našem primjeru 6 vrijednosti se nalaze nakon srednje i 6 vrijednosti - na njega. To znači da bi trebalo izračunati donji kvartil, moramo pronaći aritmetički prosjek dva prosjeka šest vrijednosti koje leže medijan. Ovdje su prosječne vrijednosti 70 i 70. Dakle, Q1 = ((70 + 70) / 2) = 70.
  • Slika pod nazivom Izračunajte Odmetnike Korak 5
    pet. Izračunajte gornji kvartil. Ova vrijednost naznačena kao Q3, iznad koje se nalazi 25% vrijednosti iz skupa podataka. Proces izračunavanja Q3 sličan je procesu izračunavanja Q1, ali ovdje se smatra vrijednostima koje se nalaze nakon srednjeg.
  • U gornjem primjeru dvije prosječne vrijednosti iz šest vrijednosti koje leže nakon srednje su 71 i 72. Dakle, Q3 = ((71 + 72) / 2) = 71.5.
  • Slika pod nazivom Izračunajte odmetnike Korak 6
    6. Izračunajte opseg Esckelter. Izračunavanje Q1 i Q3, morate pronaći udaljenost između tih vrijednosti. Da biste to učinili, odbijte Q1 iz Q3. Vrijednost intermopozicije je izuzetno važna za određivanje granica vrijednosti koje nisu emisije.
  • U našem primjeru Q1 = 70 i Q3 = 71.5. Interkomunički raspon je 71,5 - 70 = 1,5.
  • Imajte na umu da se to odnosi na negativne vrijednosti Q1 i Q3. Na primjer, ako je Q1 = -70, tada međusobno sačlana opsega je 71,5 - (-70) = 141,5.
  • Slika pod nazivom Izračunajte odmetnike korak 7
    7. Pronađite "unutarnje granice" vrijednosti u skupu podataka. Emisije se određuju kroz analizu vrijednosti - da li padaju ili ne u granica tzv. "Unutrašnjih granica" i "vanjskih granica". Vrijednost koja je podvrgnuta "unutrašnjim granicama" klasificirana je kao "beznačajna emisija", dok vrijednost iza "vanjskih granica" klasificira se kao "značajna emisija". Da biste pronašli unutrašnje granice, morate dodati ESCarotic raspon za 1,5 - rezultat se mora dodati u Q3 i odbiti iz Q1. Pronađena su dva broja koja su interne granice podataka.
  • U našem primjeru, asortiman Interkombanatite jednak je (71,5 - 70) = 1,5. Sljedeće: 1,5 * 1,5 = 2,25. Ovaj se broj mora dodati u Q3 i oduzeti ga iz Q1 da biste pronašli interne granice:
  • 71,5 + 2,25 = 73,75
  • 70 - 2,25 = 67,75
  • Stoga su unutarnje granice jednake 67,75 i 73,75.
  • U našem primjeru samo temperatura peći - 300 stepeni - leži izvan ovih granica i može se smatrati maloljetnikom. Ali ne žurite sa zaključcima, potrebno je utvrditi je li ta temperatura značajna emisija. Slika pod nazivom Izračunajte Odmetnike Korak 7Bullet2
  • Slika pod nazivom Izračunajte Odmetnike Korak 8
    osam. Pronađite "vanjske granice" set podataka. To se vrši na isti način kao i za unutarnje granice, osim što se međusobno prenose pridruživanje pomnoženo sa 3, a ne 1,5. Rezultat se mora dodati u Q3 i oduzmiti od Q1. Pronađena su dva broja koja su vanjska postavljena podatkovna granica.
  • U našem primjeru, množite se na 3: 1,5 * 3 = 4,5. Izračunajte vanjske granice:
  • 71,5 + 4,5 = 76
  • 70 - 4,5 = 65,5
  • Dakle, vanjske granice su jednake 65,5 i 76.
  • Sve vrijednosti koje su izvan vanjskih granica smatraju se značajnim emisijama. U našem primjeru temperatura peći - 300 stupnjeva - smatra se značajnim emisijama.Slika pod nazivom Izračunajte odmetnike Korak 8Bullet2
  • Slika pod nazivom Izračunajte Odmetnike Korak 9
    devet. Koristite kvalitativnu procjenu kako biste utvrdili da li će ukloniti emisiju iz skupa podataka. Gore opisana metoda omogućava vam da utvrdite da li su neke emisije (beznačajne ili značajne). Međutim, ne varanje - vrijednost klasificirana kao emisija samo je "kandidat" za izuzetak, odnosno niste dužni da ga isključite. Razlog pojave emisije glavni je faktor koji utječe na odluku o isključivanju emisije. U pravilu, emisije koja nastaju zbog pogreške (u mjerenjima, zapisima i tako dalje) su isključena. S druge strane, emisije vezane za pogreške, već s novim informacijama ili trendom, u pravilu, ostavljaju u skupu podataka.
  • Jednako je važno procijeniti utjecaj emisija u srednjski skup podataka (bilo da ih iskrivljaju ili ne). Ovo je posebno važno kada donosite zaključke na osnovu medijanskog skupa podataka.
  • U našem primjeru, izuzetno je malo vjerovatno da će peć zagrijati na temperaturu od 300 stepeni (ako samo da ne uzima u obzir prirodne anomalije). Stoga se može zaključiti (s visokim udjelom povjerenja) da je takva temperatura mjerna greška koju želite isključiti iz skupa podataka. Štaviše, ako ne isključujete emisiju, medijan set podataka bit će jednak (69 + 69 + 70 + 70 + 70 + 72 + 73 + 300) / 12 = 89,67 stupnjeva, ali ako isključite emisiju, medijan bit će jednak (69 + 69 + 70 + 70 + 70 + 71 + 71 + 71 + 72 + 73) / 11 = 70,55 stepeni.
  • Emisije su obično rezultat ljudskih grešaka, pa emisije moraju biti isključene iz skupova podataka.
  • Slika pod nazivom Izračunajte Odmetnike Korak 10
    10. Izračunajte važnost (ponekad) emisiju ostavljene u skupu podataka. Neke emisije moraju biti isključene iz skupa podataka, jer su njihovi razlozi pogreške i tehnički problemi - ostale emisije moraju se ostaviti u skupu podataka. Ako, na primjer, emisija nije rezultat pogreške i / ili daje novo razumijevanje testnog fenomena, tada se mora ostaviti u skupu podataka. Naučni eksperimenti su posebno osjetljivi na emisiju - eliminirajući emisiju greškom, možete preskočiti neki novi trend ili otvaranje.
  • Na primjer, razvijamo novi lijek za povećanje veličine ribe u ribarstvu. Koristit ćemo stari skup podataka ({71, 70, 73, 70, 70, 70, 70, 72, 71, 300, 71, 69}), ali ovaj put će biti puno ribe (u gramima) nakon prijema Eksperimentalni lijek. Drugim riječima, prvi lijek dovodi do povećanja mase ribe do71 g, drugi lijek - do 70 g i tako dalje. U ovoj situaciji je 300 značajna emisija, ali ne bismo ga trebali isključiti - ako pretpostavimo da nije bilo grešaka u mjerenju, tada je takva emisija značajan uspjeh u eksperimentu. Lijek koji povećava težinu ribe do 300 grama djeluje značajno bolje od ostalih lijekova - na taj način 300 je najvažnija vrijednost u skupu podataka.
  • Savjeti

    • Kad se nađu emisije, pokušajte objasniti njihovu prisutnost prije nego što ih isključite iz skupa podataka. Oni mogu ukazivati ​​na greške u mjerenjima ili anomalije u distribuciji.

    Sta ti treba

    • Kalkulator
    Slične publikacije