1. ObrazovanjeMathStatistikaStatistika i histogrami
Statistička radna bilježnica za lutke s mrežnom praksom, 2. izdanje

Autor Deborah J. Rumsey

Histogram je grafikon stvoren za kvantitativne podatke. Budući da su podaci numerički, podijelite ih u grupe bez ostavljanja praznina između (pa su šipke povezane). Osovina Y pokazuje bilo frekvencije (broji) ili relativne frekvencije (procent) podataka koji spadaju u svaku skupinu.

Kako izraditi histogram

Da biste napravili histogram, prvo podijelite svoje podatke na razuman broj skupina jednake duljine. Zbrojite broj vrijednosti u skupu podataka koji spadaju u svaku skupinu (drugim riječima napravite tablicu učestalosti). Ako tačka podataka padne na granicu, odlučite u koju skupinu ćete je staviti, pazeći da ostanete dosljedni (uvijek je stavite u višu od dvije ili je uvijek stavite u nižu od dvije). Napravite grafikon pomoću grupa i njihovih frekvencija - frekvencijski histogram.

Ako frekvencije podijelite s ukupnom veličinom uzorka, dobit ćete postotak koji spada u svaku skupinu. Tablica koja prikazuje skupine i njihov postotak je tablica relativne učestalosti. Odgovarajući histogram je histogram relativne frekvencije.

Za izradu histograma možete koristiti Minitab ili neki drugi softverski paket, a možete napraviti i histograme ručno. U svakom slučaju, vaš izbor intervalnih širina (nazvanih kante po računalnim paketima) može se razlikovati od onih vidljivih na slikama, što je u redu, sve dok vaš izgled izgleda slično. I oni će, sve dok ne upotrebljavate neuobičajeno mali ili veliki broj šipki, a barovi su jednake širine.

Možete odabrati i različite početne / završne točke za svaki interval, ai to je u redu. Samo označite sve jasno kako bi vaš instruktor mogao vidjeti što pokušavate učiniti. I budite dosljedni u vrijednostima koje završavaju točno na granici; uvijek ih stavljajte u donje grupiranje ili ih uvijek stavljajte u gornje. Ako ipak odlučite, napravite svoje histograme pomoću računalnog paketa poput Minitaba. To vam olakšava zadatak.

Pogledajte primjer za izradu dviju vrsta histograma.

Rezultati testova za razred od 30 učenika prikazani su u sljedećoj tablici.

Frekvencijski histogrami i histogrami relativne frekvencije izgledaju isto; upravo su rađene pomoću različitih vaga na Y-osi.

Histogram frekvencije za podatke o rezultatima prikazan je na sljedećoj slici.

frekvencijski histogram

Relativne frekvencije pronalazite tako da uzmete svaku frekvenciju i podijelite sa 30 (ukupna veličina uzorka). Relativne frekvencije za ove tri skupine su 8/30 = 0,27 ili 27%; 16/30 = 0,53 ili 53%; i 6/30 = 0,20, odnosno 20%, respektivno.

Histogram temeljen na relativnim frekvencijama izgleda isto kao i histogram (istih podataka). Jedina razlika je oznaka na osi Y.

Imajući smisla za histograme

Histogram vam daje opće informacije o tri glavne značajke vaših kvantitativnih (numeričkih) podataka: oblik, središte i širina.

Oblik histograma prikazan je njegovim općim obrascem. Mogući su mnogi obrasci, a neki su uobičajeni, uključujući sljedeće:

  • Zvonasta oblika: Izgleda poput zvona - velika kvrga u sredini i repovi koji se spuštaju sa svake strane približno jednakom brzinom. (Slika a) Desno nakrivljen: Veliki dio podataka odlazi s lijeve strane, a nekoliko većih promatranja zaostaje desno. (Slika b) Lijevo je nakrivljen: Veliki dio podataka je postavljen desno, a nekoliko manjih opažanja slijeva se s lijeve strane. (Slika c) Uniforma: Sve šipke imaju sličnu visinu. (Slika d) Bimodalni: dva vrha, ili (slika e) U-obliku: Bimodal s dva vrha na donjem i visokom kraju, s manje podataka u sredini. (Pogledajte sliku 4-1 (slika f) Simetrično: izgleda isto sa svake strane kad ga podijelite po sredini; zvonasti, uniformni i U-histogrami, svi su primjeri simetričnih podataka. (Slike a, d i f)
uobičajeni uzorci histograma

Središte histograma možete vidjeti na dva načina. Jedna je točka na osi x u kojoj grafikon uravnotežuje, uzimajući u obzir stvarne vrijednosti podataka. Ta se točka naziva prosjek, a možete je pronaći ako locirate točku izravnanja (zamislite da su podaci na toter-totter). Drugi način pregleda središta je lociranje crte na histogramu, gdje 50 posto podataka leži s obje strane. Linija se zove medijan i predstavlja fizičku sredinu skupa podataka. Zamislite da rezite histogram na pola tako da polovica područja leži s obje strane linije.

Širenje se odnosi na udaljenost između podataka, bilo u odnosu jedan prema drugom ili u odnosu na neku središnju točku. Jedan sirovi način mjerenja raširenja je pronaći raspon, odnosno udaljenost između najveće i najmanje vrijednosti. Drugi način je traženje prosječne udaljenosti od sredine, inače poznate kao standardno odstupanje. Standardno odstupanje teško je doći tako da pogledate histogram, ali možete dobiti grubu predodžbu ako uzmete raspon podijeljen sa 6. Ako su visine šipki blizu sredine vrlo velike, to znači da većina vrijednosti su blizu srednje vrijednosti, što ukazuje na malo standardno odstupanje. Ako se šipke čine kratkim, možda ćete imati veće standardno odstupanje.

Možete napraviti stvarne sažetke statistike za izračunavanje kvantitativnih podataka, ali histogram vam može dati općeniti smjer za pronalaženje tih prekretnica. Kao i pita dijagrami i grafikoni, nisu svi histogrami fer, cjeloviti i točni. Morate znati što tražiti da biste ih procijenili.

Kako ispraviti iskrivljene podatke histogramima

Morate posebno razmotriti skenirane skupove podataka, u pogledu kojih je statistika najprikladnije koristiti i kada. Također biste trebali biti svjesni kako pogrešna statistika može dati pogrešne odgovore.

Možete povezati srednju i srednju vrijednost kako biste saznali o obliku vaših podataka. Imajući srednju i srednju vrijednost jednaku stvorit će oblik koji je približno simetričan

Na sredinu utječu odmetnici u podacima, ali medijan nije. Ako su srednja vrijednost i srednja vrijednost bliski jedni drugima, podaci se ne nakrivljavaju i vjerovatno ne sadrže onestrane ljude s jedne ili druge strane. To znači da podaci izgledaju približno isto sa svake strane sredine, što je definicija simetričnih podataka (vidi a, d ili f na prethodnoj slici).

Činjenica da vam srednja vrijednost i srednja vrijednost budu bliski govore da su podaci grubo simetrični, može se upotrijebiti za drugu vrstu ispitnog pitanja. Pretpostavimo da vas netko pita jesu li podaci simetrični, a vi nemate histogram, ali imate srednju i srednju vrijednost. Usporedite dvije vrijednosti srednje i srednje vrijednosti, a ako su blizu, podaci su simetrični. Ako nisu, podaci nisu simetrični.

Kako uočiti pogrešan histogram

Čitatelji se mogu zavesti histogramom na načine koji nisu mogući sa crtastim grafikonom. Ne zaboravite da se histogram bavi numeričkim podacima, a ne kategoričkim podacima, što znači da morate odrediti kako želite da se numerički podaci razvrstavaju u grupe prikazuju na vodoravnoj osi. A kako odredite ta grupiranja, graf može učiniti da se razlikuje. Pazite na histograme koji koriste ljestvicu da bi zavaravali čitatelje. Kao i kod trajnih grafova, i ovdje možete pretjerivati ​​razlike tako što ćete koristiti manju skalu na okomitoj osi histograma, a razlike možete smanjiti upotrebom veće skale.