Statistika õppimine alates esitlusest kuni andmete levitamise meetmeteni

Statistika on matemaatikateadus, mis uurib andmete kogumist, töötlemist, analüüsi ja esitamist. Statistikat kasutatakse kindlustusseltsides laialdaselt, üks neist on kindlustuspoliisi kindlustusmakse suuruse määramine. Iga kindlustuse omanik peab maksma sissemakse, mida nimetatakse kindlustusmakseks. Makstav preemia on kooskõlas tema saadud kindlustuskaitsega.

Siin kasutab kindlustusselts statistikat, et kindlustusmakse suurus oleks kooskõlas kindlustuse omanikule pakutava kindlustuskaitse suurusega. Nii saavad sellest kasu mõlemad osapooled.

Nagu varem mainitud, pole statistika mitte ainult andmete kogumine ja töötlemine, vaid ka andmete esitamine. Statistika kasutab andmete töötlemisel ka mitmeid andmete levitamise meetmeid. Täna arutleme nii esitamise tüüpide kui ka andmete leviku suuruse üle statistikas.

Andmete esitamise tüübid

Statistika andmete esitamise tüübid hõlmavad sageduse jaotustabeleid, histogramme, hulknurki ja ogive.

Andmete esitamise esimene vorm on sageduse jaotustabeli kasutamine. Nagu nimigi ütleb, kasutame saadud andmete tüübi ja hulga kuvamiseks tabeleid. Sageduse jaotustabelil on ka mitut tüüpi, nimelt üksikute andmete ja rühma andmete sageduse jaotustabel.

(Loe ka: kaks mõõteandet statistikas)

Väikeste andmemahtude, vähemalt vähem kui 30 andmete esitamiseks kasutatakse ühte andmete sageduse jaotustabelit. Järgmine näide andmete esitamisest ühe andmesageduse jaotustabeli abil.

Allpool toodud andmed on 30 õpilase testi tulemused. Esitatakse ühes andmesageduse jaotustabelis!

4 8 7 9 10 3 4 6 7 6 5 7 7 8 9 6 6 8 7 9 4 5 6 7 8 10 4 5 6 7

Kui pöörame tähelepanu, on madalaim testitulemus 3, kõrgeim aga 10. Seejärel arvutatakse nende skooride põhjal õpilaste arv, kes selle saavad. Hinne 3 puhul näiteks ainult 1 õpilane. 4. klassi jaoks on 4 õpilast jne. Seejärel esitatakse see joonis järgmises tabelis.

turbiinid avamere tuulepargi maapinnal

Järgmine sageduse jaotustabeli tüüp on grupi andmete sageduse jaotustabel. Seda tabelit kasutatakse suure hulga andmete esitamiseks, mis on üle 30 andmete. Vaatame allpool toodud näidet.

Järgmine on tšillitaimede kõrgus (millimeetrites) tšillipuuistanduses. Esitage andmed rühma andmete jaotamise tabelis!

123 131 120 128 126 124 125 122

121 126 124 123 122 120 125 126

123 123 134 125 125 126 128 135

120 126 124 133 126 127 123 126

122 125 123 132 124 132 128 124

Erinevalt üksikutest andmetest peame siin arvutama tabelis kuvatavate klasside arvu ja klasside pikkused. Kasutades ülaltoodud andmeid, on siin arvutused.

Palju andmeid (n) = 40

Maksimaalne kõrgus (x max ) = 135

Minimaalne kõrgus (x min ) = 120

Vahemik (J) = x max  - x min = 135 - 120 = 15

Klasside arv (k) = 1 + 3,3logn = 1 + 3,3 log40 = 6,2868… ≈ k = 6

Klassi pikkus (c) = J / k = 15/6 = 2,5 ≈ c = 3

Nendest tulemustest saame kuvada rühma andmete jaotamise tabeli järgmiselt.

turbiinid avamere tuulepargi maapinnal

Järgnevalt käsitleme muid rühmitatud andmete esitamise tüüpe, nimelt histogrammide, sageduspolügoonide ja ogiilide kujul. Heitke pilk allpool olevale sagedustabelile, mis sisaldab 80 spordiklubi liikme kaaluteavet.

turbiinid avamere tuulepargi maapinnal

Andmete esitamiseks histogrammi graafiku abil konstrueerime kõigepealt ristkülikukaardi. X-telg näitab iga klassi ülemist ja alumist piiri, y-telg aga sagedust.

statistika4 (1)

Erinevalt histogrammist võtab sagedushulknurkgraafik klassi intervalli keskmise väärtuse ja kuvab selle vastavalt sagedusele joontega.

statistika5 (1)

Lõpuks kasutatakse andmete esitamisel positiivset kumulatiivset või negatiivset sageduskõverat. Kõigepealt märkige y-teljele iga intervalliklassi kumulatiivsed sageduse väärtused. Seejärel märkige punktide koordinaadid vastavalt intervalliklassi ja kumulatiivse sageduse ülemistele paaridele. Ühendage punktid ühtlaseks kõveraks.

Andmete leviku suurus

Statistikas on andmete mõõtmist kahte tüüpi, nimelt andmete kontsentratsiooni suurus ja andmete jaotuse suurus. Mis on seletus ja erinevus?

Andmekeskuse suurus on väärtus, mis tähistab andmete asukohta. Andmekeskses mõõtühikus on keskmised, režiimid ja mediaanid.

Keskmine või keskmine on kõigi vaadeldud andmete suure hulga andmetega summa jagatis. Keskmise võime sõnastada järgmiselt.

Keskmine = (kõigi andmete summa) / (palju andmeid)

Parema mõistmise nimel töötame järgmise näite probleemiga. Tundide arv nädalas, mida 5 inimest vajab keskkonnas sotsiaalseks tegevuseks, on 10, 7, 13, 20 ja 15 tundi. Määrake keskmine tundide arv nädalas, mille nad veedavad ühiskondlikuks tegevuseks!

Ülaltoodud probleemide põhjal saame numbrid valemisse sisestada järgmiselt.

Keskmine = (10 + 7 + 13 + 20 + 15) / 5 = 65/5 = 13

See tähendab, et keskmine ühiskondlikuks tegevuseks kulutatud tundide arv on 13 tundi.

Lisaks keskmisele või keskmisele on olemas ka režiimid. Režiim on väärtus, mis esineb andmetes kõige sagedamini. Vaatame järgmise probleemi näidet.

Allpool on toodud mõne 7. klassi õpilase kaaluandmed (kilogrammides). Määrake andmete režiim!

32, 35, 33, 32, 34, 31, 35, 35, 31, 34, 35, 3

Kõigepealt peame loendama, mitu korda iga väärtus andmetes ilmub. Nende andmete põhjal saame 31 (x3), 32 (x2), 33 (x1), 34 (x2) ja 35 (x4). Kuna 35 esineb kõige sagedamini, on ülaltoodud andmete režiim 35.

Viimane tsentreerivate mõõtmete tüüp on mediaan. Mediaan jagab andmed kaheks võrdseks osaks, nii et mediaan on sorteeritud andmete keskmine väärtus.

Mediaani määramiseks peame kõigepealt sortima kõik andmed kahanevas või kasvavas järjekorras. Teiseks määrake palju andmeid ja sümboliseerige neid kui "n". Kui n on paaritu, on meie kasutatav valem järgmine.

Mediaan = andmenumber - ((n + 1) / 2)

Kui n on paaris, kasutame allpool toodud valemit.

Mediaan = (andmete i (n / 2) + andmete i (n / 2 + 1)) / 2

Andmete teine ​​mõõtmine statistikas on andmete leviku mõõt. Andmevahe suurus on väärtus, mis näitab, kui kaugel on andmed andmekeskusest. Andmete jaotuse suurus koosneb vahemikust, kvartiilist ja kvartiilidevahelisest vahemikust.

Vahemik on suurima ja kõige väiksema andmeväärtuse vahe. Katvuse saame, lahutades kõige väiksematest andmetest suurimad andmed. Näiteks kui ühes klassis on kõrgeima õpilase pikkus 160 cm ja lühima õpilase kõrgus 143 cm, saame käe 23 cm.

Samal ajal on kvartiil statistiliste andmete rühmitamine neljaks võrdseks osaks. Kvartiilide suurus jaguneb kolmeks, nimelt alumiseks kvartiiliks (Q 1 ), keskmiseks kvartiiliks (Q 2 või mediaan) ja ülemiseks kvartiiliks (Q 3 ). Iga kvartiili määramiseks peame astuma mitu sammu.

Kõigepealt sorteerige andmed kasvavas või kahanevas järjekorras. Teiseks määrake andmete keskmine või keskmine väärtus. Kolmandaks määrake alumine kvartiil (Q 1 ), mis on andmerühma keskmine väärtus mediaani (Q 2) all . Lõpuks määrake ülemine kvartiil (Q 3 ), mis on andmekogumi keskmine väärtus mediaani (Q 2) kohal .

Viimane andmejaotuse tüüp on kvartiilidevaheline vahemik. Kvartiilidevaheline vahemik on erinevus ülemise ja alumise kvartiili vahel. Valem on järgmine.

Q d = Q 3 - Q 1