Učenie sa štatistike, od prezentácie po opatrenia na distribúciu údajov

Štatistika je matematická veda, ktorá študuje zber, spracovanie, analýzu a prezentáciu údajov. V poisťovniach sa často používajú štatistiky, jednou z nich je stanovenie výšky poistného v poistnej zmluve. Každý držiteľ poistenia je povinný platiť príspevok nazývaný poistné. Zaplatené poistné je v súlade s poistným krytím, ktoré dostáva.

Poisťovňa tu používa štatistiku tak, aby výška poistného bola v súlade s výškou krytia, ktoré je možné poskytnúť držiteľovi poistenia. Takto z toho majú prospech obe strany.

Ako už bolo spomenuté, štatistické údaje nielen zhromažďujú a spracúvajú, ale aj prezentujú údaje. Štatistika pri spracovaní údajov využíva aj niekoľko opatrení na distribúciu údajov. Dnes si rozoberieme typy prezentácie, ako aj veľkosť rozšírenia údajov v štatistikách.

Typy prezentácie údajov

Medzi typy prezentácie údajov v štatistikách patria tabuľky rozdelenia frekvencií, histogramy, polygóny a ogives.

Prvou formou prezentácie údajov je použitie tabuľky rozdelenia frekvencií. Ako už z názvu vyplýva, na zobrazenie typu a množstva získaných údajov používame tabuľky. Tabuľka frekvenčného rozdelenia má tiež niekoľko typov, a to tabuľku frekvenčného rozdelenia pre jednotlivé údaje a skupinové údaje.

(Prečítajte si tiež: Dve namerané údaje v štatistike)

Jedna tabuľka distribúcie frekvencie údajov sa používa na prezentáciu malého množstva údajov, minimálne menej ako 30 údajov. Nasleduje príklad prezentácie údajov pomocou jednej tabuľky distribúcie frekvencie údajov.

Údaje uvedené nižšie sú výsledkami testov 30 študentov. Slúži do jednej tabuľky distribúcie frekvencie údajov!

4 8 7 9 10 3 4 6 7 6 5 7 7 8 9 6 6 8 7 9 4 5 6 7 8 10 4 5 6 7

Ak venujeme pozornosť, najnižšie dosiahnuté skóre v teste je 3, zatiaľ čo najvyššie skóre je 10. Potom sa z týchto skóre vypočítava počet študentov, ktorí ho získajú. Napríklad pre 3. ročník iba 1 študent. Pre 4. ročník sú to 4 študenti atď. Tento obrázok je potom uvedený v nasledujúcej tabuľke.

turbíny na zemi pobrežnej veternej farmy

Ďalším typom tabuľky distribúcie frekvencií je tabuľka distribúcie frekvencie skupinových údajov. Táto tabuľka slúži na predstavenie veľkého množstva údajov, čo je viac ako 30 údajov. Pozrime sa na príklad nižšie.

Toto je výška rastlín čili (v milimetroch) na čili plantáži. Prezentujte údaje do tabuľky distribúcie skupinových údajov!

123 131 120 128 126 124 125 122

121 126 124 123 122 120 125 126

123 123 134 125 125 126 128 128 135

120 126 124 133 126 127 123 126

122 125 123 132 124 132 128 124

Na rozdiel od jednotlivých údajov tu musíme vypočítať počet tried a dĺžky tried, ktoré sa zobrazia v tabuľke. Na základe vyššie uvedených údajov sú uvedené výpočty.

Veľa údajov (n) = 40

Maximálna výška (x max ) = 135

Minimálna výška (x min ) = 120

Rozsah (J) = x max  - x min = 135 - 120 = 15

Počet tried (k) = 1 + 3,3logn = 1 + 3,3 log40 = 6,2868 ... ≈ k = 6

Dĺžka triedy (c) = J / k = 15/6 = 2,5 ≈ c = 3

Z týchto výsledkov môžeme zobraziť tabuľku distribúcie skupinových údajov nasledovne.

turbíny na zemi pobrežnej veternej farmy

Ďalej budeme diskutovať o ďalších druhoch prezentácie zoskupených údajov, a to vo forme histogramov, frekvenčných polygónov a oivov. Pozrite sa na tabuľku frekvencií nižšie, ktorá obsahuje informácie o hmotnosti pre 80 členov športového klubu.

turbíny na zemi pobrežnej veternej farmy

Na prezentáciu údajov pomocou histogramového grafu najskôr zostavíme karteziánsky graf. Os x zobrazuje hornú a dolnú hranicu každej triedy, zatiaľ čo os y zobrazuje frekvenciu.

štatistika4 (1)

Na rozdiel od histogramu, graf polygónu frekvencie berie strednú hodnotu intervalu triedy a zobrazuje ju čiarami podľa frekvencie.

štatistika5 (1)

Na záver prezentácia údajov využíva pozitívnu kumulatívnu alebo negatívnu krivku frekvencie. Najskôr na osi y označte kumulatívne hodnoty frekvencie každej triedy intervalov. Potom označte súradnice bodov podľa horne viazaných párov intervalovej triedy a kumulatívnej frekvencie. Spojte bodky do hladkej krivky.

Veľkosť dátového rozpätia

V štatistike existujú dva typy merania údajov, a to veľkosť koncentrácie údajov a veľkosť distribúcie údajov. Aké je vysvetlenie a rozdiel?

Veľkosť dátového centra je hodnota, ktorá predstavuje umiestnenie údajov. V miere zameranej na dáta existujú stredná hodnota, režim a stredná hodnota.

Priemer alebo priemer je kvocient medzi súčtom všetkých pozorovaných údajov s veľkým počtom údajov. Priemer môžeme formulovať nasledovne.

Priemer = (súčet všetkých údajov) / (veľa údajov)

Aby sme tomu lepšie porozumeli, popracujme na nasledujúcom príklade problému. Počet hodín týždenne potrebných pre 5 ľudí na spoločenské aktivity v ich prostredí je 10, 7, 13, 20 a 15 hodín. Určte priemerný počet hodín týždenne, ktoré strávia sociálnymi aktivitami!

Na základe vyššie uvedených problémov môžeme čísla zadať do vzorca nasledovne.

Priemer = (10 + 7 + 13 + 20 + 15) / 5 = 65/5 = 13

To znamená, že priemerný počet hodín, ktoré strávia sociálnymi aktivitami, je 13 hodín.

Okrem strednej alebo strednej triedy existujú aj režimy. Režim je hodnota, ktorá sa v dátach vyskytuje najčastejšie. Pozrime sa na príklad nasledujúceho problému.

Nižšie sú uvedené údaje o hmotnosti (v kilogramoch) niektorých študentov 7. ročníka. Určite režim údajov!

32, 35, 33, 32, 34, 31, 35, 35, 31, 34, 35, 3

Najskôr musíme spočítať, koľkokrát sa každá hodnota v údajoch objaví. Na základe týchto údajov dostaneme 31 (x3), 32 (x2), 33 (x1), 34 (x2) a 35 (x4). Pretože 35 sa vyskytuje najčastejšie, režim vyššie uvedených údajov je 35.

Posledným typom centrovacieho mierenia je medián. Medián rozdelí údaje na dve rovnaké časti, takže medián predstavuje strednú hodnotu zoradených údajov.

Na určenie mediánu musíme najskôr triediť všetky údaje zostupne alebo vzostupne. Po druhé, definujte veľa údajov a symbolizujte ich ako „n“. Ak je n nepárne, vzorec, ktorý používame, je nasledovný.

Medián = číslo údajov - ((n + 1) / 2)

Medzitým, ak je n párne, použijeme vzorec uvedený nižšie.

Medián = (údaje i (n / 2) + údaje i (n / 2 + 1)) / 2

Druhé meranie údajov v štatistike je mierou šírenia údajov. Veľkosť rozšírenia údajov je hodnota, ktorá udáva, ako ďaleko sú údaje od dátového centra. Veľkosť distribúcie údajov pozostáva z rozsahu, kvartilu a medzikvartilového rozsahu.

Rozsah je rozdiel medzi najväčšou dátovou hodnotou a najmenšou dátovou hodnotou. Dosah môžeme dosiahnuť odpočítaním najväčších údajov od najmenších. Napríklad ak v jednej triede má najvyšší žiak výšku 160 cm a najkratší žiak výšku 143 cm, dostaneme dosah 23 cm.

Medzitým je kvartil zoskupením štatistických údajov do štyroch rovnakých častí. Veľkosť kvartilu je rozdelená na 3, a to dolný kvartil (Q 1 ), stredný kvartil (Q 2 alebo medián) a horný kvartil (Q 3 ). Na určenie každého kvartilu je potrebných niekoľko krokov.

Najskôr zoraďte údaje vzostupne alebo zostupne. Po druhé, určte strednú alebo strednú hodnotu údajov. Po tretie, určte dolný kvartil (Q 1 ), čo je stredná hodnota skupiny údajov pod mediánom (Q 2) . Nakoniec určite horný kvartil (Q 3 ), čo je stredná hodnota súboru údajov nad mediánom (Q 2) .

Posledným typom opatrenia na distribúciu údajov je medzikvartilový rozsah. Medzikvartilový rozsah je rozdiel medzi horným a dolným kvartilom. Vzorec je nasledovný.

Q d = Q 3 - Q 1