Kaj so poligoni v grafiki. Oglejte si strani, kjer je omenjen izraz distribucijski poligon

Zaradi jasnosti so zgrajeni različni grafi statistične porazdelitve, zlasti poligon in histogram.

Poligon

Mnogokotnik frekvenc je polilinija, katere segmenti povezujejo točke. Za izgradnjo poligona frekvenc se možnosti narišejo na os abscise, frekvence, ki jim ustrezajo, pa na os ordinate. Takšne točke so povezane z odseki ravne črte in dobimo frekvenčni poligon.

Poligon relativnih frekvenc je polilinija, katere segmenti povezujejo točke. Za izdelavo poligona relativnih frekvenc se možnosti narišejo na os abscisa, ustrezne frekvence (frekvence), ki jim ustrezajo, pa na os ordinate. Takšne točke so povezane z odseki ravne črte in dobimo frekvenčni poligon.

Primer 1

Sestavite poligon frekvenc in poligon relativnih frekvenc (frekvence):

2 7 8 15 16 17 15 35 64 55 21 10

Izračunajmo relativne frekvence (frekvence):

Relativne frekvence, 2 15 0.075 7 35 0.175 8 64 0.320 15 55 0.275 16 21 0.105 17 10 0.050 Skupaj 200 1.000

Frekvenčni poligon

Relativni frekvenčni poligon

V primeru intervalne serije se vmesne točke intervalov vzamejo kot poligon.

  • Nazaj na kazalo za
    • Teorija verjetnosti in matematična statistika 〉〉
    • Statistika 〉〉

stolpčni graf

V primeru intervalne statistične porazdelitve je priporočljivo sestaviti histogram.

Frekvenčni histogram je stopničasta figura, sestavljena iz pravokotnikov, katerih osnove so delni intervali po dolžini, višine (v primeru enakih intervalov) pa morajo biti sorazmerne s frekvencami. Pri sestavljanju histograma z neenakimi intervali se vzdolž ordinate ne narišejo frekvence, ampak gostota frekvence. To je treba storiti, da se odpravi vpliv velikosti intervala na porazdelitev in da se lahko primerjajo frekvence.

V primeru sestavljanja histograma relativnih frekvenc (histograma frekvenc) morajo biti višine v primeru enakih integralov sorazmerne z relativno frekvenco, v primeru neenakih intervalov pa je višina enaka gostoti relativne frekvenco.

Primer 2

Narišite histogram frekvenc in relativnih frekvenc (frekvenc)

2-5 5-8 8-11 11-14 14-17 17-20 15 35 64 55 21 10

Izračunajmo relativne frekvence:

Intervali, Relativne frekvence, 2 – 5 15 0.075 5 – 8 35 0.175 8 – 11 64 0.320 11 – 14 55 0.275 14 – 17 21 0.105 17 – 20 10 0.050 Skupaj 200 1.000

Frekvenčni histogram

Histogram relativne frekvence

Primer 3

Zgradite histogram frekvenc (primer neenakih intervalov).

2-4 4-8 8-13 13-15 15-17 17-20 15 35 64 55 21 10

Izračunajmo gostoto frekvence:

Intervali, Intervalna dolžina, Gostota frekvenc, 2 – 4 15 2 7.500 4 – 8 35 4 8.750 8 – 13 64 5 12.800 13 – 15 55 2 27.500 15 – 17 21 2 10.500 17 – 20 10 3 3.333 Skupaj 200 -- --

Frekvenčni histogram

Grafi so vizualna oblika prikaza distribucijskih nizov. Za prikaz serije se uporabljajo črtni grafi in ravninski diagrami, vgrajeni v pravokotni koordinatni sistem.

Za grafično predstavitev atribucijske porazdelitvene serije se uporabljajo različni grafikoni: črtna, linearna, tortna, figured, sektor itd.

Za diskretne variacijske serije je graf distribucijski poligon.

Distribucijski poligon se imenuje prelomljena črta, ki povezuje točke s koordinatami ali kje - diskretna vrednost lastnosti, - frekvenca, - pogostost.

Graf je narisan na sprejeti lestvici. Distribucijski poligon je prikazan na sl. 5.1.

Za prikaz nizov intervalnih variacij uporabite histogrami, zastopanje stopničaste oblike, sestavljene iz pravokotnikov, katerih osnove so enake širini intervala , višina pa na frekvenco (pogosto ) enako intervalne serije ali gostote porazdelitve neenakomernega intervala Gradnja grafikona je podobna gradnji stolpnega grafikona. Splošni pogled na histogram je prikazan na sl. 5.2.

Za grafični prikaz variacijske serije lahko uporabimo tudi nabira- prekinjena črta, potegnjena iz nabranih frekvenc (delov). Zbrane frekvence so narisane kot ordinate; s povezovanjem točk posameznih ordinatov z odseki ravne črte dobimo nenormalno ločnico. Koordinate točk na grafu za diskretno vrsto so za intervalno serijo - Začetna točka grafa ima koordinate najvišje točke - Splošni pogled kumulatov je prikazan na sliki 5.3. Uporaba kumulatov je še posebej priročna pri primerjanju variacijskih serij.

Pri načrtovanju distribucijskih serij velik pomen ima razmerje lestvic vzdolž abscisne in ordinatne osi... V tem primeru in je treba voditi po "pravilu zlatega reza", v po katerem višina grafa mora biti približno polovica njegove osnove.

Pri empirični študiji številnih distribucij se izračunajo in analizirajo naslednje skupine kazalnikov:

Kazalniki položaja distribucijskega središča;

Kazalniki stopnje njegove homogenosti;

Kazalniki oblike distribucije.

Kazalniki položaja središča distribucije. Tej vključujejo srednja moč kot aritmetična sredina in strukturna povprečja so modna in mediana.

Srednja arfmetika za diskretno serijo porazdelitve se izračuna po formuli:

V nasprotju z aritmetično sredino, izračunano na podlagi vseh variant, način in mediana označujeta vrednost lastnosti v statistični enoti, ki zaseda določeno mesto v nizih variacij.

Srednja ( Jaz ) - vrednost značilnosti v statistični enoti, ki stoji sredi razvrščene serije in deli populacijo na dva enaka dela.

Moda (Mo) - najpogostejši pomen lastnosti v agregatu. Moda se v statistični praksi pogosto uporablja za preučevanje povpraševanja potrošnikov, evidentiranje cen itd.

Za diskretne variacijske serije Mo in Jaz so izbrane v skladu z definicijami: način - kot vrednost funkcije z najvišjo frekvenco : položaj mediane za neparno velikost populacije je določen z njenim številom, kjer je N volumen statistične populacije. Pri enakomernem obsegu vrstice je mediana enaka povprečju obeh možnosti na sredini vrstice.

Mediana se uporablja kot najbolj zanesljiv kazalnik tipično vrednote heterogene populacije, saj ni občutljiva na skrajne vrednosti lastnosti, ki se lahko bistveno razlikujejo od glavni niz njegovih vrednosti. Poleg tega mediane ugotovitve praktična uporaba zaradi posebne matematične lastnosti: Razmislite o definiciji načina in mediane v naslednjem primeru: obstaja več razdelitev delavcev glede na stopnjo usposobljenosti.

Podatki so prikazani v tabeli 5.2.

Način je izbran glede na največjo vrednost frekvence: pri n max = 14 Mo= 4, tj. najpogostejši je 4. razred. Če želite najti srednjo vrednost Jaz določene so osrednje enote, to sta 25. in 26. enota. Zbrane frekvence določajo skupino, v katero spadajo te enote. To je četrta skupina, v kateri je vrednost atributa 4. Tako, Jaz= 4, to pomeni, da ima polovica delavcev kategorijo pod četrto, za drugo pa nad četrto. V intervalnih vrstah so vrednosti Mo in Jaz se izračunajo na bolj zapleten način.

Moda je opredeljena na naslednji način:

Največja vrednost frekvence se uporablja za določanje intervala, v katerem se nahaja vrednost načina. Imenuje se modalna.

V modalnem intervalu se vrednost načina izračuna po formuli:

Za izračun mediane v intervalnih serijah se uporablja naslednji pristop:

Zbrane frekvence se uporabljajo za iskanje medianega intervala. Mediana je interval, ki vsebuje osrednjo enoto.

V srednjem intervalu je vrednost Jaz določeno po formuli:

Pri neenakomernih intervalnih serijah pri izračunu Mo uporablja se drugačen frekvenčni odziv - absolutna gostota distribucija:

Razmislimo o izračunu načina in mediane za intervalno porazdelitveno serijo na primeru porazdelitvene serije delavcev po starosti, prikazane v tabeli 5.3.

Mo izračun:

Največja frekvenca n max = 13, ustreza četrti skupini, zato je interval z mejami 12-16 let modalni.

Modo bomo izračunali po formuli:

Najpogosteje so delavci s približno 13 leti delovnih izkušenj. Način ni na sredini modalnega intervala, premaknjen je na njegovo spodnjo mejo, to je posledica strukture te distribucijske serije (pogostost predmodalnega intervala je veliko višja od frekvence postmodalnega intervala).

Izračun mediane:

Glede na graf nabranih frekvenc se določi srednji interval. Vsebuje 25 in 26 statističnih enot, ki so v različnih skupinah - v 3. in 4.. Najti Jaz lahko uporabite katerega od njih. Izračun bomo izvedli za tretjo skupino:

Isti pomen Jaz lahko dobite pri izračunu za 4. skupino:

Z dvojnim središčem Jaz je vedno na stičišču intervalov, ki vsebujejo osrednje enote. Izračunana vrednost Jaz kaže, da ima prvih 25 delavcev manj kot 12 let delovnih izkušenj, preostalih 25 pa zato več kot 12 let.

Način je mogoče grafično določiti z razdelilnim poligonom v diskretnih vrstah, s porazdelitvenim histogramom - v intervalnih serijah, mediano - pa s kumulativnim.

Če želite najti način v intervalni vrstici, mora biti desno oglišče modalnega pravokotnika povezano z zgornjim desnim kotom prejšnjega pravokotnika, levo oglišče pa v zgornji levi kot naslednjega pravokotnika. Abscisa presečišča teh ravnih črt bo način distribucije.

Za določitev mediane se višina najvišje ordinate kumulatov, ki ustreza celotni populaciji prebivalstva, prepolovi. Skozi dobljeno točko se potegne ravna črta, vzporedna z osjo abscise, dokler se ne preseka s kumulatom. Abscisa točke presečišča je mediana.

razen Mo in Jaz v variantnih serijah je mogoče opredeliti tudi druge strukturne značilnosti - kvantile. Kvantili so namenjeni globlji preučitvi strukture distribucijske serije. Kvantil Je vrednost funkcije, ki zavzema določeno mesto v razvrstitvi po to funkcijo agregat. Obstajajo naslednje vrste kvantilov:

kvartili- vrednosti lastnosti, ki delijo urejeno populacijo na 4 enake dele;

decili- vrednosti atributov, ki prebivalstvo delijo na 10 enakih delov;

percentile- vrednosti lastnosti, ki prebivalstvo delijo na 100 enakih delov.

Če so podatki združeni, je vrednost kvartila določena z nabranimi frekvencami: številko skupine, ki vsebuje i-ti kvantil. Določena je kot številka prve skupine z začetka niza, v kateri je vsota nabranih frekvenc enaka ali večja i · N, kjer je I kvantilni indeks. Če je serija intervalna, se vrednost kvantila določi s formulo:

Izračunajmo kvartile za število porazdelitev delavcev v oddelku glede na delovno dobo:

Posledično ima četrtina delavcev manj kot 7 let izkušenj, četrtina pa več kot 16 let. Tako lahko za karakterizacijo položaja središča distribucijske serije uporabimo 3 kazalnike: pomeni podpisati, moda, mediana.

Pri izbiri vrste in oblike posebnega kazalnika središča distribucije je treba izhajati iz naslednjih priporočil:

Za trajnostne družbeno-gospodarske procese se kot pokazatelj središča uporablja aritmetična sredina. Za takšne procese so značilne simetrične porazdelitve, v katerih

Za nestabilne procese je za položaj distribucijskega centra značilno Mo ali Jaz... Za asimetrične procese je mediana prednostna značilnost distribucijskega centra, saj zavzema položaj med aritmetično sredino in načinom.

Druga najpomembnejša naloga pri določanju splošne narave distribucije je ocena stopnje njene homogenosti. Za homogenost statističnih populacij je značilna vrednost variacije (razpršenosti) lastnosti, tj. neskladje med njegovimi vrednostmi za različne statistične enote. Za merjenje odstopanj v statistiki se uporabljajo absolutni in relativni kazalniki. Razjasnitev splošne narave porazdelitve ne predvideva le ocene stopnje njene homogenosti, temveč tudi preučevanje oblike porazdelitve, t.j. ocena simetrije in kurtoze.

Iz matematične statistike je znano, da se s povečanjem obsega statistične populacije in hkratnim zmanjšanjem intervala združevanja poligon ali porazdelitveni histogram vse bolj približuje določeni gladki krivulji, kar je meja za navedene grafikone. Ta krivulja se imenuje empirična krivulja porazdelitve in predstavlja grafični prikaz v obliki neprekinjene črte spremembe frekvence, funkcionalno povezane z variacijo variante.

V statistiki se razlikujejo naslednje vrste porazdelitvenih krivulj:

enostranske krivulje; večtočkovne krivulje.

Homogene populacije so opisane z unimodalnimi porazdelitvami. Porazdelitev v več točkah kaže na heterogenost preučevane populacije ali na slabo delovanje skupine.

Krivulje porazdelitve z eno točko so razdeljene na simetrične, zmerno asimetrične in skrajno asimetrične.

Porazdelitev se imenuje simetrična, če sta frekvenci poljubnih dveh variant, ki sta na enaki razdalji od obeh strani distribucijskega centra, enaki med seboj. V takšnih distribucijah

Za označevanje asimetrije se uporabljajo koeficienti asimetrije.

Najpogosteje se uporabljajo naslednje:

Pearsonov koeficient asimetrije

V unimodalnih distribucijah se vrednost tega kazalnika spreminja od -1 do +1. v simetričnih porazdelitvah As = 0. Pri As> 0 opazimo asimetrijo na desni (slika 5.4). V distribucijah z desno stransko poševnostjo MoJaz

Riž. 5.4 Desnostranska asimetrija Sl. 5.5. Levostranska asimetrija

Bližje po modulu As do 1, pomembnejša je asimetrija:

Pearsonov koeficient poševnosti označuje poševnost le v osrednjem delu distribucije, zato je pogostejši in natančnejši. koeficient asimetrije izračunano na podlagi osrednjega trenutka 3. reda:

Osrednja točka v statistiki se imenuje povprečno odstopanje posameznih vrednosti lastnosti od njene aritmetične sredine.

Osrednji moment k-tega reda se izračuna kot:

Skladno s tem so formule za določanje osrednjega trenutka tretjega reda naslednje:

Za oceno pomembnosti koeficienta asimetrije, izračunanega po drugi metodi, se določi njegova korenska napaka:

Za unimodalne porazdelitve se izračuna še en kazalnik za oceno njegove oblike - presežek... Presežekje indikator vrhunska distribucija... Izračuna se za simetrične porazdelitve na podlagi osrednjega trenutka 4. reda

TO ravno ploskev.

Rešitev.

Točke gradimo na podlagi podatkov iz tabele. Nastale točke povežemo z odseki ravne črte. Bodite pozorni na točki (0; 0) in (13; 0), ki se nahajata na osi abscise in imata njihovi abscisi 1 manjši oziroma večji kot abscisi skrajne leve in skrajne desne točke. Frekvenčni poligon je prikazan na sliki.

Če je poligon zgrajen po podatkih intervalnih nizov, se vmesne točke ustreznih intervalov vzamejo kot abscisa točk. Skrajni levi in ​​desni točki sta povezani s točkami osi abscisa - sredinama najbližjih intervalov, katerih frekvence so enake nič. Seveda v tem primeru poligon le približno odraža odvisnost frekvenc od vrednosti argumenta.

Cumulata služi za grafično predstavitev kumulativne variacijske serije. Če želite to narediti, se vrednosti argumenta narišejo na os abscise, nakopičene frekvence ali nakopičene relativne frekvence pa na os ordinate. Lestvica na vsaki osi je izbrana poljubno. Nato se narišejo točke, katerih abscise so enake možnostim (v primeru diskretnih nizov) ali zgornje meje intervalov (v primeru intervalnih serij), ordinate pa so enake ustreznim frekvencam (nakopičene) frekvence). Te točke so povezane z odseki ravne črte. Nastala lomljena črta je kumulativna.

Primer gradnje seštevkov

V skladu s tabelo sestavite kumulativno variacijsko serijo, za katero zgradite kumulativno.

Rešitev.

Sestavimo kumulativno variacijsko serijo (glej spodnjo tabelo), za katero bomo zgradili kumulativno.

Histogram uporablja za prikaz intervalnih serij. Za izdelavo histograma iz podatkov variacijske serije z enakimi intervali, pa tudi za izdelavo poligona se vrednosti argumenta narišejo na os abscise, vrednosti frekvenc ali relativnih frekvenc pa na zemljevid. ordinatna os. Nato so zgrajeni pravokotniki, katerih osnove so odseki osi abscisa, katerih dolžine so enake dolžini intervalov, višine pa so odseki, katerih dolžine so sorazmerne frekvencam ali relativnim frekvencam ustrezne intervale.

Posledično dobimo stopničasto sliko v obliki pravokotnikov, ki so medsebojno premaknjeni, katerih območja so sorazmerna s frekvencami (ali relativnimi frekvencami).

Če so intervali neenaki, je treba vrednosti gostote porazdelitve (absolutne ali relativne) narisati na os ordinate v poljubno izbrani lestvici. Tako morajo biti višine pravokotnikov, ki jih gradimo, enake gostoti ustreznih intervalov.



Ko grafično prikazujemo variacijsko serijo s pomočjo histograma, je gostota prikazana, kot da ostane konstantna v vsakem intervalu. Pravzaprav običajno ni tako. Če konstruirate porazdelitev po delih intervalov, se lahko prepričate, da gostota porazdelitve v različnih delih intervala ne ostane konstantna. Prej pridobljena gostota je predstavljala le neko povprečno gostoto. Tako histogram ne prikazuje dejanske spremembe gostote porazdelitve, ampak le povprečno gostoto porazdelitve v vsakem intervalu.

Če je histogram intervalne porazdelitve zgrajen, lahko poligon enake porazdelitve dobimo tako, da povežemo sredine zgornjih podlag pravokotnikov z odseki ravne črte.

Primer risanja histograma

Na podlagi rezultatov preverjanja matematike učencev 7. razreda so bili pridobljeni podatki o razpoložljivosti testnih postavk (razmerje med številom učencev, ki so pravilno opravili naloge, in številom preizkušenih učencev), predstavljeni v spodnji tabeli.
Test je vseboval 25 nalog. Sestavite histogram.

Rešitev.

Na os abscise položimo 7 segmentov dolžine 10. Na njih, tako kot na osnovah, gradimo pravokotnike, katerih višine so enake 1, 1, 5, 7, 7, 3, 1. Nastala stopničasta figura je želeni histogram.

Primer risanja histograma

Podatki iz prejšnjega primera bodo predstavljeni podrobneje (glej spodnjo tabelo). Sestavite histogram.

Frekvenčni poligon

Dovolite nam distribucijsko serijo, napisano s pomočjo tabele:

Slika 1.

Opredelitev 1

Frekvenčni poligon- prelomljena črta, ki povezuje točke $ (x_m, n_m) $ ($ m = 1,2, \ pike, m) $.

To pomeni, da je za izgradnjo frekvenčnega poligona potrebno narisati vrednosti variante na os abscise in ustrezne frekvence na os ordinate. Nastale točke so povezane s prelomljeno črto:

Slika 2. Frekvenčni poligon.

Poleg običajne frekvence obstaja tudi pojem relativne frekvence.

Dobimo naslednjo tabelo porazdelitve relativnih frekvenc:

Slika 3.

Opredelitev 2

Relativni frekvenčni poligon- prelomljena črta, ki povezuje točke $ (x_m, W_m) $ ($ m = 1,2, \ pike, m) $.

To pomeni, da je za izgradnjo frekvenčnega poligona potrebno narisati vrednosti variante na os abscise in ustrezne relativne frekvence na os ordinate. Nastale točke so povezane s prelomljeno črto:

Slika 4. Poligon relativnih frekvenc.

Frekvenčni histogram

Poleg pojma polinoma za neprekinjene vrednosti obstaja tudi pojem histograma.

Upoštevajte, da je površina enega takega pravokotnika $ \ frac (n_ih) (h) = n_i $. Zato je površina celotne figure enaka $ \ sum (n_i) = n $, to je enaka velikosti vzorca.

Opredelitev 4

Histogram relativne frekvence- stopničasta figura, sestavljena iz pravokotnikov z osnovo - delni intervali dolžine $ h $ in višine $ \ frac (W_i) (h) $:

Slika 6. Histogram relativnih frekvenc.

Upoštevajte, da je površina enega takega pravokotnika $ \ frac (W_ih) (h) = W_i $. Zato je površina celotne figure $ \ sum (W_i) = W = 1 $.

Primeri nalog gradnje poligona in histograma

Primer 1

Naj ima frekvenčna porazdelitev obliko:

Slika 7.

Zgradite poligon relativnih frekvenc.

Najprej zgradimo niz porazdelitve relativnih frekvenc po formuli $ W_i = \ frac (n_i) (n) $

Frekvenčni poligon

Dovolite nam distribucijsko serijo, napisano s pomočjo tabele:

Slika 1.

Opredelitev 1

Frekvenčni poligon- prelomljena črta, ki povezuje točke $ (x_m, n_m) $ ($ m = 1,2, \ pike, m) $.

To pomeni, da je za izgradnjo frekvenčnega poligona potrebno narisati vrednosti variante na os abscise in ustrezne frekvence na os ordinate. Nastale točke so povezane s prelomljeno črto:

Slika 2. Frekvenčni poligon.

Poleg običajne frekvence obstaja tudi pojem relativne frekvence.

Dobimo naslednjo tabelo porazdelitve relativnih frekvenc:

Slika 3.

Opredelitev 2

Relativni frekvenčni poligon- prelomljena črta, ki povezuje točke $ (x_m, W_m) $ ($ m = 1,2, \ pike, m) $.

To pomeni, da je za izgradnjo frekvenčnega poligona potrebno narisati vrednosti variante na os abscise in ustrezne relativne frekvence na os ordinate. Nastale točke so povezane s prelomljeno črto:

Slika 4. Poligon relativnih frekvenc.

Frekvenčni histogram

Poleg pojma polinoma za neprekinjene vrednosti obstaja tudi pojem histograma.

Upoštevajte, da je površina enega takega pravokotnika $ \ frac (n_ih) (h) = n_i $. Zato je površina celotne figure enaka $ \ sum (n_i) = n $, to je enaka velikosti vzorca.

Opredelitev 4

Histogram relativne frekvence- stopničasta figura, sestavljena iz pravokotnikov z osnovo - delni intervali dolžine $ h $ in višine $ \ frac (W_i) (h) $:

Slika 6. Histogram relativnih frekvenc.

Upoštevajte, da je površina enega takega pravokotnika $ \ frac (W_ih) (h) = W_i $. Zato je površina celotne figure $ \ sum (W_i) = W = 1 $.

Primeri nalog gradnje poligona in histograma

Primer 1

Naj ima frekvenčna porazdelitev obliko:

Slika 7.

Zgradite poligon relativnih frekvenc.

Najprej zgradimo niz porazdelitve relativnih frekvenc po formuli $ W_i = \ frac (n_i) (n) $



Povezani članki: