Какво представляват полигоните в графиката. Вижте страници, където е споменат терминът полигон за разпределение

За по -голяма яснота се изграждат различни графики на статистическото разпределение и по -специално многоъгълник и хистограма.

Многоъгълник

Многоъгълник от честоти е полилиния, чиито сегменти свързват точки. За да се изгради полигон от честоти, опциите се нанасят върху оста на абсцисата, а съответните им честоти се нанасят върху оста на ординатите. Такива точки са свързани чрез права линия и получават честотен многоъгълник.

Многоъгълник с относителни честоти е полилиния, чиито сегменти свързват точки. За да се изгради многоъгълник с относителни честоти, опциите се нанасят върху оста на абсцисата, а относителните честоти (честоти), съответстващи на тях, се нанасят върху оста на ординатите. Такива точки са свързани с прави сегменти и се получава честотен многоъгълник.

Пример 1

Постройте многоъгълник с честоти и многоъгълник с относителни честоти (честоти):

2 7 8 15 16 17 15 35 64 55 21 10

Нека изчислим относителните честоти (честоти):

Относителни честоти, 2 15 0.075 7 35 0.175 8 64 0.320 15 55 0.275 16 21 0.105 17 10 0.050 Обща сума 200 1.000

Честотен полигон

Относително честотен полигон

В случай на интервална серия, средните точки на интервалите се приемат като многоъгълник.

  • Обратно към съдържанието за
    • Теория на вероятностите и математическа статистика 〉〉
    • Статистика 〉〉

лентова графика

В случай на интервално статистическо разпределение е препоръчително да се изгради хистограма.

Честотната хистограма е стъпаловидна фигура, състояща се от правоъгълници, основите на които са частични интервали от дължина, а височините (в случай на равни интервали) трябва да бъдат пропорционални на честотите. При конструирането на хистограма с неравни интервали не се начертават честоти по ординатата, а честотата. Това трябва да се направи, за да се елиминира влиянието на размера на интервала върху разпределението и да може да се сравняват честотите.

В случай на конструиране на хистограма на относителните честоти (хистограма на честотите), височините при равни интеграли трябва да са пропорционални на относителната честота, а при неравни интервали височината е равна на плътността на относителната честота. честота.

Пример 2

Начертайте хистограма на честотите и относителните честоти (честоти)

2-5 5-8 8-11 11-14 14-17 17-20 15 35 64 55 21 10

Нека изчислим относителните честоти:

интервали, Относителни честоти, 2 – 5 15 0.075 5 – 8 35 0.175 8 – 11 64 0.320 11 – 14 55 0.275 14 – 17 21 0.105 17 – 20 10 0.050 Обща сума 200 1.000

Честотна хистограма

Хистограма за относителна честота

Пример 3

Постройте хистограма на честотите (случай на неравни интервали).

2-4 4-8 8-13 13-15 15-17 17-20 15 35 64 55 21 10

Нека изчислим плътността на честотата:

интервали, Дължина на интервала, Плътност на честотата, 2 – 4 15 2 7.500 4 – 8 35 4 8.750 8 – 13 64 5 12.800 13 – 15 55 2 27.500 15 – 17 21 2 10.500 17 – 20 10 3 3.333 Обща сума 200 -- --

Честотна хистограма

Графиките са визуална форма за показване на разпределителни серии. За показване на серията се използват линейни графики и равнинни диаграми, изградени в правоъгълна координатна система.

Различни диаграми се използват за графично представяне на атрибутивните разпределителни серии: лента, линейна, кръгова, фигурна, сектор и др.

За дискретни вариационни серии графиката е разпределителният многоъгълник.

Разпределителен многоъгълнике прекъсната линия, свързваща точки с координати или къде - дискретна стойност на характеристиката, - честота, - честота.

Графиката е начертана по приетата скала. Разпределителният полигон е показан на фиг. 5.1.

За да изобразите серия от вариации на интервали, използвайте хистограми, представляващистъпаловидни форми, съставени от правоъгълници, чиито основи са равни на ширината на интервала , а височината - до честотата (често срещан ) на еднаква интервална серия или плътност на разпределение на неравномерно интервал Изграждането на диаграма е подобно на изграждането на диаграма. Общият изглед на хистограмата е показан на фиг. 5.2.

За графично представяне на вариационната серия може да се използва и кумулира- прекъсната линия, изтеглена от натрупаните честоти (части). Натрупаните честоти се нанасят като ординати; свързвайки върховете на отделни ординати с отсечки с права линия, получаваме не намаляваща полилиния. Координатите на точките на графиката за дискретна серия са за интервална серия - Началната точка на графиката има координатите на най-високата точка - Общият изглед на кумулатите е показан на Фигура 5.3. Използването на кумулати е особено удобно, когато се правят сравнения на вариационни серии.

При начертаване на разпределителни серии голямо значениеима съотношение на скалите по осите на абсцисата и ординатите... В това случай и е необходимо да се ръководи от "правилото на златното сечение", в според което височината на графиката трябва да бъде около половината от размера на нейната основа.

При провеждане на емпирично проучване на редица разпределения се изчисляват и анализират следните групи показатели:

Индикатори за позиция на разпределителния център;

Показатели за степента на хомогенност;

Показатели за формата на разпространение.

Показатели за позицията на центъра на разпространение.Те включват средна мощност като средна аритметична и структурна средните стойности са модни и медиани.

Средна арфметичназа дискретна серия на разпределение се изчислява по формулата:

За разлика от средното аритметично, изчислено въз основа на всички варианти, режимът и медианата характеризират стойността на характеристика в статистическа единица, която заема определена позиция във вариационния ред.

Медиана ( аз ) - стойността на атрибута в статистическа единица, която стои в средата на класирана серия и разделя населението на две равни по брой части.

Мода (Mo) - най -често срещаното значение на обект в съвкупност.Модата е широко използвана в статистическата практика за изучаване на потребителското търсене, регистриране на цени и др.

За дискретни вариационни серии Пни азса избрани в съответствие с дефинициите: режим - като стойността на характеристиката с най -високата честота : позицията на медианата за нечетен размер на популацията се определя от нейния брой, където N е обемът на статистическата популация. При равен обем на реда медианата е равна на средната стойност от двете опции в средата на реда.

Медианата се използва като най-надежден индикатор типиченстойности на хетерогенна популация, тъй като е нечувствителна към екстремни стойности на характеристиката, които могат да се различават значително от основният масив от неговите стойности. Освен това медианите находки практическо приложение поради специално математическо свойство: Помислете за дефиницията на режим и медиана в следния пример: има известно разпределение на работниците по ниво на квалификация.

Данните са показани в таблица 5.2.

Режимът се избира според максималната стойност на честотата: at нмакс = 14 Пн= 4, т.е. най -често срещаният е 4 клас. За да намерите медианата азопределят се централните звена Това са 25 и 26 зв. Натрупаните честоти определят групата, към която спадат тези единици. Това е 4-та група, в която стойността на атрибута е 4. Така, аз= 4, това означава, че половината от работниците имат категория под 4 -та, а за другата - над четвърта. В интервалната серия стойностите Пни азсе изчисляват по по -сложен начин.

Модата се определя, както следва:

Максималната стойност на честотата се използва за определяне на интервала, в който се намира стойността на режима. Нарича се модален.

В рамките на модалния интервал стойността на режима се изчислява по формулата:

Следният подход се използва за изчисляване на медианата в интервални серии:

Натрупаните честоти се използват за намиране на средния интервал. Медианата е интервалът, съдържащ централната единица.

В рамките на средния интервал стойността азопределя се по формулата:

В неравномерни интервални серии, при изчисляване Пнсе използва различна честотна характеристика - абсолютна плътност разпределение:

Нека разгледаме изчисляването на режима и медианата за интервалната серия разпределение, като използваме примера за разпределението на работниците по старшинство, показан в Таблица 5.3.

Мо изчисление:

Максимална честота н max = 13, съответства на четвъртата група, следователно интервалът с границите 12-16 години е модален.

Ще изчислим модата по формулата:

Най-често има работници с около 13 години трудов стаж. Режимът не е в средата на модалния интервал, той е изместен към долната му граница, това се дължи на структурата на тази серия разпределение (честотата на предмодалния интервал е много по -висока от честотата на постмодалния интервал).

Изчисляване на медианата:

Средният интервал се определя от графиката на натрупаните честоти. Съдържа 25 и 26 статистически единици, които са в различни групи - в 3 -та и 4 -та. Да намеря азможете да използвате всеки от тях. Ще извършим изчислението за 3-та група:

Същото значение азможе да се получи при изчисляването му за 4-та група:

С двоен център азвинаги е на кръстопътя на интервали, съдържащи централни единици. Изчислена стойност азпоказва, че първите 25 работници имат по -малко от 12 години трудов стаж, а останалите 25 следователно имат повече от 12 години.

Режимът може да бъде определен графично чрез разпределителния полигон в дискретни серии, чрез разпределителната хистограма - в интервални серии, а медианата - чрез кумулативната.

За да намерите режима в интервалния ред, десният връх на модалния правоъгълник трябва да бъде свързан с горния десен ъгъл на предишния правоъгълник, а левият връх - към горния ляв ъгъл на следващия правоъгълник. Абсцисата на пресечната точка на тези прави линии ще бъде режимът на разпределение.

За да се определи медианата, височината на най -високата ордината на кумулатите, съответстваща на общата популация от населението, се намалява наполовина. През получената точка се прави права линия, успоредна на оста на абсцисата, докато се пресече с кумулата. Абсцисата на пресечната точка е медианата.

с изключение Пни азвъв вариантни серии могат да се дефинират и други структурни характеристики - квантили. Квантилите са предназначени за по-задълбочено изследване на структурата на разпределителните серии. КвантилСтойността на функция, която заема определено място в сортираната по тази функцияагрегатът. Има следните видове квантили:

квартили- стойности на характеристиките, разделящи подредената съвкупност на 4 равни части;

децили- стойности на атрибута, разделящи населението на 10 равни части;

перцентили- стойности на характеристиките, разделящи населението на 100 равни части.

Ако данните са групирани, тогава стойността на квартила се определя от натрупаните честоти: номерът на групата, която съдържа i-тия квантил. Определя се като номера на първата група от началото на поредицата, в която сумата от натрупаните честоти е равна или надвишава i · N, където I е квантилният индекс. Ако серията е интервална, тогава квантилната стойност се определя по формулата:

Нека изчислим квартилите за брой разпределение на работниците в секция по трудов стаж:

Следователно една четвърт от работниците имат по-малко от 7 години опит, а една четвърт повече от 16 години. По този начин, за да се характеризира позицията на центъра на разпределителната серия, могат да се използват 3 индикатора: означава знак, мода, медиана.

При избора на вида и формата на конкретен индикатор на центъра на разпространение е необходимо да се изхожда от следните препоръки:

За устойчиви социално-икономически процеси средното аритметично се използва като индикатор за центъра. Такива процеси се характеризират със симетрични разпределения, в които

За нестабилни процеси позицията на разпределителния център се характеризира с Пнили аз... За асиметрични процеси медианата е предпочитаната характеристика на центъра за разпределение, тъй като тя заема позиция между средноаритметичната стойност и режима.

Втората най-важна задача при определяне на общия характер на едно разпределение е да се оцени степента на неговата хомогенност. Хомогенността на статистическите популации се характеризира със стойността на вариацията (дисперсията) на признака, т.е. несъответствието между стойностите му за различни статистически единици. За измерване на вариациите в статистиката се използват абсолютни и относителни показатели. Изясняването на общия характер на разпределението предполага не само оценка на степента на неговата хомогенност, но и изследване на формата на разпределението, т.е. оценка на симетрията и куртозата.

От математическата статистика е известно, че с увеличаване на обема на статистическата съвкупност и едновременно намаляване на интервала на групиране, полигонът или хистограмата на разпределението все повече се доближава до определена гладка крива, която е границата за посочените графики. Тази крива се нарича емпирична крива на разпределениеи представлява графично представяне под формата на непрекъсната линия на промяна честоти, функционално свързани с вариацията на варианта.

В статистиката се разграничават следните видове криви на разпределение:

криви с един връх; многовершинни криви.

Хомогенните популации се описват чрез унимодални разпределения. Многовершинното разпределение показва хетерогенността на изследваната популация или некачественото представяне на групирането.

Кривите на едновърхово разпределение се разделят на симетрични, умерено асиметрични и изключително асиметрични.

Разпределението се нарича симетрично, ако честотите на всеки 2 варианта, разположени на еднакво разстояние от двете страни на разпределителния център, са равни помежду си. В такива разпределения

За характеризиране на асиметрията се използват коефициентите на асиметрия.

Най -често използваните са следните:

Коефициент на асиметрия на Пиърсън

При унимодални разпределения стойността на този индикатор варира от -1 до +1. в симетрични разпределения As = 0. При As> 0 се наблюдава дясностранна асиметрия (Фигура 5.4). В разпределения с дясностранно изкривяване Пназ

Ориз. 5.4 Дясностранна асиметрия Фиг. 5.5. Лявостранна асиметрия

Колкото по -близък по модул Катодо 1, толкова по -значима е асиметрията:

Коефициентът на асиметрия на Пиърсън характеризира асиметрия само в централната част на разпределението, поради което е по-често срещан и по-точен. коефициент на асиметрияизчислено въз основа на централен момент от трети ред:

Централна точкав статистиката се нарича средно отклонение на отделни стойности на даден признак от средната му аритметична стойност.

Централният момент на k-ти ред се изчислява като:

Съответно, формулите за определяне на централния момент от трети порядък са както следва:

За да се оцени значимостта на коефициента на асиметрия, изчислен по втория метод, се определя неговата средноквадратична грешка:

За унимодалните разпределения се изчислява още един индикатор за оценка на формата му - излишък... Излишъке индикатор пиково разпространение... Изчислява се за симетрични разпределения въз основа на централния момент от четвърти ред

ДА СЕ с плосък връх.

Решение.

Изграждаме точки въз основа на данни от таблицата. Свързваме получените точки с отсечки с права линия. Обърнете внимание на точките (0; 0) и (13; 0), разположени на оста на абсцисите и чиито абсциси са с 1 по-малко и повече от абсцисите на най-лявата и най-дясната точка, съответно. Честотният полигон е показан на фигурата.

Ако многоъгълникът е изграден според данните от интервалните серии, тогава средните точки на съответните интервали се приемат като абсцисата на точките. Крайните лява и дясна точки са свързани с точките на оста на абсцисата - средните точки на най-близките интервали, чиито честоти са равни на нула. Разбира се, в този случай многоъгълникът само приблизително отразява зависимостта на честотите от стойностите на аргумента.

Кумулатаслужи за графично представяне на кумулативните вариационни серии. За да се начертае, стойностите на аргумента се нанасят по оста на абсцисата, а натрупаните честоти или натрупаните относителни честоти се нанасят по оста на ординатата. Скалата на всяка ос се избира произволно. След това се начертават точки, чиито абсциси са равни на опциите (в случай на дискретни серии) или горните граници на интервалите (в случай на интервални серии), а ординатите са равни на съответните честоти (натрупани честоти). Тези точки са свързани с отсечки с права линия. Получената прекъсната линия е кумулативна.

Пример за изграждане на кумулати

Съгласно таблицата, съставете кумулативна серия от вариации, за която да изградите кумулативна.

Решение.

Нека съставим кумулативна вариационна серия (виж таблицата по -долу), за която ще конструираме кумулативна.

Хистограмаизползва се за показване на интервални серии. За да се изгради хистограма от данните от вариационния ред с равни интервали, както и да се изгради многоъгълник, стойностите на аргумента се нанасят върху оста на абсцисата, а стойностите на честотите или относителните честоти се нанасят върху ординатната ос. След това се конструират правоъгълници, чиито основи са сегменти от оста на абсцисата, чиито дължини са равни на дължините на интервалите, а височините са сегменти, дължините на които са пропорционални на честотите или относителните честоти на съответните интервали.

В резултат на това се получава стъпаловидна фигура под формата на правоъгълници, изместени един към друг, чиито области са пропорционални на честотите (или относителните честоти).

Ако интервалите са неравни, тогава стойностите на плътността на разпределението (абсолютна или относителна) трябва да бъдат нанесени на оста на ординатите в произволно избран мащаб. По този начин височините на правоъгълниците, които изграждаме, трябва да са равни на плътностите на съответните интервали.



При графично изобразяване на вариационна серия с помощта на хистограма, плътността се изобразява така, сякаш остава постоянна във всеки интервал. Всъщност това обикновено не е така. Ако конструирате разпределение по части от интервали, можете да се уверите, че плътността на разпределение в различните части на интервала не остава постоянна. Получената по-рано плътност представлява само някаква средна плътност. И така, хистограмата не представлява действителната промяна в плътността на разпределение, а само средната плътност на разпределение във всеки интервал.

Ако се изгради хистограмата на интервалното разпределение, тогава многоъгълникът със същото разпределение може да се получи чрез свързване на средните точки на горните основи на правоъгълниците с прави сегменти.

Пример за начертаване на хистограма

Според резултатите от тестове по математика на ученици от 7 клас са получени данни за наличието на тестови задачи (съотношението на броя на учениците, които са изпълнили задачите правилно, към броя на тестваните ученици), представени в таблицата по-долу.
Тестът съдържаше 25 задачи. Изградете хистограма.

Решение.

Полагаме върху оста на абсцисата 7 сегмента с дължина 10. Върху тях, както върху основи, изграждаме правоъгълници, чиито височини съответно са равни на 1, 1, 5, 7, 7, 3, 1. Получената стъпаловидна фигура е желаната хистограма.

Пример за начертаване на хистограма

Данните, дадени в предишния пример, ще бъдат представени по -подробно (вижте таблицата по -долу). Изградете хистограма.

Честотен полигон

Нека ни бъде предоставена дистрибуционна серия, написана с помощта на таблица:

Снимка 1.

Определение 1

Честотен полигон- прекъсната линия, която свързва точките $ (x_m, n_m) $ ($ m = 1,2, \ dots, m) $.

Тоест, за да се изгради честотен полигон, е необходимо да се начертаят стойностите на варианта по оста на абсцисата и съответните честоти по оста на ординатите. Получените точки са свързани с прекъсната линия:

Фигура 2. Честотен многоъгълник.

В допълнение към обичайната честота, съществува и концепцията за относителна честота.

Получаваме следната таблица на разпределение на относителните честоти:

Фигура 3.

Определение 2

Относително честотен полигон- прекъсната линия, която свързва точките $ (x_m, W_m) $ ($ m = 1,2, \ точки, m) $.

Тоест, за да се изгради честотен многоъгълник, е необходимо да се начертаят стойностите на варианта по оста на абсцисата и съответните относителни честоти по оста на ординатите. Получените точки са свързани с прекъсната линия:

Фигура 4. Многоъгълник на относителните честоти.

Честотна хистограма

В допълнение към понятието полином за непрекъснати стойности, съществува понятието за хистограма.

Обърнете внимание, че площта на един такъв правоъгълник е $ \ frac (n_ih) (h) = n_i $. Следователно площта на цялата фигура е равна на $ \ сума (n_i) = n $, тоест равна на размера на извадката.

Определение 4

Хистограма за относителна честота- стъпаловидна фигура, състояща се от правоъгълници с основа - частични интервали с дължина $ h $ и височини $ \ frac (W_i) (h) $:

Фигура 6. Хистограма на относителните честоти.

Обърнете внимание, че площта на един такъв правоъгълник е $ \ frac (W_ih) (h) = W_i $. Следователно площта на цялата фигура е $ \ сума (W_i) = W = 1 $.

Примери за задачата за изграждане на многоъгълник и хистограма

Пример 1

Нека честотното разпределение има формата:

Фигура 7.

Конструирайте многоъгълник от относителни честоти.

Нека първо конструираме поредица от разпределение на относителни честоти по формулата $ W_i = \ frac (n_i) (n) $

Честотен полигон

Нека ни бъде предоставена дистрибуционна серия, написана с помощта на таблица:

Снимка 1.

Определение 1

Честотен полигон- прекъсната линия, която свързва точките $ (x_m, n_m) $ ($ m = 1,2, \ dots, m) $.

Тоест, за да се изгради честотен полигон, е необходимо да се начертаят стойностите на варианта по оста на абсцисата и съответните честоти по оста на ординатите. Получените точки са свързани с прекъсната линия:

Фигура 2. Честотен многоъгълник.

В допълнение към обичайната честота, съществува и концепцията за относителна честота.

Получаваме следната таблица на разпределение на относителните честоти:

Фигура 3.

Определение 2

Относително честотен полигон- прекъсната линия, която свързва точките $ (x_m, W_m) $ ($ m = 1,2, \ точки, m) $.

Тоест, за да се изгради честотен многоъгълник, е необходимо да се начертаят стойностите на варианта по оста на абсцисата и съответните относителни честоти по оста на ординатите. Получените точки са свързани с прекъсната линия:

Фигура 4. Многоъгълник на относителните честоти.

Честотна хистограма

В допълнение към понятието полином за непрекъснати стойности, съществува понятието за хистограма.

Обърнете внимание, че площта на един такъв правоъгълник е $ \ frac (n_ih) (h) = n_i $. Следователно площта на цялата фигура е равна на $ \ сума (n_i) = n $, тоест равна на размера на извадката.

Определение 4

Хистограма за относителна честота- стъпаловидна фигура, състояща се от правоъгълници с основа - частични интервали с дължина $ h $ и височини $ \ frac (W_i) (h) $:

Фигура 6. Хистограма на относителните честоти.

Обърнете внимание, че площта на един такъв правоъгълник е $ \ frac (W_ih) (h) = W_i $. Следователно площта на цялата фигура е $ \ сума (W_i) = W = 1 $.

Примери за задачата за изграждане на многоъгълник и хистограма

Пример 1

Нека честотното разпределение има формата:

Фигура 7.

Конструирайте многоъгълник от относителни честоти.

Нека първо конструираме поредица от разпределение на относителни честоти по формулата $ W_i = \ frac (n_i) (n) $



Свързани статии: