Wartości średnie można obliczyć w formularzu. Wyznaczanie średniej, wariancji i kształtu rozkładu. Opisowe statystyki
Wartość średnia jest najcenniejsza z analitycznego punktu widzenia i uniwersalną formą wyrażania wskaźników statystycznych. Najpopularniejsza średnia – średnia arytmetyczna – posiada szereg właściwości matematycznych, które można wykorzystać w jej obliczeniach. Jednocześnie przy obliczaniu konkretnej średniej zawsze warto opierać się na jej logicznym wzorze, czyli stosunku wielkości atrybutu do wielkości populacji. Dla każdej średniej istnieje tylko jedna prawdziwa zależność początkowa, której realizacja w zależności od dostępnych danych może wymagać różnych postaci średnich. Jednakże we wszystkich przypadkach, gdy charakter uśrednianej wartości implikuje obecność wag, nie jest możliwe użycie ich wzorów nieważonych zamiast wzorów na średnią ważoną.
Wartość średnia jest najbardziej charakterystyczną wartością atrybutu dla populacji i wielkością atrybutu populacji rozłożoną w równych częściach pomiędzy jednostkami populacji.
Cecha, dla której obliczana jest wartość średnia, nazywa się uśrednione .
Wartość średnia jest wskaźnikiem obliczanym poprzez porównanie wartości bezwzględnych lub względnych. Wskazana jest wartość średnia
Wartość średnia odzwierciedla wpływ wszystkich czynników wpływających na badane zjawisko i jest ich wypadkową. Innymi słowy, wygaszając indywidualne odchylenia i eliminując wpływ przypadków, wartość średnia, odzwierciedlająca ogólną miarę wyników tego działania, działa jako ogólny wzór badanego zjawiska.
Warunki stosowania wartości średnich:
Ø jednorodność badanej populacji. Jeżeli niektóre elementy populacji poddane wpływowi czynnika losowego mają wartości badanej cechy znacząco różniące się od pozostałych, wówczas elementy te będą miały wpływ na wielkość średniej dla tej populacji. W tym przypadku średnia nie będzie wyrażać najbardziej typowej wartości atrybutu dla populacji. Jeżeli badane zjawisko jest heterogeniczne, wymaga to jego podziału na grupy zawierające elementy jednorodne. W tym przypadku obliczane są średnie grupowe – średnie grupowe, wyrażające najbardziej charakterystyczną wartość zjawiska w każdej grupie, a następnie obliczana jest ogólna wartość średnia dla wszystkich elementów, charakteryzujących zjawisko jako całość. Oblicza się ją jako średnią średnich grupowych, ważoną liczbą elementów populacji wchodzących w skład każdej grupy;
Ø wystarczająca liczba jednostek ogółem;
Ø maksymalne i minimalne wartości cechy w badanej populacji.
Wartość średnia (wskaźnik)jest uogólnioną charakterystyką ilościową cechy w systematycznym agregacie w określonych warunkach miejsca i czasu.
W statystyce stosuje się następujące formy (rodzaje) średnich, zwane potęgowymi i strukturalnymi:
Ø Średnia arytmetyczna(proste i ważone);
prosty
Wartość średnia jest ogólnym wskaźnikiem charakteryzującym typowy poziom zjawiska. Wyraża wartość cechy na jednostkę populacji.
Średnia wartość to:
1) najbardziej typowa wartość atrybutu dla populacji;
2) wielkość atrybutu populacji, rozłożona równo pomiędzy jednostki populacji.
Cecha, dla której obliczana jest wartość średnia, nazywana jest w statystyce „uśrednioną”.
Średnia zawsze uogólnia ilościową zmienność cechy, tj. w wartościach średnich eliminowane są różnice indywidualne pomiędzy jednostkami populacji wynikające z okoliczności losowych. W przeciwieństwie do średniej, wartość bezwzględna charakteryzująca poziom cechy pojedynczej jednostki populacji nie pozwala na porównanie wartości cechy pomiędzy jednostkami należącymi do różnych populacji. Jeśli więc trzeba porównać poziom wynagrodzeń pracowników w dwóch przedsiębiorstwach, nie można na tej podstawie porównać dwóch pracowników różnych przedsiębiorstw. Wynagrodzenie wybranych do porównania pracowników może nie być typowe dla tych przedsiębiorstw. Porównując wielkość funduszy wynagrodzeń w rozważanych przedsiębiorstwach, nie bierze się pod uwagę liczby pracowników, w związku z czym nie można określić, gdzie poziom wynagrodzeń jest wyższy. Ostatecznie można porównywać jedynie wskaźniki średnie, tj. Ile średnio zarabia jeden pracownik w każdym przedsiębiorstwie? Istnieje zatem potrzeba obliczenia wartości średniej jako uogólniającej cechy populacji.
Należy pamiętać, że podczas procesu uśredniania łączna wartość poziomów atrybutu lub jej wartość końcowa (w przypadku obliczania poziomów średnich w szeregu dynamicznym) musi pozostać niezmieniona. Innymi słowy, przy obliczaniu wartości średniej nie należy zniekształcać objętości badanej cechy, a wyrażenia zestawiane przy obliczaniu średniej muszą koniecznie mieć sens.
Obliczanie średniej jest jedną z powszechnych technik uogólniania; wskaźnik przeciętności zaprzecza temu, co wspólne (typowe) dla wszystkich jednostek badanej populacji, ignorując jednocześnie różnice poszczególnych jednostek. W każdym zjawisku i jego rozwoju istnieje połączenie przypadku i konieczności. Przy obliczaniu średnich, ze względu na działanie prawa wielkich liczb, losowość znosi się i równoważy, dzięki czemu można abstrahować od nieistotnych cech zjawiska, od wartości ilościowych cechy w każdym konkretnym przypadku . Możliwość abstrahowania od losowości poszczególnych wartości i wahań leży w wartości naukowej średnich jako uogólniających cech agregatów.
Aby średnia była rzeczywiście reprezentatywna, należy ją obliczyć z uwzględnieniem pewnych zasad.
Zastanówmy się nad kilkoma ogólnymi zasadami stosowania średnich.
1. Należy określić średnią dla populacji składających się z jednostek jednorodnych jakościowo.
2. Średnią należy obliczyć dla populacji składającej się z odpowiednio dużej liczby jednostek.
3. Średnią należy obliczyć dla populacji, której jednostki znajdują się w normalnym, naturalnym stanie.
4. Średnią należy obliczyć, biorąc pod uwagę treść ekonomiczną badanego wskaźnika.
5.2. Rodzaje średnich i metody ich obliczania
Rozważmy teraz rodzaje wartości średnich, cechy ich obliczania i obszary zastosowania. Wartości średnie dzielą się na dwie duże klasy: średnie mocy, średnie strukturalne.
Do środków potęgowych zaliczają się najbardziej znane i często stosowane typy, takie jak średnia geometryczna, średnia arytmetyczna i średnia kwadratowa.
Tryb i mediana są uważane za średnie strukturalne.
Skupmy się na średnich mocach. Średnie mocy, w zależności od prezentacji danych źródłowych, mogą mieć charakter prosty lub ważony. Prosta średnia Obliczany jest na podstawie danych niezgrupowanych i ma następującą ogólną postać:
,
gdzie X i jest wariantem (wartością) uśrednianej cechy;
n – opcja liczbowa.
Średnia ważona jest obliczany na podstawie pogrupowanych danych i ma wygląd ogólny
,
gdzie X i jest wariantem (wartością) uśrednianej cechy lub wartością środkową przedziału, w którym mierzony jest wariant;
m – wskaźnik średniego stopnia;
f i – częstotliwość pokazująca, ile razy występuje wartość ie uśrednionej charakterystyki.
Jeśli obliczysz wszystkie typy średnich dla tych samych danych początkowych, ich wartości okażą się różne. Obowiązuje tu zasada większości średnich: wraz ze wzrostem wykładnika m wzrasta również odpowiadająca mu wartość średnia:
W praktyce statystycznej częściej niż inne rodzaje średnich ważonych stosuje się średnie arytmetyczne i średnie ważone harmoniczne.
Rodzaje środków mocy
Rodzaj mocy |
Indeks |
Wzór obliczeniowy |
|
Prosty |
Ważona |
||
Harmoniczny |
|||
Geometryczny |
|||
Arytmetyka |
|||
Kwadratowy |
|||
Sześcienny |
Średnia harmoniczna ma bardziej złożoną strukturę niż średnia arytmetyczna. Do obliczeń używa się średniej harmonicznej, gdy jako wagi stosuje się nie jednostki populacji – nośniki cechy, ale iloczyn tych jednostek przez wartości cechy (tj. m = Xf). Do średniej prostej harmonicznej należy się odwołać w przypadku określenia np. średniego kosztu pracy, czasu, materiałów na jednostkę produkcji, na jedną część dla dwóch (trzech, czterech itp.) przedsiębiorstw, pracowników zajmujących się produkcją tego samego rodzaju produktu, tej samej części, produktu.
Głównym wymaganiem dotyczącym wzoru na obliczenie wartości średniej jest to, że wszystkie etapy obliczeń mają naprawdę znaczące uzasadnienie; uzyskana wartość średnia powinna zastąpić indywidualne wartości atrybutu dla każdego obiektu, nie zakłócając połączenia między wskaźnikami indywidualnymi i sumarycznymi. Innymi słowy, wartość średnią należy obliczyć w taki sposób, aby po zastąpieniu każdej pojedynczej wartości wskaźnika uśrednionego jego wartością średnią jakiś końcowy wskaźnik podsumowujący, w ten czy inny sposób powiązany ze wskaźnikiem uśrednionym, pozostał niezmieniony. Suma ta nazywa się definiowanie ponieważ charakter jego związku z poszczególnymi wartościami określa konkretny wzór na obliczenie wartości średniej. Zademonstrujmy tę regułę na przykładzie średniej geometrycznej.
Wzór na średnią geometryczną
stosowany najczęściej przy obliczaniu wartości średniej na podstawie indywidualnej dynamiki względnej.
Średnią geometryczną stosuje się, jeżeli podany jest ciąg względnej dynamiki łańcucha, wskazujący np. na wzrost wielkości produkcji w stosunku do poziomu z roku poprzedniego: i 1, i 2, i 3,…, i n. Oczywiście o wielkości produkcji w ostatnim roku decyduje jej początkowy poziom (q 0) i późniejszy wzrost na przestrzeni lat:
q n =q 0 × ja 1 × ja 2 ×…×i n .
Przyjmując q n za wskaźnik determinujący i zastępując poszczególne wartości wskaźników dynamiki wartościami średnimi, dochodzimy do zależności
Stąd
Specjalny rodzaj wartości średnich – średnie strukturalne – służy do badania wewnętrznej struktury szeregu rozkładów wartości atrybutów, a także do szacowania wartości średniej (rodzaju mocy), jeżeli zgodnie z dostępnymi danymi statystycznymi jej obliczeń nie można przeprowadzić (przykładowo, jeśli w rozważanym przykładzie nie było danych zarówno o wielkości produkcji, jak i wysokości kosztów według grup przedsiębiorstw).
Wskaźniki są najczęściej stosowane jako średnie strukturalne moda – najczęściej powtarzana wartość atrybutu – i mediany – wartość cechy, która dzieli uporządkowaną sekwencję jej wartości na dwie równe części. W efekcie dla połowy jednostek populacji wartość atrybutu nie przekracza poziomu mediany, a dla drugiej połowy nie jest od niej mniejsza.
Jeżeli badana cecha ma wartości dyskretne, wówczas nie ma szczególnych trudności w obliczeniu trybu i mediany. Jeśli dane o wartościach atrybutu X przedstawimy w postaci uporządkowanych przedziałów jego zmian (seria przedziałów), obliczenie postaci i mediany staje się nieco bardziej skomplikowane. Ponieważ wartość mediana dzieli całą populację na dwie równe części, kończy się ona w jednym z przedziałów cechy X. Korzystając z interpolacji, wartość mediany znajduje się w tym przedziale mediany:
,
gdzie X Me jest dolną granicą przedziału mediany;
h Me – jego wartość;
(Suma m)/2 – połowa ogólnej liczby obserwacji lub połowa wielkości wskaźnika stosowanego jako waga we wzorach na obliczenie wartości średniej (w wartościach bezwzględnych lub względnych);
S Me-1 – suma obserwacji (lub wielkość atrybutu ważącego) zgromadzona przed początkiem przedziału mediany;
m Me – liczba obserwacji lub objętość cechy ważącej w przedziale mediany (również w wartościach bezwzględnych lub względnych).
Obliczając wartość modalną cechy na podstawie danych szeregu przedziałów, należy zwrócić uwagę na to, że przedziały są identyczne, ponieważ od tego zależy wskaźnik powtarzalności wartości cechy X. Dla szereg przedziałowy o równych odstępach, wielkość modu określa się jako
,
gdzie X Mo jest dolną wartością przedziału modalnego;
m Mo – liczba obserwacji lub objętość charakterystyki ważącej w przedziale modalnym (w wartościach bezwzględnych lub względnych);
m Mo-1 – to samo dla przedziału poprzedzającego modalny;
m Mo+1 – to samo dla przedziału następującego po modalnym;
h – wartość przedziału zmian charakterystyki w grupach.
ZADANIE 1
Dla grupy przedsiębiorstw przemysłowych dostępne są następujące dane za rok sprawozdawczy
№ przedsiębiorstwa |
Wielkość produktu, miliony rubli. |
Średnia liczba pracowników, osób. |
Zysk, tysiąc rubli |
|
197,7 |
10,0 |
13,5 |
||
22,8 |
1500 |
136,2 |
||
465,5 |
18,4 |
1412 |
97,6 |
|
296,2 |
12,6 |
1200 |
44,4 |
|
584,1 |
22,0 |
1485 |
146,0 |
|
480,0 |
119,0 |
1420 |
110,4 |
|
57805 |
21,6 |
1390 |
138,7 |
|
204,7 |
30,6 |
|||
466,8 |
19,4 |
1375 |
111,8 |
|
292,2 |
113,6 |
1200 |
49,6 |
|
423,1 |
17,6 |
1365 |
105,8 |
|
192,6 |
30,7 |
|||
360,5 |
14,0 |
1290 |
64,8 |
|
280,3 |
10,2 |
33,3 |
Wymagane jest grupowanie przedsiębiorstw w celu wymiany produktów w następujących odstępach czasu:
od 400 do 600 milionów rubli.
Dla każdej grupy i dla wszystkich razem określ liczbę przedsiębiorstw, wielkość produkcji, średnią liczbę pracowników, średnią produkcję na pracownika. Wyniki grupowania przedstaw w formie tabeli statystycznej. Sformułuj wniosek.
ROZWIĄZANIE
Pogrupujemy przedsiębiorstwa według wymiany produktów, obliczymy liczbę przedsiębiorstw, wielkość produkcji i średnią liczbę pracowników, korzystając z prostego wzoru na średnią. Wyniki grupowania i obliczeń zestawiono w tabeli.
Grupy według objętości produktu
№
przedsiębiorstwa
Wielkość produktu, miliony rubli.
Średni roczny koszt środków trwałych, miliony rubli.
Średni sen
soczysta liczba pracowników, ludzi.
Zysk, tysiąc rubli
Średnia produkcja na pracownika
1 grupa
do 200 milionów rubli
1,8,12
197,7
204,7
192,6
10,0
9,4
8,8
900
817
13,5
30,6
30,7
28,2
2567
74,8
0,23
Średni poziom
198,3
24,9
2. grupa
od 200 do 400 milionów rubli.
4,10,13,14
196,2
292,2
360,5
280,3
12,6
113,6
14,0
10,2
1200
1200
1290
44,4
49,6
64,8
33,3
1129,2
150,4
4590
192,1
0,25
Średni poziom
282,3
37,6
1530
64,0
3 grupa
od 400 do
600 milionów
2,3,5,6,7,9,11
592
465,5
584,1
480,0
578,5
466,8
423,1
22,8
18,4
22,0
119,0
21,6
19,4
17,6
1500
1412
1485
1420
1390
1375
1365
136,2
97,6
146,0
110,4
138,7
111,8
105,8
3590
240,8
9974
846,5
0,36
Średni poziom
512,9
34,4
1421
120,9
Razem łącznie
5314,2
419,4
17131
1113,4
0,31
Średnio
379,6
59,9
1223,6
79,5
Wniosek. Tym samym w badanej populacji najwięcej przedsiębiorstw pod względem wielkości produkcji znalazło się w grupie trzeciej – siedem, czyli połowa przedsiębiorstw. W tej grupie mieszczą się także średnioroczny koszt środków trwałych oraz duża średnia liczba pracowników – 9974 osoby, najmniej rentowne są przedsiębiorstwa z pierwszej grupy.
ZADANIE 2
Dostępne są następujące dane o przedsiębiorstwach spółki
Numer przedsiębiorstwa wchodzącego w skład spółki
kwateruję
II kwartał
Produkcja produktu, tysiące rubli.
Osobodni przepracowanych przez pracowników
Średnia produkcja na pracownika dziennie, rub.
59390,13
do 200 milionów rubli
od 200 do 400 milionów rubli.
Zaczynając mówić o średnich, ludzie najczęściej pamiętają, jak ukończyli szkołę i weszli do instytucji edukacyjnej. Następnie na podstawie świadectwa obliczono średnią ocen: wszystkie oceny (zarówno dobre, jak i niezbyt dobre) zsumowano, a otrzymaną kwotę podzielono przez ich liczbę. W ten sposób oblicza się najprostszy rodzaj średniej, który nazywa się prostą średnią arytmetyczną. W praktyce w statystyce wykorzystuje się różne rodzaje średnich: arytmetyczne, harmoniczne, geometryczne, kwadratowe, średnie strukturalne. Stosuje się ten lub inny typ w zależności od charakteru danych i celów badania.
Średnia wartość jest najpowszechniejszym wskaźnikiem statystycznym, za pomocą którego podaje się ogólną charakterystykę zbioru podobnych zjawisk według jednej z różnych charakterystyk. Pokazuje poziom cechy na jednostkę populacji. Za pomocą wartości średnich porównuje się różne populacje według różnych cech, bada się wzorce rozwoju zjawisk i procesów życia społecznego.
W statystyce stosuje się dwie klasy średnich: potęgowe (analityczne) i strukturalne. Te ostatnie służą do scharakteryzowania struktury szeregu zmian i zostaną omówione w dalszej części rozdziału. 8.
Do grupy średnich mocy zalicza się średnie arytmetyczne, harmoniczne, geometryczne i kwadratowe. Poszczególne wzory do ich obliczania można sprowadzić do postaci wspólnej dla wszystkich średnich mocy, a mianowicie
gdzie m jest wykładnikiem średniej potęgowej: przy m = 1 otrzymujemy wzór na obliczenie średniej arytmetycznej, przy m = 0 - średniej geometrycznej, m = -1 - średniej harmonicznej, przy m = 2 - średniej kwadratowej ;
x i - opcje (wartości, jakie przyjmuje atrybut);
f ja - częstotliwości.
Głównym warunkiem, pod którym można zastosować średnie potęgowe w analizie statystycznej, jest jednorodność populacji, która nie powinna zawierać danych wyjściowych znacznie różniących się wartością ilościową (w literaturze nazywane są obserwacjami anomalnymi).
Zademonstrujmy znaczenie tego warunku na następującym przykładzie.
Przykład 6.1. Obliczmy średnie wynagrodzenie pracowników małego przedsiębiorstwa.
NIE. | Wynagrodzenie, pocierać. | NIE. | Wynagrodzenie, pocierać. |
---|---|---|---|
1 | 5 950 | 11 | 7 000 |
2 | 6 790 | 12 | 5 950 |
3 | 6 790 | 13 | 6 790 |
4 | 5 950 | 14 | 5 950 |
5 | 7 000 | 5 | 6 790 |
6 | 6 790 | 16 | 7 000 |
7 | 5 950 | 17 | 6 790 |
8 | 7 000 | 18 | 7 000 |
9 | 6 790 | 19 | 7 000 |
10 | 6 790 | 20 | 5 950 |
Aby obliczyć średnie wynagrodzenie, należy zsumować wynagrodzenia naliczone wszystkim pracownikom przedsiębiorstwa (tj. znaleźć fundusz wynagrodzeń) i podzielić przez liczbę pracowników:
Teraz dodajmy do naszej sumy tylko jedną osobę (dyrektor tego przedsiębiorstwa), ale z pensją 50 000 rubli. W takim przypadku obliczona średnia będzie zupełnie inna:
Jak widać, przekracza 7000 rubli itp. jest większa niż wszystkie wartości atrybutów z wyjątkiem jednej pojedynczej obserwacji.
Aby takie przypadki nie miały miejsca w praktyce, a średnia nie straciła na znaczeniu (w przykładzie 6.1 nie odgrywa już roli uogólniającej cechy populacji, jaką powinna być), przy obliczaniu średniej, anomalnej, ostro wyróżniające się obserwacje należy wyłączyć z analizy, a tematy uczynić populację jednorodną lub podzielić populację na jednorodne grupy i obliczyć średnie wartości dla każdej grupy i analizować nie średnią ogólną, ale średnie wartości grupy.
6.1. Średnia arytmetyczna i jej własności
Średnią arytmetyczną oblicza się albo jako wartość prostą, albo jako wartość ważoną.
Obliczając średnie wynagrodzenie zgodnie z danymi z tabeli przykład 6.1, zsumowaliśmy wszystkie wartości atrybutu i podzieliliśmy przez ich liczbę. Postęp naszych obliczeń będziemy pisać w postaci prostego wzoru na średnią arytmetyczną
gdzie x i - opcje (poszczególne wartości cechy);
n to liczba jednostek w sumie.
Przykład 6.2. Pogrupujmy teraz nasze dane z tabeli z przykładu 6.1 itd. Skonstruujmy dyskretną serię zmian rozkładu pracowników według poziomu płac. Wyniki grupowania przedstawiono w tabeli.
Zapiszmy wyrażenie służące do obliczenia średniego poziomu płac w bardziej zwartej formie:
W przykładzie 6.2 zastosowano wzór na średnią ważoną arytmetyczną
gdzie f i są częstotliwościami pokazującymi, ile razy wartość atrybutu x i y występuje w jednostkach populacji.
Średnią arytmetyczną ważoną wygodnie jest obliczyć w tabeli, jak pokazano poniżej (tabela 6.3):
Wstępne dane | Szacowany wskaźnik | |
wynagrodzenie, pocierać. | liczba pracowników, osób | fundusz płac, rub. |
x ja | f ja | x ja fi ja |
5 950 | 6 | 35 760 |
6 790 | 8 | 54 320 |
7 000 | 6 | 42 000 |
Całkowity | 20 | 132 080 |
Należy zauważyć, że prostą średnią arytmetyczną stosuje się w przypadkach, gdy dane nie są pogrupowane lub pogrupowane, ale wszystkie częstotliwości są równe.
Często wyniki obserwacji przedstawiane są w postaci szeregu rozkładów przedziałowych (patrz tabela w przykładzie 6.4). Następnie przy obliczaniu średniej punkty środkowe przedziałów przyjmuje się jako x i. Jeżeli pierwszy i ostatni przedział są otwarte (nie mają żadnej z granic), to warunkowo „zamykają się”, przyjmując za wartość tego przedziału wartość sąsiedniego przedziału itp. pierwszy jest zamykany na podstawie wartości drugiego, a ostatni na podstawie wartości przedostatniego.
Przykład 6.3. Na podstawie wyników badania reprezentacyjnego jednej z grup ludności obliczymy wysokość przeciętnego dochodu pieniężnego na mieszkańca.
W powyższej tabeli środek pierwszego przedziału wynosi 500. Rzeczywiście wartość drugiego przedziału wynosi 1000 (2000-1000); wtedy dolna granica pierwszego to 0 (1000-1000), a jego środkowa to 500. To samo robimy z ostatnim interwałem. Jako środek przyjmujemy 25 000: wartość przedostatniego przedziału wynosi 10 000 (20 000–10 000), następnie jego górna granica wynosi 30 000 (20 000 + 10 000), a środek odpowiednio wynosi 25 000.
Średni dochód gotówkowy na mieszkańca, rub. na miesiąc | Populacja ogółem, % f i | Punkty środkowe przedziałów x i | x ja fi ja |
---|---|---|---|
Do 1000 | 4,1 | 500 | 2 050 |
1 000-2 000 | 8,6 | 1 500 | 12 900 |
2 000-4 000 | 12,9 | 3 000 | 38 700 |
4 000-6 000 | 13,0 | 5 000 | 65 000 |
6 000-8 000 | 10,5 | 7 000 | 73 500 |
8 000-10 000 | 27,8 | 9 000 | 250 200 |
10 000-20 000 | 12,7 | 15 000 | 190 500 |
20 000 i więcej | 10,4 | 25 000 | 260 000 |
Całkowity | 100,0 | - | 892 850 |
Wtedy będzie średni miesięczny dochód na mieszkańca
Wykład 5. Wartości średnie
Pojęcie średniej w statystyce
Średnia arytmetyczna i jej własności
Inne rodzaje średnich mocy
Tryb i mediana
Kwartyle i decyle
Wartości średnie są szeroko stosowane w statystykach. Wartości średnie charakteryzują wskaźniki jakościowe działalności handlowej: koszty dystrybucji, zysk, rentowność itp.
Przeciętny- To jedna z powszechnych technik uogólniania. Prawidłowe zrozumienie istoty średniej przesądza o jej szczególnym znaczeniu w gospodarce rynkowej, gdzie średnia, poprzez indywidualność i losowość, pozwala zidentyfikować to, co ogólne i konieczne, określić kierunek wzorców rozwoju gospodarczego.
Średnia wartość- są to wskaźniki uogólniające, w których wyrażane są skutki ogólnych warunków i wzorców badanego zjawiska.
Średnia wartość (w statystyce) – ogólny wskaźnik charakteryzujący typową wielkość lub poziom zjawisk społecznych na jednostkę populacji, przy wszystkich innych czynnikach niezmiennych.
Metodą średnich można rozwiązać następujące problemy: główne cele:
1. Charakterystyka poziomu rozwoju zjawisk.
2. Porównanie dwóch lub więcej poziomów.
3. Badanie powiązań zjawisk społeczno-gospodarczych.
4. Analiza lokalizacji zjawisk społeczno-gospodarczych w przestrzeni.
Średnie statystyczne obliczane są na podstawie danych masowych pochodzących z prawidłowo zorganizowanych statystycznie obserwacji mas (ciągłych i selektywnych). Jednakże średnia statystyczna będzie obiektywna i typowa, jeśli zostanie obliczona na podstawie danych masowych dla jakościowo jednorodnej populacji (zjawiska masowe). Jeśli na przykład obliczy się przeciętne wynagrodzenie w spółdzielniach i przedsiębiorstwach państwowych i rozciągnie wynik na całą populację, to średnia jest fikcyjna, bo liczona jest dla niejednorodnej populacji i taka średnia traci wszelkie znaczenie.
Za pomocą średniej wygładzane są różnice w wartości cechy, które powstają z tego czy innego powodu w poszczególnych jednostkach obserwacji. Na przykład średnia produktywność sprzedawcy zależy od wielu czynników: kwalifikacji, stażu pracy, wieku, formy obsługi, stanu zdrowia itp.
Istota średniej polega na tym, że niweluje ona odchylenia wartości charakterystycznych poszczególnych jednostek populacji spowodowane działaniem czynników losowych, a uwzględnia zmiany spowodowane działaniem czynników głównych. Dzięki temu średnia odzwierciedla typowy poziom cechy i abstrahuje od indywidualnych cech właściwych poszczególnym jednostkom.
Wartość średnia jest odzwierciedleniem wartości badanej cechy, dlatego jest mierzona w tym samym wymiarze, co ta cecha.
Każda średnia wartość charakteryzuje badaną populację według jednej cechy. Aby uzyskać pełne i wszechstronne zrozumienie badanej populacji według szeregu istotnych cech, ogólnie rzecz biorąc, konieczne jest posiadanie systemu wartości średnich, który może opisać zjawisko z różnych punktów widzenia.
Istnieją różne średnie:
Średnia arytmetyczna;
Średnia geometryczna;
Średnia harmoniczna;
Średnia kwadratowa;
Średnio chronologicznie.
5.1. Pojęcie średniej
Średnia wartość - Jest to ogólny wskaźnik charakteryzujący typowy poziom zjawiska. Wyraża wartość cechy na jednostkę populacji.
Średnia zawsze uogólnia ilościową zmienność cechy, tj. w wartościach średnich eliminowane są różnice indywidualne pomiędzy jednostkami populacji wynikające z okoliczności losowych. W przeciwieństwie do średniej, wartość bezwzględna charakteryzująca poziom cechy pojedynczej jednostki populacji nie pozwala na porównanie wartości cechy pomiędzy jednostkami należącymi do różnych populacji. Jeśli więc trzeba porównać poziom wynagrodzeń pracowników w dwóch przedsiębiorstwach, nie można na tej podstawie porównać dwóch pracowników różnych przedsiębiorstw. Wynagrodzenie wybranych do porównania pracowników może nie być typowe dla tych przedsiębiorstw. Porównując wielkość funduszy wynagrodzeń w rozważanych przedsiębiorstwach, nie bierze się pod uwagę liczby pracowników, w związku z czym nie można określić, gdzie poziom wynagrodzeń jest wyższy. Ostatecznie można porównywać jedynie wskaźniki średnie, tj. Ile średnio zarabia jeden pracownik w każdym przedsiębiorstwie? Istnieje zatem potrzeba obliczenia wartości średniej jako uogólniającej cechy populacji.
Obliczanie średniej jest jedną z powszechnych technik uogólniania; wskaźnik przeciętności zaprzecza temu, co wspólne (typowe) dla wszystkich jednostek badanej populacji, ignorując jednocześnie różnice poszczególnych jednostek. W każdym zjawisku i jego rozwoju istnieje połączenie przypadku i konieczności. Przy obliczaniu średnich, ze względu na działanie prawa wielkich liczb, losowość znosi się i równoważy, dzięki czemu można abstrahować od nieistotnych cech zjawiska, od wartości ilościowych cechy w każdym konkretnym przypadku . Możliwość abstrahowania od losowości poszczególnych wartości i wahań leży w wartości naukowej średnich jako uogólniających cech agregatów.
Aby średnia była rzeczywiście reprezentatywna, należy ją obliczyć z uwzględnieniem pewnych zasad.
Zastanówmy się nad kilkoma ogólnymi zasadami stosowania średnich.
1. Należy określić średnią dla populacji składających się z jednostek jednorodnych jakościowo.
2. Średnią należy obliczyć dla populacji składającej się z odpowiednio dużej liczby jednostek.
3. Średnią należy obliczyć dla populacji, której jednostki znajdują się w normalnym, naturalnym stanie.
4. Średnią należy obliczyć, biorąc pod uwagę treść ekonomiczną badanego wskaźnika.
5.2. Rodzaje średnich i metody ich obliczania
Rozważmy teraz rodzaje wartości średnich, cechy ich obliczania i obszary zastosowania. Wartości średnie dzielą się na dwie duże klasy: średnie mocy, średnie strukturalne.
DO średnia moc Należą do nich najbardziej znane i często stosowane typy, takie jak średnia geometryczna, średnia arytmetyczna i średnia kwadratowa.
Jak średnie strukturalne uwzględniono modę i medianę.
Skupmy się na średnich mocach. Średnie mocy, w zależności od prezentacji danych źródłowych, mogą mieć charakter prosty lub ważony. Prosta średnia Obliczany jest na podstawie danych niezgrupowanych i ma następującą ogólną postać:
gdzie X i jest wariantem (wartością) uśrednianej cechy;
n – opcja liczbowa.
Średnia ważona jest obliczany na podstawie pogrupowanych danych i ma wygląd ogólny
,
gdzie X i jest wariantem (wartością) uśrednianej cechy lub wartością środkową przedziału, w którym mierzony jest wariant;
m – wskaźnik średniego stopnia;
f i – częstotliwość pokazująca, ile razy występuje wartość ie uśrednionej charakterystyki.
Podajmy dla przykładu obliczenie średniego wieku uczniów w grupie 20 osób:
Średni wiek obliczamy za pomocą prostego wzoru na średnią:
Pogrupujmy dane źródłowe. Otrzymujemy następujący szereg dystrybucyjny:
W wyniku grupowania otrzymujemy nowy wskaźnik – częstotliwość, wskazujący liczbę uczniów w wieku X lat. W związku z tym średni wiek uczniów w grupie zostanie obliczony przy użyciu wzoru na średnią ważoną:
Ogólne wzory do obliczania średnich mocy mają wykładnik (m). W zależności od wartości, jaką przyjmuje, wyróżnia się następujące rodzaje średnich mocy:
średnia harmoniczna, jeśli m = -1;
średnia geometryczna, jeśli m –> 0;
średnia arytmetyczna, jeśli m = 1;
pierwiastek średni kwadratowy, jeśli m = 2;
średnia sześcienna, jeśli m = 3.
Wzory na średnie moce podano w tabeli. 4.4.
Jeśli obliczysz wszystkie typy średnich dla tych samych danych początkowych, ich wartości okażą się różne. Obowiązuje tu zasada większości średnich: wraz ze wzrostem wykładnika m wzrasta również odpowiadająca mu wartość średnia:
W praktyce statystycznej częściej niż inne rodzaje średnich ważonych stosuje się średnie arytmetyczne i średnie ważone harmoniczne.
Tabela 5.1
Rodzaje środków mocy
Rodzaj mocy przeciętny |
Indeks stopień (m) |
Wzór obliczeniowy | |
Prosty | Ważona | ||
Harmoniczny | -1 | ||
Geometryczny | 0 | ||
Arytmetyka | 1 | ||
Kwadratowy | 2 | ||
Sześcienny | 3 |
Średnia harmoniczna ma bardziej złożoną strukturę niż średnia arytmetyczna. Do obliczeń używa się średniej harmonicznej, gdy jako wagi stosuje się nie jednostki populacji – nośniki cechy, ale iloczyn tych jednostek przez wartości cechy (tj. m = Xf). Do średniej prostej harmonicznej należy się odwołać w przypadku określenia np. średniego kosztu pracy, czasu, materiałów na jednostkę produkcji, na jedną część dla dwóch (trzech, czterech itp.) przedsiębiorstw, pracowników zajmujących się produkcją tego samego rodzaju produktu, tej samej części, produktu.
Głównym wymaganiem dotyczącym wzoru na obliczenie wartości średniej jest to, że wszystkie etapy obliczeń mają naprawdę znaczące uzasadnienie; uzyskana wartość średnia powinna zastąpić indywidualne wartości atrybutu dla każdego obiektu, nie zakłócając połączenia między wskaźnikami indywidualnymi i sumarycznymi. Innymi słowy, wartość średnią należy obliczyć w taki sposób, aby po zastąpieniu każdej pojedynczej wartości wskaźnika uśrednionego jego wartością średnią, jakiś końcowy wskaźnik podsumowujący, powiązany w ten czy inny sposób z wartością uśrednioną, pozostał niezmieniony. Suma ta nazywa się definiowanie ponieważ charakter jego związku z poszczególnymi wartościami określa konkretny wzór na obliczenie wartości średniej. Zademonstrujmy tę regułę na przykładzie średniej geometrycznej.
Wzór na średnią geometryczną
stosowany najczęściej przy obliczaniu wartości średniej na podstawie indywidualnej dynamiki względnej.
Średnią geometryczną stosuje się, jeżeli podany jest ciąg względnej dynamiki łańcucha, wskazujący np. wzrost produkcji w stosunku do poziomu roku poprzedniego: i 1, i 2, i 3,..., i n. Oczywiście o wielkości produkcji w ostatnim roku decyduje jej początkowy poziom (q 0) i późniejszy wzrost na przestrzeni lat:
q n =q 0 × ja 1 × ja 2 ×...×i n .
Przyjmując q n za wskaźnik determinujący i zastępując poszczególne wartości wskaźników dynamiki wartościami średnimi, dochodzimy do zależności
Stąd
5.3. Średnie strukturalne
Specjalny rodzaj wartości średnich – średnie strukturalne – służy do badania wewnętrznej struktury szeregu rozkładów wartości atrybutów, a także do szacowania wartości średniej (rodzaju mocy), jeżeli zgodnie z dostępnymi danymi statystycznymi jej obliczeń nie można przeprowadzić (przykładowo, jeśli w rozważanym przykładzie nie było danych zarówno o wielkości produkcji, jak i wysokości kosztów według grup przedsiębiorstw).
Wskaźniki są najczęściej stosowane jako średnie strukturalne moda – najczęściej powtarzana wartość atrybutu – i mediany – wartość cechy, która dzieli uporządkowaną sekwencję jej wartości na dwie równe części. W efekcie dla połowy jednostek populacji wartość atrybutu nie przekracza poziomu mediany, a dla drugiej połowy nie jest od niej mniejsza.
Jeżeli badana cecha ma wartości dyskretne, wówczas nie ma szczególnych trudności w obliczeniu trybu i mediany. Jeśli dane o wartościach atrybutu X przedstawimy w postaci uporządkowanych przedziałów jego zmian (seria przedziałów), obliczenie postaci i mediany staje się nieco bardziej skomplikowane. Ponieważ wartość mediana dzieli całą populację na dwie równe części, kończy się ona w jednym z przedziałów cechy X. Korzystając z interpolacji, wartość mediany znajduje się w tym przedziale mediany:
,
gdzie X Me jest dolną granicą przedziału mediany;
h Me – jego wartość;
(Suma m)/2 – połowa ogólnej liczby obserwacji lub połowa wielkości wskaźnika stosowanego jako waga we wzorach na obliczenie wartości średniej (w wartościach bezwzględnych lub względnych);
S Me-1 – suma obserwacji (lub wielkość atrybutu ważącego) zgromadzona przed początkiem przedziału mediany;
m Me – liczba obserwacji lub objętość cechy ważącej w przedziale mediany (również w wartościach bezwzględnych lub względnych).
W naszym przykładzie można uzyskać nawet trzy wartości mediany – w oparciu o liczbę przedsiębiorstw, wielkość produkcji i całkowite koszty produkcji:
Tak więc w połowie przedsiębiorstw koszt jednostki produkcji przekracza 125,19 tys. Rubli, połowa całkowitej wielkości produktów jest wytwarzana przy koszcie na produkt ponad 124,79 tys. rubli. a 50% kosztów całkowitych powstaje, gdy koszt jednego produktu przekracza 125,07 tysięcy rubli. Należy również zauważyć, że istnieje pewna tendencja do wzrostu kosztów, ponieważ Me 2 = 124,79 tys. Rubli, a średni poziom to 123,15 tys. Rubli.
Obliczając wartość modalną cechy na podstawie danych szeregu przedziałów, należy zwrócić uwagę na to, że przedziały są identyczne, ponieważ od tego zależy wskaźnik powtarzalności wartości cechy X. Dla szereg przedziałowy o równych odstępach, wielkość modu określa się jako
gdzie X Mo jest dolną wartością przedziału modalnego;
m Mo – liczba obserwacji lub objętość charakterystyki ważącej w przedziale modalnym (w wartościach bezwzględnych lub względnych);
m Mo -1 – to samo dla przedziału poprzedzającego modalny;
m Mo+1 – to samo dla przedziału następującego po modalnym;
h – wartość przedziału zmian charakterystyki w grupach.
W naszym przykładzie możemy obliczyć trzy wartości modalne w oparciu o charakterystykę liczby przedsiębiorstw, wolumenu produktów i wysokości kosztów. We wszystkich trzech przypadkach przedział modalny jest taki sam, ponieważ w tym samym przedziale liczba przedsiębiorstw, wielkość produkcji i całkowita wysokość kosztów produkcji są największe:
Zatem najczęściej istnieją przedsiębiorstwa o poziomie kosztów 126,75 tys. Rubli, najczęściej wytwarzane są produkty o poziomie kosztów 126,69 tys. Rubli, a najczęściej koszty produkcji tłumaczy się poziomem kosztów 123,73 tys. Rubli.
5.4. Wskaźniki zmienności
Specyficzne warunki, w jakich znajduje się każdy z badanych obiektów, a także cechy własnego rozwoju (społeczne, gospodarcze itp.) wyrażają odpowiadające im poziomy liczbowe wskaźników statystycznych. Zatem, zmiana, te. rozbieżność poziomów tego samego wskaźnika w różnych obiektach ma charakter obiektywny i pozwala zrozumieć istotę badanego zjawiska.
Istnieje kilka metod pomiaru zmienności statystyk.
Najprościej jest obliczyć wskaźnik zakres zmienności H jako różnica pomiędzy maksymalną (X max) i minimalną (X min) zaobserwowaną wartością cechy:
H=X maks. - X min.
Jednak zakres zmienności pokazuje tylko skrajne wartości cechy. Nie jest tu brana pod uwagę powtarzalność wartości pośrednich.
Bardziej rygorystyczne cechy są wskaźnikami zmienności w stosunku do średniego poziomu cechy. Najprostszym wskaźnikiem tego typu jest średnie odchylenie liniowe L jako średnia arytmetyczna bezwzględnych odchyleń cechy od jej średniego poziomu:
Gdy poszczególne wartości X są powtarzalne, należy zastosować wzór na średnią ważoną arytmetyczną:
(Przypomnijmy, że suma algebraiczna odchyleń od poziomu średniego wynosi zero.)
Wskaźnik średniego odchylenia liniowego jest szeroko stosowany w praktyce. Za jego pomocą analizuje się na przykład skład pracowników, rytm produkcji, jednorodność dostaw materiałów i opracowywane są systemy zachęt materialnych. Ale niestety wskaźnik ten komplikuje obliczenia probabilistyczne i komplikuje stosowanie metod statystyki matematycznej. Dlatego w statystycznych badaniach naukowych najczęściej używanym wskaźnikiem do pomiaru zmienności jest odchylenia.
Wariancję cechy (s 2) wyznacza się na podstawie średniej potęgi kwadratowej:
.
Nazywa się wskaźnik s równy odchylenie standardowe.
W ogólnej teorii statystyki wskaźnik rozproszenia jest oceną wskaźnika teorii prawdopodobieństwa o tej samej nazwie i (jako suma kwadratów odchyleń) oceną rozrzutu w statystyce matematycznej, co pozwala na wykorzystanie zapisów tych dyscypliny teoretyczne służące analizie procesów społeczno-gospodarczych.
Jeżeli wariancję szacuje się na podstawie niewielkiej liczby obserwacji z nieograniczonej populacji, wówczas średnią wartość cechy wyznacza się z pewnym błędem. Obliczona wartość dyspersji okazuje się przesunięta w kierunku malejącym. Aby uzyskać bezstronne oszacowanie, wariancję próbki uzyskaną za pomocą podanych wcześniej wzorów należy pomnożyć przez wartość n / (n - 1). W efekcie przy niewielkiej liczbie obserwacji (np.< 30) дисперсию признака рекомендуется вычислять по формуле
Zwykle już dla n > (15 20) rozbieżność pomiędzy szacunkami obciążonymi i nieobciążonymi staje się nieistotna. Z tego samego powodu obciążenie zwykle nie jest uwzględniane we wzorze na dodawanie wariancji.
Jeżeli z populacji ogólnej pobiera się kilka próbek i za każdym razem wyznacza się średnią wartość cechy, pojawia się problem oceny zmienności średnich. Oszacuj wariancję Średnia wartość jest to możliwe w oparciu o tylko jedną przykładową obserwację przy użyciu wzoru
,
gdzie n jest wielkością próby; s 2 – wariancja cechy obliczona na podstawie danych próbnych.
Ogrom jest nazywany średni błąd próbkowania i jest cechą odchylenia średniej wartości próbki X od jej prawdziwej wartości średniej. Wskaźnik błędu średniego służy do oceny wiarygodności wyników obserwacji próby.
Wskaźniki względnej dyspersji. Aby scharakteryzować miarę zmienności badanej cechy, wskaźniki zmienności oblicza się w wartościach względnych. Umożliwiają porównanie charakteru dyspersji w różnych rozkładach (różne jednostki obserwacji tej samej cechy w dwóch populacjach, o różnych wartościach średnich, przy porównywaniu populacji o różnych nazwach). Obliczenie wskaźników miary względnego rozproszenia przeprowadza się jako stosunek bezwzględnego wskaźnika rozproszenia do średniej arytmetycznej pomnożony przez 100%.
1. Współczynnik oscylacji odzwierciedla względne wahania skrajnych wartości cechy wokół średniej
.
2. Względne wyłączenie liniowe charakteryzuje proporcję średniej wartości znaku bezwzględnych odchyleń od wartości średniej
.
3. Współczynnik zmienności:
jest najczęstszą miarą zmienności stosowaną do oceny typowości wartości średnich.
W statystykach populacje ze współczynnikiem zmienności większym niż 30–35% uważa się za niejednorodne.
Ta metoda oceny zmienności ma również istotną wadę. Rzeczywiście, niech np. pierwotna populacja pracowników ze średnim stażem pracy wynoszącym 15 lat, przy odchyleniu standardowym s = 10 lat, „zestarzeje się” o kolejne 15 lat. Teraz = 30 lat, a odchylenie standardowe nadal wynosi 10. Populacja wcześniej niejednorodna (10/15 × 100 =
66,7%), okazując się tym samym dość jednorodne w czasie (10/30 × 100 = 33,3%).
Boyarsky A.Ya. Studia teoretyczne ze statystyki: sob. Naukowy Trudov – M.: Statystyka, 1974. s. 19–57.
Poprzedni |
Podobne artykuły
-
Marzyłam o welonie ślubnym
Dlaczego kobieta marzy o welonie: Dobrze znany symbol czystości, młodości, czystości, niewinności Widząc welon we śnie - taki sen obiecuje spotkanie i znajomość z osobą, która zmieni Twoje poglądy na temat życia. Jeśli marzyłeś...
-
Dlaczego śnisz o trzymaniu języka w ustach? Interpretacja snów o wyjmowaniu go z ust
Usta we śnie są symbolem komunikacji, wyrażania siebie, wskaźnikiem myśli i uczuć danej osoby. Dokładna i szczegółowa analiza własnego snu, a także związku pomiędzy tym, co widziałeś, a wydarzeniami zachodzącymi w prawdziwym życiu oraz poszukiwanie odpowiedzi w...
-
DO GOTOWANIA – przepisy na każdy dzień!
Czosnek to roślina wieloletnia, którą ludzie uprawiali już tysiąc lat temu, kiedy to młode pędy sprowadzono ze wschodu nawet do najodleglejszych zakątków planety. Pomimo zmiennego klimatu i trudnych warunków czosnek okazał się wytrwały...
-
Opis stanowiska sekretarza głowy
Sekretarz nazywany jest wiernym asystentem i prawą ręką szefa i nie bez powodu, ponieważ do obowiązków sekretarza menedżera należy zapewnienie skutecznego zarządzania i działań administracyjnych. Sekretarka kierownika jest zajęta...
-
Magia liczb Co oznacza wieniec we śnie?
Po obejrzeniu fabuły w duszy śniącego pozostaje nieprzyjemny posmak, niepokojące myśli w głowie nie dają spokoju. Co o tym myślą ezoterycy i interpretatorzy książek snów? Sen należy interpretować, biorąc pod uwagę specyfikę rozwoju fabuły snu,...
-
Dlaczego marzysz o rzece według wymarzonej książki?
Książka marzeń Millera Jeśli śnisz o gładkiej, spokojnej tafli rzeki, oznacza to, że wkrótce będziesz cieszyć się najcudowniejszymi radościami, a Twoje samopoczucie zachwyci Cię kuszącymi możliwościami. Jeśli wody rzeki są mętne i niespokojne -...