Valorile medii pot fi calculate în formular. Determinarea valorii medii, variației și formei de distribuție. Statisticile descriptive

Valoarea medie este cea mai valoroasă din punct de vedere analitic și o formă universală de exprimare a indicatorilor statistici. Cea mai comună medie - media aritmetică - are o serie de proprietăți matematice care pot fi utilizate în calculul ei. În același timp, atunci când se calculează o medie specifică, este întotdeauna recomandabil să se bazeze pe formula sa logică, care este raportul dintre volumul atributului și volumul populației. Pentru fiecare medie, există un singur raport de referință adevărat, care, în funcție de datele disponibile, poate necesita diferite forme de medii. Cu toate acestea, în toate cazurile în care natura valorii medii implică prezența ponderilor, este imposibil să se utilizeze formulele lor neponderate în locul formulelor medii ponderate.

Valoarea medie este valoarea cea mai caracteristică a atributului pentru populație și mărimea atributului populației distribuite în părți egale între unitățile populației.

Se numește caracteristica pentru care se calculează valoarea medie mediat .

Valoarea medie este un indicator calculat prin compararea valorilor absolute sau relative. Valoarea medie este

Valoarea medie reflectă influența tuturor factorilor care influențează fenomenul studiat și este rezultatul acestora. Cu alte cuvinte, rambursând abaterile individuale și eliminând influența cazurilor, valoarea medie, reflectând măsura generală a rezultatelor acestei acțiuni, acționează ca un model general al fenomenului studiat.

Condiții de utilizare a mediilor:

Ø omogenitatea populatiei studiate. Dacă unele elemente ale populației supuse influenței unui factor aleatoriu au valori semnificativ diferite ale trăsăturii studiate față de restul, atunci aceste elemente vor afecta mărimea mediei pentru această populație. În acest caz, media nu va exprima valoarea cea mai tipică a caracteristicii pentru populație. Dacă fenomenul studiat este eterogen, se impune defalcarea lui în grupuri care conțin elemente omogene. În acest caz, se calculează mediile de grup - medii de grup, care exprimă valoarea cea mai caracteristică a fenomenului din fiecare grup, iar apoi se calculează valoarea medie generală pentru toate elementele, caracterizând fenomenul în ansamblu. Se calculează ca media medie a grupului, ponderată cu numărul de elemente ale populației incluse în fiecare grupă;

Ø un numar suficient de unitati in agregat;

Ø valorile maxime si minime ale trasaturii in populatia studiata.

Valoarea medie (indicator)- aceasta este o caracteristică cantitativă generalizată a unei trăsături într-o populație sistematică în condiții specifice de loc și timp.

În statistică, sunt utilizate următoarele forme (tipuri) de medii, numite putere și structurală:

Ø medie aritmetică(simplu și ponderat);

simplu


Valoarea medie este un indicator generalizator care caracterizează nivelul tipic al fenomenului. Exprimă valoarea atributului, raportată la unitatea populației.

Valoarea medie este:

1) valoarea cea mai tipică a atributului pentru populație;

2) volumul semnului populaţiei, distribuit în mod egal între unităţile populaţiei.

Caracteristica pentru care se calculează valoarea medie se numește „medie” în statistici.

Media generalizează întotdeauna variația cantitativă a trăsăturii, adică. în valori medii se anulează diferențele individuale în unitățile populației datorate unor circumstanțe aleatorii. Spre deosebire de medie, valoarea absolută care caracterizează nivelul unei caracteristici a unei unități individuale a populației nu permite compararea valorilor caracteristicii pentru unitățile aparținând diferitelor populații. Deci, dacă trebuie să comparați nivelurile de remunerare a lucrătorilor din două întreprinderi, atunci nu puteți compara doi angajați ai unor întreprinderi diferite pe această bază. Este posibil ca salariile lucrătorilor selectați pentru comparație să nu fie tipice pentru aceste întreprinderi. Dacă comparăm mărimea fondurilor de salarii la întreprinderile luate în considerare, atunci numărul de angajați nu este luat în considerare și, prin urmare, este imposibil de stabilit unde nivelul salariilor este mai mare. În cele din urmă, doar mediile pot fi comparate, adică. Cât de mult câștigă în medie un muncitor în fiecare companie? Astfel, este necesar să se calculeze valoarea medie ca caracteristică generalizantă a populației.

Este important de menționat că în procesul de mediere, valoarea agregată a nivelurilor de atribut sau valoarea finală a acesteia (în cazul calculării nivelurilor medii într-o serie temporală) trebuie să rămână neschimbată. Cu alte cuvinte, la calcularea valorii medii, volumul trăsăturii studiate nu trebuie distorsionat, iar expresiile făcute la calcularea mediei trebuie neapărat să aibă sens.

Calcularea mediei este o tehnică comună de generalizare; indicatorul mediu neagă generalul care este tipic (tipic) pentru toate unitățile populației studiate, în același timp ignoră diferențele dintre unitățile individuale. În fiecare fenomen și în dezvoltarea lui există o combinație de întâmplare și necesitate. La calcularea mediilor, datorită funcționării legii numerelor mari, aleatorietatea se anulează reciproc, se echilibrează, prin urmare este posibil să se abstragă de la trăsăturile nesemnificative ale fenomenului, de la valorile cantitative ale atributului în fiecare specific. caz. În capacitatea de a face abstracție de la aleatorietatea valorilor individuale, a fluctuațiilor, se află valoarea științifică a mediilor ca caracteristici generalizatoare ale agregatelor.

Pentru ca media să fie cu adevărat tipică, aceasta trebuie calculată ținând cont de anumite principii.

Să ne oprim asupra unor principii generale de aplicare a mediilor.

1. Media trebuie determinată pentru populațiile formate din unități calitativ omogene.

2. Media ar trebui calculată pentru o populație formată dintr-un număr suficient de mare de unități.

3. Ar trebui calculată media pentru populația ale cărei unități se află într-o stare normală, naturală.

4. Media trebuie calculată ținând cont de conținutul economic al indicatorului studiat.

5.2. Tipuri de medii și metode de calculare a acestora

Să luăm acum în considerare tipurile de medii, caracteristicile calculului lor și domeniile de aplicare. Valorile medii sunt împărțite în două clase mari: medii de putere, medii structurale.

Mediile legii puterii includ cele mai cunoscute și utilizate tipuri, cum ar fi media geometrică, media aritmetică și pătratul mediu.

Modul și mediana sunt considerate ca medii structurale.

Să ne oprim asupra mediilor de putere. Mediile de putere, în funcție de prezentarea datelor inițiale, pot fi simple și ponderate. medie simplă este calculat din date negrupate și are următoarea formă generală:

,

unde X i este varianta (valoarea) caracteristicii mediate;

n este numărul de opțiuni.

Medie ponderată se calculează prin date grupate și are o formă generală

,

unde X i este varianta (valoarea) caracteristicii medii sau valoarea medie a intervalului în care este măsurată varianta;

m este exponentul mediei;

f i - frecvența care arată de câte ori apare valoarea i-e a caracteristicii medii.

Dacă calculăm toate tipurile de medii pentru aceleași date inițiale, atunci valorile lor nu vor fi aceleași. Aici se aplică regula majorității mediilor: cu o creștere a exponentului m, crește și valoarea medie corespunzătoare:

În practica statistică, mai des decât alte tipuri de medii ponderate, se folosesc medii ponderate aritmetice și armonice.

Tipuri de mijloace de putere

Tip de putere
mijloc

Index
grade (m)

Formula de calcul

Simplu

ponderat

armonic

Geometric

Aritmetic

pătratică

cub

Media armonică are o structură mai complexă decât media aritmetică. Media armonică este utilizată pentru calcule atunci când ponderile nu sunt unitățile populației - purtătorii trăsăturii, ci produsele acestor unități și valorile trăsăturii (adică m = Xf). Timpul mediu de oprire armonică trebuie utilizat în cazurile de determinare, de exemplu, a costurilor medii ale forței de muncă, timpului, materialelor pe unitate de producție, pe parte pentru două (trei, patru, etc.) întreprinderi, lucrători angajați în fabricarea același tip de produs, aceeași piesă, produs.

Principala cerință pentru formula de calcul a valorii medii este ca toate etapele calculului să aibă o justificare reală semnificativă; valoarea medie rezultată ar trebui să înlocuiască valorile individuale ale atributului pentru fiecare obiect fără a întrerupe legătura dintre indicatorii individuali și sumar. Cu alte cuvinte, valoarea medie trebuie calculată în așa fel încât, atunci când fiecare valoare individuală a indicatorului mediu este înlocuită cu valoarea sa medie, un indicator rezumativ final, conectat într-un fel sau altul cu cel mediat, să rămână neschimbat. Acest rezultat se numește determinareaîntrucât natura relației sale cu valorile individuale determină formula specifică pentru calcularea valorii medii. Să arătăm această regulă pe exemplul mediei geometrice.

Formula medie geometrică

cel mai adesea utilizat la calcularea valorii medii a valorilor relative individuale ale dinamicii.

Media geometrică este utilizată dacă este dată o succesiune de valori relative ale dinamicii în lanț, indicând, de exemplu, o creștere a producției față de nivelul din anul precedent: i 1 , i 2 , i 3 ,…, i n . Evident, volumul producției din ultimul an este determinat de nivelul său inițial (q 0) și de creșterea ulterioară de-a lungul anilor:

q n =q 0 × i 1 × i 2 ×…×i n .

Luând q n ca indicator definitoriu și înlocuind valorile individuale ale indicatorilor de dinamică cu cele medii, ajungem la relația

De aici



Un tip special de valori medii - medii structurale - este utilizat pentru a studia structura internă a seriei de distribuție a valorilor atributelor, precum și pentru a estima valoarea medie (tipul de putere), dacă, conform datelor statistice disponibile, calculul acestuia nu poate fi efectuat (de exemplu, dacă nu existau date în exemplul considerat).și asupra volumului producției și asupra mărimii costurilor pe grupuri de întreprinderi).

Indicatorii sunt folosiți cel mai adesea ca medii structurale. Modă - valoarea caracteristică cel mai frecvent repetată - și mediana - valoarea unei caracteristici care împarte succesiunea ordonată a valorilor sale în două părți egale ca număr. Ca urmare, într-o jumătate din unitățile populației, valoarea atributului nu depășește nivelul median, iar în cealaltă jumătate nu este mai mică decât acesta.

Dacă caracteristica studiată are valori discrete, atunci nu există dificultăți deosebite în calcularea modului și a mediei. Dacă datele despre valorile atributului X sunt prezentate sub formă de intervale ordonate ale modificării acestuia (serie de intervale), calculul modului și al mediei devine oarecum mai complicat. Deoarece valoarea mediană împarte întreaga populație în două părți egale ca număr, ea ajunge într-unul dintre intervalele caracteristicii X. Utilizând interpolare, valoarea mediană se găsește în acest interval median:

,

unde X Me este limita inferioară a intervalului median;

h Eu este valoarea lui;

(Suma m) / 2 - jumătate din numărul total de observații sau jumătate din volumul indicatorului care este utilizat ca ponderare în formulele de calcul a valorii medii (în termeni absoluti sau relativi);

S Me-1 este suma observațiilor (sau volumul caracteristicii de ponderare) acumulate înainte de începutul intervalului median;

m Me este numărul de observații sau volumul caracteristicii de ponderare în intervalul median (și în termeni absoluti sau relativi).

Când se calculează valoarea modală a unei caracteristici în funcție de datele seriei de intervale, este necesar să se acorde atenție faptului că intervalele sunt aceleași, deoarece indicatorul frecvenței valorilor caracteristicii X depinde de acest lucru. o serie de intervale cu intervale egale, valoarea modului este determinată ca

,

unde X Mo este valoarea inferioară a intervalului modal;

m Mo este numărul de observații sau volumul caracteristicii de ponderare în intervalul modal (în termeni absoluti sau relativi);

m Mo-1 - la fel pentru intervalul premergător modalului;

m Mo+1 - la fel pentru intervalul care urmează modalului;

h este valoarea intervalului de modificare a trăsăturii în grupuri.

SARCINA 1

Următoarele date sunt disponibile pentru grupul de întreprinderi industriale pentru anul de raportare


întreprinderilor

Volumul producției, milioane de ruble

Număr mediu de angajați, pers.

Profit, mii de ruble

197,7

10,0

13,5

22,8

1500

136,2

465,5

18,4

1412

97,6

296,2

12,6

1200

44,4

584,1

22,0

1485

146,0

480,0

119,0

1420

110,4

57805

21,6

1390

138,7

204,7

30,6

466,8

19,4

1375

111,8

292,2

113,6

1200

49,6

423,1

17,6

1365

105,8

192,6

30,7

360,5

14,0

1290

64,8

280,3

10,2

33,3

Este necesar să se efectueze o grupare de întreprinderi pentru schimbul de produse, luând următoarele intervale:

    până la 200 de milioane de ruble

    de la 200 la 400 de milioane de ruble

  1. de la 400 la 600 de milioane de ruble

    Pentru fiecare grup și pentru toate împreună, determinați numărul de întreprinderi, volumul producției, numărul mediu de angajați, producția medie per angajat. Rezultatele grupării trebuie prezentate sub forma unui tabel statistic. Formulați o concluzie.

    SOLUŢIE

    Să facem o grupare de întreprinderi pentru schimbul de produse, calculul numărului de întreprinderi, volumul producției, numărul mediu de angajați după formula mediei simple. Rezultatele grupării și calculelor sunt rezumate într-un tabel.

    Grupări după volumul de producție


    întreprinderilor

    Volumul producției, milioane de ruble

    Costul mediu anual al mijloacelor fixe, milioane de ruble

    somn mediu

    număr suculent de angajați, pers.

    Profit, mii de ruble

    Producția medie per muncitor

    1 grup

    până la 200 de milioane de ruble

    1,8,12

    197,7

    204,7

    192,6

    10,0

    9,4

    8,8

    900

    817

    13,5

    30,6

    30,7

    28,2

    2567

    74,8

    0,23

    Nivel mediu

    198,3

    24,9

    2 grupa

    de la 200 la 400 de milioane de ruble

    4,10,13,14

    196,2

    292,2

    360,5

    280,3

    12,6

    113,6

    14,0

    10,2

    1200

    1200

    1290

    44,4

    49,6

    64,8

    33,3

    1129,2

    150,4

    4590

    192,1

    0,25

    Nivel mediu

    282,3

    37,6

    1530

    64,0

    3 grupa

    de la 400 la

    600 de milioane

    2,3,5,6,7,9,11

    592

    465,5

    584,1

    480,0

    578,5

    466,8

    423,1

    22,8

    18,4

    22,0

    119,0

    21,6

    19,4

    17,6

    1500

    1412

    1485

    1420

    1390

    1375

    1365

    136,2

    97,6

    146,0

    110,4

    138,7

    111,8

    105,8

    3590

    240,8

    9974

    846,5

    0,36

    Nivel mediu

    512,9

    34,4

    1421

    120,9

    Total în total

    5314,2

    419,4

    17131

    1113,4

    0,31

    Media agregată

    379,6

    59,9

    1223,6

    79,5

    Concluzie. Astfel, în totalul luat în considerare, cel mai mare număr de întreprinderi din punct de vedere al producției s-a înscris în a treia grupă - șapte sau jumătate dintre întreprinderi. În această grupă se află și valoarea valorii medii anuale a mijloacelor fixe, precum și valoarea mare a numărului mediu de angajați - 9974 persoane, întreprinderile din primul grup sunt cele mai puțin profitabile.

    SARCINA 2

    Avem următoarele date despre întreprinderile companiei

    Numărul întreprinderii aparținând companiei

    eu sfert

    trimestrul II

    Ieșire, mii de ruble

    Lucrat prin zile-om muncitor

    Producția medie per muncitor pe zi, frecare.

    59390,13

Începând să vorbească despre valori medii, cel mai adesea își amintesc cum au absolvit școala și au intrat într-o instituție de învățământ. Apoi, conform certificatului, s-a calculat punctajul mediu: s-au adunat toate notele (atât bune, cât și nu foarte bune), suma rezultată a fost împărțită la numărul lor. Așa se calculează cel mai simplu tip de medie, care se numește medie aritmetică simplă. În practică, în statistică se folosesc diverse tipuri de medii: medii aritmetice, armonice, geometrice, pătratice, structurale. Unul sau altul dintre tipurile lor este utilizat în funcție de natura datelor și de obiectivele studiului.

valoarea medie este cel mai comun indicator statistic, cu ajutorul căruia se dă o caracteristică generalizantă a totalității aceluiași tip de fenomene în funcție de unul dintre semnele variabile. Arată nivelul atributului pe unitate de populație. Cu ajutorul valorilor medii se face o comparație a diferitelor agregate în funcție de caracteristici diferite și se studiază modelele de dezvoltare a fenomenelor și proceselor vieții sociale.

În statistică, se folosesc două clase de medii: putere (analitică) și structurală. Acestea din urmă sunt folosite pentru a caracteriza structura seriei variaționale și vor fi discutate în continuare în Cap. 8.

Grupul mijloacelor de putere include aritmetice, armonice, geometrice, pătratice. Formulele individuale pentru calculul lor pot fi reduse la forma comună tuturor mediilor de putere, și anume

unde m este exponentul mediei puterii: cu m = 1 se obține o formulă de calcul a mediei aritmetice, cu m = 0 - media geometrică, m = -1 - media armonică, cu m = 2 - media patratică ;

x i - opțiuni (valori pe care le ia atributul);

fi - frecvenţe.

Condiția principală în care mijloacele legii puterii pot fi utilizate în analiza statistică este omogenitatea populației, care nu trebuie să conțină date inițiale care diferă puternic în valoarea lor cantitativă (în literatură sunt numite observații anormale).

Să demonstrăm importanța acestei afecțiuni în exemplul următor.

Exemplul 6.1. Calculați salariul mediu al angajaților unei întreprinderi mici.

Tabelul 6.1. Salariile angajaților
Nu. p / p Salariu, freacă. Nu. p / p Salariu, freacă.
1 5 950 11 7 000
2 6 790 12 5 950
3 6 790 13 6 790
4 5 950 14 5 950
5 7 000 5 6 790
6 6 790 16 7 000
7 5 950 17 6 790
8 7 000 18 7 000
9 6 790 19 7 000
10 6 790 20 5 950

Pentru a calcula salariul mediu, este necesar să se însumeze salariile acumulate tuturor angajaților întreprinderii (adică să se găsească fondul de salarii) și să se împartă la numărul de angajați:


Și acum să adăugăm la totalitatea noastră o singură persoană (directorul acestei întreprinderi), dar cu un salariu de 50.000 de ruble. În acest caz, media calculată va fi complet diferită:

După cum puteți vedea, depășește 7.000 de ruble etc. este mai mare decât toate valorile caracteristicii, cu excepția unei singure observații.

Pentru ca astfel de cazuri să nu apară în practică, iar media să nu-și piardă sensul (în exemplul 6.1 nu mai joacă rolul unei caracteristici generalizatoare a populației, ceea ce ar trebui să fie), la calcularea mediei, anormale, observațiile aberante ar trebui fie excluse din analiză și apoi pentru a face populația omogenă, fie pentru a împărți populația în grupuri omogene și a calcula valorile medii pentru fiecare grup și a analiza nu media totală, ci mediile grupului.

6.1. Media aritmetică și proprietățile sale

Media aritmetică este calculată fie ca valoare simplă, fie ca valoare ponderată.

La calcularea salariului mediu conform tabelului din exemplul 6.1, am adunat toate valorile atributului și am împărțit la numărul lor. Scriem cursul calculelor noastre sub forma unei formule pentru media aritmetică a unui simplu

unde x i - opțiuni (valorile individuale ale caracteristicii);

n este numărul de unități din populație.

Exemplul 6.2. Acum să grupăm datele noastre din tabelul din exemplul 6.1 etc. să construim o serie variaţională discretă a distribuţiei muncitorilor în funcţie de nivelul salariilor. Rezultatele grupării sunt prezentate în tabel.

Să scriem expresia pentru calcularea nivelului salarial mediu într-o formă mai compactă:

În exemplul 6.2, a fost aplicată formula mediei aritmetice ponderate

unde f i - frecvențele care arată de câte ori apare valoarea caracteristicii x i y unități ale populației.

Calculul mediei ponderate aritmetice este efectuat în mod convenabil în tabel, după cum se arată mai jos (Tabelul 6.3):

Tabelul 6.3. Calculul mediei aritmetice într-o serie discretă
Datele inițiale Indicator estimativ
salariu, freacă. numărul de angajați, oameni fond de salarii, frec.
x i fi x i f i
5 950 6 35 760
6 790 8 54 320
7 000 6 42 000
Total 20 132 080

Trebuie remarcat faptul că media aritmetică simplă este utilizată în cazurile în care datele nu sunt grupate sau grupate, dar toate frecvențele sunt egale între ele.

Adesea rezultatele observației sunt prezentate ca o serie de distribuție pe intervale (vezi tabelul din exemplul 6.4). Apoi, la calcularea mediei, punctele medii ale intervalelor sunt luate ca x i. Dacă primul și ultimul interval sunt deschise (nu au una dintre granițe), atunci ele sunt „închise” condiționat, luând valoarea intervalului alăturat ca valori ale intervalului dat etc. primul este închis pe baza valorii celui de-al doilea, iar ultimul - pe valoarea penultimului.

Exemplul 6.3. Pe baza rezultatelor unui sondaj prin sondaj a unuia dintre grupurile de populație, calculăm mărimea venitului mediu pe cap de locuitor.

În tabelul de mai sus, mijlocul primului interval este 500. Într-adevăr, valoarea celui de-al doilea interval este 1000 (2000-1000); atunci limita inferioară a primului este 0 (1000-1000), iar mijlocul ei este 500. Facem același lucru cu ultimul interval. Luăm ca mijloc 25.000: valoarea penultimului interval este 10.000 (20.000-10.000), apoi limita superioară este 30.000 (20.000 + 10.000), iar mijlocul, respectiv, 25.000.

Tabelul 6.4. Calculul mediei aritmetice în seria de intervale
Venitul mediu pe cap de locuitor în numerar, rub. pe luna Populație în total, % f i Punctele medii ale intervalului x i x i f i
Până la 1.000 4,1 500 2 050
1 000-2 000 8,6 1 500 12 900
2 000-4 000 12,9 3 000 38 700
4 000-6 000 13,0 5 000 65 000
6 000-8 000 10,5 7 000 73 500
8 000-10 000 27,8 9 000 250 200
10 000-20 000 12,7 15 000 190 500
20.000 și mai mult 10,4 25 000 260 000
Total 100,0 - 892 850

Atunci venitul mediu lunar pe cap de locuitor va fi

Cursul 5

Conceptul de medie în statistică

Media aritmetică și proprietățile sale

Alte tipuri de mijloace de putere

Mod și mediană

Quartile și decile

Valorile medii sunt utilizate pe scară largă în statistici. Valorile medii caracterizează indicatorii calitativi ai activității comerciale: costuri de distribuție, profit, rentabilitate etc.

Mediu Aceasta este una dintre cele mai comune generalizări. O înțelegere corectă a esenței mediei determină semnificația ei deosebită într-o economie de piață, când media, printr-o singură și aleatorie, face posibilă identificarea generală și necesară, identificarea tendinței modelelor de dezvoltare economică.

valoarea medie- sunt indicatori generalizatori în care găsesc expresie a acţiunii condiţiilor generale, tipare ale fenomenului studiat.

valoarea medie (în statistică) - un indicator generalizator care caracterizează dimensiunea sau nivelul tipic al fenomenelor sociale pe unitatea de populație, toate celelalte lucruri fiind egale.

Metoda mediilor rezolvă următoarele scopuri principale:

1. Caracteristici ale nivelului de dezvoltare a fenomenelor.

2. Compararea a două sau mai multe niveluri.

3. Studiul relaţiei fenomenelor socio-economice.

4. Analiza distribuţiei fenomenelor socio-economice în spaţiu.

Mediile statistice se calculează pe baza datelor de masă ale observației de masă organizate corect statistic (continuă și selectivă). Cu toate acestea, media statistică va fi obiectivă și tipică dacă este calculată din date de masă pentru o populație omogenă calitativ (fenomene de masă). De exemplu, dacă calculăm salariile medii în cooperative și întreprinderile de stat și extindem rezultatul la întreaga populație, atunci media este fictivă, deoarece este calculată pentru o populație eterogenă, iar o astfel de medie își pierde orice semnificație.

Cu ajutorul mediei, există, parcă, o netezire a diferențelor de amploare a caracteristicii care apar dintr-un motiv sau altul în unitățile individuale de observație. De exemplu, producția medie a unui agent de vânzări depinde de mulți factori: calificări, vechime în serviciu, vârstă, formă de serviciu, sănătate și așa mai departe.

Esența mediei constă în faptul că anulează abaterile valorilor atributului unităților individuale ale populației, datorită acțiunii factorilor aleatori, și ia în considerare modificările cauzate de acțiunea factori principali. Acest lucru permite ca media să reflecte nivelul tipic al atributului și să facă abstracție de la caracteristicile individuale inerente unităților individuale.

Valoarea medie este o reflectare a valorilor trăsăturii studiate, prin urmare, este măsurată în aceeași dimensiune cu această trăsătură.

Fiecare valoare medie caracterizează populația studiată în funcție de orice atribut. Pentru a obține o imagine completă și cuprinzătoare a populației studiate în ceea ce privește o serie de caracteristici esențiale, este, în general, necesar să existe un sistem de valori medii care să poată descrie fenomenul din diferite unghiuri.

Există diferite medii:

Media aritmetică;

medie geometrică;

Armonică medie;

Medie pătrată;

Cronologic mediu.

5.1. Conceptul de medie

Valoarea medie - acesta este un indicator generalizator care caracterizează nivelul tipic al fenomenului. Exprimă valoarea atributului, raportată la unitatea populației.

Media generalizează întotdeauna variația cantitativă a trăsăturii, adică. în medii, diferențele individuale în unitățile populației datorate unor circumstanțe aleatorii sunt anulate. Spre deosebire de medie, valoarea absolută care caracterizează nivelul unei caracteristici a unei unități individuale a populației nu permite compararea valorilor caracteristicii pentru unitățile aparținând diferitelor populații. Deci, dacă trebuie să comparați nivelurile de remunerare a lucrătorilor din două întreprinderi, atunci nu puteți compara doi angajați ai unor întreprinderi diferite pe această bază. Este posibil ca salariile lucrătorilor selectați pentru comparație să nu fie tipice pentru aceste întreprinderi. Dacă comparăm mărimea fondurilor de salarii la întreprinderile luate în considerare, atunci numărul de angajați nu este luat în considerare și, prin urmare, este imposibil de stabilit unde nivelul salariilor este mai mare. În cele din urmă, doar mediile pot fi comparate, adică. Cât de mult câștigă în medie un muncitor în fiecare companie? Astfel, este necesar să se calculeze valoarea medie ca caracteristică generalizantă a populației.

Calcularea mediei este o tehnică comună de generalizare; indicatorul mediu neagă generalul care este tipic (tipic) pentru toate unitățile populației studiate, în același timp ignoră diferențele dintre unitățile individuale. În fiecare fenomen și în dezvoltarea lui există o combinație de întâmplare și necesitate. La calcularea mediilor, datorită funcționării legii numerelor mari, aleatorietatea se anulează reciproc, se echilibrează, astfel încât este posibil să se abțină de la trăsăturile nesemnificative ale fenomenului, de la valorile cantitative ale atributului în fiecare specific. caz. În capacitatea de a face abstracție de la aleatorietatea valorilor individuale, fluctuațiile constă în valoarea științifică a mediilor ca caracteristici generalizatoare ale agregatelor.

Pentru ca media să fie cu adevărat tipică, aceasta trebuie calculată ținând cont de anumite principii.

Să ne oprim asupra unor principii generale de aplicare a mediilor.
1. Media trebuie determinată pentru populațiile formate din unități calitativ omogene.
2. Media ar trebui calculată pentru o populație formată dintr-un număr suficient de mare de unități.
3. Ar trebui calculată media pentru populația ale cărei unități se află într-o stare normală, naturală.
4. Media trebuie calculată ținând cont de conținutul economic al indicatorului studiat.

5.2. Tipuri de medii și metode de calculare a acestora

Să luăm acum în considerare tipurile de medii, caracteristicile calculului lor și domeniile de aplicare. Valorile medii sunt împărțite în două clase mari: medii de putere, medii structurale.

LA putere înseamnă includ cele mai cunoscute și utilizate tipuri, cum ar fi media geometrică, medie aritmetică și medie pătratică.

La fel de medii structurale sunt luate în considerare modul și mediana.

Să ne oprim asupra mediilor de putere. Mediile de putere, în funcție de prezentarea datelor inițiale, pot fi simple și ponderate. medie simplă este calculat din date negrupate și are următoarea formă generală:

unde X i este varianta (valoarea) caracteristicii mediate;

n este numărul de opțiuni.

Medie ponderată se calculează prin date grupate și are o formă generală

,

unde X i este varianta (valoarea) caracteristicii medii sau valoarea medie a intervalului în care este măsurată varianta;
m este exponentul mediei;
f i - frecvența care arată de câte ori apare valoarea i-e a caracteristicii medii.

Să dăm ca exemplu calculul vârstei medii a elevilor dintr-un grup de 20 de persoane:


Calculăm vârsta medie folosind formula medie simplă:

Să grupăm datele sursă. Obținem următoarea serie de distribuție:

Ca urmare a grupării, obținem un nou indicator - frecvența, care indică numărul de elevi în vârstă de X ani. Prin urmare, vârsta medie a elevilor din grupă va fi calculată folosind formula medie ponderată:

Formulele generale pentru calcularea mediilor exponențiale au un exponent (m). În funcție de valoarea necesară, se disting următoarele tipuri de medii de putere:
medie armonică dacă m = -1;
medie geometrică dacă m –> 0;
medie aritmetică dacă m = 1;
rădăcină medie pătrată dacă m = 2;
cubic mediu dacă m = 3.

Formulele mediei puterii sunt date în tabel. 4.4.

Dacă calculăm toate tipurile de medii pentru aceleași date inițiale, atunci valorile lor nu vor fi aceleași. Aici se aplică regula majorității mediilor: cu o creștere a exponentului m, crește și valoarea medie corespunzătoare:

În practica statistică, mai des decât alte tipuri de medii ponderate, se folosesc medii ponderate aritmetice și armonice.

Tabelul 5.1

Tipuri de mijloace de putere

Tip de putere
mijloc
Index
grade (m)
Formula de calcul
Simplu ponderat
armonic -1
Geometric 0
Aritmetic 1
pătratică 2
cub 3

Media armonică are o structură mai complexă decât media aritmetică. Media armonică este utilizată pentru calcule atunci când ponderile nu sunt unitățile populației - purtătorii trăsăturii, ci produsele acestor unități și valorile trăsăturii (adică m = Xf). Timpul mediu de oprire armonică trebuie utilizat în cazurile de determinare, de exemplu, a costurilor medii ale forței de muncă, timpului, materialelor pe unitate de producție, pe parte pentru două (trei, patru, etc.) întreprinderi, lucrători angajați în fabricarea același tip de produs, aceeași piesă, produs.

Principala cerință pentru formula de calcul a valorii medii este ca toate etapele calculului să aibă o justificare reală semnificativă; valoarea medie rezultată ar trebui să înlocuiască valorile individuale ale atributului pentru fiecare obiect fără a întrerupe legătura dintre indicatorii individuali și sumar. Cu alte cuvinte, valoarea medie trebuie calculată în așa fel încât, atunci când fiecare valoare individuală a indicatorului mediu este înlocuită cu valoarea sa medie, un indicator rezumativ final, conectat într-un fel sau altul cu cel mediat, să rămână neschimbat. Acest rezultat se numește determinareaîntrucât natura relației sale cu valorile individuale determină formula specifică pentru calcularea valorii medii. Să arătăm această regulă pe exemplul mediei geometrice.

Formula medie geometrică

cel mai adesea utilizat la calcularea valorii medii a valorilor relative individuale ale dinamicii.

Media geometrică este utilizată dacă este dată o succesiune de valori relative ale dinamicii în lanț, indicând, de exemplu, o creștere a producției față de nivelul din anul precedent: i 1 , i 2 , i 3 ,..., eu n . Evident, volumul producției din ultimul an este determinat de nivelul său inițial (q 0) și de creșterea ulterioară de-a lungul anilor:

q n =q 0 × i 1 × i 2 ×...×i n .

Luând q n ca indicator definitoriu și înlocuind valorile individuale ale indicatorilor de dinamică cu cele medii, ajungem la relația

De aici

5.3. Medii structurale

Un tip special de valori medii - medii structurale - este utilizat pentru a studia structura internă a seriei de distribuție a valorilor atributelor, precum și pentru a estima valoarea medie (tipul de putere), dacă, conform datelor statistice disponibile, calculul acestuia nu poate fi efectuat (de exemplu, dacă nu existau date în exemplul considerat).și asupra volumului producției și asupra mărimii costurilor pe grupuri de întreprinderi).

Indicatorii sunt folosiți cel mai adesea ca medii structurale. Modă - valoarea caracteristică cel mai frecvent repetată - și mediana - valoarea unei caracteristici care împarte succesiunea ordonată a valorilor sale în două părți egale ca număr. Ca urmare, într-o jumătate din unitățile populației, valoarea atributului nu depășește nivelul median, iar în cealaltă jumătate nu este mai mică decât acesta.

Dacă caracteristica studiată are valori discrete, atunci nu există dificultăți deosebite în calcularea modului și a mediei. Dacă datele despre valorile atributului X sunt prezentate sub formă de intervale ordonate ale modificării acestuia (serie de intervale), calculul modului și al mediei devine oarecum mai complicat. Deoarece valoarea mediană împarte întreaga populație în două părți egale ca număr, ea ajunge într-unul dintre intervalele caracteristicii X. Utilizând interpolare, valoarea mediană se găsește în acest interval median:

,

unde X Me este limita inferioară a intervalului median;
h Eu este valoarea lui;
(Suma m) / 2 - jumătate din numărul total de observații sau jumătate din volumul indicatorului care este utilizat ca ponderare în formulele de calcul a valorii medii (în termeni absoluti sau relativi);
S Me-1 este suma observațiilor (sau volumul caracteristicii de ponderare) acumulate înainte de începutul intervalului median;
m Me este numărul de observații sau volumul caracteristicii de ponderare în intervalul median (și în termeni absoluti sau relativi).

În exemplul nostru, chiar și trei valori medii pot fi obținute - pe baza semnelor numărului de întreprinderi, volumului de producție și a valorii totale a costurilor de producție:

Astfel, pentru jumătate dintre întreprinderi, costul unei unități de producție depășește 125,19 mii ruble, jumătate din volumul total de producție este produs cu un nivel al costurilor pe produs de peste 124,79 mii ruble. și 50% din costul total este format la nivelul costului unui produs peste 125,07 mii de ruble. De asemenea, observăm că există o anumită tendință de creștere a costurilor, deoarece Me 2 = 124,79 mii de ruble, iar nivelul mediu este de 123,15 mii de ruble.

Când se calculează valoarea modală a unei caracteristici în funcție de datele seriei de intervale, este necesar să se acorde atenție faptului că intervalele sunt aceleași, deoarece indicatorul frecvenței valorilor caracteristicii X depinde de acest lucru. o serie de intervale cu intervale egale, valoarea modului este determinată ca

unde X Mo este valoarea inferioară a intervalului modal;
m Mo este numărul de observații sau volumul caracteristicii de ponderare în intervalul modal (în termeni absoluti sau relativi);
m Mo -1 - la fel pentru intervalul care precede modalul;
m Mo+1 - la fel pentru intervalul care urmează modalului;
h este valoarea intervalului de modificare a trăsăturii în grupuri.

Pentru exemplul nostru, trei valori modale pot fi calculate pe baza semnelor numărului de întreprinderi, volumului producției și mărimii costurilor. În toate cele trei cazuri, intervalul modal este același, deoarece pentru același interval atât numărul de întreprinderi, volumul producției, cât și valoarea totală a costurilor de producție se dovedesc a fi cele mai mari:

Astfel, cel mai des se întâlnesc întreprinderi cu un nivel de cost de 126,75 mii ruble, cel mai adesea se produc produse cu un nivel de cost de 126,69 mii ruble, iar cel mai adesea costurile de producție sunt explicate printr-un nivel de cost de 123,73 mii ruble.

5.4. Indicatori de variație

Condițiile specifice în care se află fiecare dintre obiectele studiate, precum și caracteristicile dezvoltării proprii (sociale, economice etc.) sunt exprimate prin nivelurile numerice corespunzătoare ale indicatorilor statistici. Prin urmare, variație, acestea. discrepanţa dintre nivelurile aceluiaşi indicator la diferite obiecte este obiectivă şi ajută la înţelegerea esenţei fenomenului studiat.

Există mai multe moduri de a măsura variația în statistici.

Cel mai simplu este calculul indicatorului variație de interval H ca diferență între valorile maxime (X max) și minime (X min) observate ale trăsăturii:

H=X max - X min.

Cu toate acestea, intervalul de variație arată doar valorile extreme ale trăsăturii. Repetabilitatea valorilor intermediare nu este luată în considerare aici.

Caracteristicile mai stricte sunt indicatorii de fluctuație în raport cu nivelul mediu al atributului. Cel mai simplu indicator de acest tip este abaterea liniară medie L ca medie aritmetică a abaterilor absolute ale unei trăsături de la nivelul său mediu:

Odată cu repetarea valorilor individuale ale lui X, se utilizează formula medie aritmetică ponderată:

(Reamintim că suma algebrică a abaterilor de la nivelul mediu este zero.)

Indicatorul abaterii liniare medii și-a găsit aplicație largă în practică. Cu ajutorul acestuia, de exemplu, se analizează compoziția lucrătorilor, ritmul producției, uniformitatea aprovizionării cu materiale și se dezvoltă sisteme de stimulente materiale. Dar, din păcate, acest indicator complică calculele de tip probabilistic, îngreunează aplicarea metodelor statisticii matematice. Prin urmare, în cercetarea științifică statistică, indicatorul este cel mai adesea utilizat pentru măsurarea variației. dispersie.

Varianța caracteristicii (s 2) este determinată pe baza mediei puterii pătratice:

.

Un exponent s egal cu este numit deviație standard.

În teoria generală a statisticii, indicatorul de dispersie este o estimare a indicatorului de teoria probabilităților cu același nume și (ca sumă a abaterilor pătrate) o estimare a dispersiei în statistica matematică, care permite utilizarea prevederilor acestor discipline teoretice pentru a analiza proceselor socio-economice.

Dacă variația este estimată dintr-un număr mic de observații luate de la o populație generală nelimitată, atunci valoarea medie a caracteristicii este determinată cu o anumită eroare. Valoarea calculată a dispersiei pare să fie deplasată în jos. Pentru a obține o estimare imparțială, varianța eșantionului obținută din formulele de mai sus trebuie înmulțită cu n / (n - 1). Ca urmare, cu un număr mic de observații (< 30) дисперсию признака рекомендуется вычислять по формуле

De obicei, deja la n > (15÷20) discrepanța dintre estimările părtinitoare și nepărtinitoare devine nesemnificativă. Din același motiv, părtinirea nu este de obicei luată în considerare în formula de adăugare a variațiilor.

Dacă din populația generală se prelevează mai multe eșantioane și de fiecare dată când se determină valoarea medie a atributului, atunci se pune problema estimării variabilității mediilor. Estimarea variației Valoarea medie se poate baza și pe o singură observație eșantion conform formulei

,

unde n este dimensiunea eșantionului; s 2 este varianța caracteristicii calculată din datele eșantionului.

Valoare se numește eroare medie de eșantionareși este o caracteristică a abaterii valorii medii eșantionului a caracteristicii X de la valoarea sa medie adevărată. Indicatorul de eroare medie este utilizat în evaluarea fiabilității rezultatelor observării eșantionului.

Indicatori de dispersie relativă. Pentru a caracteriza măsura fluctuației trăsăturii studiate, indicatorii de fluctuație sunt calculați în termeni relativi. Ele vă permit să comparați natura dispersiei în distribuții diferite (unități diferite de observare a aceleiași trăsături în două seturi, cu valori diferite ale mediilor, atunci când se compară seturi diferite). Calculul indicatorilor de măsurare a dispersiei relative se realizează ca raport dintre indicele de dispersie absolut și media aritmetică, înmulțit cu 100%.

1. Coeficient de oscilație reflectă fluctuația relativă a valorilor extreme ale trăsăturii în jurul mediei

.

2. Oprirea liniară relativă caracterizează ponderea valorii medii a semnului abaterilor absolute de la valoarea medie

.

3. Coeficient de variație:

este cea mai comună măsură a varianței utilizată pentru a evalua caracterul tipic al mediilor.

În statistică, populațiile cu un coeficient de variație mai mare de 30–35% sunt considerate a fi eterogene.

Această metodă de estimare a variației are și un dezavantaj semnificativ. Într-adevăr, să fie, de exemplu, populația inițială de muncitori cu o vechime medie în muncă de 15 ani, cu o abatere standard s = 10 ani, „în vârstă” cu încă 15 ani. Acum = 30 de ani, iar abaterea standard este încă 10. Populația anterior eterogenă (10/15 × 100 = 66,7%), astfel se dovedește a fi destul de omogen în timp (10/30 × 100 = 33,3%).

Boyarsky A.Ya. Cercetări teoretice asupra statisticii: Sat. Științific Proceedings.- M .: Statistics, 1974. pp. 19–57.

Anterior


Articole similare