Documente online.
Username / Parola inexistente
  Zona de administrare documente. Fisierele tale  
Am uitat parola x Creaza cont nou
  Home Exploreaza
Upload


loading...



















































VARIABILE ALEATOARE. FUNCTII DE REPARTITIE. INDICATORI STATISTICI

economie




VARIABILE ALEATOARE. FUNCŢII DE REPARTIŢIE. INDICATORI STATISTICI



realizeaza niciodata īn cadrul unui experiment dat.

Evenimentele ce apar ca rezultat al unor experimente le vom nota , etc. Evenimentul complementar unui eveniment este acel eveniment care se realizeaza atunci si numai atunci cānd nu se realizeaza Evenimentul care consta īn realizarea simultana a evenimentelor se noteaza cu (se citeste evenimentul si

Probabilitatea unui eveniment este o masura a sanselor de realizare a acelui eveniment. Daca un eveniment se desfasoara astfel īncāt producerea oricarui eveniment legat de acesta are un numar finit de sanse egal-posibile, probabilitatea evenimentului este raportul dintre numarul rezultatelor favorabile producerii evenimentului si numarul tuturor rezultatelor posibile.

Se considera exemplul cunoscut al urnei care contine bile de aceeasi marime, dintre care sunt albe si sunt negre. Probabilitatea de a extrage o bila alba sau neagra va fi

, (2.1)

respectiv

. (2.2)

Din relatia (2.1) se vede imediat ca probabilitatea unui eveniment este cu 535h79f prinsa īntre zero si unitate, adica

Evident, cānd īn urna sunt numai bile negre, iar cānd īn urna sunt numai bile albe etc.

Teorema probabilitatii totale


Sa presupunem ca pentru producerea unui eveniment din cazuri posibile, egal probabile, sunt cazuri favorabile, adica

(2.3)

De asemenea, pentru producerea evenimentului , pentru care avem cazuri favorabile, putem scrie

(2.4)

Se mai considera ca cele doua evenimente se exclud reciproc, adica cānd se produce , nu se produce

Probabilitatea ca īn cele cazuri posibile sa se produca sau , va fi

(2.5)

relatie care reprezinta principiul probabilitatii totale, si anume:

Cānd un eveniment se poate realiza īn mai multe moduri posibile care se exclud reciproc, probabilitatea producerii lui este egala cu suma probabilitatilor care corespund diferitelor moduri de producere.


Teorema probabilitatii compuse


Se considera cazul unui eveniment mai complex care rezulta din realizarea succesiva a doua evenimente dependente si . Pentru examinarea acestei situatii mai presupunem:

- īn cazuri se produce atāt evenimenul cāt si

- īn cazuri se produce evenimenul dar nu se produce

- īn cazuri se produce evenimenul dar nu se produce

- īn cazuri nu se produce nici nici

Fie numarul de cazuri total posibile.

Pentru producerea evenimentelor si probabilitatea este

si (2.6)

Pentru a se produce , probabilitatea este

(2.7)

deoarece are , cazuri favorabile, fiind acelasi.

Dupa ce s-a produs evenimentul , ramāne sa examinam probabilitatea lui . Evident, acesta are numai cazuri favorabile. Deoarece producerea lui este conditionata de aceea a lui (numai acele cazuri vor fi favorabile cānd are loc ), numarul cazurilor posibile pentru va fi . Prin urmare,

Pentru probabilitatea definita de (2.8), se foloseste notatia ceea ce īnseamna probabilitatea ca sa se produca dupa ce s-a produs (probabilitate conditionata).

Din compararea relatiilor (2.6), (2.7) si (2.8) rezulta principiul probabilitatii compuse

si (2.9)

care arata ca: Daca producerea unui eveniment presupune realizarea altor evenimente si , atunci probabilitatea producerii lui este egala cu produsul dintre probabilitatea producerii lui si probabilitatea lui , dupa ce s-a produs

Īn conditiile de mai sus, numarul cazurilor posibile este limitat. De aceea, definitiile si probabilitatile de mai sus se refera la asa numita teorie a probabilitatilor discontinue, care se apropie de teoria probabilitatilor continue daca numarul cazurilor favorabile este destul de mare.

Probabilitatea evenimentului se noteaza si este un numar cuprins īntre 0 si 1, valoarea 0 corespunzānd unui eveniment imposibil, iar 1 unui eveniment sigur.

Daca masurarea unei marimi se efectueaza, īn conditii identice, de un numar mare de ori , obtināndu-se siruri de valori aleatorii , iar din acestea, valori se afla īn intervalul , probabilitatea

(2.10)

este o caracteristica a intervalului si se numeste frecventa relativa a variabilei īn intervalul considerat.


Variabile aleatoare


Se numeste variabila aleatoare o marime reala care, īn raport cu rezultatul unui experiment, poate lua orice valoare dintr-o multime bine definita de valori reale (domeniul de definitie al variabilei).

Variabilele aleatoare se clasifica dupa multimea pe care sunt definite. Astfel, se deosebesc variabile aleatoare de tip discret si de tip continuu.

Variabilele aleatoare discrete sunt definite pe o multime cel mult numarabila de evenimente. Numarul valorilor posibile ale unei variabile aleatoare discrete poate fi finit sau infinit.

Variabila aleatoare continua este definita pe o multime continua. Variabila aleatoare continua poate lua orice valoare īntre doua numere. Numarul valorilor posibile ale unei variabile aleatoare continua este infinit.


Functia de repartitie


Functia de repartitie a variabilei aleatoare se noteaza cu si este definita ca probabilitatea evenimentului

(2.11)

Din punct de vedere probabilistic, functia de repartitie caracterizeaza complet o variabila aleatoare, indiferent daca este vorba de o variabila aleatoare discreta sau continua.

Functia de repartitie (sau functia cumulativa a probabilitatilor) a unei variabile aleatoare discrete este suma probabilitatilor de la stānga punctului de abscisa (Fig. 2.1)

(2.12)

Se numeste repartitie a unei variabile aleatoare legea de probabilitate dupa care ea se produce. Repartitia unei variabile aleatoare discrete se scrie sub forma

sau


Fig. 2.1. Repartitia unei variabile discrete


Daca este o variabila aleatoare continua, functia de repartitie se defineste astfel (Fig. 2.2):

. (2.14)


Fig. 2.2. Repartitia unei variabile continue


Functia de repartitie are urmatoarele proprietati:

1. Functia de repartitie este o functie monoton nedescrescatoare

, daca ; (2.15)

2. Pentru cea mai mica valoare posibila a variabilei aleatoare , functia de repartitie este egala cu zero

; (2.16)

3. Pentru cea mai mare valoare posibila a variabiei aleatoare , functia de repartitie este egala cu 1

; (2.17)

4. Functia de repartitie fiind o probabilitate, satisface dubla inegalitate

; (2.18)

5. Probabilitatea ca variabila aleatoare sa fie cuprinsa īntre si este egala cu diferenta dintre valorile functiei de repartitie la extremitatile intervalului, adica cu cresterea functiei īn intervalul considerat

. (2.19)

Functia de repartitie a unei variabile discrete este o functie discontinua, īn scara, admite salturi, salturile de la o treapta la treapta curenta sunt egale cu , suma tuturor salturilor fiind egala cu 1 (Fig. 2.3.a).


a) b)

Fig. 2.3. Functia de repartitie


Functia de repartitie a unei variabile aleatoare continue este, de asemenea o functie continua (Fig. 2.3.b, īn care functia are drept asimptote dreptele si


Densitatea de repartitie


Se numeste densitate de repartitie (sau densitate de probabilitate) prima derivata - daca exista - a functiei de repartitie

.(2.20)

Densitatea de repartitie exista numai pentru variabile de tip continuu.

Probabilitatea ca variabila aleatoare continua sa ia valoare īn intervalul este egala cu integrala densitatii de repartitie pe intervalul

, (2.21)

adica evenimentul este imposibil, iar este sigur.


Operatii cu variabile aleatoare


Fie si doua variabile aleatoare avānd repartitiile

si (2.22)

Daca este o constanta reala, atunci este o variabila aleatoare avānd repartitia

(2.23)

Suma a doua variabile aleatoare si este o variabila aleatoare avānd repartitia

(2.24)

īn care este probabilitatea realizarii simultane a evenimentelor si adica si

Produsul a doua variabile aleatoare si este o variabila aleatoare avānd repartitia

(2.25)

īn care

si (2.26)

Densitatea de repartitie are proprietatile:



1. Densitatea de repartitie este nenegativa si aceasta rezulta din proprietatea functiei de repartitie de a fi nedescrescatoare,

2. Integrala densitatii de repartitie, īn cadrul limitelor de variatie infinite, a variabilei aleatoare continue, este egala cu unitatea,

(2.27)



Valorile tipice ale variabilei aleatoare


O variabila aleatoare este caracterizata prin repartitia sa. Daca repartitia unei variabile nu este cunoscuta, pentru caracterizarea variabilei aleatoare se pot folosi anumite marimi numite valori tipice, asociate variabilei aleatoare.


Media


Prin definitie, valoarea medie (speranta matematica) a unei variabile aleatoare discrete cu repartitia (2.13) este egala cu suma produselor dintre valorile pe care le poate lua si probabilitatile corespunzatoare

(2.28)

Fie o variabila aleatoare de tip continuu si densitatea sa de repartitie. Media unei variabile aleatoare continue este definita de relatia

(2.29)

Daca variabila aleatoare este definita pe intervalul , atunci valoarea medie este

(2.30)


Mediana


Se numeste mediana a variabilei aleatoare , numarul care satisface ecuatia

(2.31)

sau

. (2.32)

Rezulta din ecuatia (2.32) ca mediana este solutia ecuatiei

(2.33)

Pentru o variabila aleatoare continua, mediana este data de ecuatia

(2.34)



Dispersia


Dispersia unei variabile aleatoare discrete reprezinta valoarea medie a patratului abaterii

(2.35)

sau


(2.36)


adica, diferenta dintre media patratului variabilei aleatoare si patratul mediei variabilei aleatoare.

Dispersia unei variabile aleatoare continue este media patratului abaterii lui

(2.37)


Abaterea medie patratica


Abaterea medie patratica a unei variabile aleatoare este radacina patrata a dispersiei acestei variabile aleatoare

. (2.38)

Dispersia si abaterea medie patratica sunt indicatorii cei mai utilizati pentru a caracteriza īmprastierea valorilor unei variabile aleatoare.


Momente


Momentul simplu (initial) de ordinul k al unei variabile aleatoare discrete , calculat īn raport cu originea abaterilor, care este zero, are expresia

(2.39)

Momentul simplu (initial) de ordinul 1 reprezinta media aritmetica

(2.40)

Folosind momentele simple, dispersia se poate exprima dupa cum urmeaza:

(2.41)

īn care reprezinta momentul simplu de ordinul 2.

Momentul centrat de ordinul k al unei variabile aleatoare discrete , calculat īn raport cu media aritmetica a variabilei aleatoare, este

(2.42)

Momentul centrat de ordinul 1 este zero, datorita proprietatii mediei aritmetice conform careia

(2.43)

Momentul centrat de ordinul 2 īn raport cu media aritmetica este dispersia

(2.44)

Momentul ordinar de ordinul k, calculat īn raport cu o valoare arbitrara , este media variabilei aleatoare

(2.45)

Momentul initial de ordinul al unei variabile aleatoare continue este

(2.46)

Īn particular, pentru se obtine valoarea medie a variabilei aleatoare continue


Momentul centrat de ordinul al unei variabile aleatoare continue este

(2.48)

Īn particular, pentru rezulta dispersia variabilei aleatoare continue

Momentul ordinar (conventional de ordinul este

(2.50)

Īntre momentele initiale si momentele centrate exista urmatoarele relatii:

(2.51)

(2.52)


Coeficientul de covarianta


Covarianta a doua variabile aleatoare si reprezinta momentul centrat mixt al celor doua variabile

(2.54)

Dezvoltānd (2.54) se obtine formula echivalenta de calcul

(2.55)

Se numeste coeficient de covarianta raportul

(2.56)

īn care sunt elementele matricei de covarianta, iar sunt numite corelatii.

Daca variabilele si sunt independente atunci , reciproca nefiind adevarata. Daca exista, atunci . Inegalitatea este o consecinta a inegalitatii lui Schwarz [ ].



Proprietatile valorilor tipice ale variabilei aleatoare


Proprietatile mediei


Media unei variabile aleatoare are proprietatile:

1. Daca este o constanta , atunci

(2.57)

2. Daca este o variabila aleatoare si si doua constante, atunci valoarea medie a variabilei aleatoare este egala cu

(2.58)

3. Daca si sunt doua variabile aleatoare independente avānd valorile medii si respectiv, , atunci valoarea medie a variabilei aleatoare exista si este egala cu

(2.59)

4. Daca si sunt doua variabile aleatoare independente pentru care exista valorile medii si respectiv, atunci valoarea medie a variabilei aleatoare exista si este egala cu


(2.60)


5. Daca este o variabila aleatoare a carei valoare medie exista, atunci variabila aleatoare se numeste abatere de la valoarea medie.


Proprietatile dispersiei


Dispersia unei variabile aleatoare are proprietatile:

1. Fie o variabila aleatoare cu dispersia ; atunci oricare ar fi numerele reale si , dispersia variabilei aleatoare este

(2.61)

2. Daca si sunt doua variabile aleatoare independente avānd dispersiile , respectiv , atunci pentru oricare doua constante , dispersia variabilei este

(2.62)

3. Daca este o variabila aleatoare avānd dispersia si o constanta reala, atunci

(2.63)

egalitatea avānd loc doar pentru

4. Pentru orice variabila aleatoare are loc inegalitatea Cebīsev [ ]

arbitrar.    (2.64)



Functii derivate


Se numeste functie caracteristica a variabilei aleatoare , valoarea medie a unei noi variabile aleatoare, obtinute din , īnlocuind argumentul prin , unde este unitatea imaginara, iar - un parametru real.

Daca variabila este distribuita discret atunci functia caracteristica este data de relatia

(2.65)

Daca variabila are distributie continua cu desinatea atunci functia caracteristica este

(2.66)

Daca repartitia variabilei este de tip continuu, densitatea sa de repartitie este data de relatia

(2.67)

Functia de supravietuire sau de fiabilitate reprezinta probabilitatea ca o variabila aleatoare sa ia o valoare mai mare decāt

(2.68)

Functia hazard sau rata cedarii a unei variabile este definita ca raportul dintre densitatea de repartitie si functia de supravietuire:




(2.69)

(2.70)

sau

(2.71)


Functia generatoare a unei variabile aleatoare care ia numai valori īntregi pozitive este definita de relatia

(2.72)

Īntre funtia caracteristica si functia generatoare exista relatia

(2.73)

Functia caracteristica se utilizeaza pentru calculul mometelor factoriale, obisnuite si centrate de diferite ordine.



Indicatori statistici


Indicatorul statistic reprezinta expresia numerica a unei trasaturi observate pe o colectivitate definita īn timp si spatiu.

Īn functie de metoda obtinerii indicatorilor si de rolul jucat īn cercetarea statistica, indicatorii pot fi īmpartiti īn doua categorii: (a) indicatori absoluti (primari); (b) indicatori derivati (secundari).

Indicatorii absoluti sunt rezultatul observarii si sistematizarii datelor; īn consecinta acestia reflecta dimensiunea, marimea, amplitudinea fenomenului īn unitati concrete, specifice, de masura.

Indicatorii derivati se obtin īn procesul de calcul statistic si reflecta īntr-o maniera abstracta, aspecte calitative, evolutive ale colectivitatii cercetate. Dintre indicatorii derivati amintim: marimile relative si marimile medii, indicatorii variatiei si ai asimetriei, indicii statistici, parametrii functiilor de regresie si ajustare analitica etc.

Functiile indicatorilor statistici sunt: de masurare, de comparare, de sinteza, de estimare, de verificare a ipotezelor statistice, de testare a semnificatiilor parametrilor statistici utilizati.

Orice indicator statistic trebuie sa īndeplineasca doua conditii: (a) sa aiba un continut stiintific bine determinat, o definitie sau o formula a sa; (b) sa indeplineasca conditia de compatibilitate.


Indicatorii tendintei centrale


Principali indicatori ai tendintei centrale sunt: (a) indicatorii medii de control: media aritmetica, media geometrica, media armonica etc; (b) indicatorii medii de pozitie: modul, mediana, cuartilele si decilele.

Media aritmetica


Media este expresia sintetizarii īntr-un singur nivel reprezentativ a tot ce este esential, tipic si obiectiv īn aparitia, manifestarea si dezvoltarea unei variabile (caracteristici) [1].

Functie de natura datelor īnregistrate si de natura variatiei, media poate fi: media aritmetica (simpla), media armonica, media geometrica, media patratica, media cubica, media parabolica, media cronologica etc.

Media aritmetica simpla de sondaj (sau de selectie) a unui sir de valori se calculeaza cu relatia

(2.74)

Media aritmetica ponderata a unui sir de valori se calculeaza cu relatia

(2.75)

īn care reprezinta frecventa sau numarul de aparitii al variabilei

Media aritmetica ponderata este influentata atāt de nivelul caracteristicii cāt si de nivelul frecventei.

Media aritmetica este o valoare interna a seriei din care a fost calculata (trebuie sa fie mai mare decāt valoarea minima si mai mica decāt valoarea maxima),

Principiul pe care se bazeaza media este cel al compensatiei abaterilor (+ sau -); suma abaterilor nivelurilor individuale ale variabilei aleatoare fata de media lor diind egala cu zero.


Media armonica


Media armonica reprezinta acea valoare care īnlocuid termenii reali din colectivitate nu modifica suma inverselor. Media armonica este o valoare interna seriei din care a fost calculata. Se disting doua cazuri:

- Media armonica simpla

; (2.76)

Media armonica ponderata

. (2.78)

Cānd nu se cunosc frecventele se foloseste media armonica special ponderata. Ponderarea nu se face cu ci cu . Īn acest caz, media armonica este un artificiu de calcul pentru a determina media aritmetica cānd datele nu permit aflarea directa a acesteia

(2.79)


Media geometrica


Media geometrica este acea valoare care īnlocuid termenii reali din colectivitate nu modifica produsul acestora. Īn cazul mediei geometrice functia determinanta este de tip multiplicativ si se disting doua cazuri:

- Media geometrica simpla (neponderata)

sau , (2.80)

- Media geometrica ponderata

. (2.81)

Media geometrica nu este influentata nici de valorile cele mai mici, nici de valorile cele mai mari, dar nu poate fi determinata daca unele valori sunt nule sau negative. Media geometrica se utilizeaza pentru calculul indicelui mediu de crestere sau descrestere.


Media patratica


Se foloseste cānd nivelul variabilei prezinta cresteri din ce īn ce mai mari, modificāndu-se aproximativ dupa o functie exponentiala. Se disting doua cazuri:

- Media patratica simpla

; (2.82)

- Media patratica ponderata

.

Media patratica se poate calcula si pentru variabile nule sau negative. Media geometrica este sensibila la variatii mari care prin ridicare la patrat devin foarte mari.

Īntr-o serie statistica īn care se pot calcula toate mediile exista relatia

(2.84)


Media cronologica


Media cronologica este utilizata pentru determinarea nivelului mediu al seriilor cronologice de momente. Media cronologica este o medie care are la baza principiul de calcul al mediei aritmetice.

Daca intervalele de timp care separa termenii seriei cronologice sunt egale, se calculeaza media cronologica simpla

(2.85)

Daca intervalele de timp dintre termenii seriei cronologice de momente sunt neegale atunci se calculeaza media cronologica ponderata. Īn acest caz, mediile partiale din care se calculeaza media īntregii perioade sunt ponderate cu durata perioadelor partiale cuprinse īntre termenii seriei dupa formula

(2.86)

Media progresiva


Media progresiva reprezinta o medie a timpilor de nivel calitativ superiori īn cadrul colectivitati date. Media progresiva se calculeaza cu relatia

(2.87)

īn care este media generala a seriei, iar - media termenilor calitativ superiori mediei generale.


Mediana


Mediana este acea valoarea a caracteristicii fata de care frecventa valorilor mai mica decāt ea este egala cu frecventa valorilor mai mari decāt ea, deci mediana īmparte sirul de date īn doua parti egale. Din punct de vedere analitic, mediana corespunde valorii abscisei pentru care ordonata īmparte suprafata delimitata de curba de repartitie īn doua parti egale.

Daca sirul de date este constituit dintr-un numar impar de valori , mediana este reprezentata de valoarea de rang . Īn cazul īn care sirul de date este constituit dintr-un numar par de valori , mediana se situeaza īntre doua valori mediane si n general, s-a convenit sa se considere ca mediana media aritmetica a celor doua valori mediane:

Mediana unei functii de repartitie este valoarea pentru care valoarea mai mare si mai mica a lui au probabilitati egale

(2.89)

Īn cazul seriilor de distributie, mediana se determina cu formulele:

, unde este numar par; (2.90)

unde este numar impar, (2.91)

īn care: este limita inferioara a intervalului median; - frecventele caracteristicii - marimea intervalului; - frecventa intervalului median; - marimea intervalului.



Modul


Modul este, prin definitie, valoarea caracteristicii cu frecventa cea mai mare de aparitie īn colectivitate. Modul mai poate fi definit ca valoarea caracteristicii careia īi corespunde densitatea maxima de repartitie. Minimul densitatii de repartitie este antimod. Daca sirul de masuratori are doua valori maxime, repartitia se numeste bimodala, iar daca sunt mai multe, plurimodala.

Modul unei functii de repartitie este valoarea lui pentru care functia are un maxim. Intervalul modal este intervalul cu frecventa cea mai mare.

Īn cazul seriilor de distributie, modul se calculeaza cu relatia

(2.92)

unde: este limita inferioara a intervalului modal; - diferenta dintre frecventa intervalului modal si frecventa intervalului premodal (anterior); - diferenta dintre frecventa intervalului modal si frecventa intervalului postmodal (urmator); - marimea intervalului modal.

K. Person [ ] a stabilit o expresie care da valoarea modului īn functie de media aritmetica si mediana pentru toate repartitiile unimodale

(2.93)

Media, mediana si modulul caracterizeaza tendinta centrala si forma de variatie a caracteristicii. Īn cazul unei distributii simetrice ele coincid.


Valoarea centrala a sirului


Valoarea centrala a sirului de date este

(2.94)

īn care este valoarea cea mai mare dintre valorile , iar , cea mai mica.

Cuantilele


Cuantilele sunt valori ale caracteristicii care īmpart seria īn parti egale. Ele descriu pozitia anumitor termeni īn cadrul seriilor statistice. Functie de valorile lui , cuantilele se numesc: mediana, ; cuartile, ; decile, ; centile,


Cuartile


Cuartilele sunt marimi de pozitie īn seriile statistice. Cuartilele, īn numar de trei, īmpart seria īn patru parti de frecvente egale cu 1/4

(2.95)

unde este limita inferioara a cuartilei - frecventa cumulata pāna la intervalul - frecventa intervalului - marimea intervalului īn care se afla cuartila

Cuartila centrala a seriei se noteaza cu , ea reprezentānd valoarea unitatii mediane. Ordonata corespunzatoare acestei unitati īmparte aria delimitata de curba distributiei īn doua parti egale. Cuartila inferioara este unitatea mediana a valorilor situate īn partea inferioara a medianei , iar cuartila superioara este mediana valorilor situate īn partea superioara a medianei propriu-zise.

Locul unei cuartile oarecare este dat de relatia

(2.96)




Decilele


Decilele, īn numar de noua, īmpart seria īn zece intervale de frecvente egale cu 1/10

(2.96)

unde este limita inferioara a decilei - frecventa cumulata (suma frecventelor anterioare) pāna la intervalul - frecventa intervalului - marimea intervalului īn care se afla decila

Locul unei decile oarecare este dat de relatia

(2.96)


Centilele


Centilele, īn numar de 99, īmpart seria īn 100 de intervale egale

(2.97)

unde este limita inferioara a centilei - frecventa cumulata pāna la intervalul - frecventa intervalului - marimea intervalului īn care se afla centila



Indicatorii de masura a īmprastierii

Dispersia


Dispersia (sau varianta) sirului de date, denumita si dispersie de sondaj (esantion) este indicatorul de baza al īmprastierii.

Pentru o serie simpla, dispersia se calculeaza cu formula

(2.98)



Pentru o serie de frecvente variate, dispersia se calculeaza cu formula

(2.99)

Dispersia de sondaj se poate folosi ca estimatie a dispersiei din populatia originara (dispersie de selectie), considerāndu-se relatia

(2.100)


Abaterea medie patratica


Pentru o serie simpla, abaterea medie patratica (sau deviatia standard de sondaj; abaterea standard) se calculeaza cu formula

(2.101)

Pentru o serie de frecvente variate, abaterea medie patratica se calculeaza cu formula

(2.102)

Abaterea medie patratica a populatiei originara este


Abaterea medie liniara


Abaterea medie liniara (sau abaterea medie absoluta) se calculeaza ca media aritmetica din valorile absolute ale abaterilor variantelor caracteristicii fata de media acestor variante.


Abaterea medie liniara se foloseste pentru a caracteriza omogenitatea colectivitatii statistice.


Coeficientul de variatie


Coeficientul de variatie al sirului de date se calculeaza ca raportul dintre abaterea medie patratica si media aritmetica a sirului de date

. (2.106)

Coeficientul de variatie ia valori īncepānd cu 0. Daca este pāna īn 35% se considera ca intensitatea variatiei este redusa, colectivitatea este omogena si media este reprezentativa. Daca depaseste 35% se considera ca intensitatea variatiei creste si colectivitatea este eterogena iar media tinde sa fie o marime nereprezentativa.


Abaterea medie intercuartilica


Abaterea medie intercuartilica este definita ca jumatatea intercuartilei

(2.107)

Intercuartila este o masura a dispersiei exprimata prin diferenta dintre cuartila superioara si cea inferioara.

Abaterea medie intercuartilica este folosita īn analiza dispersionala si are avantajul ca poate fi usor calculata. Abaterea medie intercuartilica reprezinta aproximativ din abaterea standard si este mai putin exacta decāt abaterea medie liniara. Avānd īn vedere ca se exprima īn aceeasi unitate de masura ca si variabila analizata, abaterea medie intercuartilica nu se poate utilize pentru comparatii īntre serii statistice diferite din punct de vedere al unitatilor de masura.


Coeficientul de variatie intercuartilica

Coeficientul de variatie intercuartilica este rapotrul dintre semiintercuartila si mediana

(2.108)

Coeficientul de variatie intercuartilica prezinta avantajul unei comparabilitati mai largi.


Amplitudinea


Amplitudinea variatiei exprima marimea cāmpului de īmprastiere īn jurul mediei.

Amplitudinea absoluta este diferenta dintre valoarea cea mai mare si valoarea cea mai mica a sirul de date

(2.109)

Amplitudinea se poate calcula si ca marime relativa. Amplitudinea relativa este raportul dintre amplitudinea absoluta si media aritmetica a sirului de date

(2.110)

Amplitudinea variatiei are aplicatie īn studiul statistic al calitatii productiei.


Momente


Momentele sunt acele valori care caracterizeaza o repartitie si permit precizarea anumitor caracteristici ale repartitiei. Exista mai multe tipuri de momente:

Pentru serii simple, momentul simplu de ordinul are expresia

(2.111)

Pentru serii de distributie, momentul simplu se calculeaza cu relatia

(2.112)

Momentul centrat de ordinul , pentru serii simple, are expresia

(2.113)

Pentru serii de distributie, momentul centrat are expresia

(2.114)

Pentru serii simple, momentul ordinar de ordinul , calculat īn raport cu o valoare arbitrara , are expresia

(2.115)

Pentru serii de distributie, momentul ordinar are expresia

(2.116)


Indicatorii asimetriei


Coeficientul de asimetrie


Pentru caracterizarea seriilor de distributie unidimensionale si unimodale este necesara cunoasterea gradului de oblicitate, de īndepartare a acestor distributii de la simetrie, aspect denumit asimetrie.

Pentru cuantificarea gradului de asimetrie se foloseste coeficientul de asimetrie definit de relatia


(2.117)

sau īn functie de momentele centrate

(2.118)

īn care este momentul centrat de ordinul trei, iar este momentul centrat de ordinul doi.

De asemenea, coeficientul de asimetrie poate fi definit ca diferenta dintre medie si mod

. (2.119)

Daca: atunci exista simetrie perfecta; exista asimetrie pozitiva sau de stānga; exista asimetrie negativa sau de dreapta.


a) b)

Fig. 2.4. Distributii asimetrice:

a) asimetrie negativa; b) asimetrie pozitiva.


Pentru masurarea asimetriei se foloseste cel mai des coeficientul de asimetrie Pearson [ ] definit de relatia

(2.120)

īn care este modulul; - abaterea medie patratica; - media aritmetica.

Daca repartitia prezinta o asimetrie negativa. Daca repartitia este simetrica. Daca repartitia prezinta o asimetrie pozitiva. Pentru repartitii moderat asimetrice

Coeficientul de asimetrie determinat pe baza metodei Fisher [ ] are expresia

(2.121)

īn care reprezinta mediana.

Coeficientul de asimetrie are valori īntre -3 si +3; cu cāt se apropie de zero cu atāt sirul este mai simetric.

Coeficientul de asimetrie determinat pe baza cuartilelor are expresia

(2.122)

Coeficientul de asimetrie determinat pe baza centilelor are expresia

(2.123)


Coeficientul de boltire


Coeficientul de boltire se calculeaza ca raport īntre momentul centrat de ordinul patru si patratul momentului centrat de ordinul doi


īn care:

(2.125)

(2.126)

Coeficientul de boltire este un indicator al pantei curbei densitatii de repartitie, īn vecinatatea modului de sondaj.


Curtozisul


Curtozisul arata gradul de concentrare al frecventelor īn zona centrala a distributiilor unimodale. Pentru determinarea curtozisului se foloseste coeficientul de boltire.

stiind ca pentru repartitia normala si considerānd aceasta valoare ca nivel standard īn masurarea gradului de boltire al distributiei unimodale, curtozisul este dat de relatia

(2.127)

Daca , curba densitatii de repartitie se numeste leptocurtica si este mai ascutita la vārf decāt curba normala. Daca repartitia se numeste platicurtica si are vārful mai plat decāt o curba normala. Daca repartitia se numeste normala sau mezocurtica.

Curtozisul se poate determina si cu ajutorul cuartilelor si al centilelor cu relatia

(2.128)

























Se pot utiliza urmatoarele functii Excel:

  1. AVERAGE - Media aritmetica.
  2. MEDIAN - Mediana
  3. MODE - Modulul
  4. VARP - Variatia populatiei (se calculeaza numai daca avem in studiu o populatie)
  5. VAR - Variatia de selectie
  6. STDEVP - Abaterea standard a populatiei (se calculeaza numai daca avem in studiu o populatie)
  7. STDEV - Abaterea standard de selectie
  8. STDEV/AVERAGE - Coeficientul de variatie
  9. QUARTILE- Cvartila 1,2,3,4 
  10. AVEDEV - media deviatiei de la media aritmetica
  11. DEVSQ - suma de patrate a deviatiilor valorilor de la media aritmetica
  12. GEOMEAN- media geometrica
  13. HARMEAN - media armonica
  14. KURT- boltirea sau kurtosis-ul
  15. MAX - maximul
  16. MIN - minimul
  17. PERCENTILE - returneaza a k-a percentila
  18. SKEW - asimetria

* daca CV este sub 10% atunci populatia poate fi considerata omogena;

* daca CV este intre 10%-20% atunci populatia poate fi considerata relativ omogena;

* daca CV este intre 20%-30% atunci populatia poate fi considerata relativ eterogena;

* daca CV este peste 30% atunci populatia poate fi considerata eterogena.





loading...










Document Info


Accesari: 31565
Apreciat:

Comenteaza documentul:

Nu esti inregistrat
Trebuie sa fii utilizator inregistrat pentru a putea comenta


Creaza cont nou

A fost util?

Daca documentul a fost util si crezi ca merita
sa adaugi un link catre el la tine in site

Copiaza codul
in pagina web a site-ului tau.




eCoduri.com - coduri postale, contabile, CAEN sau bancare

Politica de confidentialitate

Copyright © Contact (SCRIGROUP Int. 2020 )