Documente online.
Zona de administrare documente. Fisierele tale
Am uitat parola x Creaza cont nou
 HomeExploreaza
upload
Upload




Introducere in analiza statistica multivariata

economie



Introducere în analiza statistica multivariata


Analiza statistica univariata are în vedere o singura variabila, analizata prin raportare la ea însasi. Daca ne intereseaza caracteristicile unei anumite distributii (variabile), ne slujim de tehnicile si in 454c29e dicatorii statisticii descriptive: analiza de frecvente, indicatorii sintetici ai tendintei centrale, împrastierii si formei distributiei. Toate acestea fac parte din analiza statistica univariata, deoarece se refera la o anumita variabila, luata în considerare fara a fi raportata la o alta variabila.

Analiza statistica bivariata descrie relatii dintre doua variabile perechi. Un exemplu tipic este, sa zicem, o structura de date formata din doua variabile: scorul la un test de inteligenta si nivelul performantei la un test de cunostinte scolare. Sau nivelul salariului si apartenenta la o grupa vârsta, în cadrul unei organizatii. În astfel de situatii suntem interesati sa punem în evidenta o eventuala legatura între respectivele variabile. Cu alte cuvinte, ne intereseaza variatia lor comuna, concomitenta. Desigur, în subsidiar, urmarim o legatura de tip cauzal, dar, asa cum stim, afirmarea cauzalitatii este un proces care nu se poate baza exclusiv pe tehnici de analiza statistica, având nevoie de un context experimental riguros. Testarea diferentei dintre doua medii, coeficientul de corelatie Pearson, sau testul chi-patrat, sunt alte exemple tipice de analiza statistica bivariata.

Analiza statistica multivariata, se distinge prin aceea ca permite analizarea relatiilor existente simultan între mai mult de doua variabile. În acest caz datele statistice sunt organizate în structuri de linii si coloane numite matrici multivariate, în care pe linie avem cazurile iar pe coloane avem trei sau mai multe variabile, a caror relatie dorim sa o investigam.


În tabelul urmator avem trei structuri de date, corespunzatoare celor trei tipuri de analiza statistica:


Structura datelor în cele trei tipuri de analiza statistica

univariata


Bivariata


Multivariata

Subiect

QI


Subiect

QI

Perf. scolara


Subiect

QI

Perf. scolara

Motivatie











1 (mare)













2 (medie)











3 (mica)























O b i e c t i v u l a n a l i z e i s t a t i s t i c e

Identificarea caracteristicilor distributiei QI




Verificarea ipotezei unei relatii între QI si performanta scolara


Verificarea ipotezei ca performanta scolara variaza simultan cu QI si motivatia.

Caracteristici ale datelor supuse analizei multivariate


Ca o regula generala, valabila nu doar pentru statistica multivariata ci si pentru celelalte metode de analiza, este reprezentarea numerica a valorilor. Desigur, variabilele de tip interval raport, sunt prin natura lor exprimate numeric dar în cazul variabilelor nominale valorile sunt exprimate prin coduri atribuite de cercetator. Sexul poate fi exprimat cu literele "m"/"f", temperamentele cu "m" pentru melancolic, "f" pentru flegmatic, "s" pentru "sanguinic", "c" pentru coleric. În toate cazurile se vor evita codurile bazate pe litere sau combinatii de litere si vor folosi coduri numerice conventionale (de exemplu: "1" pentru feminin, "2" pentru masculin).

Datele supuse analizei multivariate se prezinta într-o forma speciala, numita "matrice", si care consta într-o structura de linii si coloane. Exista mai multe tipuri de matrici dintre care, pentru exemplificare, amintim aici:

Matricea de date, este similara cu modul de prezentare din tabelul de mai sus. Liniile reprezinta cazurile (care, în mod obisnuit, sunt "subiectii") iar coloanele reprezinta variabilele analizate. În tabelul de mai sus, matricea pentru analiza univariata este formata dintr-un vector cu cinci linii si o singura coloana, cea pentru analiza bivariata, de o matrice cu cinci linii si doua coloane, în fine, cea pentru analiza multivariata, de o matrice cu cinci linii si trei coloane.

Matricea de corelatie, este o structura patratica de linii si coloane în care pe fiecare linie si coloana corespunzatoare sunt aceleasi variabile iar în celulele de intersectie se gasesc coeficientii de corelatie.

Matricea de varianta-covarianta, este similara celei de corelatie, cu deosebirea ca la intersectia liniilor cu coloanele sunt înscrise valorile de covarianta dintre variabile.


La fel ca si numerele obisnuite, matricile pot fi supuse unor operatii de însumare, scadere, înmultire, împartire, etc. Acestea fac parte din algebra matriceala si nu sunt absolut necesare a fi tratate aici, programele computerizate facând mai putin necesare cunostintele de acest gen. Totusi, atragem atentia asupra calitatii datelor supuse analizei. Rezultatele calculelor computerizate se prezinta printr-o cantitate impresionanta de numere si de grafice impresionante care sugereaza precizie dar care nu spun realmente nimic decât în masura în care datele initiale au fost corect masurate si exprima ceva autentic.

În ce priveste dimensiunea matricilor nu exista limite teoretice, procedurile de calcul putând fi aplicate unor matrici de orice dimensiuni, atât sub aspectul numarului de linii cât si al celui de coloane. Din punct de vedere practic, potentialul de calcul al programelor care ruleaza pe computerele actuale nu are decât o singura limita: capacitatea de stocare pe suportul de memorie fixa, numarul cazurilor sau al variabilelor prelucrabile fiind mult peste ceea ce ar putea constitui interesul unui cercetator oricât de pretentios.

În ciuda puterii de calcul a programelor statistice actuale, se va evita includerea în analiza multivariata a unui numar prea mare de variabile. Relatiile multiple sunt dificil de înteles si de explicat. De aceea, înainte de a trece la analiza statistica propriu-zisa, se impune o analiza preliminara a potentialelor directii de influenta reciproca. Pe aceasta baza se poate alege mai bine lista variabilelor a caror relatie interconditionata va fi analizata.



Caracteristici generale ale analizei statistice multivariate


Tehnicile analizei multivariate vin sa completeze analiza statistica în directia identificarii relatiilor complexe dintre variabile. Acest lucru este cu atât mai necesar în domeniul stiintelor social-umane, unde interconditionarea unui numar mare de variabile este mai degraba o regula decât o exceptie. În mod normal, un anumit comportament uman este influentat simultan de cunostinte, atitudini, emotii, opinii, caracteristici demografice, etc. Un model de analiza care ia în considerare relatia dintr-o singura variabila independenta si o variabila dependenta, oricât de semnificative ar fi rezultatele acestuia, nu face decât sa arunce o lumina partiala asupra realitatii. Aceste variabile, pe lânga influenta pe care o exercita una asupra alteia suporta, în acelasi timp, fiecare separat sau amândoua împreuna, influenta unora sau mai multor variabile.



Strategii ale analizei multivariate


Sa ne întoarcem la exemplul de mai sus în care am imaginat o analiza multivariata pentru relatia simultana dintre QI si motivatie, cu performanta scolara. În acest caz, primele doua variabile enuntate sunt variabile independente iar performanta scolara este variabila dependenta. Problema noastra este aceea de a descoperi cantitatea de variatie la nivelul performantei scolare care este indusa de "QI" pe de o parte, si de "motivatie" pe de alta parte. Însumarea acestor doua surse de variatie ne da "efectul cumulat" al variabilelor independente asupra variabilei dependente. Daca motivatia contribuie la performanta scolara cu 30% iar QI-ul cu 40%, atunci 70% din variatia rezultatelor scolare este explicata de cele doua variabile independente actionând simultan. Din pacate, solutia problemei, desi simpla la prima vedere, se complica daca ne gândim ca, la rândul lor, variabilele independente pot varia una în raport cu cealalta. Absenta oricarei relatii dintre doua variabile (corelatie "zero") se numeste "ortogonalitate". În analiza statistica multivariata ortogonalitatea este un lucru ideal dar nu întotdeauna usor de gasit. Complexitatea relatiilor dintre variabilele realitatii socio-umane face ortogonalitatea mai degraba o exceptie decât o regula.

Din acest motiv, cercetatorul are la dispozitie doua strategii de analiza multivariata:

a.       Analiza standard, în care relatia reciproca dintre variabilele independente este ignorata, fiind luata în considerare numai relatia dintre fiecare variabila independenta si variabila dependenta.    

b.      Analiza secventiala, se bazeaza pe stabilirea unei prioritati la punerea în ecuatie a variabilelor independente. Astfel, prima variabila din lista, va contribui la efectul asupra variabilei dependente cu variatia proprie dar si cu variatia pe care o împartaseste cu variabilele independente aflate sub ea, pe lista de prioritate. În mod similar, variabila independenta urmatoare contribuie cu propria variatie dar si cu variatia pe care o are în comun cu variabilele de sub ea, s.a.m.d. Stabilirea pozitiei pe "lista de prioritate" tine de decizia analistului si se bazeaza de intuitie dar si pe verificarea prealabila a ortogonalitatii, adica a corelatiilor dintre variabile luate doua câte doua.


Din cele afirmate mai sus desprindem o particularitate esentiala a analizei multivariate: aceea de a fi fundamentata pe asumarea unei relatii de tip liniar dintre variabile. Analiza relatiilor dintre mai multe variabile este redusa la analize de tip liniar dintre variabile luate doua câte doua. Acest fapt face importanta verificarea conditiei de liniaritate enuntata anterior.


Interpretarea rezultatelor


Statistica pune la dispozitie tehnici sofisticate de calcul, computerele moderne le executa cu mare precizie si viteza dar, din pacate, acestea nu sunt suficiente pentru întelegerea semnificatiei rezultatelor analizei multivariate. Interpretarea rezultatelor atunci când sunt implicate relatii între mai multe variabile simultan nu este un lucru facil. Motiv pentru care, uneori, este aproape imposibil sa se dea un raspuns precis la problema cercetarii. Alteori, rezultatele sunt ambigui, diferiti indicatori statistici contrazicându-se unii pe altii. De asemenea, capcane potentiale sunt puterea redusa si nerespectarea preconditiilor variabilelor introduse în analiza (normalitate, homoscedasticitate, liniaritate).

În aceste conditii, interpretarea rezultatelor depinde foarte mult de experienta si de capacitatea cercetatorului, de întelegerea intima a proceselor investigate ca suport pentru interpretarea statistica. Exista aici, deci, o portita deschisa subiectivismului de interpretare, dar acest lucru nu face mai putin utila analiza statistica multivariata, dimpotriva, mai pasionanta si mai plina de interes.






Document Info


Accesari: 7231
Apreciat: hand-up

Comenteaza documentul:

Nu esti inregistrat
Trebuie sa fii utilizator inregistrat pentru a putea comenta


Creaza cont nou

A fost util?

Daca documentul a fost util si crezi ca merita
sa adaugi un link catre el la tine in site


in pagina web a site-ului tau.




eCoduri.com - coduri postale, contabile, CAEN sau bancare

Politica de confidentialitate | Termenii si conditii de utilizare




Copyright © Contact (SCRIGROUP Int. 2025 )