Documente online.
Zona de administrare documente. Fisierele tale
Am uitat parola x Creaza cont nou
 HomeExploreaza
upload
Upload




Informatica Medicala si Biostatistica

medicina



Indicatii generale



Testarea statistica de semnificatie poate fi aplicata atât pentru cazul în care avem de-a face cu date numerice, cât si pentru alte situatii.

Ea consta, asa cum a precizat creatorul ei, R. A. Fisher, în acceptarea "adevarului" afirmatiei dorite, ca urmare a respingerii ca "implauzibila" a unei alte afirmatii, numite "ipoteza nula". Este însa absolut necesar ca ipoteza nula sa exprime o egalitate sau o coincidenta!



În aceasta lucrare practica:

a)      veti confirma, prin testare statistica de semnificatie, propozitii care afirma

- ca o proportie este mai mare decât alta,

- ca o medie este mai mare decât alta,

- ca exista asociere între ;

b)     veti recapitula cunostinte referitoare la crearea unui chestionar în Epi Info, calcule statistice (indicatori statistici) si diagrame

c)     veti învata sa lucrati cu comanda MEANS rezolvând probleme date ca exemplu.



Softul ce va fi utilizat în lucrarea practica:

Microsoft Excel Epi Info




Tabelul urmator este întocmit pentru compararea a doua proportii independente.


Bolnavi

(infectie a tractului respirator)

Sanatosi

(control)

Total

Proc.

Fumatori





Nefumatori





Total





Evident, este un tabel de contingenta (de tipul 2

Au fost alesi în mod special un numar egal de fumatori si nefumatori în grupul de control. Dar aceasta nu este obligatoriu!

Procentul de bolnavi în rândul fumatorilor (ar trebui sa fie de 56.9%) este mai mare decât procentul corespunzator de bolnavi în rândul nefumatorilor (de doar 43.1%). Oare diferenta procentuala este semnificativa?

Datele sunt adaptate folosirii unui test hi-patrat.

Pentru nivelul de semnificatie de 0.05, valoarea critica a distributiei este 3.841. Valoarea calculata este 5.249, deci vom trage concluzia ca exista o diferenta semnificativa între proportiile îmbolnavirilor.

Sa ne reamintim cum se creeaza un fisier (chestionar = view) în EpiInfo. (Înainte de toate este necesar sa preluam toate fisierele aplicatiei EpiInfo!) Pentru aceasta vom folosi modulul Make View. File New File name (numele bazei de date = nume_EPIINFO) Open Name the View (numele chestionarului = Primul) care contine urmatoarele cinci câmpuri:

- nrcrt. Dupa Insert Field vom introduce Question or Prompt = Nr.Crt., Type = Number, Pattern = ####, Field Name = NrCrt

- varsta. În Field Definition vom introduce Question or Prompt = Varsta, Type Number, Pattern = ###, Field Name = Varsta


-- sex, care va avea doua valori, F si M. Pentru aceasta în Field Definition vom introduce Question or Prompt = Sex, Type = Text, Legal Value Create New: M, F OK

- dom, care va avea doua valori, R (de la "rural")  222n1312c 51;i U (de la "urban"). Pentru aceasta în Field Definition vom introduce Question or Prompt = Domiciliu, Type = Text, Legal Value Create New R, U OK

- h. În Field Definition vom introduce Question or Prompt = Inaltimea, Type = Number, Pattern = ###, Field Name = H

Introduceti acum, folosind modulul Enter Data, datele urmatoare.

NrCrt

Varsta

Sex

Dom

H


NrCrt

Varsta

Sex

Dom

H



F

R





M

U




F

R





F

U




F

U





M

R




F

U





M

U




F

U





M

U




F

R





F

U




F

U





F

U




F

U





F

U




F

U





F

R




F

U





F

U




F

U





F

U




F

U





F

R




F

U





F

U




F

U





F

U




F

U





F

U




F

U





F

U




F

R





F

U




F

U





F

U




F

R





F

U




F

U





F

U




F

U





F

U




F

U





M

R




F

U





F

U




F

U





M

R




F

U





F

U


plus o ultima înregistrare (a 51-a) care sa contina datele d-voastra.



Sa facem observatia ca valorile variabilelor Varsta si H sunt numerice, iar cele ale variabilelor Sex si Dom sunt calitative (chiar Booleene!).

Pentru variabilele numerice se calculeaza de obicei media si varianta (eventual abaterea standard). Pentru variabilele calitative se creaza de obicei diagrame de tip rozeta.

Pentru a efectua calcule statistice vom folosi modului Analyze Data. Mai întâi vom încarca fisierul creat anterior. Pentru aceasta vom folosi comanda Read indicând în Data Source denumirea nume_EPIINFO.mdb

Verificati continutul fisierului cu comanda List

Calculati media si varianta variabilei Varsta. Folositi comanda Means Means of: Varsta. Media va fi valoarea afisata la Mean iar varianta valoarea afisata la Variance. Ar trebui sa obtineti: Mean în jur de 48.00 si Variance aprox. 347.55.

Calculati media si varianta variabilei Varsta separat pentru persoanele de sex masculin si pentru persoanele de sex feminin: Folositi aceeasi comanda Means Means of: Varsta, dar de data aceasta Stratify by: Sex

Reprezentati valorile variabilei Sex într-o diagrama cu dreptunghiuri: Se foloseste comanda Graph: Graph Type: Bar iar la X-Axis: Main_Variable(s): Sex. Titlul diagramei (1st Title) va fi: "Distributia pe sexe". Diagrama obtinuta va fi exportata (comanda File Export ) în format JPG si va fi salvata cu numele nume_GRAFIC1 alegând aceasta la Export Destination: File Browse

Importul de fisiere: Pentru importa un fisier din format Excel vom folosi modulul Analyze Data, mai precis, comanda Read. Exemplu:

Read Data Formats: Excel 8.0, Data Source: An2_09_1.xls, Worksheets: chd

Pentru acest fisier, reprezentati valorile variabilei Smk într-o diagrama rozeta. Pentru reprezentarea grafica se foloseste comanda Graph: Graph Type: Pie iar la X-Axis: Main_Variable(s : Smk. Titlul diagramei (1st Title) va fi: "Repartitia fumatorilor si nefumatorilor". Diagrama obtinuta va fi exportata (File Export ) în format JPG si va fi salvata cu numele nume_GRAFIC2.


Pentru datele din fisierul An2_09_2.xls vom calcula intervalul de încredere 95% pentru proportia de indivizi pentru care medicamentul s-a dovedit util. Importati mai întâi datele: Read Data Formats: Excel 5.0, Data Source: C:\Anul2\An2_09_2.xls, Worksheets: Medicament.

Pentru a obtine acest interval vom folosi comanda Frequencies: Frequency of: Medicament. Rezultatul obtinut este urmatorul:

Medicament

Frequency

Percent

Cum Percent










Total




apoi

95% Conf Limits







Deci, intervalul de încredere 95% pentru proportia de indivizi pentru care medicamentul s-a dovedit util (valoarea 1) este [73.8, 85.3]. În esantion proportia de indivizi pentru care medicamentul s-a dovedit util este de 80.0%. Vom concluziona ca - în populatia din care s-a extras esantionul - proportia de indivizi pentru care medicamentul se va dovedi util va fi între 73.8% si 85.3% cu o probabilitate de 95%. (Exista 5% sanse ca proportia de indivizi pentru care medicamentul se va dovedi util în populatie sa se afle în afara acestui interval!)

Comparati acest rezultat cu cel obtinut în lucrarea practica nr. 8 si înregistrat în fisierul nume_INTERVALE.doc. Ce explicatie puteti da pentru eventualele diferente constatate?

Creati un document Word cu numele nume_COMENTARIU care sa contina interpretarea rezultatului obtinut prin rularea comenzii Frequencies: Frequency of: Medicament referitor la proportia de indivizi pentru care medicamentul nu s-a dovedit util (valoarea 0). Preluati în acest document si outputul dat de EpiInfo (prin selectare pe ecran, copiere apoi lipire).


Comanda Means este folosita pentru a se obtine statistici descriptive pentru variabile de tip continuu (ceea ce nu este cazul variabilei Medicament de mai sus). De asemenea, sunt calculate si statistici care se refera la probabilitatea ca mediile pentru grupuri sa fie egale. Comanda Means aplicata unei variabile categoriale (cu valorile yes\no) calculeaza proportia pentru valoarea yes.

Comanda Means are doua formate. Daca se utilizeaza numai pentru o singura variabila (Means of), ea genereaza un tabel identic cu cel al comenzii Frequencies, dar în plus sunt calculate si statisticile descriptive.

În cazul în care se utilizeaza pentru doua variabile, prima fiind o variabila numerica care contine datele care vor fi analizate (Means of) si cea de-a doua fiind o variabila de grupare (Cross-tabulate by Value of), se va obtine un tabel mai amplu, cu urmatoarele statisticile descriptive pentru fiecare valoare a variabilei de grupare: media (Mean), mediana (Median), cuartilele (25% si 75%), valoarea minima (Minimum) si maxima (Maximum), modul (Mode), varianta (Variance) si deviatia standard (Std Dev). Tabelul se continua cu valorile pentru testele statistice Anova, t, Bartlett, Mann-Whitney/Wilcoxon sau Kruskal-Wallis.

Daca este specificata si variabila de grupare (Stratify by), se obtin mai multe tabele, câte unul pentru fiecare valoare a variabilei de grupare.

Asadar, comanda Means realizeaza urmatoarele teste statistice:

teste parametrice: ANOVA, Student (t-test),

teste neparametrice: Kruskal-Wallis, Mann-Whitney (U-test).

În cazul în care variabila de grupare are numai doua valori (avem doua grupuri) este calculat testul t (testul Student) sau testul Mann-Whitney (Wilcoxon Rank Sum Test), iar în cazul în care variabila de grupare are mai mult de doua valori (cel putin trei grupuri) este calculat testul f (ANOVA) sau testul Kruskal-Wallis. Alegerea între testele parametric respectiv neparametric se va face în functie de rezultatul testului Bartlett (testul pentru verificarea omogeneitatii variantelor).


Ca exemplu, preluati fisierul de date cu ajutorul comenzii Read Data Formats Epi 2000 Data Source sample.mdb Views viewSmoke

Sa verificam ca exista o diferenta semnificativa între media înaltimii barbatilor si media înaltimii femeilor. Pentru aceasta vom folosi comanda Means în care variabila numerica este Height iar variabila de grupare (Cross-tabulate by Value of) este Sex. Vom lucra cu urmatoarele ipoteze:

Ipoteza alternativa: Exista o diferenta semnificativa între media înaltimii barbatilor si media înaltimii femeilor.

Ipoteza nula: Nu exista o diferenta semnificativa între media înaltimii barbatilor si media înaltimii femeilor.

Variabila Sex are doua valori. Vom verifica mai întâi daca dispersiile sunt omogene pentru cele doua grupuri: barbati (1) si femei (2), cu ajutorul testului Bartlett. Se va observa ca variantele pentru înaltimea barbatilor (2481.7762) si pentru înaltimea femeilor (2509.2829) nu difera foarte mult între ele.

Valoarea p data de testul Bartlett este 0.9455 (foarte apropiata de 1), ceea ce indica faptul ca variantele sunt aproximativ egale, deci putem sa folosim rezultatele de la testele parametrice (fie ANOVA, fie t). În cazul nostru vom folosi rezultatul dat de testul t.


Valoarea p data de testul t (Student) este afisata ca 0.0000, deci este foarte mica. Se poate respinge deci ipoteza nula! Afirmatia conform careia exista o diferenta semnificativa între înaltimea medie a barbatilor si înaltimea medie a femeilor este confirmata de datele din esantionul folosit. Aceasta diferenta nu poate sa fie atribuita sansei, întâmplarii sau erorii de esantionare!

. Sa verificam ca exista o diferenta semnificativa între greutatile medii ale straturilor (persoanele au fost grupate în 3 straturi). Pentru aceasta vom folosi comanda Means în care variabila numerica este Weight iar variabila de grupare (Cross-tabulate by Value of) este Strata. Vom lucra cu urmatoarele ipoteze:

Ipoteza nula: Greutatea medie a persoanelor din stratul 1 coincide cu greutatea medie a persoanelor din stratul 2 si cu greutatea medie a persoanelor din stratul 3.

Ipoteza alternativa: Exista cel putin o diferenta "semnificativa" între greutatile medii corespunzatoare celor 3 straturi.

Rezultatele afisate de catre EpiInfo vor arata în felul urmator:

Descriptive Statistics for Each Value of Crosstab Variable


Obs

Total

Mean

Variance

Std Dev





















Minimum


Median


Maximum

Mode























ANOVA, a Parametric Test for Inequality of Population Means

(For normally distributed data only)

Variation

SS

df

MS

F statistic

Between





Within





Total





Bartlett's Test for Inequality of Population Variances

Bartlett's chi square=


df=2

P value=0.0000

A small p-value (e.g., less than 0.05 suggests that the variances are not homogeneous and that the ANOVA may not be appropriate.

Mann-Whitney/Wilcoxon Two-Sample Test (Kruskal-Wallis test for two groups)

Kruskal-Wallis H (equivalent to Chi square) =


Degrees of freedom =


P value =


Observam ca variabila Strata are trei valori (1, 2 si 3). Vom verifica mai întâi omogeneitatea variantelor, pentru cele trei grupuri, cu ajutorul testului Bartlett. (Rezultate: 1: 40130.05; 2 ). Observati cât de diferite sunt valorile variantelor în cele trei straturi.

Valoarea p (de la testul Bartlett) este iarasi foarte mica (0.0000), ceea ce indica faptul ca dispersiile sunt neomogene. Deci nu putem sa folosim rezultatele de la testele parametrice (Anova sau t). Vom folosi prin urmare rezultatele testelor neparametrice si anume, în cazul nostru, rezultatul testului Kruskal-Wallis.

Valoarea p este 0.9582, foarte mare, ar trebui sa ne determine sa acceptam ipoteza nula, conform careia nu exista diferente semnificative între greutatile medii ale celor trei straturi (1: 210.15; 2: 217.49; 3: 168.21).

În concluzie, nu exista, din punct de vedere statistic, diferente între greutatile medii ale persoanelor din cele trei straturi, iar diferentele constatate pot sa fie atribuite sansei (întâmplarii) sau erorii de esantionare.

Exercitiu

1) Exista diferenta semnificativa între mediile dozei de medicament (dose) la persoanele cu varsaturi (vomit = 1) si la persoanele fara varsaturi (vomit = 0)? Fisierul de date este An2_09_3.xls.

2) Exista diferenta semnificativa între mediile dozei de medicament (dose) la persoanele din grupurile definite de cele trei metode (method = 1, 2, 3)? Fisierul de date este acelasi.


Alegeti una dintre problemele de mai sus (1 sau 2). Rezolvati aceasta problema cu ajutorul programului Epi Info. Creati un document Word cu numele nume_MEANS care sa contina:

explicit, ipoteza nula si ipoteza alternativa,

rezultatul si interpretarea testului Bartlett,

testul statistic corespunzator si interpretarea valorii p pentru testul ales,

concluzia (recomandarea) finala.




Document Info


Accesari: 7560
Apreciat: hand-up

Comenteaza documentul:

Nu esti inregistrat
Trebuie sa fii utilizator inregistrat pentru a putea comenta


Creaza cont nou

A fost util?

Daca documentul a fost util si crezi ca merita
sa adaugi un link catre el la tine in site


in pagina web a site-ului tau.




eCoduri.com - coduri postale, contabile, CAEN sau bancare

Politica de confidentialitate | Termenii si conditii de utilizare




Copyright © Contact (SCRIGROUP Int. 2024 )