Deductia cauzala generalizata: metode pentru studii individuale

Psihologie

ALTE DOCUMENTE

O mentalitate sanatoasa , o relatie trainica , optimism si o viata lipsita de prejudecati

INSTRUCTIUNI DE COMPLETARE TEST

EVALUAREA IN CONSILIERE

LUCRARE DE EVALUARE PSIHOLOGIE

Manipulati si evitati sa fiti manipulati

DEFINITII

TIPURILOR IN BIOGRAFIE

Impunerea inconstientului in psihologie

EDUCATIA SI SOCIETATEA CONTEMPORANA

Imagistica mentala

Deductia cauzala generalizata: metode pentru studii individuale

Meth-od (mëth'əd) (metoda): [procedura medicala in engleza medie, din latinescul metho-dus, metoda, din grecescul methodos, urmarire, metoda: meta-, dincolo, dupa; vezi meta- + hodos, cale ,calatorie] n. 1. Un mijloc sau o maniera de procedura, in special un mod regulat si systematic de a realiza ceva: o metoda simpla pentru a realiza crusta unei placinte ; medierea ca metoda de solutionare a conflictelor . 2. Aranjament ordonat al partilor si etapelor pentru indeplinirea unui scop: eforturi la intamplare care duc lipsa unei metode. 3. Procedurile si tehnicile c 242g64c aracteristice unui anumite discipline sau domeniu de cunoastere: Acest curs in domeniu ofera o prezentare generala a metodei arheologice.

Sin-gle (sïng'gəl) (singur): [sengle in engleza medie, din franceza veche din latinescul singulus] adj. 1. neinsotit de un altul sau de altii; solitar.
2.a. constand intr-o singura parte, aspect sau sectiune: o sigura grosime; o singura servire. 2.b. Avand aceeasi aplicatie pentru toti ; uniform: un singur cod moral pentru toti. 2.c. Constand intr-un singur numar : Nu avea decat un singur gand, si anume sa evadeze.

Acest capitol descrie o varietate de metode pentru explorarea deductiei cauzale generalizate in studiile individuale, metode care nu se bazeaza pe esantionarea la intamplare. Acestea includ esantionarea oportuna, tehnici statistice selectate modelarea la suprafata a raspunsului, si o serie de metode calitative si cantitative pentru studierea explicatiilor cauzale.

ESANTIONAREA OPORTUNA SI DEDUCTIA CAUZALA GENERALIZATA

Aici vom descrie mai in detaliu cele doua optiuni de esantionare oportuna pe care le-am introdus in ultimul capitol -esantionarea oportuna a exemplelor tipice (PSI-Typ), si esantionarea oportuna a exemplelor eterogene (PSI-Het).

Vom arata de asemenea modul in care aceste metode sunt utilizate cu primele patru principii ale deductiei cauzale generalizate (cel de-al cincilea principiu, explicatia cauzala, este tratat mai in detaliu in cea de-a doua parte a acestui capitol).

Esantionarea oportuna a exemplelor tipice

Esantionarea oportuna a exemplelor tipice necesita o definire clara a caracteristicilor persoanelor, setarilor, timpilor, experimentelor, sau rezultatelor tipice la care cineva doreste sa generalizeze si apoi incercarea de a selecta un esantion care sa se potriveasca cu aceasta tinta . Daca acest lucru poate fi realizat, cercetatorul sporeste probabilitatea ca deductia cauzala sa generalizeze in exemple tipice - nu este o realizare triviala daca exemplele tipice sunt definite de lucruri precum moduri care au loc mai frecvent dcat alte exemple.

Definirea exemplelor tipice si selectarea probelor pentru a reprezenta acele exemple sunt cele mai usoare atunci cand tinta generalizarii este un exemplu sau un set de exemple individuale clar stabilit (de ex., o scoala, sau toate scolile publice dintr-un oras) pe care datele disponibile il descriu pe baza unor caracteristici diverse (de ex., dimensiunea sau compozitia etnica a scolii). Apoi, caracterul tipic este definit in mod util cu referire la o masura statistica a tendintei centrale precum mijlocul, mediul sau modul asupra acelor caracteristici, si in cel mai simplu dintre cazuri cercetatorul poate selecta o singura scoala publica care este apropiata de tendinta centrala privind acele caracteristici. Daca exista moduri multiple, unul poate defini mai mult decat un exemplu tipic si poate obtine cel putin un exemplu in fiecare mod. Astfel, in multe districte scolare urbane in care diversitatea etnica nu este distribuita in mod normal in scoli, am putea constata trei moduri corespunzand unor scoli cu elevi in totalitate negri, scoli cu elevi in totalitate albi, si scoli mai putin scindate din punct de vedere rasial. Apoi, o alegere minima ar consta in tr-o singura scoala din fiecare din aceste categorii.

Definirea exemplelor tipice este mai dificila atunci cand nu exista date corespunzatoare pentru a descrie tinta generalizarii. Aceasta situatie are loc adesea atunci cand tinta generalizarii se modifica rapid de-a lungul timpului, precum in cazul datelor de recensamant din Statele Unite ; aceste date sunt colectate doar o data la fiecare deceniu, dar modificarile populatiei in anumite zone ale Statelor Unite au loc atat de rapid incat datele de recensamant devin rapid invechite. Aceasta are loc de asemenea impreuna cu noile tinte de generalizare nou emergente, precum si cu evolutia foarte rapida a experimentelor inhibitoare ale angiogenezei pentru cancer la sfarsitul anilor 1990, atunci cand efectiv nici o data descriptiva cu privire la aceste experimente pe oameni nu erau dispoibile insa cu toate acestea au dat nastere la o cantitate enorma de studii fundamentale si aplicate (Folkman, 1996). Chiar si in astfel de cazuri, cu toate acestea, cercetatorul poate esantiona parerile expertilor si ale partilor interesate pentru a obtine impresiile acestora referitor la cum si ce este un exemplu tipic. O impresie complexa ar putea fi apoi derivata pentru toate impresiile individuale, iar acest complex formeaza cadrul pentru a decide mostrele de inclus.

Definirea tipicalitatii devine in mod substantial un rationament calitativ atunci cand tinta de generalizare este o constructie (de exemplu, copii dezavantajati), pentru ca atunci problema este aceea de a decide exact ce caracteristici constituie aceasta constructie (de exemplu, copiii dezavantajati sunt cei care cad sub linia de saracie federala, care locuiesc in cartiere in saracie, si care au rezultate sub medie la teste).

O data ce exemplele tipice au fost definite, cercetatorul inca se mai confrunta cu sarcina de a esantiona unul sau mai multe dintre acestea . O astfel de esantionare este probabil cea mai facila in lucrarile de consultanta sau de evaluarea a proiectului, in care mostra disponibila este extrem de constransa de insasi natura proiectului. De exemplu, un director industrial care angajeaza un consultant stie faptul ca acesta doreste sa generalizeze la forta de munca prezenta in setarea sa curenta realizand sarcinile sale prezente, a carei eficacitate este masurata prin intermediul indicatorilor de productivitate, profitabilitate, absenteism, intarziere si altii aemenea stabiliti la nivel local. Consultantii sau evaluatorii cunosc faptul ca trebuie sa selecteze respondenti si setari care sa se rasfranga asupra acestor tinte circumscrise. In alte cazuri, totusi, cercetatorii au o mai mre discretie. Acestia pot esantiona un exemplu tipic; exemple multiple, fiecare dintre acestea fiind tipice; sau exemple multiple care se potrivesc cu tinta in medie, chiar daca fiecare exemplu esantionat in mod individual nu este in sine tipic. Date fiind constrangerile privind resursele, experimentele si setarile sunt adesea reprezentate de un singur exemplu tipic, dar persoanele si rezultatele permit o mai mare flexibilitate. Vom furniza exemple pentru fiecare din aceste tipuri de esantionare in sectiunile ulterioare .

Esantionarea oportuna a exemplelor eterogene

Punctul de plecare pentru esantionarea exemplelor eterogene este acelasi ca si punctul de plecare pentru esantionarea oportuna a exemplelor tipice - definirea caracteristicilor persoanelor, setarilr, experimentelor, sau rezultatelor in functie de care cineva doreste sa generalizeze. Cu toate acestea, in timp ce PSI-Typ tinteste sa creeze un esantion tipic pentru aceste caracteristici, PSI-Het tinteste sa creeze o mostra eterogena si care nu trebuie sa includa deloc un exemplu tipic. De exemplu, daca scopul unui individ era acela de a masura satisfactia conjugala intr-un experiment privind efectele terapiei conjugale, PSI-Typ ar putea determina cercetatorul sa selecteze Scara de Ajustare Conjugala (MAS; Locke & Wallace, 1959), care este cea mai larg raspandita masura a acestei constructii. PSI-Het, pe de alta parte, ar determina cercetatorul sa selecteze o varietate de masuri de satisfactie conjugala care sunt heterogene din punctul de vedere al reprezentarii constructiei si al metodelor utilizate care nu trebuie sa includa deloc MAS. In mod similar, daca scopul unui individ ar fi acela de a studia locuitorii varstnici din sanatoriile private, PSI-Typ ar determina cercetatorul sa-i includa pe locuitorii ale caror varste ar avea, sa zicem, varsta medie a locuitorilor din sanatoriile private din populatia de interes, sau a caror varsta ar fi aproximativ media tuturor locuitorilor. Dar PSI-Het ar determina cercetatorul sa selecteze pacienti ale caror varste variaza destul de mult, de la cei mai taneri pana la cei mai varstnici astfel de pacienti. Nu doar ca PSI-Het nu ar necesita includerea unui pacient a carui varsta era de fapt la medie, nici macar nu ar necesita varsta medie a esantionului pentru a se potrivi cu acea medie.

Atingerea eterogeneitatii este ceea ce este important pentru PSI-Het. Aceasta eterogeneitate are doua avantaje. In primul rand, relatiile cauzale sunt de obicei mai usor de gasit atunci cand esantionele sunt omogene, pentru ca esantioanele eterogene sporesc adesea variatia erorii intr-o analiza, in special cu atat mai mult cu cat acea sursa de eterogeneitate este corelata cu rezultatul. Asadar, o relatie cauzala care rezista in ciuda eterogeneitatii va avea adesea o rezistenta mai mare si astfel se presupune ca are o generalizabilitate mai mare in virtutea acestei rezistente . Aceasta este o presupunere foarte fragila dar este una care este inca in mod sporit mai mare decat ar fi cazul cu un efect intr-un esantion omogen. Citatul din Fisher (1935) in Capitolul 11 cu privire la dezavantajele standardizarii subliniaza acest punct. In al doilea rand, PSI-Het ofera cercetatorului o mai mare abilitate decat PSI-Typ pentru identificarea irelevantelor, pentru realizarea discriminarilor, pentru explicarea partilor din rezultat care sunt cele mai afectate de care parti din experiment prin care mediatorii, si, in cazul unei variabile continue, pentru interpolare si extrapolare. In sectiunea urmatoare, vom demonstra cum functioneaza acest lucru.

Uneori este avantajos sa se obtina esantioane eterogene care difera cat mai mult posibil unul de altul. Astfel, daca ar fi posibil, un individ ar putea alege sa implementeze un experiment atat intr-o 'scoala magnet,' si anume, o scoala stabilita pentru a exemplifica conditiile de predare in cele mai bune conditii presupuse, cat si de asemenea intr-una dintre scolile cu problemele cele mai grave din oras. aDaa fiecare exemplu a produs efecte comparabile, atunci am putea incepe sa suspectam . faptul ca efectul ar avea loc in multe alte tipuri de scoli. Cu toate acestea, exista un pericol real in a avea doar exemple extreme la fiecare capat al unui continuu implicit, general. Aceasta problema poate fi cel mai bine subliniata prin intrebarea , 'Care sunt concluziile dvs. cu privire la generalizabilitate daca un efect ar fi obtinut intr-o scoala dar nu si in cealalta?' Unii s-ar grabi sa concluzioneze orice cu privire la efectele tratarii in majoritatea scolilor intre extreme. Astfel incat ajuta daca PSI-Het include cel putin un exemplu al modului populatiei aflata sub investigatie, precum i exemplele la fiecare dintre extreme. Cu alte cuvinte, cel putin un exemplu ar trebui sa fie reprezentativ pentru scoala tipica a unui anumit oras si cel putin un exemplu reprezentativ pentru cele mai bune si cele mai putin bune scoli.

PSI-Het esteade asemenea util pentru evitarea limitarilor care rezulta din neluarea in considerare a tintelor secundare ale deductiei - de exemplu, intrebari cu privire la categoria sociala a acelor copii testati in comparatie cu categoria sociala a copiilor de varsta scolara. Exceptand cazul in care avem motive suficiente pentru a compara categoria sociala a celor testati si a copiilor, modelul bazat pe PSI-Het indica cat este de dezirabil sa se esantioneze dintr-un grup eterogen de persoane testate cu medii de categorii sociale diferite, dat fiind faptul ca o categorie sociala ar putea afecta in mod plauzibil anumite tipuri de rezultate ale copiilor si in multe cazuri poate deveni eterogena cu costuri mici sau fara nici un cost suplimentar.

Cu toate acestea , PSI-Het poate reduce rezistenta. Daca efectul principal al unui experiment general este constatat, aceasta problema este adusa in discutie; dar, in caz contrar, problema se manifesta in doua feluri. Unul este reprezentat de intervalele de incredere mai mari in jurul dimensiunii efectului si de aici o probabilitate crescuta a unei erori de tip II pentru principala ipoteza a efectului tratarii. Celalalt este reprezentat de faptul ca dimensiunea efectului ar putea sa nu varieze in mod semnificativ alte nivele ale variabilei care a devenit eterogena. Cercetatorul ar putea atunci concluziona faptul ca efectul generalizeaza nivelele acelei variabile cand, de fapt, testul avea o putere prea mica pentru a detecta efectele distinctive ale tratarii in ceea ce priveste aceasta sursa.

Esantionarea oportuna si primele patru principii

Am observat anterior ca PSI-Het tinteste sa creeze esantioane eterogene si ca PSI-Typ tinteste sa creeze esantioane tipice. Dar eterogen din ce punct de vedere? Tipic din ce punct de vedere? Aceste doua metode de esantionare oportuna ofera cercetatorilor o ghidare insuficienta in ceea ce priveste selectia particulara a variabilelor pentru care se doreste tipicalitate sau eterogeneitate. Din fericire, primele patru dintre principiile subliniate in capitolul anterior (similaritatea suprafetei, eliminarea irelevantelor, realizarea discriminarilor, interpolarea si extrapolarea) ofera o ghidare suplimentara cu privire la variabile pentru a le clasifica in tipice sau eterogene. In aceasta sectiune, vom furniza atat o ghidare metodologica cat si exemple privind modul in care esantionarea oportuna este combinata cu aceste principii pentru a facilita deductia cauzala generalizata. Cel de-al cincilea principiu, explicatia cauzala, se bazeaza mult mai putin pe esantionare decat pe alte metode calitative si cantitative pentru studierea explicatiilor, pe care le vom analiza in cea de-a doua jumatate a acestui capitol.

Similaritatea suprafetei

Acest principiu evidentiaza similaritatile suprafetei intre tinta de generalizare si exemplul care o reprezinta. De exemplu, Triplett (1898) era interesat de factorii care ar putea imbunatati cursele de bicicleta din lume reala si in special daca ciclistii rulau mai reped in competitii decat atunci cand rulau singuri. Pentru a studia acest lucru, el s-a asigurat ca trasaturile caracteristice ale competitiei pe teren (prezenta competitiei si activitatea de a merge cu bicicleta ) au fost recreate in laborator. Bicicletele sale de laborator aveau roti si pedale precum bicicletele tipice (desi erau fixe si echipate cu indicatori de kilometraj), iar aparatul sau permitea competitorilor sa ruleze fie unul langa altul fie de unii singuri (pentru a constata daca o competitie ar determina diferente) in timp ce un marker semnalizand finalul cursei se apropia. Acest exemplu ilustreaza un esantion oportun al unui exemplu tipic unic ghidat de similaritatea suprafetei dintre experimentul in laborator si competitia pe teren. Triplett a imbunatatit prin urmare valabilitatea constructiei experimentului de laborator, in speranta evidenta ca rezultatele de laborator sa reziste de asemenea in setarile pe teren in virtutea similaritatii suprafetei dintre bicicleta de laborator si cele utilizate in competitiile de teren.¹

Triplett a folosit doar o versiune a experimentului, dar uneori mai multe ivele ale unui experiment sunt de interes, iar sarcina este aceea de a esantiona in mod deliberat acele nivele. Experimentul privind Taxa pe Venit Negativa din New Jersey (Rees, 1974) studia experimentele de sustinere a venitului care erau cele mai probabile sa fie adoptate ca politica, si mai multe astfel de nivele de suport erau luate in considerare in discutiile politice relevante. Astfel, cercetatorii au identificat cele mai reduse si cele mai mari garantii pe venit si rate de reducere a beneficiului care se aflau in acea raza de politica probabila (PSI-Het pentru exemple extreme) si apoi au studiat mai multe optiuni esantionate in mod oportun din cadrul acelei raze.

Esantionarea oportuna oferea mai mult control asupra spatierii intervalelor dintre nivelele pe care le-ar fi permis nivelele de esantionare la intamplare, o trasatura dezirabila pentru modelarea formei relatiei dintre nivelul de suport si rezultat. Acest exemplu folosea PSI-Het pentru a imbunatati valabilitatea constructiei unor experimente multiple. Si imbunatatea simultan capacitatea cercetatorului de a realiza deductii de valabilitate externa, nu doar pentru ca permitea cercetatorilor sa stdieze modul in care efectele experimentului variau asupra nivelelor experimentelor dar si pentru ca cercetatorii puteau interpola si extrapola mai tarziu pentru nivelele nestudiate ale experimentului- spre deosebire de studiul Triplett, care nu furniza nici o informatie pentru investigarea unor astfel de chestiuni de valabilitate externa.

Obtinerea unui esantion tipic nu necesita ca fiecare exemplu esantionat sa fie tipic. Uneori, cercetatorul se poate asigura ca media exemplelor esantionate sa fie tipica. De exemplu, cercetatorii care evalueaza locurile esantionate in mod oportun in ceea ce priveste Auto-angajarea in statul Washington si Demonstratia privind dezvoltarea intreprinderii pentru minimizarea unui indice avantajos al diferentelor medii inree locatiile esantionate caracteristicile medii ale tuturor locatiilor din stat (Orr, 1999; Orr, Johnston, Montgomery, &c Hojnacki, 1989).² De asemenea, desi setarile nu erau in mod oportun esantionate pentru eterogeneitatea lor, cercetatorii puteau de asemenea folosi orice eterogeneitate exista in cadrul locatiilor pentru a explora modul in care variabilitatea caracteristicilor locatiei modificau efectele programului.

Similaritatea suprafetei poate fi subminata daca cercetatorii se bazeaza pe operatiuni care sunt usor disponibile. De exemplu, Pearlman et al. (1989) puneau in discutie utilizarea crescuta a anunturilor publicitare din mass-media pentru a solicita participanti la cercetarea experimentului legat de alcool, aratand faptul ca acestia difereau de clintii obisnuiti ai clinicilor din punctul de vedere al multor caracteristici de suprafata. Argumente similare se aplica la setari-participarea in multe studii este adesea voluntara, iar setarile coluntare au adesea personal care este in mod neobisnuit de dornic sa incerce inovatii sau care este condus de un administrator deosebit de dinamic. Desi astfel de trasaturi pot fi cruciale pentru rezultatele unui studiu, acestea pot si irelevante pentru constructia setarii intentionate. Efortul intens este necesar pentru a convinge alte setari fara aceste trasaturi sa participe. In etapele timpurii ale cercetarii, atunci cand eficacitatea este cel mai mult pusa in chestiune, experimentatorii pot in mod justificat sa argumenteze ca incearca sa observe daca interventia va functiona in conditii optime. Dar daca este asa, acestia trebuie sa-si califice concluziile raportate in consecinta.

Astfel de aptitudini sunt prea rar recunoscute, iar limitarile de setare pot deveni rapid paradigmatice in privinta programelor de crcetare care implica multi investigatori. Weisz, Weiss, si Donenberg (1992), de exemplu, argumentau faptul ca dupa ce au luat in considerare punctajele studiilor cu rezultate in psihoterapia copilului si a adolescentului, acestia au putut constata doar doar cateva care examinau efectele experimentelor care erau folosite in prezent in setarile clinice. Cand s-au uitat la aceste studii, acestia au afirmat ca psihoterapia nu avea nici un efect. Studiul Weisz et al. (1992) ilustreaza utilizarea retrospectiva a similaritatii suprafetei pentru a evalua tipurile de constructie si deductii de valabilitate externa care puteau fi garantate-acestia au nascocit termenul de 'terapie de cercetare' pentru a se referi la constructia experimentului demonstrata de fapt ca fiind eficienta in aceste studii, si au subliniat ca deductiile cu privire la efectele 'terapiei clinice' erau mai putin garantate din cauza faptului ca astfel de terapii erau in principal nestudiate in literatura respectiva.

Harold Brown (1989) a realizat o critica de retrospectiva similara a lui Gholson si Houts (1989), care folosisera studenti de facultate pentru a studia modul in care savantii testeaza ipotezele. Brown (1989) a afirmat ca aceasta alegere a participantilor era atat de indepartata de oamenii de stiinta reali pentru a fi irelevanta cu privire la modul in care gandesc oamenii de stiinta. Houts si Gholson (1989) au raspuns imediat ca similaritatea suprafetei nu este singurul aspect al generalizarii, iar utilizarea de catre noi a celorlalte patru principii sustine punctul acestora de vedere. Cu toate acestea critica lui Brown (1989) cu privire la lipsa similaritatii suprafetei in cazul Gholson si Houts (1989) ramane valabila. Studentii de facultate nu par a fi asemanatori cu oamenii de stiinta practicanti (vezi de asemenea Shadish et al., 1994).

Eliminarea irelevantelor

Acest principiu face apel la cercetator pentru a identifica acele atribute ale persoanelor, setarilor, experimentelor, si masurilor de rezultat care sunt presupuse a fi irelevante pentru ca nu modifica o generalizare si apoi sa transforme aceste irelevante in exemple eterogene (PSI-Het) pentru a testat aceasta prezumtie. Matricea multitrasaturi-multimetode pe care Campbell si Fiske (1959) au subliniat-o mai intai este un exemplu al acestei strategii pentru valabilitatea constructiei. Intr-un exemplu din articolul lor, irelevanta era daca cercetatorul a masurat atitudinile prin intervievare sau printr-o lista de verificare a trasaturilor; si intr-un alt exemplu, irelevanta era daca cercetatorul a masurat popularitatea prin autoevaluari, evaluari sociometrice realizate de catre altii, sau observatii realizate de catre evaluatori. Asa cum ilustreaza aceste exemple, Campbell si Fiske au subliniat in special eliminarea irelevantelor metodologice, pentru ca constructiile din teoria masurarii sunt de obicei legate de caracteristicile substantiale ale lucrului masurat, iar metodele sunt rareori o parte planuita a constructiei. Irelevantele metodologice, cu toate acestea, sunt doar un caz special pentru lucrurile care nu sunt considerate relevante howeverpentru teoria constructiei.

Acest argument se prelungeste de la masurare la toate celelalte aspecte ale unui studiu de probare a unei cauze. De exemplu, multe proiecte de demonstrare sunt evaluate folosind participanti voluntari atunci cand voluntariatul este asteptat ca fiind irelevant din punct de vedere conceptual pentru persoanele servite de catre program. In ceea ce priveste experimentele, interventia pe care noi o numim Inceputul initial este adesea evaluata in diferie centre, iar identitatile unor anumiti membri de personal sunt presupuse a fi irelevante din punct de vedere conceptual. In ceea ce priveste setarile, experimentele de mentinere a venitului din anii 1970 si 1980 au fost implementate intr-un numar limitat de orase (de exemplu, Seattle, Denver), ale caror identitati rau de asemenea considerate ca fiind irelevante din punct de vedere conceptual pentru efect. In acestecazuri, sarcina este aceea de a identifica nivelele de irelevanta (de exemplu, voluntari versus nevoluntari) si apoi de a selecta in mod deliberat cel putin un exemplu pentru a reprezenta fiecare nivel. Acest lucru permite testarea presupunerii de irelevanta.

Multi cercetatori nu au resursele pentru a esantiona in mod eterogen, si astfel ei se bazeaza pe un esantion mult mai putin definit de persoane, setari, masuri, manipulari, si timpi. Dar chiar si atunci, cazurile sunt rareori identice si mai degraba tind sa difere unele de celelalte intr-o multime de feluri irelevante pentru chestiunea de cercetare majora. Masurarea acestor irelevante adauga uneori un cost mic pentru cercetare. In cercetarile in care un cadru de esantionare mai amplu este posibil, putem examina cat de robusta este o relatie cauzala peste, sa spunem, regiuni ale tarii, durate de existenta ale spitalelor, durata medie de exercitare a profesiei de catre medici, tipuri de diagnostice pentru pacienti, sau orice alte atribute legate de pacienti.

Problemele speciale intervin atunci cand esantionul de exemple este mic -asa cum este adesea pentru setari in particular. Cate state, spitale, scoli, si altele asemenea poate gazdui un buget de cercetare? Date fiind esantioanele mici, cum ar trebui sa fie selectate cazurile, de vreme ce eterogeneitatea poate fi atinsa in mod intentionat doar pentru un numar redus de atribute presupuse irelevante ? In unele cazuri, esantionarea oportuna a exemplelor eterogene este imposibila, in special atunci cand chestiunea dcercetare de ghidare specifica in mod substantial variabile mijlocitoare relevante care trebuie sa fie incluse in planul de esantionare si fara de care scopul principal al studiului ar fi subminat. Includerea unor astfel de mijlocitori consuma resurse care in caz contrar ar putea fi folosite pentru facilitarea eterogeneitatii. Imaginati-va ca ati putea esantiona 20 de spitale -10 in fiecare cu doua grupuri de experiment. Dupa stratificarea realizata asupra oricarui mijlocitor potential de interes practic sau teoretic relevant (sa zicem, spitalele public versus spitalele private si mari versus mici), singurul spatiu ramas pentru eterogeneitate pote fi acela care a fost generat in mod spontan. Teoreticienii privind esantionarea pot renunta in acest punct si pot sustine ca esantioanele mici si excesul de determinanti cauzali potentiali redau teoria de esantionare irelevanta in cazuri precum acestea. Noi intelegem si le impartasim exasperarea. Dar cu astfel de limitari se confrunta in general cercetatorii care testeaza propuneri cauzale de testare cu bugete modeste. Nu putem renunta la nevoia pentru deductii cauzale generalizate doar pentru ca metodologiile bazate pe esantioane mari si selectie aleatorie nu sunt aplicabile. Cu toate acestea, trebuie sa fim de asemenea clari ca, in contextul esantioanelor mici, nu exista nici un algoritm perfect pentru selectarea variabilelor care sa devina eterogene. Cel mai bun curs poate fi unul falsificat-selectarea variabilelor pe care experimentatorul le considera irelevante dar despre care criticii pot afirma ca ar schimba semnul sau directia unei relatii cauzale.

Atunci cand o relevanta potentiala nu este variata sau chiar masurata dar poate fi supusa criticii de catre alti cercetatori, ar trebui sa fie constatata cau o presupunere de studiu si descrisa prin orice masuri sau observatii calitative relevante disponibile. In acest sens Lavori et al. (1986) spunea ca cercetatorii ar trebui sa analizeze de ce indivizii si organizatiile au fost de acord sa participe la un studiu. Au fost toti voluntari ai unitatii? Au fost selectati pentru ca pareau cazuri exemplare de buna practica? Sau unitatile au experimentat probleme speciale si astfel au avut nevoie de ajutor special ? Lavori et al. (1986) par sa atribuie un statut special acestui set de cai (presupuse a fi) irelevante in care esantioanele difera de populatiile tinta avute in vedere, evidentiindu-le ca parte din descrierea necesara a esantionului care trebuie sa inlocuiasca atunci cand selectia aleatorie nu este fezabila. Astfel de descrieri sunt vitale, oricare ar fi variatia atinsa in mod aleatoriu sau deliberat, astfel incat pot fi supuse unei cercetari atente critice de catre cei care considera ca trasatura nu este irelevanta.

Realizarea discriminarilor

Acest principiu solicita cercetatorului sa realizeze discriminari cu privire la tipurile de persoane, masuri, experimente, sau rezultate in care o generalizare rezista sau nu. Un exemplu este acela de a introduce o variatie a experimentului care sa clarifice valabilitatea de constructie a cauzei. De exemplu, multe studii indica faptul ca o interventie scurta psihosociala reduce cu succes sederea in spital pentru pacientii de la chirurgie. Dar daca medicii sau asistentele stiu cine primeste o interventie, este atunci crucial sa sediscrimineze efectele educatiei de efectele asteptarilor profesionistilor pentru recuperare. Realizarea acestui lucru necesita manipulare indiferent daca specialistii cunosc starea experimentala a pacientului. Cu toate acestea, motivele practice dicteaza faptul ca exista un prag foarte jos pentru adaugarea manipularilor in studii.

Discriminarile pot fi realizate de asemenea cu variabile de stratificare, adesea pentru a clarifica generalizarile de valabilitate externa. De exemplu, cercetatorii care evalueaza modul in care Actul de Parteneriat pentru Formarea in Munca (Job Training Partnership Act) (JTPA) a afectat castigurile ulterioare suspectau faptul ca efectele ar fi mai puternice printre femeile care se aflasera in asistenta sociala un timp mai indelungat (Orr, 1999). Asadar, acestia si-au stratificat esantionul in femei care beneficiasera de Ajutor pentru familii du copii in intretinere (AFDC) (1) niciodata, (2) mai putin de 2 ani, sau (3) mai mult de doi ani. JTPA a fost in mod clar eficient doar pentru ultimul dintre grupuri. Desi efectele JTPA asupra primelor doua grupuri depindea de modul in care erau realizate analizele, acestea nu au fost niciodata mai importante decat pentru ultimul grup. Durata de timp a ajutorului social pare a fi un mijlocitor important pentru generalizabilitatea efectelor JTPA. Cu toate acestea, la fel ca si cu adaugarea de noi manipulari, exista o limita pentru numarul de straturi care pot fi adaugate la un studiu.

In mod similar, in experimentele mari in mai mlte locatii, cercetatorii constata adesea ca locatiile difera una de cealalta dinpunctul de vedere al rezultatului, iar aceste diferente de locatie pot fi sursa cautarilor pentru variabile care modereaza efectele in functie de locatie. Ioannidis et al. (1999), de exemplu, a constatat ca raspunsul pacientilor cu SIDA la un tratament preventiv pentru pneumonie a variat in mod semnificativ de-a lungul celor 30 de locatii clinice in proba aleatorie. Intr-o serie de analize de explorare, acestia au constatat ca aceste diferente au fost prevazute de diferentele de locatie in administrarea tratamentului, de tipurile de diagnostice oferite, si de nivelele de risc ale pacientilor. Desi acest studiu nu a pornit sa creeze maximul de eterogeneitate posibil prin planul sau de esantionare, autorii cu toate acestea au profitat de eterogeneitatea care a avut loc pentru a explora generalizabilitatea efectelor experimentului.

Dar exista de asemenea o limita cu privire la cantitatea de stratificare care este fezabila intr-un studiu la numarul de setari sau experimente care pot fi adaugate. Asada cea mai simpla cale de a studia discriminarile este de a adauga masuri de diferentiere. Luati in considerare durata de sedere in spital ca masura de recuperare din interventiile chirurgicale. Desi o perioada mai scurta de sedere ar putea indica faptul ca educatia pacientului a ajutat la viteza de recuperare, administratorii de spitale se afla sub presiunea companiilor de asigurare si a guvernului pentru a reduce durata de sedere.

Pentru un diagnostic dat, spitalele sunt acum rambursate doar pentru un numar prespecificat de zile de spitalizare; nu exista nici un angajament deschis. Cu toate acestea, daca pacientii au parasit spitalul mai devreme datorita acestei componente financiar-administrative legata de durata de sedere, acestia s-ar putea afla intr-o stare fizica necorespunzatoae si astfel ar putea fi reinternati sau ar putea intarzia la reintoarcerea lor la activitatile normale acasa sau la serviciu. Pentru a distinge intre o recuperare reala mai rapida si o externare prematura datorata politelor de rambursare, masuri valabile sunt necesare pentru astfel de variabile precum starea fizica a pacientilor la parasirea spitalului, ratele lor de reinternare, si timpul necesar pentru a se reintoarce la activitatile normale. Diferentierea intre rezultatele tinta si cele inrudite ar trebui sa fie larg raspandita in studiile individuale data fiind relativa usurinta cu care pot fi colectate masurile rezultateului suplimentar.

Este in mod similar usor si de valoare sa se adauge masuri de diferentiere cu privire la persoane, setari si tratamente. De exemplu, daca o cercetare anterioara indica faptul ca pacientii deprimati care merg la medicii de ingrijire primaraau nivel diferite de bunastare si functionare decat pacientii care merg la specialistii de sanatate mentala (Stewart et al., 1993), un tip variat de furnizor ar putea fi indicat. In mod similar, testele initiale de imunoterapie prin intepaturi de albine au fost realizate asupra apicultorilor, cu rezultate care sugereaza ca un preparat realizat din albini intregi maruntite era la fel de eficient ca si un preparat din venin de albina. Mai tarziu, cu toate acestea, s-a dovedit ca apicultorii aveau os sensibilitate speciala la ambele preparate datorita expunerii lor zilnice la albine. Probe ulterioare pe alte persoane au demonstrat ca doar veninl de albine functiona in mod corespunzator (Lichtenstein, 1993).

Interpolarea si extrapolarea

Atat extrapolarea cat si interpolarea sunt facilitate de detinerea mai multor nivele diferite ale variabilei la realizare. Cu rezultatele, aceasta este mult mai izbitor ilustrata de problema efectelor de interpolare intre extremele unui rezultat dicotom-ce se intampla legat de calitatea vietii intre viata si moarte din punctul de vedere al cercetarii medicale sau in satisfactia conjugala intre divort si alegerea de a locui impreuna prin cercetarea terapiei conjugale sau in GPA intre trecerea si picarea examenelor in educatie? Din fericire, usurinta cu care masurile pot fi adaugate adesea la studii ofera o mare oportunitate pentru masurare la un nivel foarte fin.

Mai multe nivele diferite ale timilor si persoanelor pot fi de obicei obtinute prin prelungirea razei esantionate si prin masurarea caracteristicilor acestora la intervale chiar si mai fine. In ceea ce priveste timpii, de exemplu, studiile longitudinale cu evaluari multiple ale rezultatului de-a lungul timpului permit o mai mare interpolare cu privire la ceea ce se intampla intre evaluari, pentru ca cu cat sunt inclusi mai multi timpi, cu cat este mai usor de modelat forma relatiei dintre timp si rezultat. Adesea trecute cu vederea sunt evaluarile rezultatului in timpul experimentului insusi, care faciliteaza evaluarile de raspuns la doza atunci cand doza este o functie a timpului (de exemplu, numarul de sedinte de terapie). Unele analize ale curbei de crestere permit ca timpul de evaluare sa difere pentru ficare participant, inerpoland si chiar extrapoland ca rezultatele participantilor uneori neobservate bazate pe datele disponibile pentru participantul respectiv au crescut

cu datele din intregul esantion (de exemplu, Bryk & Raudenbush, 1992; Hedeker &c Gibbons, 1994).³ In mod similar, persoanele pot fi adesea masurate pe baza variabilelor continue care pot prezice raspunsul la tratament -punctajele de aptitudine pentru interventiile educationale, nivelele de saracie pentru formarea in munca, diferentierea celulei canceroase pentru tratamentele de cancer, sau pregatirea pentru schimbare in cadrul programelor de renuntare la fumat.

Diversificarea tratamentelor si setarilor este mult mai dificila. Experimentele de teren cu multe nivele manipulate in mod deliberat ale variabilei independente sunt rare. Motivul pentru acest lucru evidentiaza cateva dintre problemele practice cele mai presante implicate in experimentarea sociala. In mod tipic, doar doua nivele ale unui tratament sunt esantionate-tratamentul in sine si u anumit grup de control. Contrastul dintre acestea il reprezinta diversitatea disponibia pentru studiu. Astfel, cercetatorii ar putea specifica educatia pacientilor ca fiind cauza dar atunci manipuleaza doar o medie de 3 ore din aceasta . Din cauza faptului ca grupul de control va experimenta de asemenea o anumita educatie a pacientului in cursul tratamentului normal de spitalizare, contrastul obtinut in educatia pacientului va fi mai mic de 3 ore-sau sa zicem, 2. Dar concluziile scrise ale cercetarii vor face rareori referire la cauza ca fiind fie '3 ore de educatie a pacientului' fie pentru a fi mai precis 'diferentialul de 2 ore privind educatia pacientului.' Constructia cauzala necalificata 'educatia pacientului' va tinde sa fie invocata.

Solutia ideala descrie forma functiei care leaga raza deplina a variabilei independente de raza deplina a variabilei dependente. Realizarea acetui lucru determina un studiu de raspuns la doza. Cea mai buna versiune a acestui studiu necesita esantioane independente de unitati atribuite aleatoriu la multe nivele ale unei variabile independente unidimensionale care poate fi exprimata in mod cantitativ (cel putin in mod ordinal). Aceste cerinte sunt rareori practice cu exceptia
studiilor experimentale in laborator. Interventiile multicomponente si cateva nivele de comparatie reprezinta realitatea in alta parte.
Dilema practicienilor, atunci, este aceea de a decide cate nivele sa se aleaga si ce serie sa reprezinte.

Atunci cand se studiaza o interventie foarte noua despre care se cunosc foarte putine lucruri, este intelept sa se dauge, la un minim, un nivel de tratament care este puternic sau la fel de puternic pe cat este practic si un altul ca echivalent la un grup de control neincadrat in experiment pe cat posibil. Dar atunci, concluziile pot fi trase cu privire la efectul A doar in masura in care acesta variaza intre aceste doua nivele, si nu doar cu privire la A in general. Cu mai multe resurse, un grup de experiment intre aceste doua nivele ar putea fi adaugat. Daca un efect ar fi apoi observat la ambele nivele ale experimentului, s-ar putea concluziona ca efectul ar fi observat la nivele (neesantionate) intre cele doua nivele ale experimentului. Acest lucru sugereaza o generalizare delimitata in mod empiric bazata pe interpolarea intre cele doua nivele ale experimentului (si presupunand de asemenea ca efectul si cauza nu sunt legate in mod curbilinear in cadrul seriei studiate). Daca, pe de alta parte, analizele datelor au dezvaluit ca un efect a fost constatat la nivelul superior dar nu si la nivelul inferior al variabilei independente, acest lucru sugereaza ca experimentul are un prag cauzal mai mare decat nivelul inferior.

Complicarea alegerii o reprezinta faptul ca cercetatorii aplicati sunt adesea interesati de nivelul de implementare a experimentului care ar fi anticipat ca modal daca s-ar adopta in mod rutinic o interventie (Glasgow, Vogt, &C Boles, 1999). Acest lucru necesita selectarea (si justificarea) unui nivel al experimentului care sa corespunda cu ceea ce pare a fi practica regulata. Dar doar aceasta alegere nu ne-ar informa cu privire la tratament atunci cand acesta este implementat la valorile sale cele mai bune. Stabilirea acestui lucru este adesea o preocupare atat a teoreticienilor independenti cat si a dezvoltatorilor programului, in special in primele stadii ale unei teorii sau ale unui program. Prin urmare, presupusa implementare modala este cel mai bine incorporata in planuri experimentale ca intermediar intre nivelele de inalta intensitate si cele nesupuse experimentului. Desi astfel de strategii deplaseaza analiza catre circumstanta dezirabila de a descrie relatia functionala dintre variabilele independente si cele dependente, in afara experimentelor de laborator acestea sunt adesea atat de multidimensionale incat nu pot fi masurate cu acuratete in mod ordinal.

Cele de mai sus fac referirela manipularea planificata a nivelelor eterogene ale experimentului; dar variatia neplanificata are loc aproape intotdeauna, de asemenea, dat fiind faptul ca experimentele sunt rareori implementate cu fidelitate deplina si ca unii oameni refuza sa incheie intrgul experiment. In capitolele 4 si 5 am observat pericolele interpretarii rezultatelor legate de aceasta variabilitate neplanificata, in special incurcarea directiei de selectie care are loc atunci cand oamenii se autoselecteaza in nivele ale dozei de experiment. Cu toate acestea, daca aceasta variabilitate a fost masurata, aceasta poate fi utila pentru explorarea a doua chestiuni legate de generalizabilitate. Una este daca ramane un efect relativ constant in ciuda variabilitatii neplanificate, sau cel putin peste un anumit nivel prag al experimentului; iar cealalta este de a sugera posibilele praguri cauzale sub care nici un efect nu poate fi pobabil.

Problemele de mai sus se aplica cu forta egala pentru generalizarile cu privire la setari -inr-adevar, intr-un sens problemele pot fi chiar mai grave. Cu exceptia probelor de amplitudine, bine fundamentate, multe studii implementeaza experiment doar intr-o singura setare, realizand extrapolari sau interpolari cu privire la variabilitatea setarii aproape imposibile. Unii cercetatori evita sa utilizeze mai mult de o setare pentru a simplifica monitorizarea indeaproape a cercetarii si pentru a evita reducerea in rezistenta statistica care poate avea loc in anumite planuri stratificate de setare sau aleatorii de grup. Cu toate acestea, decizia de a utiliza o singura setare este adesea realizata doar pentru convenienta astfel incat investigatorii nu trebuie sa se deplaseze prea departe, pot obtine permisiunea participantilor umani mai usor, pot evita dificultatile interpretative care rezulta atunci cand efectele experimentului variaza in functie de setare. Desi am utilizat astfel de expuneri rationale in acelasi scop noi insine, acestea devin mai greu de justificat din punct de vedere intelectual atunci cand anumite caracteristici de setare pot afecta in mod dramatic rezultatul. Analiza mentionata anterior a rezultatului psihoterapiei in setari relevante din punct de vedere clinic (Weisz et al., 1992) este un exemplu excelent. Dat fiind ca probele de psihoterapie controlate au fost rareori realizate in conditiile in care cea mai mare parte a psihoterapiei are loc si ca exista controverse cu privire la faptul daca studiile realizate in setari clinice au sau nu efecte (Shadish et al., 2000), evitarea acestei variabilitati de setare de dragul comoditatii este foarte dificil de sustinut.

Metode statistice pentru generalizare din esantioanele oportune

Sectiunea anterioara subliniaza modurile in care planul de studiu afecteaa generalizabilitatea. Partial, acest lucru ne reflecta concentrarea in acasta carte asupra planului de experimente mai mult decat asupra analizei lor; si partial, acesta reflecta realitatea ca putine metode statistice sunt disponibile pentru studiul generalizabilitatii rezultatelor experimentale atunci cand nu se foloseste esantionarea aleatorie. Cu toate acestea, unele metode sunt disponibile, in special cand sunt folosite in concordanta cu o esantionare oportuna mai buna, pentru a fi informative. Vom descrie aceste metode mai jos. Astfel de modele nu au fost in mod necesar realizae in scopul deductiei cauzale generalizate din experimente pentru constructii sau exemple nestudiate, astfel incat acestea nu acoperaintreaga serie a teoriei conceptuale pe care o subliniem. Aplicabilitatea acestora va depinde de asemenea de datele corespunzatoare disponibile, ceea ce nu va fi cazul cel mai adesea.

Recantarirea esantionului

In principiu, rezultatele experimentale asupra esantioanelor oportune pot fi realizate pentru a aproxima rezultatele care ar avea loc in cadrul popultiei prin recantarirea caracteristicilor esantionului. Cercetatorii sondajului folosesc in mod rutinic recantarirea pentru a corecta esantioanele aleatorii pentru pierderea participantilor care ar putea fi sistematica si pentru imbunatatirea potrivirii dintre esantioanele nealeatorii si populatii (Cochran, 1977; Rossi et al., 1983). O astfel de recantarire are loc de asemenea in experimente de teren in economie, combinand rezultatele din experimentele aleatorii cu cunoasterea caracteristicilor pertinente ale populatiei pentru a prezice efectele populatiei (Orr, 1999). Construirea greutatilor necesare necesita cunoasterea caracteristicilor pertinente ale populatiei pentru care se cauta generalizarea. Atunci cand aceasta cunoastere este disponibila, datele de esantionare sunt recantarite pentru a reflecta compozitia populatiei respective cu privre la acele caracteristici. Rezultatele vor fi de obicei mai putin precise in legatura cu rezultatele care ar fi obtinute in cazul in care un esantion ala intamplare ar fi folosit (Orr; 1999), dar de obicei vor fi mai putin inclinate ca estimari ale ceea ce s-ar fi intamplat in randul populatiei decat care ar fi fost rezultatele necantarite ale studiului (Hedges, 1997b).

Doua probleme impiedica utilizarea raspandita ale unor astfel de tehnici de recantarire. In primul rand, utilizarea acestei metode necesita o anumita estimare a caracteristicilor populatiei pentru a realiza cantarirea corespunzatoare. Atunci cand aceste estimari nu sunt disponibile , cercetatorul trebuie sa le obtina prin alte studii de cercetare (de exemplu, examinari ale esantionului populatiei pertinente). Hedges (1997b) sugereaza sa se realizeze acest lucru doar daca exista motive pentru a considera ca banii nu ar fi mai bine investiti in imbunatatirea valabilitatii concluziei statistice si interne a experimentului primar. Adesea, acestea din urma sunt prioritati superioare date fiind nivelele de finantare redusa pentru multe experimente.

In al doilea rand, aceste metode se concentreaza in principal pe greutati pentru caracteristicile oamenilor. Desi o prelungire a setarilor pare plauzibila, prelungirile pentru tratament si rezultate sunt mai putin probabile. La urma urmei, daca o populatie este identificata ca de obicei in statistica ca 'orice adunare finita sau infinita de indivizi ' (Marriott, 1990, p. 158), listele de tratamente sau rezultate sunt rare si in general nu sunt considerate ca fiind complete. In multe zone, de exemplu, rezultatele disponibile sunt in mod tipic masuri de auto-raportare; dar masurile fiziologice sau ale observatorului sunt adesea complet absente din lista in ciuda dezirabilitatii teoretice bine acceptate pentru generalizarea unor astfel de surse de variatie a metodei. Cu toate acestea, aceasta a doua obiectie implica o forta mai mica in masura in care cercetatorul este dornic sa restrictioneze deductia la cat de bine aceasta combinatie deosebita experiment-rezultat generalizeaza pentru populatiile de persoane si setari in schimb. Adesea, o astfel de limitare este plauzibila.

Modelarea suprafetei raspunsului

Modelarea suprafetei raspunsului (RSM) se refera la un set general de metode pentru construirea modeluui empiric si utilizarea ulterioara a modelului respectiv pentru a prezice rezultatele ca o functie a elementelor de prevedere precum durata si intensitatea experimentului sau caracteristicile persoanei si ale setarii, atata timp cat aceste elemente de prevedere pot fi cuantificate. Box si Draper (1987) ofera exemplul din psihologie conform caruia 'un investigator ar putea dori sa descopere modul in care un punctaj la un test [rezultat] obtinut de anumiti subiecti depindea de durata [data de intrare 1) perioadei in care au studiat materialul relevant si de intarzierea [data de intrare 2] dintre studiu si test' (p. 1). Cu aceste trei variabile, de exemplu, o suprafata de raspuns tridimensionala poate fi construita portretizand in mod grafic relatia dintre variabile. O utilizare a acestei suprafete este de a vedea ce combinatie de durata si intarziere a maximizat punctajele testului prin gasirea celui mai ridicat punctaj la test estimat pe suprafata -chiar daca cercetatorul nu inclusese acea combinatie deosebita a duratei si intarzierii in experiment. Atunci cand sunt incluse mai multe elemente de prevedere, este de obicei imposibil sa se mltiplice si sa se vizualizeze suprafata de raspuns M-dimensionala rezultata. Dar vizualizarea grafica este pur si simplu o unealta convenabila care reflecta ecuatia de regresie fundamentala care apare la suprafata, si intr-adevar aceasta ecuatie este utilizata pentru a realiza predictia.

In logica RSM, deductia cauzala generalizata este o predictie cu privire la efectul probabil care ar fi obtinut cu persoane, setari, experimente, sau rezultate specificatee catre analist ca tinta de generalizare. Sa luam in considerare exemplul dezbaterii laborator-versus-clinica in psihoterapie (de exemplu, Weisz. et al., 1992) in care intrebara era daca rezultatele din studiile de cercetare ale efectelor psihoterapiei ar generaliza in mai multe contedxte reprezentative din punct de vedere clinic. Tinta de interes ar include probabil setari clinice, terpeuti specialisti experimentati, clienti prezentandu-se prin rute de trimitere obisnuite, si altele asemenea, astfel incat un RSM ar proiecta rezultatele din datele existente -care ar putea sa nu aiba nici un studiu reprezentand aceasta combinatie deosebita de caracteristici -catre un studiu care a prezentat intr-adevar aceste caracteristici. In mod similar, RSM permite examinarea indiferent daca rezultatul variaza peste nivelele elementelor de prevedere care sunt presupuse a fi irelevante, in special daca criticii sugereaza ca acestea s-ar putea dovedi relevante -precum probema prezentata care implica un copil sau un adult. Permite examinarea faptului daca rezultatul variaza peste nivelele elementelor de prevedere care sunt considerate a fi un rezultat moderat, precum daca studiul a atribuit aleatoriu sau nu clienti de psihoterapie la tratament sau control.

Si permite examinarea modului in care rezultatul se modifica in functie de elementele de prezicere care variaza pe baza unui continuu, precum doza de terapie sau durata urmaririi post-terapie.

In toate aceste sensuri, RSM este o metoda ideala pentru explorarea deductiei cauzale generalizate. Asadar West et al. (1993) a sugerat folosind RSM sa se identifice ce combinatie deosebita de componente ale programelor de preventie cu componente multiple a maximizat rezultatul, chiar daca acea combinatie particulara este posibil sa nu fi fost niciodata studiata cu adevarat. Cu toate acestea, exemplele lor au fost toate ipotetice; nu cunoastem nici o aplicatie a RSM cu privire la problema deductiei cauzale generalizate din experimentele de teren in stiintele sociale, cu exceptia anumitor parti ale economiei. De exemplu, mai multe experimente de mentinere a venitului variau nivele multiple ale catorva din variabilele independente pentru a crea 'parametrii care pot fi aplicati pentru a proiecta efectele propunerilor de politica nationala ce afecteaza persoaele cu venit mic' (Greenberg & Shroder, 1997, p. 374).

In practica, utilitatea RSM este adesea limitata in experimente individuale de lipsa de variabilitate asupra irelevantelor si variabilelor de discriminare importante si de nerealizarea obisnuia a varierii intentionate sau chiar a masurarii dimensiunilor cantitative necesare pentru extrapolare si interpolare. Tacest lacune sunt de inteles data fiind lipsa obisnuita a resurselor necesare pentru implementarea a mai mult de un nivel din anumite variabile, precum setarea sau tratamentul, si conflictul obisnuit dintre beneficiile variabilitatii pentru generalizare si costurile variabilitatii pentru puterea statistica. Alti cercetatori pot fi intimidati de literatura statistica traditionala asupra RSM din cauza faptului ca nu este fformulata in termeni familiari si datorita faptului ca exemplele provin in principal din productia industriala (Box & Draper, 1987). Dar aceste impedimente sunt mai mult aparente decat reala, pentru ca statisticile necesare sunt in principal simple ecuatii de regresie. Prevederea catorva exemple ar incuraja probabil mult mai multi experimentatori sa realizeze analizele solicitate.

Alte metode

Literatura contine multe alte metode statistice care ar putea fi adaptate la deductia cauzala generalizata -probabil mult mai multe decat mentionam noi aici. Sen-Gupta (1995), de exemplu, utiliza proceduri de masurare multidimensionale pentru a identifica trasaturile prototipice ale acelor indivizi bolnavi din punct de vedere mental cronic care au beneficiat cel mai mult de angajare de sustinere. Presupunerea este aceea ca aceste tratamente folosite pentru alti indivizi in alte locatii ar putea fi mai eficiente in masura in care impartasesc aceste caracteristici prototipice. In mod similar, in demonsatratia de dezvoltare a intreprinderii si auto-angajarii in statul Washington, cercetatorii au selectat locatii nealeatoriu , pentru a minimiza indicele cantarit al diferentelor dintre locatii si din intregul stat pe baa unui set de caracteristici presupus a fi important pentru reprezentarea statului. (Orr, 1999; Orr et al., 1989). In continuare, anumite statistici descrise in capitolele anterioare pentru generalizarea din partea celor care accepta atribuirea aleatorie pentru conditii catre cei invitati la experiment (dintre care unii au refuzat atribuirea aleatorie) ar putea fi probabil prelungite pentru a modela generalizarea la populatii inca si mai mari (Braver & Smith, 1996; Ellenberg, 1994).

In cele din urma, Glasgow et al. (1999) a propus o abordare mixta care combina informatiile statistice si experimentale disponibile cu aprecierile de rationament pentru a realiza presupuneri (partial bazate pe date) cu privire la probleme precum eficacitatea, acoperirea probabila, si gradul de implementare anticipata, dintre care toate sunt apoi combinate pentru a estima efectele probabile la populatiile mai generalizate.

La nivel general, Hedges (1997b) a descris un model de statistica cuprinzator, care include cateva din teoriile conceptuale pe care le-am schitat in aceasta lucrare. In primul rand, modelul defineste un efect cauzal global (generalizabil) deoarece media unui set de estimari echilibrate din experimentele individuale au fost realizate pe metode admisibile, contexte, operatii si participanti. Diferenta intre un experiment individual si acest efect cauzal global poate aparea din cauza erorii de estimare (in mod obisnuit, eroare de esantionare si eroare de masurare), erorii locale cauzale de deductie (surse de invaliditate interna in cadrul experimentelor individuale) si eroarea de deductie cauzala generalizata (generalizabilitate limitata in cadrul contextelor). Cu toate ca modelul lui Hedges nu conduce imediat la metode statistice practice care pot imbunatati deductia cauzala generalizata, el indica totusi faptul ca statisticienii lucreaza la aceasta problema si ca metodele practice complementare pot fi la indemana oricui in anii viitori.

METODE PENTRU STUDIEREA EXPLICATIEI CAUZALE

Cel de-al cincilea principiu al deductiei cauzale generalizate este explicatia cauzala. Din mai multe puncte de vedere, metodele care studiaza explicatia cauzala sunt mai variate si mai bine dezvoltate decat sunt pentru oricare din celelalte patru principii. Va prezentam trei abordari generale: (1) metode calitative care ajuta in primul rand sa se descopere si exploreze posibilele explicatii, (2) metode statistice, ca de exemplu modelarea ecuatiei structurale, care combina informatia experimentala cu masuri ale proceselor de mediere si (3) programe de experimente care manipuleaza variabile explicative in experimente. Ordinea prezentarii este realizata in mod deliberat, incepand cu metodele care sunt orientate mai mult spre descoperire prin cele care masoara dar nu manipuleaza si terminand cu cele care furnizeaza o baza mai puternica pentru a sublinia rolul cauzal al variabilelor mediationale.

Document Info

Accesari: 4954
Apreciat:

Comenteaza documentul:

Nu esti inregistrat
Trebuie sa fii utilizator inregistrat pentru a putea comenta

Creaza cont nou

A fost util?

Daca documentul a fost util si crezi ca merita
sa adaugi un link catre el la tine in site

Copiaza codul:
in pagina web a site-ului tau.

eCoduri.com - coduri postale, contabile, CAEN sau bancare

Politica de confidentialitate | Termenii si conditii de utilizare