Caracteristicile de baza ale domeniului procesarii de imagini

java

ALTE DOCUMENTE

Abstract Factory

Meniuri in Java- Meniuri cu java js

JAVA.LANG

INTERFATA GRAFICA

Serializarea obiectelor

Primele programe Java

Real-Time Transport Protocol

Caracteristicile de baza ale domeniului procesarii de imagini

Procesarea imaginilor consta din utilizarea informatiilor bidimensionale sau tridimensionale de la un captor vizual, utilizând tratari numerice, cu ajutorul calculatoarelor în procesul de analiza.

Patru factori au influentat în mod decisiv dezvoltarea unor sisteme de analiza a imaginilor de cost redus:

-larga disponibilitate a unor sisteme de calcul relativ ieftine (compatibile IBM PC sau Macintosh) cu posibilitati de calcul si memorare ridicate precum si cu posibilitati de interfatare la dispozitive de stocare a imaginilor de tip frame-grabber sau placi multimedia

-dezvoltarea unor circuite integrate care permit o conversie a semnalelor video de înalta calitate si la o rata de transfer ridicata

-cresterea calitatii dispozitivelor de achizitie de imagini combinata cu reducea preturilor de vânzare si aparitia în ultima vreme a camerelor digitale la preturi accesibile

-disponibilitatea atât hardware, cât si software pentru calculatoare compatibile IBM PC sau Macintosh, a unor placi de achizitie de imagini precum si a unor programe aplicative sau biblioteci de functii (API) la un pret din ce în ce mai redus si cu posibilitati de calcul din ce în ce mai mari.

6.2.1. Achizitia si pastrarea imaginilor

Prin digitizare, scena din realitate este convertita într-o imagine compusa din unitati digitizate (pixeli în cadrul spatiului 2D, voxeli în spatiul 3D) carora în general le este asociata o valoare, valoarea de gri, cuprinsa uzual între 0 si 255, reprezentând intensitatea spotului luminos convertit.

Scena reprezinta acea zona "vazuta" de catre captor formata dintr-o multime de obiecte fizice într-o zona a mediului, iar imaginea reprezinta în general o matrice de pixeli stocata într-o memorie de imagini care urmeaza a fi prelucrata de catre un sistem de calcul, reprezentând proiectia scenei pe un plan bidimensional.

In Figura 6.2. se prezinta definirea imaginii si a scenei.

Figura 6.2. Definirea imaginii si a scenei

6.2.1.1. Camerele video si achizitia imaginilor

Prima diferenta importanta între vederea umana si imaginea analizata de sistemul de calcul este modul în care se achizitioneaza imaginea. Cei mai obisnuiti senzori utilizati pentru a capta imagini sunt camera video si scanerul.

In general imaginile se memoreaza în calculator ca si o matrice bidimensionala de numere. Aceste numere corespund diferitelor informatii cum ar fi:

-intensitatea nivelelor de gri

-luminanta

-crominanta, etc.

Pentru a putea procesa o imagine, ea trebuie trecuta în calculator într-o forma digitala. Pentru a digitiza imaginile analogice ele trebuie esantionate si cuantizate.

Esantionarea presupune procesul de captura de esantioane din semnalul analogic, adica preluarea punctelor de informatie aflate la diferite distante unele de altele.

Cuantizarea reprezinta procesul asignarii unei valori binare pentru fiecarea valoare esantionata.

Un digitizor (camera sau scaner analogic) considera initial imaginea analogica si continua. Digitizorul esantioneaza imaginea convertind de fapt lumina într-un semnal ce reprezinta stralucirea. Acest lucru se realizeaza cu ajutorul unor traductoare. Dupa aceea un convertor A/D cuantizeaza semnalul produs care apoi poate fi memorat digital în calculator. Aceste valori memorate reprezinta intensitati astfel încât de obicei Negru = 0 si Alb este valoarea maxima posibila (de obicei 255).

Camerele de achizitie a imaginilor pot fi împartite în:

a) Camere standard, care utilizeaza cipuri care au o multime de senzori pentru pixeli (elemente de imagine) -cca. 500.000 senzori /cmp. Senzorii functioneaza ca numaratori de fotoni, astfel ca semnalul sumat si amplificat de la fiecare linie a acestor senzori produce un voltaj analog. Exista diferite circuite care citesc informatia data de senzori CCD (charge couple device) circuite cu transfer de sarcina, CID (charge injection device) sau altele. Efectul dat de diferentele acestea este ca sunt camere care permit acumularea în cip a unor imagini intunecoase pe perioade mai lungi de timp sau din contra capturarea rapida a imaginii intr-o scurta perioada de timp. Camerele utilizate pentru a capta imagini de intensitate foarte joasa sunt utilizate în astronomie, microscopia fluorescenta, etc.

Figura 6.3. Dispozitiv CCD

Dispozitivele CCD executa 2 functii:

-convertesc fotonii într-o sarcina electrica

-permit deplasarea sarcinii (bucket brigade) astfel incât citirea reprezinta un flux serial de date.

Aceste circuite CCD reprezinta inima camerelor si scanerelor, având un raspuns foarte liniar, Figura 6.4.

Figura 6.4. Raspunsul camerelor CCD si vidicon

b)Camerele cu vidicon -camere de tip vechi cu tub de vacuum sunt camere mai ieftine si servesc ca prototip de comparatie cu camerele solide, iar principiul de functionare este cel al fotoconductibilitatii, o imagine ce patrunde pe suprafata tubului, altereaza conductibilitatea unui învelis al acestuia. Un fascicul de electroni bombardeaza fata posterioara a acestui învelis fotosensibil si prin neutralizarea sarcinilor electrice creeaza o diferenta de potential care produce pe un electrod colector un curent. Prin esantionarea si cuantificarea acestui semnal se obtine imaginea digitala. (Figura 6.5.)

Figura 6.5. Camera cu vidicon

Camerele standard si cele cu vidicon produc un semnal analogic ce corespunde intensitatii luminoase a diferitelor puncte ale imaginii, însa intre camerele standard si cele cu vidicon exista unele diferente (Figura 6.4.) - în camerele cu vidicon poate aparea o marire a spotului luminos (datorita împrastierii luminii sau electronilor în învelis) sau poate aparea efectul "cozii de cometa" lânga spotul luminos sau pot aparea diferite deformari ale imaginii în "perna" sau în "butoi", (Russ, 1999). Tot aceste camere au materiale de învelis care au raspuns spectral si astfel poate surveni o modificare a culorilor adica acelasi obiect apare diferit la iluminare diferita. Sistemul de lentile si neizolarea individuala a tranzistorilor din interiorului camerelor cu cip (care s-a micsorat progresiv de la 1 inch la 1/3 inch) fac ca lumina sa se împrastie de la un tranzistor la altul si astfel un procent uneori pâna la 50 % din lumina este pierdut. Solutia este de a asocia o singura lentila de dimensiuni mici fiecarui tranzistor si astfel colectarea luminii este de 100%. De asemenea camerele standard au senzitivitate mare la partea de sfârsit a spectrului vizibil mai ales la rosu sau chiar lumina infrarosie care daca nu este eliminata din sistemul optic al camerei produce încetosarea sau pa 252g66c tarea imaginilor.

c) Camereler digitale - majoritatea înca nu sunt potrivite pentru aplicatii tehnice datorita unor limitari de optica si a rezolutiei limitate, datorita faptului ca folosesc compresii de tip JPEG ceea ce poate produce pierderi. Sunt unele camere mai avansate care nu pierd prin compresie si acestea s-ar preta la aplicatii tehnice. Camerele utilizate în domeniul tehnic nu au facilitati de comprimare, ele folosind sistem optic flexibil si asigurând o rezolutie înalta.

Exista trei tipuri principale de camere digitale în acest moment:

- cu cip monocrom; se pot realiza capturi color daca se folosesc trei filtre RGB si trei secvente de imagini

- cu scanare liniara; au rezolutie mare si timp îndelungat de scanare, sunt folositoare doar pentru imagini statice

- care utilizeaza cipuri de megapixel de provenienta RGB. O camera de aceast tip este lenta, direct legata la interfetele SCSI ale sistemelor de calcul, nu realizeza compresii, posibilitati mari de depozitare a imaginilor; înca sunt foarte costisitoare.

Tendinta actuala este de a îmbunatati camerele standard prin îmbunatatirea continua a rezolutiei spatiale (numarul senzorilor individuali), uniformitatea realizarii lor si reducerea costurilor acestor camere. Ramâne de vazut în ce masura HDTV (High Definition TeleVision - televiziune de înalta rezolutie), va aduce îmbunatatiri remarcabile camerelor video în viitorul apropiat. De asemenea camerele digitale sunt într-o continua dezvoltare piata oferind in acest moment camere la preturi rezonabile si cu facilitati tot mai mari. Exista camere de tip firewire care respecta standardul IEEE 1394 si care astfel permit prin intermediul unor placi simple de achizitie introducerea direct în memoria calculatorului a imaginilor. De asemenea standardul USB mai ales varianta 2.0 permite interfatarea simpla între un sistem de calcul si o camera digitala care introduce direct datele în cadrul memoriei calculatorului.

Indiferent de camera care se poate folosi pentru achizitia de imagini este important ca sistemul optic al camerei sa focalizeze corect pentru a captura detalii fine ale imaginii. Exista camere care realizeaza acest lucru automat - sisteme de microscopie automata sau unele sisteme de urmarire (ex. de trafic). Uneori acest lucru se face cu ajutorul unui circuit electronic atasat camerei sau realizat cu ajutorul unui software dedicat care încearca sa determine o serie de parametrii alegând astfel parametrii care duc la obtinerea imaginii celei mai bune.

Focalizarea automata în imaginile macroscopice utilizeaza tehnologii de masurat distanta cum ar fi sunet de înalta frecventa sau în infrarosu pentru a determina distanta fata de subiect si astfel se ajusteaza sistemul optic obtinându-se imaginea cea mai buna. Exista algoritmi pentru a detecta calitatea imaginii si acestea sunt aplicabile tuturor imaginilor în care exista un bun contrast si detalii fine. Acestea se realizeaza cu ajutorul unor filtre care sunt aplicate fie hardware fie software.

Intre camere si convertorul analog-digital exista cabluri, conectori care împreuna cu circuitele de compensare ale luminozitatii si care tin în mod obisnuit de camera, ele producând pierderi de semnal si modificari ai parametrilor imaginii (ex., modificari de contrast). Achizitia imaginilor folosind camere video este considerata achizitie în timp real, în multe aplicatii rata de achizitie nu trebuie însa sa fie foarte mare.

Achizitia imaginilor folosind dispozitive CCD poate fi facuta folosind o singura linie CCD sau o matrice bidimensionala care ofera o rezolutie marita si un tip de achizitie mai scurt însa la un pret mai ridicat. In acest sens distingem notiunile de scanare:

-intretesuta, linii pare/impare

-neintretesuta sau progresiva, utilizata mai ales la HDTV.

Tehnica progresiva este folosita de:

-camerele de înalta performanta

-microscoapele cu scanare directa, SEM - Scanning Electron Microscope, STM - Scanning Tunneling Microscope, AFM - Atomic Force Microscope

-digitizoare de film si cadre, etc.

In HDTV densitatea pixelilor este mare în raportul 16:9 fata de raportul 4:3 existent actualmente la norma NTSC. Pixelul este considerat si în acest caz patrat iar o imagine tipica este de 1920x1080 la o rata de 30 cadre/sec rezulta ca se vehiculeaza multa informatie care trebuie prelucrata.

Scanerele se pot clasifica în:

- reflective, cele care masoara lumina reflectata de sursa originala

- transmisive, cele care masoara lumina transmisa de sursa.

Aceste scanere pot scana imagini:

- alb-negru

- color, folosind diferite tehnici. Se prefera în general întâi o prescanare si apoi o sanare finala. În domeniul razelor X se folosec scanere SEM, Scanning Electron Microscope.

Placile de achizitie a imaginilor sunt dispozitive intercalate între camerele video si sistemul de calcul. Ele pot fi de tip frame-grabber, sau mai nou placile multimedia de cost relativ scazut pot indeplini rolul acestor placi de achizitie în cadrul unor aplicatii uzuale. Aceste placi de achizitie au ajuns astazi la performante deosebite atât ca viteza de achizitie, ca rezolutie dar si ca posibilitati de a prelucra într-o oarecare masura imaginea capturata.

Tendinta actuala pe piata placilor de achizitie este de a realiza placi extrem de performante cu soft de analiza si prelucrari de imagini care sunt utilizate mai ales în scopuri profesionale. Stereoviziunea a impulsionat dezvoltarea placilor de achizitie multicanal care permit achizitia simultana pe mai multe canale a semnalelor provenite de la mai multe dispozitive de achizitie.

6.2.1.2. Stocarea imaginilor digitale

Când se lucreaza cu un sistem de analiza computerizata a imaginilor, imaginile trebuie salvate pe disc sub forma de fisiere care sunt oarecum asemanatoare cu celelalte tipuri de fisiere, (text, programe, etc.), dar din anumite motive, fisierele cu imagini digitale trebuie sa fie considerate distincte din anumite puncte de vedere.

Fisierele de imagini sunt de obicei mari. O singura imagine de 640x480 pixeli monocrom ocupa aproximativ 300 KB în timp ce o imagine color necesita aproximativ 1 MB. Imaginile 3D sunt mult mai mari (de exemplu 500 x 500 x 500 imagine de reconstructie tomografica 3D ocupa aproximativ 125 MB), deci necesita o mare capacitate de stocare.

6.2.1.3. Memorarea imaginilor

O imagine digitala pe 8 biti de dimensiuni 1024 x 1024 pixeli necesita 10⁶ biti, adica un spatiu foarte mare, de aceea memoria ocupa un loc important în sistemele de prelucrare de imagini.

Pentru aplicatii de prelucrare a imaginilor se poate realiza:

- memorare pe termen scurt, necesara procesarii propiu-zise, ea reprezinta memoria temporara de lucru, într-un calculator fiind memoria de tip RAM

- memorarea on-line, necesara pentru accesare rapida sau memoria de scurta durata de obicei fiind realizata pe discuri de tip Whinchester. Tendinta actuala este de a folosi suporturi magneto-optice si chiar stocarea holografica.

- memorarea în vederea arhivarii, de lunga durata în care accesul la imagine este mai putin frecvent.

Memoria de arhivare se caracterizeaza prin capacitati foarte mari de memorare necesare dar cu accesare mai putin frecventa. Acestea sunt discurile optice si benzile magnetice. CD-ROM-ul este o modalitate ieftina de stocare si de aceea CD-urile reprezinta modalitatea cea mai frecventa de a avea la dispozitie bilioteci de imagini. Exista CD-uri de inalta densitate (DVD - Digital Video Disk) care ofera stocarea unei cantitati mai mari de informatie pe acelasi format.

Discurile optice (WORM - drives = write once read many) ofera mai multe posibilitati ca CD-ROM-ul, oferindu-ne atat arhivarea si stocarea imaginilor cât si accesul acestora prin citire / scriere. Acestea sunt utile mai ales în medicina dar si în alte domenii în care imaginile trebuie stocate în mod permanent acestea având o capacitate mare, în medie de aproximativ 1GB/disc.

Floppy discurile sunt de capacitate redusa si astazi sunt mai putin utilizate pentru transportul si stocarea unui numar extrem de mic de imagini (una singura), cu capacitati între 1.4 si 120MB acestea din urma fiind denumite floptical disc deoarece au nevoie de o unitate prevazuta cu senzor optic necesar pentru citirea informatiei.

Discurile de mare capacitate (ZIP-drive), cu o capacitate în medie de peste 100MB, sunt astazi competitive ca pret si performanta cu discurile optice, având o viteza de acces sub cea a hard-discurilor dar sunt mult mai rapide decât CD-urile.

Benzile magnetice sunt extrem de lente, dar au capacitate mare de stocare.

La alegerea mediului de stocare a imaginilor trebuie avut în vedere volumul de imagini care va fi stocat, scopul utilizarii acestor imagini (viteza de acces ) si pretul de cost al stocarii.

6.2.1.4. Formate de imagine

Tentatia de a realiza un format de imagine propriu este foarte mare, mai ales în cazul firmelor de marca care doresc sa-si impuna standardele, ajungându-se astfel la multe formate de imagini diferite. Acestea pot fi apreciate dupa mai multe criterii cum ar fi, gradul de compresie pe care îl realizeaza si timpul necesar împachetarii si despachetarii acestora. Cele mai importante formate din aceasta categorie sunt: PCX, BMP, IMG, TARGA, IBM, TIFF, GIF, WPG, JPEG, PIC, CDR, PCD, PNG, PPG, PPM,etc.

O imagine 2D este un tablou bidimensional de pixeli, denumit adesea rastru (raster). Fiecare linie orizontala este numita linie de scanare, sau linie de rastru. În calculator, culoarea fiecarui pixel este reprezentata printr-una din urmatoarele metode:

- daca imaginea este binara, culoarea fiecarui pixel este exprimata printr-o valoare de 1 bit - 1 - 0, iar daca e monocroma fiecare pixel va avea o intensitate într-o plaja de obicei 0,255.

- pentru o imagine True Color, culoarea fiecarui pixel este exprimata în general, în termenii intensitatilor de rosu (R), verde (G) si albastru (B) care creeaza culoarea. De obicei, fiecare componenta a unei culori este reprezentata pe un octet, astfel exista 256 de nivele pentru fiecare componenta de culoare. Aceasta abordare necesita trei octeti pentru fiecare pixel si permite pâna la 256 x 256 x 256 = 16777216 sau peste 16 milioane de combinatii distincte ale valorilor RGB (culori).

- pentru o imagine bazata pe o paleta de culori, valoarea fiecarui pixel este interpretata ca un index într-un tabel cu valori RGB cunoscut sub numele de paleta de culori, sau harta de culori (Colormap). Pentru fiecare pixel se afiseza valoarea RGB corespunzatoare continutului acelui pixel. Numarul de biti necesari pentru stocarea valorii fiecarui pixel depinde de numarul de culori din paleta. Dimensiunile obisnuite ale paletelor de culori sunt 16 (necesita 4 biti pe pixel) si 256 (necesita 8 biti pe pixel).

Caracteristici comune ale fisierelor de imagine

Pentru a va asigura ca puteti citi, interpreta si afisa o imagine stocata electronic, imaginea trebuie sa contina cel putin urmatoarele informatii:

- dimensiunile imaginii - latimea si înaltimea

- numarul de biti pe pixel

- tipul imaginii - daca valorile pixelilor trebuie interpretate ca fiind culori RGB sau elemente într-o paleta de culori

- paleta de culori - daca imaginea foloseste vreuna

- datele imaginii, care reprezinta tabloul cu valorile pixelilor

Aproape toate fisierele imagine (vezi Figura 6.6. ) contin acest set de informatii, dar fiecare format specific de fisier organizeaza aceste informatii într-un alt mod.

Antet

Paleta de culori

(daca exista)

Datele imaginii

(tabloul de pixeli)

Figura 6. 6. Format tipic de fisier imagine

Aceasta figura reprezinta structura unui fisier imagine tipica. Fisierul începe cu un scurt antet - având de la câtiva, pâna la 128 sau chiar mai multi octeti. Urmeaza apoi o paleta de culori daca valorile pixelilor din imagine folosesc paleta de culori. Datele imaginii - tabloul cu valorile pixelilor - apar dupa paleta de culori. De obicei tabloul de pixeli este stocat linie cu linie. Tabloul de pixeli ocupa cea mai mare parte a fisierului imagine. De exemplu, o imagine de dimensiune 640 x 480 pixeli cu 256 culori necesita 640 x 480 = 307200 octeti pentru stocare, deoarece valoarea fiecarui pixel ocupa un octet. Desigur, spatiul de stocare necesar pentru datele imaginii poate fi redus recurgând la compresia datelor, fie printr-un algoritm de codare pe baza lungimii, fie cu alte scheme de compresie.

Cu toate ca multe fisiere imagine au un aspect similar celui prezentat anterior este loc pentru mai multe variatii:

- ordinea informatiilor din antet poate sa difere de la un format de fisier la altul.

- formatele dependente de ecran sar peste întreaga paleta de culori si stocheaza numai tabloul de pixeli.

- tabloul de pixeli poate fi stocat de sus în jos sau de jos în sus.

- daca valorile pixelilor sunt componente RGB, ordinea rosu, verde, albastru poate fi modificata.

- valorile pixelilor pot fi stocate în format împachetat sau ca planuri de biti. În formatul împachetat, toti bitii apartinând unui pixel sunt stocati unul dupa altul. Când imaginea este stocata pe planuri de biti, bitii pentru fiecare pixel sunt separati conform pozitiei bitului, cei mai putin semnificativi biti ai tuturor pixelilor sunt stocati linie cu linie, apoi se trece la bitii urmatoarei pozitii de bit si asa mai departe.

- valorile pixelilor pot fi stocate într-un format comprimat.

Formate uzuale pentru fisiere imagine

Exista mai multe metode de stocare a unei imagini într-un fisier, acesta fiind motivul pentru care veti gasi atât de multe tipuri diferite de formate pentru fisiere imagine. Iata câteva dintre cele mai populare formate de fisiere imagine:

-Formatul PCX, folosit la început de programul Paint Brush al companiei Zsoft, este un format pentru fisiere imagine pe care-l suporta multe programe de desenare si scanere. Fisierele PCX folosesc o schema de codare pe baza lungimii (Run-Length-Encoding - RLE) pentru a stoca imaginea într-o forma comprimata.

- Formatul BMP Windows sau DIB (un format introdus de Microsoft Windows 3.0) stocheaza imaginea ca pe o harta de biti independenta de dispozitiv. Formatul DIB include o paleta de culori si stocheaza datele imaginii într-o maniera standard pentru a face fisierul imagine independent de dispozitiv. Formatul Windows BMP poate stoca imagini folosind 1 (monocrom), 4 (16 culori), 8 (256 culori) sau 24 (16 milioane de culori) de biti pe pixeli. Formatul BMP nu este la fel de eficient ca PCX si alte formate, dar interpretarea fisierelor BMP este relativ usoara.

-Formatul pe 24 de biti Truevision Targa provine de la adaptoarele de ecran de înalta performanta pentru PC-uri Truevision. Exista câteva tipuri diferite de fisiere Targa. Cea mai populara este versiunea cu 24 de biti pe pixel care foloseste 8 biti pentru fiecare dintre componentele R, G si B. Acest format poate stoca fisiere imagine cu pâna la 16 milioane de culori. Totusi, dimensiunea fisierului pentru o imagine pe 24 de biti este foarte mare - o imagine 640 x 480 pe 24 de biti necesita 3 x 640 x 480 = 921600 octeti, adica aproximativ un 1Mb.

-TIFF, sau Tagged Image File Format a fost dezvoltat în colaborare de Microsoft Corporation si Aldus Corporation ca un format flexibil, independent de sistem, pentru stocarea de imagini monocrome pâna la imagini cu culori pe 24 de biti. Multe programe de tehnoredactare computerizata si procesoare de texte pot citi si folosi imagini TIFF. În plus, toate scannerele dispun de programe de control care pot salva imagini în formatul TIFF.

-GIF sau Graphics Interchange Format a fost dezvoltat de CompuServe pentru stocarea într-o forma compacta a imaginilor cu pâna la 256 de culori. Fisierele GIF stocheaza imagini folosind schema de compresie LZW (denumita astfel dupa autorii ei, Lempel-Ziv-Welsh).

-JPEG (Joint Photographers Expert Group) este cel mai utilizat format de imagine în reteaua Internet. Este un format comprimat de imagine ceea ce îi confera avantaje extrem de mari în comparatie cu celelalte formate de imagine.

6.2.1.5. Metode de compresie a imaginilor

Metodele de compresie ale imaginilor faciliteaza comunicarea rapida între diferite sisteme pe baza imaginilor, precum si stocarea lor în vederea unei utilizari ulterioare. În ultimii ani s-a trecut la standardizarea procesului de compresie a imaginilor în vederea utilizarii imaginilor în diverse aplicatii de prelucrari de imagini.

Prin rata de compresie, Cr întelegem raportul dintre cantitatea initiala de date necompresate si cantitatea de date compresata.

Exista metode de compresie a imaginilor care conduc la degradarea informatiilor în momentul decompresiei lor, functie de gradul de compresie ales (lossy compression). Aceste metode duc la pierderea informatiilor neesentiale si redundante. Ratele de compresie sunt relativ mari necesitând însa algoritmi mai complicati si mai multe calcule. Aceste metode pot fi folosite la imagini care urmeaza doar sa fie vizualizate, omul nesesizând pierderile.

Exista si metode de compresie a imaginilor, metode care nu duc la degradarea informatiilor (lossles compresion) prin refacerea lor prin decomprimare, însa eficienta acestor metode este relativ scazuta fiind tot mai putin folosite. Un sistem care suporta compresia datelor trebuie sa contina in configuratia sa un codor si un decodor (Figura 6.7.).

Figura 6.7. Sistem care suporta compresia datelor

Cele mai importante trei standarde de compresie de imagini (care s-au impus în mod deosebit la început în domeniul compresiilor de date) sunt:

- JPEG (Joint Photographic Experts Group), utilizat în cazul imaginilor statice. Codorul JPEG converteste imaginea într-o reprezentare de frecventa spatiala folosind o transformare DCT (Discret Cosine Transform) 2D.

- MPEG (Moving Pictures Expert Group), utilizat în cadrul imaginilor în miscare, cu diverse variante care s-au dezvoltat în ultimii ani. Codorul MPEG este mult mai complex decât codorul JPEG. Acest codor cauta sa faca o predictie asupra evolutiei unei imagini, printr-un estimator de miscare, transformând si codificând apoi diferenta între imaginea prevazuta si imaginea în sine. Predictia imaginilor poate fi facuta pe baza imaginilor viitoare precum si pe baza celor trecute. Astfel codorul trebuie sa reordoneze imaginile punând imaginea de referinta înaintea celor prevazute. Decodorul pune imaginile înapoi într-o ordine de afisare corecta.

- P*64 , reprezinta standardul CCITT H.261, ca si codor/decodor în videotelefonie. Codorul P*64 codifica de asemenea imagini prevazute a fi eronate, dar care trebuie sa le ia asa cum vin. Poate alege între o imagine curenta si una prevazuta cu ajutorul unui sistem " block-by-block". Predictia codorului este bazata în mod normal pe acelasi bloc al imaginii precedente, codorul putând include ca si optiuni un estimator de miscare, precum si un filtru.

Alte considerente referitor la compresia imaginilor

Compresia este necesara stocarii si transmisiei imaginilor deoarece reduce marimea lor. Stocarea este esentiala în mai multe domenii, unul important fiind tehnica video digitala, în timp ce transmisia de imagini se întâlneste la retelele de telecomunicatii , teleconferinte, etc.

Exista mai multe criterii dupa care metodele de compresie pot fi judecate, si anume:

- timpul necesar comprimarii/decomprimarii - acest criteriu este important mai ales în transmisiile în timp real, cum ar fi videoconferintele

- gradul de conservare al imaginii

- costurile impuse de algoritmii alesi si resursele de calcul

- standardul de compresie utilizat, daca este sau nu universal pentru a putea fi utilizat si de catre altii.

Metodele de compresie

Metodele de compresie sau codare a imaginilor se împart în doua categorii:

- codarea predictiva

- codarea prin transformari.

Codarea predictiva exploateaza redundanta existenta în imagine, în vreme ce codarea prin transformari realizeaza modificarea structurii de date a imaginii într-o alta matrice, astfel ca o mare cantitate de informatii este impachetata într-un numar mai mic de esantioane.

Exista algoritmi care combina aceste categorii. În primul caz este vorba, mai bine zis, de o codificare decât o compresie si permite reconstructia imaginii initiale. Aceasta codificare este utilizata mai ales în transmisiile de imagini. Se bazeaza pe asemanarea (diferenta) dintre pixelii unei imagini astfel ca se folosesc un numar mai mic de biti pe pixel pentru a memora ceea ce au comun acesti pixeli. Viitoarea abordare a compresiei de imagini este de a utiliza algoritmi predictivi, care examinând mai multi pixeli precedenti anticipeaza si stocheaza diferentele dintre acestia.

RLE (Run Length Encoding) este una din metodele cele mai simple de compresie fiind folosita în cazul în care avem date care se repeta (zone din imagine care au aceeasi valore a pixelilor). Astfel, secventa de caractere:

AAAABBBBBCCCCCCCCDEEEE

devine,

4A5B8C1D4E

si deci, în acest caz:

Cr = 22/10 = 2.2

În cazul în care zona care urmeaza a fi codata nu este repetitiva, metoda este foarte ineficienta putând duce chiar la factori de compresie subunitari. De aceea metoda RLE va pastra aceste zone nemodificate si deci necodate, urmând a fi codate doar zonele repetitive, lucru ce va fi precizat printr-un caracter special. Astfel secventa:

ABCDDDDDDDDEEEEEEEEE

ar deveni ,

ABC+8D+9E

Formatul PCX foloseste metoda RLE de compresie pe planele separate ale imaginii. Metoda se preteaza imaginilor specifice desenelor animate si nu imaginilor naturale.

O metoda care da rezultate mai bune foloseste mai putini biti pentru a reprezenta datele ce apar mai fercvent si cele ce apar mai putin frecvent necesita mai multi biti. Aceasta codare de lungime variabila reprezinta ideea codarii Huffman. Aceasta metoda furnizeaza o densitate mai mare a datelor decât tehnicile de codare de lungime fixa. Lungimea datelor codate este invers proportionala cu frecventa datelor. Se aseamana cu tehnica Morse care foloseste mai putine linii si puncte pentru literele care apar mai frecvent. Codarea Huffman necesita doua treceri, prima determina frecventa caracterelor, a doua face compresia. Se pot folosi tabele fixe care nu vor duce la compresii optimale dar vor avea o singura trecere. Exista si alte metode de compresie cum ar fi Huffman modificat utilizata pentru date de la fax-uri sau metoda READ derivata din Huffman folosita pentru imagini alb-negru inclusiv fax-uri. Aceste metode se limitau la codarea unui caracter la un moment dat.

LZW (Lempel Ziv Welch) este un algoritm care permite codarea unor siruri de caractere folosind tabele de codare existând si alti algoritmi care permit aceasta codare.

Standardul JPEG (Joint Photographers Expert Group) reprezinta efortul colaborarii între CCITT (International Telegraph and Telephone Consultative Committee) si ISO (International Standard Organization).

Acest standard defineste trei sisteme diferite de codare:

- un sistem de codare de baza cu pierderi, care este bazat pe transformata DCT si este adecvat pentru o gama larga de aplicatii,

- un sistem de codare extinsa pentru aplicatiile de precizie înalta sau reconstructie progresiva fara pierderi,

- un sistem de codare cu pierderi mai mici pentru conversia reversibila.

Modul de compresie progresiv JPEG se obtine prin realizarea unui set de subimagini si fiecare subimagine va fi codata cu un set specific de coeficienti DCT. Compresia progresiva JPEG poate fi obtinuta folosind trei tipuri de algoritmi: un algoritm progresiv de selectie spectrala, un algoritm progresiv de aproximari succesive si un algoritm progresiv combinat.

Standardul JPEG permite si folosirea unor algoritmi de compresie fara pierderi, respectiv un algoritm de compresie predictiva în locul transformarii DCT.

Compresia ierarhica JPEG permite o reprezentare progresiva a imaginii decodate, într-un mod similar cu algoritmul progresiv, dar permite în plus fata de acesta, imagini codate cu rezolutii multiple. JPEG nu specifica un format de fisier fiind considerat doar printr-un flux de biti. Sunt mai multe formate de imagini care memoreaza imagini JPEG cele mai folosite fiind JFIF si JPEG pentru TIFF 6.0.

Standardul H.261 este dezvoltat pentru aplicatii de telecomunicatii video. Deoarece acestea sunt în general aplicatii care nu implica modificari importante ale continutului cadrelor succesive datorate miscarii obiectelor din imagine, algoritmul folosit limiteza strategiile de cautare si estimare a miscarii, în scopul obtinerii unei rate de compresie cât mai ridicate. Folosind acest standard se pot atinge rate de compresie între 100:1 si 2000:1.

Compresia fractalica, este o metoda diferita de compresie prin care se memoreaza instructiuni sau formule de creare a imaginilor. De aceea metoda este independenta de rezolutie, imaginile putând fi scalate la o rezolutie mai mare decât imaginea originala.

Fractalii sunt imagini compuse din imagini mai mici. Metoda permite rate de compresie de peste 100 fiind considerata o metoda asimetrica. Aceasta metoda duce la un timp mare de compresie dar decompresia este rapida. Compresia fractalica încearca sa gaseasca relatiile din imagine care leaga imaginile mai mici prin formule matematice. Decompresia tine cont de aceste formule si da rezultate foarte bune pornind practic de la ori ce set de date, practic contând relatiile matematice si nu imaginile. Cu cât codarea este mai buna ea este mai lenta si decodarea oferind imagini de calitate superioara.

Compresia Wavelet, se aseamana cu cea DCT, care însa este limitata la utilizarea functiei cosinus. Wavelet foloseste functii mai simple, complexitatea calculelor scazând fara însa a sacrifica major calitatea imaginii obtinute.

Compresia holografica este o noua metoda care se bazeaza pe o reprezentare frecventiala 3D a imaginilor. Metoda este în curs de elaborare. Rezultatele pe care le ofera par sa fie spectaculos de bune.

In cadrul imaginilor dinamice initial au existat standardele Apple Qucktime si Microsoft Video for Windows, VfW. Actualmente Microsoft încearca sa introduca standardul DirectX respectiv Direct Shaw un standard mai flexibil si mai eficient.

In acest caz se utilizeaza variate metode de compresie si decompresie, denumite CODECs (Compressor DECompressor).

Standardul de compresie MPEG (Motion Picture Experts Group) a fost propus pentru aplicatii video care se caracterizeaza prin modificari importante între doua cadre succesive, datorate miscarii obiectelor din imagine. Metoda de compresie utilizeaza un algoritm de codare intercadre si poate realiza o compresie de pâna la 200:1 prin memorarea numai a diferentelor dintre cadre succesive. Totodata standardul MPEG prevede si compresia unui canal audio cu rata de 5:1 pâna la 10:1. Se bazeaza pe similitudinea unor blocuri de pixeli al unor imagini succesive transmitând doar 2 frame-uri pe secunda, restul fiind informatie codificata ca diferenta dintre frame-uri prin asa numitele keyframe-uri. Standardul MPEG este în continua dezvoltare, actualmente folosindu-se cu precadere MPEG4.

6.2.2. Analiza modulului de ameliorare a imaginilor

Modulul de ameliorare (preprocesare) a imaginii urmareste restaurarea imaginii numerice degradate de diversi factori cum ar fi: zgomote, defecte de iluminare, miscarea sau defocalizarea imaginii, etc.

Preprocesarea imaginii se efectueaza înaintea operatiei de analiza efectiva a ei. Preprocesarea imaginilor are ca scop eliminarea erorilor aparute în cursul procesului de achizitie, erori cauzate de procesul de conversie a semnalului video analogic în semnal digital sau datorate parazitilor indusi aleator pe calea de achizitie a semnalului analogic.

6.2.2.1. Restaurarea imaginilor digitale

Corectarea (restaurarea) imaginilor digitale se refera la înlaturarea sau minimizarea degradarii cunoscute într-o imagine. Orice imagine achizitionata prin mijloace optice, electro-optice sau electronice este degradata într-o anumita proportie. Degradarea se poate datora zgomotului, proastei focalizari a camerei, miscarii relative obiect-camera, etc. Restaurarea se face prin filtrarea efectelor degradarii.

Reducerea zgomotului unei imagini se poate realiza prin înlocuirea unui pixel cu media lui si a vecinilor lui pe o regiune variabila si este cu atât mai eficienta cu cât regiunea este mai mare (filtru de mediere), insa astfel imaginea apare mai încetosata. Acesta metoda de a reduce zgomotul unei imagini îmbunatateste calitatea imaginii, însa se repercuteaza asupra rezolutiei imaginii.

O alta metoda este cea a filtrului Olympic; pe o anumita zona se elimina pixelii cu valori extreme ale intensitatii luminoase ale pixelilor vecini si pe urma se face o medie a pixelilor ramasi, însa rezultatele metodei nu sunt bune deoarece imaginea ramâne încetosata si zgomotul nu este eliminat în totalitate.

Filtrul median este utilizat mai ales pentru a elimina zgomotul produs de pixelii care sunt distrusi sau lipsesc din imagine, înlocuindu-i cu valoarea de mijloc (ca pozitie) a pixelilor învecinati care sunt ordonati în functie de intensitatea luminoasa.

Eliminarea zgomotelor se poate face apelând si la unii operatori ai morfologiei matematice. Eroziunea si dilatarea imaginilor de intensitate, este o metoda de filtrare care utilizeaza minimul si maximul valorilor intensitatilor luminoase. Astfel, valoarea pixelului cu cea mai mare intensitate luminoasa în fiecare regiune este utilizata pentru a înlocui valorile originale ale pixelilor. Ca si operator morfologic în vederea îmbunatatirii imaginii se mai poate folosi si operatorul top hat. Acest operator înlocuieste supradenivelarile cu valori medii sau mediane luate din marginea top hat.

Entropia maxima poate fi utilizata si ea în procesul îmbunatatirii imaginilor. Imaginile contin alte defecte cum ar fi încetosarea datorata miscarii obiectului sau focalizarea defectuoasa. În aceste conditii se vor aplica filtrele inverse. Acestea sunt utile pentru corectarea semnalului de intrare anticipând degradarile cauzate de sistem.

Cresterea contrastului este operatia prin care se imbunatateste vizibilitatea structurilor unei imagini. Pixelii intunecati din imagine devin negri, cei deschisi devin albi, iar cei gri din imaginea originala iau valori noi care sunt interpolate liniar între negru si alb. Reasignarea valorilor pixelilor din imaginea originala creste contrastul vizual al pixelilor prezenti dar nu creste abilitatea de a discrimina variatii subtile în nuantele de gri.

6.2.2.2. Imbunatatirea imaginilor

Exista metode care cresc vizibilitatea unei portiuni a imaginii, a unui aspect sau a unei componente a imaginii, scopul fiind de accentuare a anumitor caracteristici (contrast, contururi), etc., (pentru analiza sau redarea acestora fara modificari de date din structura imaginilor). Având în vedere utilitatea lor practica în toate aplicatiile legate de prelucrari de imagini, aceste metode sunt extrem de importante.

Din punctul de vedere al algoritmului utilizat pentru îmbunatatirea imaginii se disting patru categorii mari de tehnici de îmbunatatire:

Operatii punctuale: marirea contrastului, atenuarea zgomotului, operatiuni de tip fereastra (transformari, pseudocolorari, etc.) si atenuarea imaginii prin histograme;

Operatii spatiale (pe arii): filtarea de zgomot, filtrarea mediana, tehnica de "zooming" a imaginii, alte tipuri de filtrari;

Operatii de tranformare a imaginilor: filtrarea liniara, filtrarea de tip radical sau filtrarea homomorfica;

Operatii de pseudocolorare între care se disting tehnicile de colorare si pseudocolorare a imaginilor, Look Up Table (LUT).

Modificarea de contrast este necesara mai ales în cazul imaginilor cu contrast mic datorat iluminarii slabe, aceasta trasformare îmbunatateste vizibilitatea pixelilor de amplitudine mica fata de pixelii de amplitudine mare.

Negativarea imaginilor sau inversarea acestora este utilizata mai ales în medicina, imaginile fiind mai usor de interpretat.

Histogramele sunt reprezentarea frecventei de aparitie a diferitelor nivele de gri într-o imagine. Egalizarea histogramelor modifica intensitatea luminoasa a pixelilor permitând astfel evidentierea unor detalii în anumite arii.

Amplificarea Laplaciana accentueaza contururile mai ales cele liniare, permitând interpretatea mai usoara a imaginilor.

Scaderea imaginilor este utila când este necesara compararea a doua imagini complexe cu elemente având însa deosebiri relativ mici între ele.

În ceea ce priveste marirea si interpolarea imaginilor (zoom-ul) exista mai multe modalitati ca: dublarea imaginii, interpolarea liniara sau bazata pe alte metode. În cazul dublarii imaginii fiecare pixel de-a lungul unei linii si fiecare linie este repetata. Interpolarea liniara este o multiplicare a imaginii la care pixelii care se intercaleaza pot fi media aritmetica a pixelilor vecini din imaginea originala. Aceasta transformare este necesara pentru a vizualiza si masura anumite detalii din imagine.

6.2.2.3. Operatii specifice modulului de ameliorare a imaginilor

O prima metoda specifica preprocesarii de imagini o constituie corectia optica.

a) Corectia optica urmareste:

- pastrarea în timp a nivelului de gri al obiectului de analizat în conditii de achizitii multiple de imagini,

- eliminarea imperfectiunilor sistemului optic,

- accentuarea contrastului în imaginea achizitionata.

b)Histograma este functia care asociaza la fiecare nivel de gri un anumit numar de pixeli având acest nivel de gri din imaginea analizata.

La reprezentarea ei grafica, pe axa x sunt trecute intensitatile disponible ale pixelilor, iar pe axa y sunt trecute numarul de aparitii pentru fiecare intensitate.

Figura 6.8. Histograma unei imagini

Imaginile întunecate au histograma grupata în partea stânga, cele luminoase o au grupata în partea dreapta, iar imaginile complet luminate au histograma în toata plaja de distributie.

De obicei, histograma este folosita pentru identificarea simpla a obiectelor, obiectele similare având de obicei intensitati similare.

De asemenea, vârfurile si vaile permit separarea obiectelor de intensitati diferite din imagine, vaile permitând definirea pragurilor de separare.

c)Egalizare de histograma - imaginile care nu au o distributie uniforma a intensitatilor pot fi modificate, fara însa a le uniformiza. Intensitatile se vor redistribui astfel încât, daca histograma initiala avea vârfuri si vai si dupa egalizare se vor pastra, dar vor fi shiftate (deplasate). Practic, histograma va fi întinsa (împrastiata).

Egalizarea histogramei se efectueaza în urmatorii pasi:

1). se calculeaza histograma obtinând un vector de 256 de elemente (pentru o imagine cu 8 biti/pixel)

2). Se calculeaza suma normalizata a histogramei, obtinând tot un vector de 256 de elemente, astfel:

-elementul 0 este neschimbat,

-elementul 1 va fi suma dintre elementul 1 si 0,

-elementul 2 va fi suma dintre elementul 2, 1 si 0,

-elementul 255 va fi suma dintre elementul 255, 254, . 1 si 0.

Aceste valori vor fi apoi normalizate, înmultind fiecare element cu:

În acest mod (ajustând la cel mai apropiat întreg) se obtine un LUT care poate fi folosit pentru pasul urmator.

3). se modifica imaginea în imaginea destinatie, folosind acest LUT.

Egalizarea histogramei lucreaza cel mai bine pe imaginile care au detalii fine în zona întunecoasa.

d)Specificarea histogramei - egalizarea histogramei aproximeaza o histograma, relativ uniforma, dar uneori se doreste întunecarea sau iluminarea ei, sau marirea contrastului. În aceste cazuri se foloseste specificarea histogramei, care necesita:

-o imagine ca intrare,

-o histograma dorita.

Ea se efectueaza astfel:

-se egalizeaza histograma imaginii originale,

-se determina inversa histogramei egalizate pornind de la imaginea egalizata si histograma dorita.

Figura 6.9. Specificarea de histograma

Determinarea inversei histogramei egalizate necesita sa generam LUT corespunzator histogramei dorite si apoi sa calculam transformarea inversa a LUT. Acesta transformare inversa este calculata analizând iesirile lui LUT. Cea mai apropiata iesire pentru o intrare particulara devine valoarea inversa.

e)Normalizrea imaginii (extinderea contrastului, contrast stretching) - asa cum am aratat, contrastul unei imagini este dat de distributia pixelilor luminosi si întunecosi.

Imaginile cu contrast scazut au histograme în care pixelii sunt concentrati la stânga, la dreapta sau în mijloc. Practic, se foloseste un domeniu redus de valori din histograma.

Imaginile care au contrastul mare au regiuni largi de intensitati închise si luminoase. În general, imaginile de contrast ridicat au doua vârfuri mari, unul în zona inferioara, iar celalalt în zona superioara.

Normalizarea este aplicata la o imagine pentru a extinde histograma astfel încât sa umple tot domeniul dinamic al imaginii. Este utilizata pentru a îmbunatati imagini de contrast redus, lucrând cel mai bine pe imagini care au o distributie Gaussiana sau aproape Gaussiana.

Exista doua metode de normalizare:

-normalizarea de baza (basic contrast stretching)

Aceasata lucreaza bine pe imaginile care au toti pixelii concentrati într-o parte a histogramei. Metoda va expanda histograma imaginii astfel încât sa fie acoperit tot domeniul pixelilor.

Relatia de transfer este:

unde low si high reprezinta extremele domeniului de expandare.

-ends-in-search

Aceasta metoda lucreaza pentru imaginile care au toate intensitatile, dar au o concentrare de pixeli într-o parte a histogramei. În acest caz, relatia care permite calculul LUT pentru transfer este:

f)Transformarea intensitatii - are rolul de a converti un pixel vechi într-unul nou folosind o functie predefinita. Aceste transformari sunt implementate cu LUT. Se prefera o reprezentare grafica (pe x, valorile pixelilor originali, iar pe y valorile pixelilor de iesire).

Ca si transformari avem:

-transformare null → pixel_nou = pixel_vechi

-negativare → se vor negativa valorile

-corectie gama → iesire = intrare ^1/γ

care este folosta la compensarea raspunsurilor neliniare.

Pentru:

γ < 1.0 → curba exponentiala,

γ = 1.0 → null,

γ > 1.0 → curba logaritmica.

Monitoarele RGB au γ cuprins între 1.4 si 2.8.

g)O alta metoda utilizata în preprocesarea imaginii o reprezinta netezirea (filtrarea) imaginilor. La achizitia oricaror semnale de frecventa înalta peste semnalul dat apare o componenta de zgomot. Acest zgomot daca nu este înlaturat, poate influenta negativ analizele ulterioare.

În cazul procesarii imaginilor, un accent important s-a pus pe gasirea unui filtru care sa înlature zgomotul alb (datorat componentelor aleatoare de înalta frecventa a semnalului video digitizat). Aceste zgomote apar în câmpul imaginii sub forma unor pixeli izolati cu nuante mult diferite de nuanta pixelilor înconjuratori si poarta numele de zgomot sare si piper.

De remarcat ca pierderea frecventelor înalte din imagine poate duce si la pierderea unor detalii semnificative pentru procesul de recunoastere. De aici rezulta ca alegerea filtrului este deosebit de importanta.

Netezirea imaginilor poate fi realizata cu:

1. filtre spatiale liniare - aceste filtre se caracterizeaza prin raspunsul lor impulsional h(m,n) caz în care filtrarea unei imagini f(i,j) se obtine prin convolutie discreta:

Daca limitele m si n sunt finite, filtrul este cu raspuns impulsional finit (RIF), în caz contrar avem filtre cu raspuns impulsional infinit (RII). Cele mai utilizate filtre sunt de tip RIF, de dimensiune redusa (3 x 3) din cauza procesoarelor de convolutie specializate.

Convolutia - este folosita în procesarea de imagini pentru:

-netezire (smoothing)

-accentuare a contrastelor (crispening)

-detectie de contur, etc.

În principiu, convolutia reprezinta o suma ponderata de pixeli preluati din vecinatatea pixelului curent, suma utilizata pentru a determina noua valoare a pixelului central.

Ponderile sunt determinate de o matrice relativ mica (3 x 3, 37 x 37) numita matrice masca, nucleu de convolutie. În general dimensiunea este impara, putându-se astfel localiza centrul care va corespunde pixelului de iesire.

Aceasta matrice se va plimba peste toata imaginea initiala, obtinând astfel valorile pixelilor de iesire (vezi Figura 6.10.).

Trebuie avut grija ca la procesarea pixelilor de iesire sa nu stricam valorile celorlalti pixeli, de aceea se prefera ca rezultatul sa fie memorat într-o alta matrice, altfel se obtine un sistem cu raspuns infinit în impuls, ceea ce nu este de dorit.

Daca suma ponderilor din matricea de convolutie este 1, atunci imaginea obtinuta va avea aceeasi intensitate cu cea originala. Daca aceasta suma este 0 (sunt si coeficienti negativi), în mod obisnuit se adauga la valoarea obtinuta o constanta si daca tot se obtine un pixel negativ el va fi setat pe 0.

O alta problema care se pune la convolutie este modul în care sunt tratate marginile imaginii. Pentru aceasta sunt mai multe cazuri:

noua valoare = I0 x M0 + I1 x M1 + . + I7 x M7 + I8 x M8

Figura 6.10. Modul de calcul pentru convolutia imaginii, cazul wrap

-se considera pixelii care nu apartin imaginii ca fiind egali cu 0,

-se porneste convolutia doar din locul în care se suprapune pe imagine,

-dublarea marginilor pentru o matrice de 3 x 3,

-considerarea valorilor în celelalte extremitati (wrap).

Multe masti de convolutie sunt considerate separabile, adica, convolutia poate fi efectuata prin executia a doua convolutii cu o masca unidimensionala.

O functie separabila satisface relatia:

f(x,y) = g(x) x h(y) ,

ele reducând numarul de calcule atunci când se folosesc masti de dimensiuni mari. De exemplu, convolutia cu masca:

poate fi operata prin,

însa economia nu e spectaculoasa (6 înmultiri în loc de 9).

Printre filtrele spatiale liniare amintesc:

Scoaterea în relief (embossing) - se poate obtine cu matricea

dupa convolutie adaugând valoarea 128.

În cadrul imaginilor color exista în general doua tehnici care se aplica:

-lucrul cu imagini HSI, caz în care se lucreaza doar asupra intensitatii, culoarea fiind pastrata (cea mai des folosita),

-lucrul cu cele trei planuri R, G, B, caz care ofera rezultate mai bune, dar e costisitoare ca timp de calcul.

Blurring (contururi neclare)

Reprezinta un filtru trece jos care elimina detaliile fine din imagine. E folosit pentru a simula defocalizarea unei camere, a nu scoate în evidenta fondul, etc.

Tehnica este folosita în domeniul fotografierii când se introduc diverse filtre. Ea se poate realiza cu o masca de convolutie în care toti coeficientii sunt egali:

- la 3 x 3 , toti au valoarea 1/9 caz în care masca h(3,3) este:

fiind un filtru trece jos.

Ca si valori în matricea de convolutie pot avea toti valoarea 1 si în fata folosesc 1/9 sau1/25.

Acest filtru reduce zgomotul Gaussian din imagine nefiind însa eficient pentru zgomotul în impuls, care reprezinta un zgomot cu valori extreme 0 si 255 (zgomot sare si piper). Filtrul elimina zgomotele din imagine, fiind eficace în cazul regiunilor uniforme. El deterioreaza marginile contururilor, efectul lui fiind o usoara defocalizare a imaginii ce poate fi corectata prin deconvolutie.

Medierea micsoreaza contrastul, valorile tinzând sa se alinieze la valori de mijloc.

Pentru blurring se mai foloseste urmatoarea masca:

care se apropie cel mai mult de profilul Gaussian.

Suma coeficientilor este egala cu 1 si deci, intensitatea imaginii de iesire nu este afectata.

Filtrele Gaussiene de netezire sunt de forma:

unde σ controleaza împrastierea efectiva.

Mastile care au valoare mica pentru σ sunt ascutite, iar cele cu σ mare sunt late. σ influenteaza si dimensiunea mastilor. Ele trebuie sa fie suficient de mari ca sa contina toti coeficintii diferiti de zero.

Pentru:

σ = 2.0 este nevoie de o masca de 15x15

σ = 3.0 este nevoie de o masca de 23x23

Pentru 3x3 se folosesc valorile (-1,-1) , (-1,0) , (-1,1) , (-1,0) , (0,0) , (0,-1) , (1,0) , (0,1) si (1,1) pentru coordonatele x si y.

Filtrele trece jos elimina zgomotele, dar contururile devin neclare, de aceea filtrul median este mai eficient.

Sharpening, ascutirea detaliilor are efect opus celui de blurring. Este referita ca accentuarea contrastelor (crispening), dar scotând în evidenta detaliile din imagine. Aceasta tehnica poate fi folosita la restaurarea imaginilor, marind în acelasi timp si contrastul. Matricea de convolutie are un coeficient pozitiv în centru si în general negativi în rest. Ca si masti de convolutie avem:

sau masca

Filtrele trece sus, se pot constitui din doua filtre liniare a caror iesire reprezinta estimarea gradientului din imagine.

Amplitudinea gradientului poate fi estimata cu:

g = max ( |gx | , |gy | )

Orientarea dupa care variatia intensitatii este maxima, este data de:

In cazul discret avem :

D_x f(x,y) = g_x = f(x,y) - f(x-1,y)

D_y f(x,y) = g_y = f(x,y) - f(x,y-1)

Derivata functiei imagine fata de o directie a, este data de:

D_a f(x,y) = g_x cos a + g_y sin a

Operatorul Laplace, este un operator derivativ de ordin par, cu rol de accentuare izotropica. Se defineste ca :

În cazul discret derivatele partiale de ordinul al doilea pe directiile x si y, sunt aproximate prin relatiile:

Nucleul de convolutie este o singura matrice de 3 x 3 care poate fi:

Pentru marirea preciziei se lucreaza cu un nucleu de convolutie de forma:

care sintetizeaza media laplacianului corespunzator axelor originale, cu laplacianul unui sistem de axe ortogonale rotite cu 45^o fata de axele originale, sau cu matricea:

Imaginea accentuata va fi | f(x,y) | .

Filtrele trece sus maresc detaliile dar si amplifica zgomotele din imagine.

2. filtre spatiale neliniare

Aceste filtre se constituie ca o multitudine de metode care depind în general de aplicatia utilizata. Unul dintre aceste filtre îl constituie filtrul median.

Filtrul median înlocuieste valoarea fiecarui punct al imaginii cu valoarea mediana a tuturor pixelilor din vecinatatea punctului ales. Rezultatele sunt foarte bune, însa costul e destul de mare din cauza necesitatii sortarii în fiecare punct. Filtrul elimina zgomotele izolate din regiunile uniforme, pastrând tranzitiile dintre regiuni.

Zgomotul Gaussian este înlaturat de filtrele trece-jos. Zgomotul în impuls este cel mai bine eliminat cu filtrul median.

Filtrul median pastreaza contururile si detaliile si deci frecventele înalte din imagine. Omul este foarte sensibil la frecventele înalte din imagine. Filtrul median consta din suprapunerea si translatarea unei ferestre în general cu un numar impar de linii si coloane. Pixelii din imagine peste care se suprapune fereastra sunt ordonati crescator, iar pixelul din mijloc va fi introdus în locul pixelului curent (cel din mijlocul ferestrei). Ca si fereastra se ia de obicei un bloc patrat impar, dar daca se doresc anumite operatii speciale putem avea:

- filtrul vertical

care elimina zgomotul corelat orizontal, cum ar fi o linie scanata care a disparut.

- daca aplicam un filtru orizontal, atunci pixelul disparut va fi împrastiat în ambele directii. Acest filtru elimina zgomotele care apar în coloane de pixeli.

- se pot alege elemente si în forma de X sau de diamant.

La alegerea unui bloc pentru filtrul median trebuie sa se tina cont de timpul de procesare si de faptul ca un filtru median de latime 3 pixeli elimina zgomotele din imagine de pe o linie, iar un filtru median de latime 5 pixeli, elimina zgomotele din imagine de pe doua linii, s.a.m.d.

Filtrul median poate fi aplicat si în spatiul 3D (2D + timp) mai ales în televiziune, fiind numit filtru median temporal. Se elimina zgomotele de burst (vârf), pastrând de asemenea si miscarea, mai bine decât filtrul temporal clasic.

Se pune problema de a optimiza acest filtru median pentru ca odata ce este aplicat pe o fereastra, în pasul urmator, când se trece la urmatorul pixel, se va modifica doar o coloana. Sunt metode care tin cont de pixelii procesati realizând un algoritm de sortare adaptiv.

Se poate considera si un filtru median separabil. Acest lucru implica, mai întâi filtrarea imaginii cu un filtru orizontal si apoi urmata de o filtrare verticala. Acest lucru va reduce timpul de calcul, sortând 2n numere, fata de n x n = n². Iesirea filtrului separabil este similara cu cea a filtrului neseparabil.

În cadrul imaginilor color, algoritmul de calcul este diferit. Se poate aplica pe fiecare plan R, G, B, si în final se combina cele trei planuri, dar se pierde corelatia dintre componentele lor. O proprietate importanta a filtrului median este aceea ca el nu inventeaza alte valori, în pixelul curent fiind introdus un pixel din imagine ales ca urmare a sortarii. Deci, un pixel obtinut din filtrarea mediana color trebuie sa fie un pixel din imaginea initiala. În cadrul filtrarii mediane color se poate exploata proprietatea ca suma diferentelor dintre valoarea mediana si toate celelalte valori va fi mai mica decât suma diferentelor pentru orice alte valori din multime:

unde: N = 9 pentru un bloc 3 x 3,

y este o valoare arbitrara si x_med este valoarea mediana.

Pe baza acestei proprietati putem însuma diferentele dintre componentele R, G si B. Pixelul având cea mai mica suma va fi considerat ca si iesire a filtrului median.

Pentru a face calculele pentru filtrul median color se porneste cu N elemente aflate în fereastra filtrata. Pentru fiecare pixel color se determina distanta:

unde i reprezinta pixelul procesat si j sunt ceilalti pixeli din fereastra. Valorile x si y din ecuatia precedenta vor fi componentele R, G si B.

x _i =

, va corespunde iesirii filtrului, x_i .

Metoda poate fi folosita pentru ferestre pare si impare, insa cum, traditional, pixelul de iesire este asociat valorii centrale din fereastra, este de preferat ca numarul pixelilor de intrare ai filtrului sa fie impar.

Filtrul minim/maxim este un filtru asemanator cu cel median, doar ca în loc de a înlocui cu valoarea mediana pixelul din centru, el va fi înlocui cu valoare minima sau maxima. Aceste filtre elimina zgomotele impulsionale extreme (minimul elimina vârfurile albe, iar maximul elimina vârfurile negre).

Filtrul minim/maxim poate fi folosit pentru a largi trasaturile din cadrul unei imagini cu contrast ridicat. Acest filtru nu poate elimina zgomotele impulsive mixte atâta timp cât îmbunatatesc vârfurile negative si cele pozitive. O cascada de filtre minim/maxim poate elimina sarea si piperul.

Un filtru maxim urmat de un filtru minim se numeste un filtru de închidere (closing). Un filtru minim urmat de un filtru maxim se numeste un filtru de deschidere (opening).

Filtrul median poate fi usor transformat în filtru minim/maxim.

3. filtrarea temporala a imaginilor

Acest tip de filtru reuseste sa pastreze detaliile fine din imagine fara a deteriora informatia utila din imagine.

Metoda consta în preluarea mai multor cadre ale aceleiasi scene de analizat si medierea rezultatelor. Desi îmbunatatirea este spectaculoasa, ea este aplicabila doar în cazul unor scene statice si necesita un timp destul de mare afectat doar procesului de achizitie.

h) Operatii de adiacenta

Operatiile de adiacenta formeaza structuri din pixelii individuali. Sunt impuse reguli de conectivitate (care din pixelii din vecinatate sunt considerati pentru expansiunea structurii) si de admisie (ce valori ale pixelilor candidati pot fi luate pentru expansiune).

1.Concatenarea reprezinta cel mai simplu exemplu de operatie de adiacenta. Ea poate opera asupra imaginilor binare folosind în general conectivitatea pentru 8 pixeli învecinati. Toti pixelii candidati cu o valoare de 1 sunt admisi. Concatenarea repetata da un obiect.

2.Operatia de înlantuire în cadrul imaginilor binare reprezinta un mod de a obtine conturul unui obiect. Operatia cauta în mod secvential în sensul acelor de ceasornic printre pixelii aflati în adiacenta punctului curent. Primul pixel având valoarea 1 reprezinta urmatorul centru de cautare. Printr-o operatie repetata de înlantuire se obtine conturul ordonat cu conditia ca punctul de start sa fie pe contur.

Cu ajutorul morfologiei matematice se pot extrage dintr-o imagine anumite caracteristici specifice, functie de scopul urmarit prin aplicarea unei succesiuni de operatori adecvati.

O transformare morfologica elementara f este caracterizata prin:

- tipul ei : erodare, dilatare, etc.,

- elementul structural, B,

- iteratorul sau : o constanta n, o limita,

- o masca, în cazul transformarilor geodezice.

Morfologia matematica a fost dezvoltata si pentru cazul digital în vederea utilizarii în cadrul aplicatiilor de prelucrari de imagini. Exista operatori definiti în cazul imaginilor binare precum si în cazul imaginilor de intensitate.

Principalii operatori morfologici sunt:

a). Dilatarea

Daca notam:

- X ansamblul de puncte (albe) din imagine marcate cu 1 ce reprezinta obiectul, fondul fiind marcat cu 0,

- B, un ansamblu de puncte, numite element structural. Unul din punctele elementului structural yo, e numit centrul lui B, celelalte puncte fiind numite marcatoare,

- By reprezinta translatarea lui B cu y, yo = y,

- B' simetricul lui B fata de originea reperului,

atunci, dilatarea lui X cu B este definita ca :

Y = X + B' ,

ca un ansamblu de puncte

Y =

Operatia de dilatare revine la marcarea (cu alb) a tuturor punctelor interceptate de elementul structural B atunci când centrul elementului structural baleiaza ansamblul punctelor multimii X. Daca elementul structural e o bula (sfera, cerc) dilatarea largeste obiectul cu o grosime constanta.

b). Erodarea

Erodarea lui X cu B este data prin :

Y = X - B'

si reprezinta ansamblul de puncte,

Y = ,

adica Y e formata din punctele y astfel încât elementul structural centrat în y , By, sa fie inclus în X, deci plasând centrul elementului structural pe punctele ansamblului de puncte erodate, toti marcatorii reacopera un punct al obiectului ce a fost erodat..

Daca elementul structural e o bula, erodarea subtiaza obiectul cu o grosime constanta.

Erodarea si dilatarea sunt duale fata de complement,

( X + B')^C = X^C - B',

adica e echivalent a dilata punctele albe sau a eroda punctele negre.

Erodarea si dilatarea reprezinta cazuri speciale ale operatorilor de votare. Votarea majoritara sau minoritara admite pixelul daca un set de pixeli din conectivitate are valoarea 1. Daca setul este 1 peste tot operatia de votare degenereaza la dilatare sau erodare.

c). Deschiderea

Deschiderea este definita ca o erodare urmata de o dilatare,

X = ( X - B') + B ,

reprezentând domeniul B baleiat de toate translatarile lui B incluse în X.

Operatia netezeste contururile, suprima neregularitatile, taie istmurile.

Daca elementul structural este o bula, operatia rotunjeste unghiurile, suprimând unicele regiuni conexe.

d). Închiderea

Inchiderea este definita ca o dilatare urmata de o erodare,

X^B = ( X + B') - B,

unghiurile fiind rotunjite, iar gaurile umplute.

Deschiderea si închiderea sunt duale prin complementaritate:

( X _B)^C = ( X^C ) ^B si ( X^C )_B = ( X^B )^C

Ca si operatii asupra imaginilor, închiderea si deschiderea reduc mult din complexitatea datelor ce reprezinta conturul corpurilor, retinând caracteristicile lor cele mai pregnante.

e). Scheletizarea unei imagini binare

Scheletul unei forme X oarecare poate fi definit ca centrul bulelor maximale incluse în forma. Putem de asemenea considera ca, contururile formelor sunt erodate din exterior pâna când fronturile eroziunilor se reîntâlnesc în puncte care reprezinta scheletul.

Algoritmii morfologiei matematice, prin abstractizare elimina informatia redundanta în sensul scopului, punând în evidenta corpul de analizat.

Cu ajutorul morfologiei matematice se pot extrage din imagine o sumedenie de caracteristici cu o succesiune de primitive adecvate.

Primitivele morfologiei matematice pot fi privite din doua puncte de vedere:

- al continutului matematic si algoritmic, ca si primitive operator, de transformare,

- al efectului pe care îl au asupra imaginii ca si primitive de efect, de criteriu, de caracteristica.

Primitivele se clasifica functie de gradul de selectivitate într-o scara ierarhica, complexitatea crescând cu selectivitatea.

Operatorii morfologici pentru imagini de intensitate au la baza definirea operatorilor definiti pentru imagini binare, doar ca selectarea valorii care urmeaza a fi înscrisa în imagine ca urmare a unei transformari morfologice se face pe baza unui criteriu de minim sau maxim, aplicat asupra pixelilor din vecinatatea de lucru.

Prin operatiile de adiacenta definite pentru imaginile de intensitate se poate obtine o mai mare flexibilitate.

6.2.3. Procesarea geometrica a imaginilor

Acest mod de procesare modfica arnjamentul pixelilor pornind de la unele transformari geometrice. Ideea consta doar din deplasarea pixelilor în cadrul imaginii astfel încât în mod ideal valorile sa nu fie modificate. El poate fi efectuat atât în etapa de preprocesare cât si în cea de analiza a imaginilor.

Daca acest proces se refera la un pixel a carui localizare nu exista, atunci el va fi generat. Aceasta generare se numeste interpolare. Interpolarea nu este un proces geometric, dar este utilizata de multe transformari geometrice.

a). Inverse mapping

În cazul în care se utilizeza transformari geometrice asupra imaginilor, deseori se folosesc coordonatele imaginii destinatie pentru a genera coordonatele imaginii sursa. Acest proces se numeste "potrivire inversa" (inverse mapping).

b). Forward mapping

Procesarea punctuala permite transferul unui pixel de intrare de coordonate (x,y) în unul de iesire printr-un proces numit "potrivire înainte" (forward mapping). La aceasta potrivire apar doua probleme:

-gaurile (holes) reprezinta pixeli nedefiniti, pixelii destinatie neavând corespondenta în sursa,

-suprapunerile (overlaps) apar atunci când doi pixeli de intrare se potrivesc pe acelasi pixel de iesire.

c). Interpolarea

Din cauza potrivirii putem avea anumite probleme. Fie transformarea:

Pixelul de la destinatia [0][0] va porni de la sursa [0][0]. Pentru destiantia [1][1] sursa ar trebui sa fie [0.5][0.5], pixel care, însa, nu exista în imagine (doar la rezolutie subpixel).

Interpolarea reprezinta procesul generarii de valori ce pot apartine între pixeli, deci pentru domeniul subpixel. Ea genereaza un pixel nou analizând pixelii din jur, astfel încât sa poata face o asociere cât mai corecta în functie de transformarea dorita si de pixelii din jur.

Functia de interpolare este dependenta de aplicatia dedicata, astfel încât cu cât procesul de interpolare este mai sofisticat, procesul de calcul va fi mai complicat si mai lung.

Principalele tehnici de interpolare sunt:

-interpolarea bazata pe cel mai apropiat vecin, pixelul fiind asignat pixelului cel mai apropiat adresei nou generate, ca si pixel de iesire. Adresele fractionare calculate pentru pixelii sursa vor fi rotunjite la cel mai apropiat pixel, valid ca adresa.

-interpolarea biliniara, noul pixel generat fiind o sursa ponderata a patru pixeli, cei mai apropiati. Ponderile sunt direct proportionale cu distanta de la fiecare pixel existent. Sunt necesare trei interpolari liniare pe pixel rezultând o imagine mai neteda (smoother) decât la metoda precedenta.

-interpolare de nivel înalt, foloseste zone mai mari pentru pixelii din vecinatate in vederea generarii pixelului de iesire. La acest nivel avem tehnicile de interpolare cubice si B-spline care folosesc saisprezece pixeli vecini pentru a genera pixelul de iesire. Principiul se bazeaza pe convolutia unidimensionala. Convolutia unidimensionala cubica este data de relatia:

cu valori pentru a:

- 0.5 pentru precizie aritmetica mare,

- 0.75 si

- 1.0 pentru vizualizare buna.

În procesul de calcul se impun optimizari pentru a creste viteza de calcul.

Functia ideala de interpolare reprezinta un filtru trece jos, în acest caz interpolarea B-spline oferind un rezultat foarte bun. Functia este strict pozitiva, oferind netezirea cea mai buna. Functia unidimensionala B-spline este data de relatia:

d). Scalarea imaginilor

Scalarea permite modificarea anumitor dimensiuni dintr-o imagine. Procesul prin care o imagine sau o portiune din imagine este scalata se numeste:

-magnificare

-scaling up

-zooming

-upsampling

-stretching, daca se face prin marire, respectiv:

-shrinking

-scaling down

-decimare

-downsampling

-minificare, daca se face prin micsorare.

Prin scalare nu se va îmbunatati rezolutia pentru ca nu sunt mai multe date decât cele capturate. Prin interpolare se mai pot genera noi valori, dar ele, practic, vor altera imaginea originala.

Scalarile se fac având ca referinta imaginea originala, imaginea rezultata va fi modificata tinând cont de anumiti factori de scala, iar daca se revine la marimea initiala, noua imagine va fi deteriorata fata de cea originala datorita procesului de interpolare.

În principiu, scalarea este un proces simplu:

-magnificare - repetari de pixeli, în functie de metoda de interpolare aleasa,

-shrinking - duce la posibilitatea pierderii detaliilor fine din imagine.

De aceea pot fi folosite diverse tehnici, cum ar fi:

-reprezentarea mediana a unui bloc de pixeli, care înlocuieste blocul cu valoare lui mediana,

-reprezentarea medie a unui bloc de pixeli, care înlocuieste blocul cu valoare lui medie, etc.

e). Rotatia imaginii

Rotatia imaginii se face centrat la un pixel sau la origine, cu un unghi dat α, pe baza relatiilor:

x_sursa = x_destinatie·cos α + y_destinatie·sin α

y_sursa = y_destinatie·cos α - x_destinatie·sin α,

referitor la origine.

Aceasta relatie roteste imaginea raportat la punctul (0,0), dar daca imaginea este centrata în (x_centr,y_centr), relatia devine:

x_sursa = (x_destinatie - x_centr)·cos α + (y_destinatie - y_centr)·sin α

y_sursa = (y_destinatie - y_centr)·cos α - (x_destinatie - x_centr)·sin α

f). Translatia

Consta din deplasarea unei sectiuni a imaginii la o alta locatie în imagine. Este posibil ca destinatia sa se suprapuna peste sursa si în acest caz trebuie memorate aceste valori pentru a evita distrugerea imaginii.

g). Oglindirea

Reprezinta oglindirea imaginii dupa axa Ox sau Oy. Oglindirea orizontala se face dupa axa Oy, iar oglindirea verticala se face dupa axa Ox. Practic, pixelii vor fi reorganizati, neefectuându-se nici o operatie de transformare.

6.2.4. Procesarea pe cadre

Implica considerarea a doua sau mai multe imagini, imaginea de iesire obtinându-se ca urmare a unei operatii care se efectueaza între mai multe imagini.

Principalele operatii care se efectueaza sunt:

-adunarea,

-scaderea,

-operatii logice (sI / SAU),

-media.

a)Adunarea

De obicei nu se face adunare simpla pentru ca poate sa apara depasire. De aceea se foloseste relatia:

Noul_pixel = α · pixel1 + (1 - α)· pixel2

Astfel, α poate fi specificat astfel încât una dintre imagini sa fie predominanta.

b)Scaderea

Este folosita pentru a determina diferentele dintre imagini, folosita mai ales în procesul de supraveghere. În acest caz se considera un prag care declanseaza alarma (algoritmii mai complicati se ghideaza si în functie de stralucire, etc.).

c)Operatii logice

Operatia AND (sI)se foloseste pentru a masca o parte din imagine.

Operatia OR (SAU)este folosita pentru a adauga parti dintr-o alta imagine peste imaginea initiala.

d)Media

Practic, reprezinta filtrul temporal si deci imaginile trebuie sa fie statice.

Media elimina doar zgomotele necorelate.

6.2.5. Modulul de segmentare a imaginilor

Etapa de separare respectiv detectare a corpurilor din câmpul imaginii are ca efect o reducere importanta a volumului informatiilor prin definirea indicilor de imagine care poseda o semnificatie. Distinctia dintre fond si obiect, numita segmentare, poate fi facuta prin punerea în evidenta a zonelor de variatie rapida a intensitatii luminoase.

În cazul unei imagini de intensitate, procesul de segmentare depinde de geometria obiectelor, reflectanta suprafetei vizibile, iluminarea scenei si originea captorului.

Segmentarea se poate face în mai multe moduri:

- Binarizare - o segmentare care împarte imaginea în doua clase, obiect si non-obiect.

- Extragere de contur - segmentarea care împarte imaginea în zone de contur si non-contur.

Conturul reprezinta zone din imagine a caror valoare a pixelilor variaza într-un mod brusc. Conturul fizic este reprezentat în general prin linii de discontinuitate a suprafetei, margini tangentiale ale suprafetei, limitele umbrelor sau reflectiilor sau linii de discontinuitate date de reflectanta diferita a unor zone.

Pornind de la conturul fizic, conturul unei imagini este dat în general printr-o aproximare prin segmente de dreapta care pot fi considerate indici de imagine.

- Extragere de regiuni - o segmentare care detecteaza regiunile din imagine, ca indici de imagine.

Regiunile reprezinta zone omogene ale imaginii tinând cont de un anumit criteriu cum ar fi, nivelul de gri, culoare, textura, etc.

Formarea regiunilor poate fi facuta printr-un procedeu bazat pe aplicarea pragurilor deduse din histograma imaginii sau prin metode mai complicate cum ar fi cele bazate pe aproximare functionala.

În cazul segmentarii bazate pe intensitate, deseori apar detectate regiuni false. Aparitia regiunilor false este data în general de zgomotul de înalta frecventa si de tranzitia neteda între regiuni uniforme. Rafinarea regiunilor poate fi facuta în mod interactiv sau automat.

Principiile generale ale segmentarii se refera la faptul ca obiectul de interes poate fi gasit prin descoperirea zonelor unde valorile pixelilor sunt omogene si în cazul în care obiectele nu difera apreciabil fata de vecini, trebuie sa ne bazam pe detectia de muchii.

6.2.5.1. Detectia de prag (Thresholding)

Pe baza detectiei de prag putem efectua:

-binarizarea unei imagini, caz în care o imagine de intensitate (cu nivele de gri) va fi convertita într-una alb-negru (binarizare). Aceasta noua imagine trebuie sa contina toate informatiile necesare referitor la numarul, pozitia si forma obiectelor.

-extragere de contur,

-extragere de regiuni.

Utilizarea nivelelor de gri ale pixelilor face ca anumiti pixeli având nivele de gri apropiate sa poata fi împartiti pe baza unei proceduri de clasificare în obiect sau nou obiect.

Detectia de prag, aproape intotdeauna este esentiala înainte de:

-subtierea contururilor (thinning)

-vectorizare

-operatii morfologice, etc.

Cea mai folosita metoda de conversie a unei imagini de intensitate într-una alb-negru este de a selecta un singur prag, T. În acest mod:

-daca I(i,j)<T , I(i,j)=0 , colectia pixelilor negrii

I(i,j) T , I(i,j)=1 , colectia pixelilor albi

Selectia pe baza unui singur prag ne ofera o solutie bruta de segmentare, oferind o solutie globala utilizabila mai ales în cazul în care imaginile se preteaza a fi tratate astfel (documente scanate, imagini simple de test, etc.)

Algoritmii de detectie de prag se pot baza:

-pe histograma imaginii

-pe anumite valori din imagine, etc.

O metoda simpla, dar relativ ineficienta consta din a considera valoarea medie a intensitatilor din imagine ca si prag. Aceasta implica, ca imaginile au aceeasi pondere pentru negru si alb, lucru care nu este realist. În general procentul de negru poate fi constant, dar nu egal cu cel de alb. La o foaie tiparita el variaza în general între 8,46% si 15,67%, în functie de existenta formelor, imaginilor, etc.

În general histograma este cea mai folosita în procesul detectiei de prag. Adesea pragul este considerat a fi punctul cel mai de jos între doua vârfuri semnificative ale histogramei. Daca histograma este doar cu doua vârfuri, aceasta alegere este cea mai buna.

Segmentarea bazata pe prag a imaginilor se bazeaza pe faptul ca o muchie (edge) este data de pixelii care sunt apropiati de contur, între obiect si fond sau între doua obiecte care aproape se ating. Histograma punctelor care constituie muchia este foarte regulata si din acest motiv se pot detecta muchiile pornind de la Laplacian, care este un operator de detectie de muchii nedirectional. Cel mai simplu mod în acest caz este de a folosi un nucleu de convolutie adecvat pentru acest Laplace.

În continuare se vor considera doar acei pixeli care au valori largi ale Laplacian-ului. Acei pixeli care au Laplacian-ul mai mare cu 85% fata de veciniii lor vor fi pastrati în imagine; dupa aceea pragul va fi determinat pornind de la noua histograma a imaginii obtinute.

O metoda de detectie de prag care nu se bazeaza pe histograma considera valoarea medie T_med a intensitatii din imagine ca un prim prag, care apoi este rafinat printr-un proces de selectie iterativ. Urmatorul prag se determina considerând media nivelelor de gri a tuturor pixelilor de la 0 la T_med , T_b , respeciv de la T_med la 255, de unde obtinem T_o . Noua valoare va fi:

Procesul se repeta pâna când nu mai avem o schimbare a pragului. Acest proces poate fi implementat hardware, varianta software se poate implementa mai usor, pornind de la histograma.

La detectia de prag se poate folosi si entropia. Entropia este o masura a continutului informational a unei imagini.

Multimile fuzzy pot fi si ele folosite la detectia de prag, precum si alte diverse metode.

Oricum, procesul de detectie de prag în vederea segmentarii este foarte dependent de natura si calitatea imaginilor utilizate.

6.2.5.2. Detectia de contur (muchii)

Muchiile dintr-o imagine permit izolarea obiectelor, determinarea formei, dimensiunii si anumite informatii legate de textura.

O muchie reprezinta locul în care intensitateta unei imagini se modifica brusc de la o valoare low la o valoare high sau invers.

Sunt multe aplicatii, uneori folosite doar ca si efecte speciale unde iesirea unui detector de muchii se poate suprapune peste imaginea initiala pentru a accentua muchiile.

Detectia de muchii reprezinta cel mai complex element din "procesarea" imaginii, neexistând o metoda universal valabila pentru ca muchiile sunt foarte diverse.

De multe ori se fac diferite experimente pentru a alege cea mai buna tehnica de detectie de contur.

Cel mai simplu si rapid detector de muchii determina valoarea maxima prin scaderea din valoarea pixelului central a celor opt vecini (separat), valoarea de iesire fiind maximul valorii absolute a fiecarei diferente. Acesta este operatorul de omogenitate.

Operatorul diferenta este mai rapid, el facând mai putine operatii, facând scaderi în vecinatate în modul urmator:

Ceilalti detectori globali de contur folosesc unele masti de convolutie si putem avea în acest caz:

a) Operatori derivativi de ordin 1

-Operatorii de tip gradient obisnuit, (sau gradient ortogonal) detecteaza muchii orizontale si verticale. Acesti operatori lucreaza prin convolutie. Mastile cele mai utilizate sunt:

Hr Hc

Roberts

Prewitt

Sobel

Frei - Chen

Amplitudinea poate fi determinata calculând vectorul suma al Hr si Hc:

Orientarea muchiilor poate fi gasita prin:

-Operatorul gradient compass, detecteaza muchii pentru opt orientari diferite. Practic, imaginea va fi convolutionata cu opt masti, iesirea fiind maximul dintre cele opt valori obtinute.

Ceea ce este de remarcat este faptul ca mastile de dimensiune mica sunt senzitive la zgomote.

b) Operatori derivativi de ordin 2

Operatorii gradient au un raspuns larg asupra zonei tratate. Ei sunt buni pentru muchiile care au o rampa lenta.

Detectarea oricarui contur se numeste localizare, dar în general este dificil a detecta conturul muchiilor de câtiva pixeli. De multe ori se foloseste un proces de subtiere (thinning) pentru a reduce latimea muchiilor la un pixel.

Operatori derivativi de ordin 2 ofera rezultate mai bune. De asemenea, contururile obtinute sunt inchise.

Operatorul Laplacian este cel care este untilizat cel mai frecvent fiind prezentat anterior. El va produce muchii mai ascutite decât majoritatea celorlalte tehnici.

Utilizând anumite masti, în imagine apar valori ale pixelilor care duc la o schimbare de semn la muchiile imaginii. Aceste schimbari de semn sunt numite "treceri prin zero" sau zero crossing. Dupa convolutie imaginea trebuie sa fie procesata pentru a detecta aceste treceri prin zero si pentru a seta pixelii de iesire în mod adecvat.

Operatorul Laplace este sensibil la zgomote, si de aceea "trecerile prin zero" indica mai multe muchii decât sunt în realitate. De aceea se foloseste un prag pentru a determina magnitudinea muchiilor care vor fi marcate. De multe ori se prefera folosirea Laplacianului Gaussianului, LOG, care este un operator mai eficient. El presupune, mai întâi, aplicarea netezirii Gaussiene si apoi a Laplacianului. Se poate defini astfel masca:

Functia este numita "filtrul palaria Mexicana".

Primul punct "zero crossing"a lui LOG este la .

De obicei acest operator este folosit cu masti de dimensiuni mari mai mari de 7x7 si de aceea numarul de calcule este foarte mare. Pentru cazul 37x37 se prefera a se folosi o aproximare data de operatorul DoG (Difference of Gaussians):

Practic se va face convolutia cu DoG prin scaderea a doua masti Gaussiene cu valori σ diferite. Raportul σ₁/σ₂=1.6 da o aproximare buna pentru LOG. Un avantaj a lui DoG este abilitatea de a specifica latimea muchiilor de detectat modificând valorile lui σ₁ si σ₂ ; masca de 9 x 9 va detecta muchii mai largi decât masca de 7 x 7.

De asemenea, DoG închide contururile detectate.

c) Filtrul Canny

A fost propus în 1986 de catre John Canny. Acesta propunea ca un detector de muchii este necesar sa satisfaca trei criterii:

-detectie buna,

-localizare buna,

-un singur raspuns la o singura muchie.

Acest filtru se implementeaza considerând urmatorii pasi:

-se face o convolutie a imaginii cu o masca Gaussiana,

-se calculeaza componentele gardientului pentru fiecare pixel,

-se calculeaza directia gradientului pentru fiecare pixel rezultat,

-se calculeaza derivata de ordin 2 în lungul acestei directii a gradientului pentru fiecare pixel,

-se localizeaza valorile de zero în aceasta derivata de ordin 2,

-se clasifica valorile de zero ca puncte de pe contur.

d) Detectia color

Într-o imagine color trebuie vazuta care este diferenta muchiilor. În cazul în care suntem în spatiul HSI (sau unul corespondent), detectia se face tinând cont de canalul de intensitate. În spatiul RGB, detectia de contur se face pe cele trei planuri separate, dupa care, combinând cele trei planuri, rezulta o imagine color segmentata. Cele trei componente pot fi si adunate pentru a crea o scala de gri, sau pot fi adunate vectorial rezultând tot nivele de gri, astfel:

În general majoritatea muchiilor detectate în spatiul HSI se gasesc si in spatiul RGB, deci este suficient a se face detectia pornind de la componenta de intensitate.

În cazul în care avem imagini de contrast scazut, detectia pornind de la intensitate nu este suficienta si atunci se face o detectie tinând cont si de crominanta imaginii.

6.2.6. Modulul de analiza si interpretare a imaginilor

Analiza si interpretarea imaginilor grupeaza doua tehnici principale si fundamentale de abordare:

a) tratari numerice, care permit dupa ameliorarea imaginilor, utilizând diferite tehnici de segmentare, extragerea de caracteristici generale cum ar fi, linii de contrast, segmente si unghiuri de referinta, etc. Algoritmii asociati în acest caz depind într-o mica masura de natura problemei de tratat, ei fiind algoritmi generali de recunoastere de forme.

b) metode de judecata, fondate pe cunostinte explicite precum si pe reprezentarea lor. Cunostintele sunt legate de problemele puse spre rezolvare, domeniul de aplicatie, tehnica utilizata, etc.

Majoritatea metodelor practice de recunoastere a formelor permit identificarea obiectelor pe baza corespondentei cu o baza de modele. Modelele pot fi perceptuale, functionale sau semantice.

Aceste cunostinte sunt organizate în cadrul unui sistem de reprezentare, sistem în cadrul caruia se definesc:

-tipul de cunostinte care se doreste a fi reprezentat, utilizând:

- atribute caracterizând forma obiectelor, cum ar fi factor de forma, factor de ondulatie, factor de aplatizare, orientare, etc.,

- atribute depinzând de natura suprafetei obiectelor cum ar fi textura, culoare, etc.,

- relatii între obiecte, de apartenenta sau de pozitie relativa.

-reprezentarea informatica a acestor cunostinte prin, reguli de productie, reprezentari procedurale, utilizarea de limbaje orientate obiect, etc.

Combinarea metodelor de analiza a imaginilor, în special în cazul tratarilor imaginilor de o calitate mediocra, faciliteaza obtinerea unor rezultate deosebit de utile.

În vederea vizualizarii imaginilor prelucrate atât în cazul unor sisteme cu posibilitati de lucru cu imagini de intensitate cât si color, se pune problema recodificarii lor în vederea scoaterii în evidenta a unor detalii de interes care duc la o metoda de interpretare cât mai precisa a rezultatelor.

Metodele de recodificare a imaginilor pe baza de LUT (Look Up Table) sunt intens folosite datorita vitezei mari de prelucrare a volumului de informatie continut de semnalul imagine. Aceasta viteza se datoreza si setului ortogonal de instructiuni al procesoarelor moderne.

În principiu, metoda consta în schimbarea intensitatii si/sau a nuantei pixelilor unei imagini conform unei tabele construite în prealabil. În vederea pastrarii intensitatii pixelilor din imagine se prefera ca recodificarea sa fie facuta tinând cont doar de crominanta, astfel ca ulterioarele prelucrari care se efectueaza asupra imaginii sa beneficieze de aceleasi valori pentru intensitati. În sistemele moderne de prelucrari de imagini LUT-ul este un dispozitiv hard. Tabelele de recodificare, LUT implementeaza cel mai usor algoritmii referitor la operatiile punctuale asupra imagnilor.

Deci LUT sunt tablouri simple, care folosesc valoarea curenta a pixelului ca un index în cadrul acestor tabele, de unde se va lua o noua valoare care va fi introdusa în imaginea de iesire în aceeasi pozitie în care a fost în imaginea de intrare.

Imaginea de intrare LUT Imaginea de iesire

Figura 7.11. Tabele de recodificare LUT

Utilizarea LUT evita efectuarea de operatii de calcul inutile. În cazul de mai sus (3 biti / pixel), practic, doar trei valori sunt procesate, indiferent de dimensiunea imaginii (în general, la imagini cu opt biti per pixel sunt procesate 256 de valori).

6.2.7. Tehnici specifice utilizate în procesarea imaginilor

6.2.7.1. Analiza texturala

Analiza texturala este inclusa în cadrul analizei imaginilor fiind o parte integranta a vederii artificiale. Ţinând cont de diferenta existenta între teoria elaborata în vederea definirii texturilor si aplicatiile practice care urmeaza a le implementa este necesara definirea si descrierea unor primitive care sa caracterizeze textura.

Analiza texturala se încadreaza în cadrul analizei imaginilor nonfigurative. În acest caz imaginile contin anumite modele care se repeta dupa o anumita regula. Printre domeniile în care analiza texturala isi gaseste diferite aplicatii avem medicina cu deosebire genetica, morfopatologia, histopatologia, biofizica etc.

Uneori diferenta între doua texturi e data de acest aspect aleator al texturii sau de distributia statistica gasita între textoni (sabloane care se pot repeta fie în mod exact, fie cu unele mici modificari).

Figura 6.12. Imagini având regiuni caracterizate prin texturi

(a, b) Textura arificiala

(c, d, e) Textura naturala delimitata din imagini reale

În Figura 6.12. este prezentata o mica colectie de texturi, câteva naturale si altele artificiale. Analiza texturala este strâns legata de procesul de segmentare a texturilor mai degraba decât de caracterizare a lor.

O textura este considerata a fi o structura spatiala construita prin organizarea unor primitive cu aspect aleator. Este extrem de dificil a segmenta texturi. Liniile de separatie desenate între texturi deseori sunt arbitrare, functia de perceptie deseori este matematica. Este posibil ca anumite combinatii de operatii sa ofere rezultate rezonabile. Noi metode se incearca a fi utilizate, în general metode bazate pe fractali si analiza fractalica.

Se pot încerca unele metode simple de detectie a texturilor folosind intensitatea din cadrul unor ferestre (de 3 x 3, pâna la 37 x 37) unde se poate determina intensitatea medie precum si unii parametrii statistici specifici.

Utlizarea unor ferestre care se suprapun printr-un anumit algoritm asupra imaginii poate sa ofere unele rezultate acceptabile. Acest lucru este explicabil tinând cont de faptul ca textura se refera la regiuni de pixeli si nu la pixeli individuali. În consecinta delimitarea texturilor se poate face considerând o distanta de W pixeli, unde W reprezinta latimea ferestrei alese.

Figura 6.13. Segmentarea texturilor folosind fereastra de suprapunere

(a) Media intensitatilor intr-o fereastra de 14x14 considerand imaginea din 7.12.b.

(b) Binarizarea acestei imagini.

In Figura 6.13. este ilustrat urmatorul principiu. Se foloseste media intensitatilor pentru a segmenta imaginea din Figura 6.12.b.

Valoarea medie da rezultate acceptabile în acest caz dar în general în cadrul altor tipuri de imagini rezultatele sunt nesatisfacatoare. Se mai poate considera în acest sens si deviatia standard a nivelelor de gri.

Figura 6.14. ne arata regiunile identificate folosind deviatia standard locala la segmentarea texturilor. Asfel, Figura 6.12.a poate fi segmentata prin aceasta metoda si chiar si celelalte imagini cu exceptia 6.12.d.

Figura 6.14. Utilizarea deviatiei standard la segmentarea imaginilor din Figura 6.12.

Document Info

Accesari: 6918
Apreciat:

Comenteaza documentul:

Nu esti inregistrat
Trebuie sa fii utilizator inregistrat pentru a putea comenta

Creaza cont nou

A fost util?

Daca documentul a fost util si crezi ca merita
sa adaugi un link catre el la tine in site

Copiaza codul:
in pagina web a site-ului tau.

eCoduri.com - coduri postale, contabile, CAEN sau bancare

Politica de confidentialitate | Termenii si conditii de utilizare