Documente online.
Username / Parola inexistente
  Zona de administrare documente. Fisierele tale  
Am uitat parola x Creaza cont nou
  Home Exploreaza
Upload






























SISTEME DE TELEVIZIUNE DIGITALA

tehnica mecanica



SISTEME DE TELEVIZIUNE DIGITALĂ


4.1 Probleme specifice īn televiziunea digitala




Ochiul, receptorul sistemului vizual uman, este un receptor de tip analogic.

Televiziunea analogica (cu definitie normala) transmite imagini color si sunetul īnsotitor īntr-o banda de 6-8 MHz īn cazul distributiei terestre si īntr-o banda de 18-30 MHz īn cazul distributiei prin satelit sau prin retele terestre de microunde (pentru a realiza un raport S/Z mare la modulatia FM).

Un semnal digital TV de calitate ar putea fi transmis īntr-o banda de frecventa mult mai mica, dependenta si de raportul semnal / zgomot de pe canalul de comunicatie

Dar largimea de banda īn care poate fi transmis semnalul TV digital nu este singurul argument īn favoarea televiziunii digitale. Al doilea argument important este avantajul prelucrarii si transmisiei digitale fata de prelucrarea si transmisia analogica a semnalelor. Calitatea originala a semnalului poate fi refacuta ori de cāte ori este nevoie īn transmisie, īnregistrare sau prelucrare īn studiouri de televiziune, ceea ce nu este valabil pentru semnalul analogic. Se pot folosi tehnici de codare pentru protectie la perturbatii specifice canalelor digitale.

Trebuie totodata remarcat faptul ca exista o tendinta evidenta spre dezvoltarea masiva a retelelor digitale integrate tip ISDN (Integrated Service Digital Network), care sunt deosebit de avantajoase pentru distributia televiziunii digitale.

Īn sistemele TV digitale trebuie transmis si sunetul īnsotitor (mono sau stereo) precum si semnalele de sincronizare pe orizontala si verticala īn acelasi timp cu secventele video.

Un alt aspect important este ca la transmisia digitala a semnalului de televiziune se poate realiza usor criptarea, necesara atat pentru rezolvarea unor probleme legate de licenta de transmisie pe anumite zone cāt si pentru sistemele de tip televiziune interactiva.

Nu īn ultimul rānd trebuie spus ca transmisia digitala a semnalului de televiziune elimina problemele create īn studiourile analogice la conversia de standard si sistem atunci cānd sursele de program TV sunt din tari cu standarde si norme TV diferite.

Evolutia spre televiziunea digitala a īnceput īn studiourile de televiziune prin adoptarea standardului digital international de studio 4:2:2, ceea ce permite transmisia semnalului īntre studiouri fara transcodari. La celalalt capat al lantului-receptorul TV au aparut functii noi. Desi semnalul TV este īn continuare analogic īn majoritatea situatiilor (din considerente de compatibilitate), televizoarele īncep sa fie dotate cu convertoare A/D si D/A rapide, cu memorii de unul sau mai multe cadre si cu circuite specializate, care permit prelucrari digitale īn timp real asupra semnalului TV : filtrari pentru īmbunatatirea raportului semnal/zgomot, afisarea unei imagini fara pālpāire (cu 100 Hz), efecte speciale (zoom, imagine īn imagine, afisarea unor informatii), prelucrari ale unor semnale codate, etc. Exista si receptoare īn care, cu exceptia partii de īnalta frecventa (tuner, AFI, demodulator) si a blocurilor de putere, toate celelalte prelucrari sunt realizate digital.

Ulterior acestor dezvoltari de la capetele lantului de televiziune, īn momentul actual se transmite din ce īn ce mai mult semnalului TV īn forma digitala īntr-o banda acceptabila si la un pret accesibil al receptorului, prin diverse metode : prin satelit, prin emitatoare terestre, prin cablu, prin internet (Video over IP), telefonie mobila, etc.


4.2 Etapele conversiei digitale a semnalului de televiziune


Etapele conversiei analog - digitala pentru semnalul de televiziune sunt cele clasice care se aplica oricarui semnal dependent de timp - esantionarea, cuantizarea si codarea - cu particularitati specifice care tin seama de banda, structura spectrului si particularitatile sistemului vizual uman.


4.2.1 Esantionarea semnalelor de televiziune


Teorema esantionarii a lui Nyquist trebuie evident respectata si īn acest caz, ceea ce īnseamna ca frecventa de esantionare trebuie sa fie destul de mare. De exemplu, pentru un semnal video cu rezolutie normala care are banda de 5 MHz trebuie aleasa o frecventa de esantionare peste 10 MHz (avānd īn vedere ca filtrele de pre- si postesantionare trebuie sa fie realizabile). Īn acest fel se elimina posibilitatea de aliere a spectrului de baza cu spectrele repetate.

Īn aceasta zona de frecventa este util sa se aleaga o frecventa de esantionare f E a carei valoare sa fie un multiplu al frecventei liniilor fH. Īn acest fel se obtine o structura de esantionare ortogonala :



De unde rezulta :


Īn acest fel pe o linie de explorare īncap un numar īntreg de esantioane, deci pe linii succesive esantioanel cad unele sub altele. Este un avantaj pentru redarea corecta a contururilor verticale abrupte.

Un alt aspect ce trebuie sa fie luat īn calcul este cel legat de posibilitatea realizarii subesantionarii daca se tine seama de structura particulara a spectrului semnalului de imagine, care contine benzi spectrale īnguste (circa 5-6 Hz) centrate pe multipli ai fre 545h77f cventei liniilor, frecventei semicadrelor si combinatii liniare ale acestora. Prin alegerea corespunzatoare a frecventei de esantionare se poate asigura intercalarea benzilor din spectrul original cu cele din spectrul repetat (care are evident aceeasi structura) fara aparitia efectului de aliere valabil atunci cand spectrul este continuu. Se poate de exemplu esantiona semnalul PAL cu dublul frecventei subpurtatoarei de culoare (aproximativ 8,86 MHz) care este sub frecventa Nyquist de 10 MHz (pentru o banda a semnalului PAL de 5 MHz).

Esantionarea se poate face pe componente (R, G, B sau Y, R-Y, B-Y) sau pe semnal videocomplex (PAL, SECAM sau NTSC). Din punct de vedere al calitatii imaginii este recomandata esantionarea pe componente, lucru care se realizeaza īn standardul digital de studio. Se utilizeaza esantionarea pe componente pe luminanta Y si diferente de culoare R-Y si B-Y īn locul celei pe semnale primare R, G, B, deoarece banda semnalelor diferenta de culoare (si īn consecinta frecventa de esantionare) poate fi redusa cel putin la jumatate.

Esantionarea semnalului videocomplex este realizata īn receptoarele cu prelucrare digitala īn care, dupa demodularea semnalului si obtinerea semnalului videocomplex īn banda de baza, toata prelucrarea ulterioara se face digital. Īn acest caz pentru PAL este util de ales o frecventa de esantionare egala cu de 4 ori frecventa subpurtatoarei de culoare (aproximativ 17,72 MHz) ceea ce permite realizarea usoara a decodorului de culoare digital PAL, deoarece sunt 4 esantioane pe o perioada de subpurtatoare. Se poate observa ca īn acest caz frecventa de esantionare este si multiplu al frecventei liniilor, adica structura de esantionare este ortogonala.



4.2.2. Cuantizarea semnalelor de imagine


Cuantizarea semnalelor de imagine īnsemana alegerea unor nivele de decizie si de cuantizare astfel īncāt valoarea analogica a fiecarui esantion sa fie rotunjita la valoarea cea mai apropiata de cuantizare. Aceasta operatie introduce o eroare la reconstituirea esantioanelor dupa conversia digital - analog, deoarece valoarea esantionului reconstituit nu mai este riguros egala cu valoarea esantionului original. Apare asa-numitul zgomot de cuantizare. Pentru ca acesta sa nu afecteze calitatea imaginii este necesar ca numarul si dispunerea nivelelor de cuantizare sa tina seama de calitatile de perceptie ale sistemului vizual uman.

Cel mai suparator mod īn care zgomotul de cuantizare ar putea afecta imaginea ar fi īn cazul īn care īn zona respectiva de imagine este o variatie continua de stralucire. Dupa cuantizare la trecerea de la un nivel de cuantizare la altul ar putea apare efectul de contur fals.

Se stie ca perceptia variatiilor de luminanta este discontinua si neliniara. Astfel, daca luminanta variaza īntr-o zona de imagine, ochiul va percepe acest lucru doar daca se depaseste un anumit prag ΔB. Acest prag depinde īnsa de luminanta B a zonei de imagine respective, raportul ΔB / B este constant si egal cu aproximativ 0,02. Daca distanta dintre doua nivele de cuantizare este mai mica decāt cel mai mic ΔB perceptibil de catre ochi, atunci zgomotul de cuantizare nu afecteaza imaginea.

Din punct de vedere al realizarii caracteristicii de cuantizare, aceasta va fi o caracteristica īn trepte situata īn cadranul unu daca semnalul este unipolar (cum este de exemplu semnalul de luminanta Y sau semnalele primare R, G, B) sau simetrica īn cadranele unu si trei daca este vorba de cuantizarea semnalelor diferenta de culoare R-Y si B-Y care sunt semnale bipolare. Treptele caracteristicii pot fi egale sau inegale. Daca se utilizeaza cuantizarea uniforma nivelele de decizie si de cuantizare sunt egal departate. Daca nivelele de decizie si de cuantizare nu sunt uniforme se spune ca avem un cuantizor neuniform.

Alegerea caracteristicii de cuantizare trebuie sa duca la minimizarea zgomotului de cuantizare si tine seama īn acest scop de statistica semnalului. Daca distributia de probabilitate a nivelelor esantioanelor este uniforma, atunci cuantizorul optim este cuantizorul uniform. Acesta este si cel mai simplu de realizat practic, pentru ca pragurile comparatoarelor din convertorul A / D sunt egale.

Atunci cānd distributia de probabilitate a esantioanelor semnalului nu este uniforma, cu alte cuvinte exista probabilitati diferite ca un nivel sa apara la intrarea cuantizorului, cuantizorul optim ce minimizeaza zgomotul de cuantizare este cel neuniform. Constructia practica a acestuia se face folosind tot un cuantizor uniform dar care este precedat de un circuit cu o caracteristica neliniara numit compresor.

Rolul compresorului este de a face ca la iesirea sa nivelele de cuantizare sa aiba distributie de probabilitate uniforma, ceea ce face posibila utilizarea cuantizorului uniform. Dupa prelucrarea semnalului digital (transmisie, memorare, etc.) cānd este necesara conversia D/A a semnalului video, este nevoie de realizarea unei operatii inverse celei a compresorului astfel īncāt semnalul sa nu fie distorsionat. Aceasta operatie se numeste expandare si se realizeaza dupa conversia D/A. De exemplu, daca functia neliniara a compresorului este una logaritmica, atunci functia expandorului este una exponentiala.

Operatia de comprimare si expandare se numeste compandare. Trebuie precizat ca prelucrari asemanatoare se fac si pentru semnalul audio.




4.2.3 Codarea semnalului video


Ultima etapa īn prelucrarea necesara conversiei analog-digitale a semnalului video este codarea. Aceasta īnseamna ca fiecarui nivel de cuantizare sa i se aloce un cod binar. Cea mai simpla codare este codarea cu modulatia impulsusrilor īn cod MIC (īn engleza PCM Pulse Code Modulation). Aceasta īnseamna ca fiecarui nivel de cuantizare qk sa i se aloce codul binar natural ce reprezinta numarul k. De exemplu, pentru codarea PCM a semnalului video cuantizat uniform cu 256 nivele (8 biti pe esantion) rezulta urmatoarea alocare


q0 ... 0000 0000

q1 .. 0000 0001


q255 . . 1111 1111


Toate celelalte metode de codare se raporteaza la codarea PCM atunci cānd se calculeaza viteza de transmisie necesara pentru semnalul video digital. De exemplu, daca frecventa de esantionare este de 12 MHz (suficienta pentru o banda video de 5 MHz) si se cuantizeaza uniform cu 8 biti pe esantion, viteza seriala de transmisie a semnalului video digital este


V [Mbit/s] = 12 x 8 = 96 Mbit/s


Aceasta este o viteza foarte mare pentru orice canal de comunicatie. Ea poate fi redusa prin metode de compresie spectru la valori rezonabile de 2-4 Mbit/s sau chiar mai mult exploatānd doua elemente

Caracteristica sistemului vizual uman.

Statistica semnalului video.

Raportul de compresie obtinut se exprima fie ca un numar fata de metoda standard PCM (de exemplu se obtine o compresie 8 : 1) sau ca numarul echivalent de biti pe esantion necesar transmisiei (pentru acelasi exemplu 1 bit / esantion).



4.3 Standardul digital de studio si familiile de standarde corespunzatoare


Recomandarea 601 a CCIR (ITU-R 601) prevede pentru studiouri un standard principal digital cu codare pe componente, standardul 4:2:2 ai carui parametri principali sunt prezentati īn tabelul 4.1. Frecventa de esantionare este un multiplu īntreg al frecventei liniilor atāt pentru standardul cu 625 linii/50 Hz cīt si pentru standardul cu 525 linii/60 Hz deoarece :



Multiplii comuni ai acestor frecvente sunt multiplii frecventei de 2,25 MHz. Valorile convenabile ale frecventei de esantionare sunt : 11,25 MHz (5x2,25) ; 13,5 (6x2,25) ; 15,75 (7x2,25) . Pentru standardul principal s-a ales valoarea de 13,5 MHz.


Tabelul 4.1

Parametrii

Sistemul 525 linii/60 Hz

Sistemul 625 linii/50 Hz

Semnale

Y, R-Y, B-Y

Y, R-Y, B-Y

Esantioane/linie

Y

R-Y, B-Y







Structura de esantionare


Ortogonala, esantioanele R-Y si B-Y coincid cu esantioanele impare ale lui Y

Frecventa de esantionare

Y

R-Y, B-Y



13,5 MHz

6,75 MHz



13,5 MHz

6,75 MHz

Codare

PCM uniform cu 8 bit    pe esantion

Nr. de esantioane pe linia activa

Y

B-Y, R-Y









Relatia dintre nivelul semnalului video si nivelele de cuantizare

Y


R-Y, B-Y






nivel 16=nivel de negru, nivel 235=nivel de alb


224 nivele cu nivelul    128=nivel de zero



Lungimea liniei active este aceeasi pentru ambele sisteme de explorare si anume 720 esantioane pentru luminanta si 360 esantioane pentru fiecare semnal de crominanta.

Debitul de informatie pentru standardul principal este :

pentru semnalul de luminanta si :

pentru semnalul de crominanta deci īn total :

Exista multe situatii īn care calitatea imaginii este diferita de cea din standardul principal. De aceea, plecīnd de la standardul principal s-a creat o familie de standarde care au proprietatea ca frecventele lor de esantionare se afla īntr-un raport de numere īntregi cu standardul principal 4:2:2 (tabelul 4.2).


Tabelul 4.2

Standard

Frecventa

de esantionare

Y

Frecventa de esantionare

R-Y

Frecventa de esantionare

B-Y

Debitul de informatie

[Mbit/s]

Aplicatii


13,5 MHz

13,5 MHz

13,5 MHz


Calitate ridicata la īncrustare


13,5 MHz

6,75 MHz

6,75 MHz


Standard primar de studio


13,5 MHz

3,375 MHz

3,375 MHz


Transmi-siuni de calitate īnalta   


6,75 MHz

3,375 MHz

3,375 MHz


Jurnalistica electronica

(ENG)


10,125 MHz



3,375 MHz

3,375 MHz


Calitate identica cu cea din PAL


Standardele de ordin superior sunt 8:4:4 si 4:4:4. Standardul 8:4:4 este un standard de explorare progresiva cu 625 linii/semicadru. Dupa prefiltrare vertical-temporala si eliminarea unei linii din doua se obtine semnal īntretesut 4:2:2. Dupa stocare acest semnal poate fi postfiltrat si aplicat pe un monitor cu afisare cu 625 linii/semicadru. Standardul 4:4:4 esantioneaza semnalele R, G, B sau Y, R-Y, B-Y cu aceeasi banda initiala.

Standarde de ordin inferior (sau substandarde) sunt 4:1:1 ; 2:1:1 ; 4:1:0 (semnale diferenta de culoare transmise secvential) si 3:1:0. Standardul 4:1:1 poate fi transmis cu 140 Mbit/s (nivelul cuaternar al ierarhiei digitale de transmisie) daca se utilizeaza intervalul de stingere pe orizontala.

Construirea unui standard inferior din standardul principal nu īnseamna numai reducerea frecventelor de esantionare ci si modificarea structurii de esantionare care devine neortogonala ceea ce reduce rezolutia pe directie diagonala. Standardul 3:1:0 realizeaza esantionarea īn sah pe cadre a semnalului de luminanta la 3/4 din frecventa standardului principal si transmisia secventiala a semnalelor diferenta de culoare. La standardul 2:1:1 se face o esantionare neortogonala la jumatate din frecventa standardului principal ceea ce permite mentinerea unei rezolutii pe orizontala de 6 MHz pentru luminanta si de 3 MHz pentru crominanta īn timp ce rezolutia pe diagonala scade. Atāt standardul 3:1:0 cāt si standardul 2:1:1 produc o oarecare degradare a calitatii imaginii, dar aceasta este suficient de mica, ceea ce permite obtinerea unei calitati comparabile cu cea a semnalului PAL (asa numitul "nivel auxiliar" sau nivel reportaj "ENG=Electronic News Gathering").

Recomandarea 601 a CCIR a lasat īnsa nerezolvate doua probleme importante :

1) Forma filtrelor trece-jos necesare īnainte de conversia A/D si dupa conversia D/A.

2) Realizarea interfetelor pentru transmisia semnalelor īn unul din aceste standarde.

Filtrele trece-jos trebuie sa īndeplineasca urmatoarele conditii :

- distorsionari cāt mai mici ale semnalelor din banda de trecere ;

- posibilitatea cascadarii codec-urilor (codor-decodor) fara degradari semnificative ale semnalului ;

- complexitate acceptabila (deci dimensiuni si costuri reduse).

Este necesar un compromis deoarece o banda de trecere mare si o rejectie puternica a frecventelor de aliere mai mari sau egale cu jumatate din frecventa de esantionare implica o cadere abrupta a caracteristicii filtrului si deci oscilatii ale caracteristicii de amplitudine īn banda de oprire. Riplul caracteristicilor de amplitudine si timp de grup poate fi redus marind complexitatea filtrului. Amplitudinea acestui riplu se va multiplica cu numarul de codec-uri cascadate daca se utilizeaza filtre identice.

CCIR si EBU au dat unele directii de proiectare a acestor filtre :

- Se va specifica o banda de trecere (daca este posibil pāna la 5,5 MHz) pentru luminanta ;

- Se va realiza o atenuare mare (40 dB) a benzii translatate (īn cazul anterior 8-13,5 MHz) ;

- Rejectia la jumatate din frecventa de esantionare va fi moderata (12 dB sau chiar mai putin) pentru a se realiza un compromis īntre oscilatii īn banda de oprire si aliere ;

- Masuri comparabile (īn raport 2:1 pentru standardul principal) se vor aplica semnalelor diferenta de culoare urmānd ca filtrarea sa se efectueze o singura data la sursa sau la afisare chiar si īn cazul cascadarii unor codec-uri.

Īn ceea ce priveste interfetele pentru transmisia semnalelor digitale din standardul 4:2:2 pe distante de pāna la maximum cītiva kilometri se pot utiliza interfete seriale sau paralel. Īn interfetele paralel se transmit simultan cei 8 biti plus un semnal de ceas. Cele trei fluxuri de cuvinte Y, R-Y, B-Y sunt multiplexate īn timp pentru a forma un singur flux de cuvinte cu viteza de 27 Mbit/s. O astfel de interfata permite utilizarea unor circuite integrate ieftine. O interfata seriala cu viteza de 243 Mbit/s a fost realizata de EBU si SMPTE.


4.4 Metode de compresie a imaginilor

Viteza mare de bit pentru fluxul de date īn standardul digital de studio impune utilizarea unor metode de compresie de spectru pentru reducerea semnificativa a acestei viteze.

Pentru compararea performantelor diverselor metode de compresie se utilizeaza mai multe criterii.

Primul dintre ele este raportul de compresie care este egal cu raportul dintre viteza de bit īn transmisia cu modulatia impulsurilor īn cod (PCM) si viteza de transmisie dupa compresie.

Al doilea criteriu este calitatea imaginii receptionate. Obiectivul urmarit de CCIR este de a evita receptia unei imagini de calitate mai slaba decīt cea produsa de o transmisie analogica. Calitatea este evaluata prin teste subiective īn raportul CCIR 405-4 si Recomandarea 500-2.

Al treilea criteriu este complexitatea procesului, care trebuie limitata la minimum deoarece determina complexitatea si costul echipamentului de codare si decodare.

Al patrulea criteriu este sensibilitatea sistemului de decodare la erorile din lantul de transmisie si efectul acestor erori asupra imaginii (Raportul CMTT 967).

Reducerea vitezei de transmisie se bazeaza pe proprietatile sursei de semnal si pe proprietatile sistemului vizual uman. Acestea vor fi trecute īn revista īn continuare.

Proprietatile sursei

Au fost facute īn decursul timpului multe masuratori statistice asupra imaginilor si a secventelor de imagini si au fost propuse cīteva modele, īn general modele stationare. Īn afara studiilor teoretice este de mentionat ca trebuie utilizate proprietatile structurale ale imaginilor, care sunt sensibile la rupturi locale ale stationaritatii (de ex. margini). Īn general, s-a dovedit eficient sa se analizeze imaginile si secventele de imagini printr-un model de tip "mozaic", un model nestationar unde fiecare componenta a "mozaicului" are proprietatile sale statistice. Principalele configuratii locale sunt :

zone cvasi-uniforme, adica zone īn care gradientul spatial este mai mic decāt de exemplu 2 % din gama dinamica a unui pixel iar extensia spatiala mai mare decāt cāteva zeci de pixeli īn fiecare directie ;

zone cu detalii cu contrast scazut, adica zone cu contrast local mai mic de 5 % din gama dinamica, fiecare detaliu fiind mic īn directie spatiala (cātiva pixeli) ;

zone cu detalii cu contrast mare, cu contrast si gradient mai mare decāt de exemplu 15 % din gama dinamica, fiecare detaliu fiind mic īn spatiu ;

margini, cu contrast mai mare decāt 15 %, latimea tranzitiei de unul sau doi pixeli, tranzitia īntinzāndu-se longitudinal pe cātiva zeci de pixeli.

Primele trei tipuri sunt configuratii de tip "suprafata" si sunt mai mult sau mai putin stationare, Ultima poate fi considerata de tip "linie" si corespunde la īntreruperi ale stationaritatii. Este evident ca nu exista delimitari foarte clare īntre aceste patru categorii, zonele uniforme devin texturate pe masura ce contrastul creste iar zonele texturate devin un mozaic de zone uniforme si margini pe masura ce distanta focala creste.

De asemenea, fiecare din aceste configuratii spatiale devine o configuratie spatio-temporala daca se considera si axa timpului. Ele vor fi supuse modificarilor īn timp si miscarii. S-a propus sa se faca distinctie īntre miscarea obiectelor si miscarea camerei, aceasta din urma fiind o miscare globala. S-a propus si introducerea unor parametri relevanti ca vectorul de miscare, amplitudinea sa īn spatiu, geometria sa (translatie, zoom) si posibilitatea de urmarire a miscarii datorata abilitatii ochiului de a urmari miscarile.

Īn descrierea generala spatio-temporala se considera secventele de imagini ca esantioane ale unui model dinamic de tip mozaic. Din cauza lipsei de date statistice adecvate acest model este un model calitativ structural suficient pentru studiul compresiei de date a semnalului video.

Proprietatile sistemului vizual uman.

Acestea pot fi studiate din diferite aspecte : anatomice, fiziologice, psihofizice (detectie, perceptie) si psihologice (cunoastere, semiotica).

Pentru aplicatii legate de codarea semnalelor de televiziune sunt utile datele psihovizuale care dau praguri de detectie (masuratori directe sau modele) sau nivele de perceptie subiectiva ca functii de parametrii stimulilor vizuali carora subiectii trebuie sa le raspunda. Avānd ca obiectiv un standard de calitate īnalta pentru sisteme TV sunt utile mai ales datele de detectie. Pragurile de detectie se pot aplica conditiilor de vizualizare asa cum se definesc īn Recomandarea CCIR 500. Datele se obtin prin asa numita metoda a "stimulului constant" care consta īn a prezenta īn ordine aleatoare stimuli predeterminati cu valori selectate ale parametrilor. Procentele de cazuri īn care se vad stimulii sunt interpolate pentru a defini un prag de detectie de 50%. Se poate folosi īntreaga scala de vizibilitate a stimulului pentru a defini un prag de perceptibilitate īntre cele doua grade mai īnalte, "imperceptibil" si "perceptibil dar nu suparator". Literatura de specialitate contine foarte multe date de acest tip dar de multe ori acestea sunt dificil de aplicat la problemele de optimizare a codarii. Īn majoritatea cazurilor defectele codarii corespund unor stimuli vizuali mai complecsi si apar īn imagini sau īn secvente de imagini reale īn contrast cu formele de test simple utilizate īn experimentele psihovizuale (de obicei fundal uniform, margini sintetice foarte precise, etc).

Īn continuare se vor trece īn revista principalele metode de compresie utilizate īn televiziune.

Exista doua constrīngeri specifice care determina tipurile de algoritmi ce pot fi utilizati pentru televiziune. Īn primul rānd este necesara o operare īn timp real, cu o viteza mare (de ordinul zecilor de megabiti pe secunda) , pe un canal cu viteza de transmisie fixa. Aceasta face sa fie preferate schemele de codare cu viteza fixa sau, pentru algoritmi care produc viteze variabile, este necesar sa se utilizeze registre tip buffer si metode de evitare a supraīncarcarii registrelor. Īn al doilea rānd, constrīngerile sursei nu permit ca unii algoritmi care sunt eficienti, de exemplu pentru videoconferinta, sa fie la fel de eficienti pentru televiziune. De asemenea nu este posibila utilizarea schemelor de codare adaptiva cu transformare care sunt foarte eficiente pentru imagini fixe, sau a schemelor de codare pentru grafice si facsimil.

Avānd īn vedere aceste considerente variantele posibile de codare pentru compresie sunt :

PCM (Pulse Code Modulation) si scheme de codare īnrudite : cuantizare liniara, cuantizare neliniara si cuantizare adaptiva, esantionare cu diferite frecvente si structuri, cu filtrare pre- si postesantionare fixa sau adaptiva.

DPCM (Differential PCM) : scheme de codare cu predictie spatiala (intrasemicadru) sau spatio-temporala (intersemicadru sau intercadru) cu predictie fixa sau adaptiva, cu cuantizare fixa sau adaptiva, urmata uneori de codare cu lungime de cod variabila a semnalului diferenta. Pentru marirea eficientei predictiei se poate folosi estimarea miscarii sau a marginilor.

Codare cu transformare : transformari pe blocuri, spatiale sau spatio-temporale, de tip Hadamard, cosinus, etc., cu cuantizare zonala (fixa sau adaptiva) sau codare cu prag ;

Scheme hibride : cu DPCM īn unele dimensiuni si transformare īn altele.

Codarea cu transformare este īntr-adevar o metoda foarte eficienta realizānd factori de compresie mari, dar pretinde foarte multe operatii de calcul ce trebuie efectuate īn timp real pentru codarea semnalului de televiziune.

Dimpotriva, codarea cu DPCM este mai usor de realizat practic si are avantajul ca separarea celor doua functii (predictie si cuantizare) permite o buna adaptare la proprietatile semnalului (predictie) si ale observatorului uman (cuantizare).


4.4.1 Codarea cu predictie

Codarea cu predictie este o metoda larg utilizata pentru eliminarea redundantei din semnalul de televiziune. Codarea cu predictie se bazeaza pe observatia ca īntre esantioanele semnalului de televiziune exista o corelatie destul de puternica. Codarea este cu atāt mai eficienta cu cāt aceasta corelatie este mai mare. Predictia valorii unui esantion se bazeaza pe valoarea esantioanelor anterioare. Valoarea prezisa nu va fi chiar valoarea esantionului curent dar va putea fi foarte aproape de aceasta. Daca se transmite numai diferenta dintre esantionul curent si cel prezis, volumul de informatie transmis poate fi redus semnificativ. Deci īn codarea cu predictie redundanta previzibila poate fi eliminata din semnalul de intrare, ceea ce permite compresia datelor.

Esantionul prezent este estimat din valoarea esantioanelor anterioare

. Īn codarea cu predictie liniara esantionul prezis este o combinatie liniara a valorilor esantioanelor precedente :

unde sīnt coeficienti constanti iar este valoarea esantionului anterior cu i perioade de tact. Daca se aplica transformata Z rezulta :

unde :

Eroarea de predictie este :


Eroarea de predictie este codata si transmisa la receptor. La receptor este reconstituit din semnalul receptionat . Daca exista o corelatie puternica īn semnalul de televiziune, eroarea de predictie este relativ mica īn raport cu semnalul de intrare, deci poate fi codata cu un numar mai mic de biti. Principiul acestei prelucrari este prezentat īn fig. 4.1.






Fig. 4.1 Schema bloc a codarii cu predictie


Predictia este o filtrare liniara cu functia de transfer si este realizata cu un filtru digital nerecursiv. Functia de transfer a codorului este . Decodorul este un filtru digital cu functia de transfer . Daca se face predictia utilizīnd doar esantionul precedent, adica

atunci functia de transfer a codorului este (un circuit de diferentiere) iar functia de transfer a decodorului este (un circuit de integrare). De obicei codarea cu predictie este realizata īntr-o configuratie cu bucla de reactie. Prezenta cuantizorului īn bucla de reactie evita acumularea erorilor de cuantizare. Codarea DPCM are si avantajul de a elimina un eventual comportament nestationar al semnalului.

Proiectarea optima a unui predictor īnseamna īnseamna alegerea unui numar suficient de mare de esantioane anterioare si alegerea valorilor coeficientilor (deci determinarea functiei de transfer ) pentru care eroarea medie patratica de predictie este minima :

unde reprezinta media statistica. Derivīnd partial īn raport cu si egalīnd rezultatul cu zero se obtine sistemul de ecuatii :

Daca se noteaza functia de autocorelatie a semnalului cu :

sistemul se poate scrie matricial :


Daca se rezolva ecuatia matriciala se pot obtine valorile coeficientilor de predictie. Puterea erorii de predictie minimizate este :

Īn cadrul experimentarilor s-a constatat ca proprietatile statistice ale erorii de predictie pot fi descrise cu ajutorul distributiei Laplace :


Functia de autocorelatie a semnalului de televiziune poate fi aproximata cu expresia :

unde este o constanta. Se poate demonstra, folosind ecuatiile de mai sus, ca īn acest caz predictorul optim este de ordinul unu iar coeficientii sunt dati de relatia :

unde este coeficientul de corelatie īntre doua esantioane vecine. Puterea erorii de predictie minime este :


Cu cāt este mai mare puterea erorii de predictie minime este mai mica fata de puterea semnalului. Daca se doreste ca eroarea medie de predictie sa fie egala cu zero, atunci este necesar ca predictia sa se faca īn conformitate cu ecuatia :

unde este media semnalului. Īn cazul imaginilor este utila predictia bidimensionala. Īn predictia bidimensionala sunt utilizate si esantioane din liniile precedente ale aceluiasi cāmp. De obicei corelatia este puternica doar cu elementele liniei anterioare din acelasi cīmp. Coeficientii functiei de predictie se determina īn cazul bidimensional pe acelasi principiu ca si īn cazul unidimensional, punānd conditia minimizarii erorii patratice medii de predictie.

Functia de autocorelatie bidimensionala a imaginii pentru zone stationare īn sens larg este de forma :

Valorile experimentale obtinute sunt urmatoarele :

- Pentru imagini de tip prim-plan (cu suprafete uniforme relativ multe)

- Pentru imagini cu multe detalii :

- Pentru imagini tip prim plan

- Pentru imagini cu multe detalii

Daca functia de autocorelatie bidimensionala are forma din relatia de mai sus, atunci se poate demonstra ca :

pentru

Cu alte cuvinte semnalul de eroare de predictie este necorelat. Īn cazul īn care functia de autocorelatie bidimensionala este de alta forma decīt cea de mai sus, atunci este necesar sa se utilizeze mai mult de 3 elemente vecine ale esantionului curent pentru a se obtine o buna estimare. Īn aplicatiile practice, deoarece proprietatile statistice ale imaginii sunt nestationare si neuniforme spatial, se prefera sa se varieze functia de predictie adaptiv, īn functie de proprietatile locale ale imaginii. Un mod tipic de adaptare este de a selecta un predictor optim din mai multe functii de predictie (fig. 4.2). Alegerea functiei de predictie optime se face observānd elementele anterioare ale imaginii din vecinatatea elementului considerat. Aceasta este o schema de predictie neliniara īn care functia de predictie variaza cu statistica locala a imaginii. Predictia adaptiva este eficace pentru scaderea erorii de predictie la tranzitia dintre doua zone cu proprietati statistice diferite.


Functia rata-distorsiune īn codarea cu predictie

Functia rata-distorsiune arata legatura care exista īntre distorsiunile admise īntr-o metoda de compresie care reduce entropia sursei initiale si valoarea minima la care poate fi redus debitul de informatie al sursei efective.

Fie un vector N-dimensional care reprezinta īntr-un spatiu metric semnalul generat de sursa si vectorul N-dimensional care reprezinta semnalul comprimat transmis. Distorsiunea introdusa prin compresie poate fi masurata daca se defineste distanta īntre cele doua semnale. Se poate alege distanta :





Fig. 4.2 Predictie adaptiva cu predictori comutati


unde :


unde si sunt componentele īnainte si respectiv dupa compresie.

Reducerea entropiei īn procesul de compresie este echivalenta cu efectul perturbatiilor asupra unui canal de transmisiune. Circuitul de compresie poate fi considerat un canal afectat de perturbatii si se poate defini transinformatia :

Eroarea medie este cu atāt mai mare cu cāt distorsiunile introduse prin compresie sunt mai importante. Functia rata-distorsiune este definita prin relatia :

unde minimul este īn raport cu probabilitatile si este supus conditiei ca distorsiunile sa nu depaseasca valoarea D admisa :

Functia reprezinta debitul de informatie minim la iesirea circuitului de compresie care garanteaza ca distorsiunea nu este depasita. Deci o compresie efectuata de o transformare care reduce entropia transforma sursa cu debit biti/s īntr-o noua sursa cu debit mai mic astfel īncīt distorsiunile sa nu depaseasca o valoare admisa D. Se poate deci defini raportul de compresie maxim :

care reprezinta de fapt o limita superioara ce nu poate fi depasita prin nici un procedeu de compresie fara depasirea limitei admise pentru distorsiuni.

Teorema codarii surselor a lui Berger este urmatoarea :

" Pentru codarea unei surse discrete fara memorie, exista, atunci cānd distorsiunea este mai mica decīt , un cod bloc cu viteza de bit atunci cānd lungimea blocului este suficient de mare ".



Reciproca acestei teoreme este :

" Daca este disponibila o viteza de bit pentru codarea unei surse discrete fara memorie, atunci nu poate fi depasita o distorsiune ".

Pentru o sursa stationara continua, fara memorie, caracterizata de functia de distributie gaussiana :

Valoarea functiei este :

[biti/simbol]

iar distorsiunea :

Pentru orice rata de informatie , sistemele de compresie care sunt proiectate sa atinga o distorsiune pentru o sursa cu distributie gaussiana cu valoare medie nula si dispersie , vor asigura o distorsiune care nu depaseste valoarea pentru orice alta sursa stationara avānd valoare medie nula si aceeasi dispersie. Cu alte cuvinte, dintre toate sursele continue fara memorie, stationare si ergodice, cu valoare medie nula si cu aceeasi dispersie, cea care necesita cea mai mare valoare a functiei este sursa gaussiana :

Sursele reale sunt īn majoritatea cazurilor surse cu memorie. Pentru surse cu memorie, stationare si ergodice, calculul functiei rata-distorsiune se face, īn functie de momentele de ordinul unu si doi, utilizīnd rezultatele obtinute īn calculul functiei pentru surse fara memorie.


4.4.2 Codarea cu transformate

Metodele de compresie care utilizeaza transformate reduc corelatia dintre esantioane prin trecerea īn spatiul transformat īn care corelatia dintre coeficientii transformatei este redusa semnificativ. Raportul de compresie obtinut este cu atāt mai mare cu cāt de obtine o decorelare mai puternica a coeficientilor din spatiul transformat.

Schema bloc a transmisiei cu codare cu transformate este prezentata īn fig. 4.3.



Fig. 4.3 Codarea cu transformate. Schema bloc


Transformarea se face pe blocuri 8 x 8 sau 4 x 4 din motive de complexitate a calculelor care trebuie efectuate la imaginile cu miscare īn timp real. La intrarea etajului de transformare directa se aplica esantioanele f(x,y) ale blocului N x N (de ex. 8 x 8). Transformarea directa se efectueaza conform relatiei (care poate fi scrisa si matricial).

A(x,y,u,v) este nucleul transformarii directe.

Blocul de selectie va face selectarea coeficientilor ce vor fi transmisi dupa doua criterii posibile :

Selectie zonala

Selectie cu prag.

Selectia zonala presupune alegerea unei anumite zone din spatiul transformat (zona de joasa frecventa) si transmisia numai a acelor coeficienti, ceilalti coeficienti urmānd a fi considerati egali cu zero la receptie.

Selectia cu prag presupune fixarea unui anumit prag de amplitudine de la care se considera ca valoarea coeficientilor din spatiul transformat este semnificativa si transmisia numai a coeficientilor care depasesc acest prag, ceilalti coeficienti find considerati egali cu zero. Īn acest caz trebuie īnsa transmisa si informatia despre localizarea coeficientilor nenuli din spatiul transformat.


La receptie transformata inversa permite trecerea īnapoi īn spatiul imaginii

Unde s-a notat cu B(x,y,u,v) nucleul transformarii inverse si cu S(u,v) functia de selectie a coeficientilor ce urmeaza a fi transmisi (egala cu 1 pentru coeficientii ce vor fi transmisi si cu 0 pentru coeficientii ce nu vor fi transmisi si vor fi considerati la receptie egali cu 0).

Transformarile bidimensionale utilizate trebuie sa fie unitare (matricea transformarii sa fie unitara) si sa aiba algoritm de calcul rapid. Transformata optima care elimina complet corelatia dintre coeficienti īn spatiul transformat este transformarea Karhunen-Loeve, dar aceasta nu are algoritm de calcul rapid.Transformari suboptimale cu algoritm de calcul rapid sunt transformarile Fourier rapida, Walsh-Hadamard, Cosinus discreta (DCT = Discrete Cosine Transform) ;I transformarea wavelet.


4.4.3 Codarea vectoriala

Codarea vectoriala se bazeaza pe rezultatele teoremei rata-distorsiune a lui Shannon, care arata ca performantele metodelor de compresie de date sunt īntotdeauna mai bune atunci cānd se codeaza vectori īn locul scalarilor, chiar daca sursa este fara memorie.

Codarea vectoriala este foarte mult utilizata īn codarea imaginilor statice. Schema bloc pentru o metoda de compresie cu cuantizare vectoriala este data īn fig. 4.4. Codorul si decodorul utilizeaza o lista de coduri , care contine cuvinte de cod (vectori de cod) de dimensiune notati cu un indice . Imaginea este īmpartita īn blocuri de pixeli de dimensiune . Fiecare bloc poate fi considerat un vector de dimensiune . Pentru fiecare bloc codorul selecteaza cuvāntul de cod care da cea mai mica distorsiune . Indicele al cuvīntului de cod este transmis pe canal. Daca nu exista zgomot, decodorul reface cuvīntul de cod din indicele si rezulta .

Din punct de vedere matematic cuantizarea vectoriala este o functie de la un spatiu -dimensional la un set finit de simboluri :

Viteza de transmisie este :

[biti/vector]

Viteza de transmisie pe esantion este [biti/esantion]. De obicei este o putere a lui 2 si atunci este numar īntreg.

Performantele sistemului cu codare vectoriala depind de structura listei de coduri. Exista mai multe criterii pentru a proiecta īn mod optim o lista de coduri. Unul dintre ele consta īn minimizarea distorsiunii medii (tipic eroarea medie patratica MSE). Alt criteriu urmareste maximizarea entropiei listei de coduri, ceea ce īnseamna ca fiecare cuvīnt de cod este utilizat īn medie de acelasi numar de ori. De obicei lista de coduri este fixata la codor si la decodor. Īn codarea vectoriala adaptiva lista de coduri este modificata odata cu modificarea caracteristicilor statistice ale imaginii. Se creaza noi liste de coduri pe parcursul functionarii sistemului care le īnlocuiesc pe cele vechi.

Īn trecut codarea vectoriala a fost mai putin utilizata din cauza complexitatii calculelor atāt īn procesul de codare cāt si īn procesul de īnvatare. Īn ambele procese se calculeaza distorsiunile pentru fiecare cuvīnt de cod din lista si se compara īntre ele pentru a gasi cuvīntul de cod care da distorsiunea cea mai mica. Deoarece se utilizeaza blocuri īn codarea vectoriala exista posibilitatea ca structura de blocuri sa fie vizibila pe imagine.

Īn acelasi timp, codarea vectoriala prezinta avantaje semnificative, pe lānga compresia pe care o realizeaza. Se pot construi liste de cuvinte de cod pentru care entropia este aproape de valoarea maxima posibila. Rezulta astfel ca se poate face codare cu cuvinte de cod cu lungime fixa cu toate avantajele ce decurg de aici īn privinta comportarii sistemului īn prezenta erorilor de pe canal. De asemenea, cuvintele de cod pot fi aranjate astfel īncāt cele care sunt apropiate īn distanta Euclidiana sa aiba indici de cod apropiati īn distanta Hamming. Rezultatul obtinut este ca erorile de transmisie determina decodorul sa selectioneze un cuvīnt apropiat de cel original. Se obtine astfel compresie maxima (pe baza entropiei) si o sensibilitate redusa la erorile de transmisie.

O metoda clasica de proiectare a listei de cuvinte de cod este algoritmul LBG, care este un algoritm optimizat local utilizat īn mod frecvent la proiectarea cuantizorilor vectoriali pentru imagine si semnal vocal.

Īn ultimul timp au fost propuse pentru proiectarea codorilor vectoriali retele artificiale neuronale (ANN=Artificial Neural Network) care elimina limitarile algoritmilor traditionali. Retelele ANN sunt formate dintr-un numar mare de unitati de calcul simple interconectate īntre ele, care pot lucra īn paralel. Algoritmii de proiectare cu ANN nu necesita acces īn acelasi timp la īntregul set de date pentru īnvatare.



Fig.4.4 Principiul codarii vectoriale


Cuantizarea vectoriala diferentiala (DVQ=Differential Vector Quantization) īnlocuieste cuantizorul scalar din schema DPCM cu un cuantizor vectorial. Rezulta un sistem care īmbina multe din avantajele celor doua metode de compresie.

Un rol important īn DVQ joaca marimea blocurilor de imagine considerate. Īn general blocurile mai mari maresc raportul de compresie dar degradeaza calitatea. De obicei se lucreaza cu blocuri 2 x 2 (), 3 x 3 (k=9), 4 x 4 (k=16). S-a constatat ca blocurile mai mari de 2 x 2 introduc o structura vizibila pe imagine, care nu este acceptabila pentru imagini de foarte buna calitate. De asemenea, blocurile 2 x 2 permit prelucrarea īn timp real.

S-a constatat, prin teste pe secvente de imagini, ca eroarea patratica medie MSE depinde de numarul de biti/esantion. Pentru un numar fix de cuvinte de cod blocurile de dimensiune 2 x 2 necesita mai putine cicluri de īnvatare. Trebuie spus ca, daca prelucrarea īn timp real se dovedeste posibila, este util sa se realizeze un sistem DVQ intercadre. De asemenea, cuantizorul vectorial poate fi facut adaptiv, arhitectura retelei neuronale artificiale ANN putānd fi folosita pentru reactualizarea listei de cuvinte de cod pe masura ce se modifica proprietatile statistice ale imaginii.


4.5 Standarde de compresie digitala a imaginilor


4.5.1 Standardul JPEG

Standardul JPEG (Joint Photographic Experts Group) este utilizat pentru compresia imaginilor fixe. Grupul JPEG a fost creat īn 1988 sub egida ISO ca un proiect comun al ISO si al comisiei Q16 CCITT. Īn anul 1992 a devenit standard ISO. Rata de compresie poate ajunge pāna la 15:1. Exista si o varianta pentru secvente de imagini MJPEG (Motion JPEG). Standardul JPEG permite patru moduri de operare :

Codare secventiala DCT , īn care fiecare componenta de imagine (YUV) este codata īntr-o singura explorare de la stānga la dreapta si de sus īn jos.

Codare progresiva DCT, īn care imaginea este codata īn explorari succesive pentru a produce o imagine rapida, decodata brut atunci cānd timpul de transmisie este lung.

Codare fara pierderi, īn care imaginea este codata pentru a garanta o refacere exacta dupa decodare. Se utilizeaza algoritmi de codare cu predictie īn locul codarii cu DCT.

Codare ierarhica, īn care imaginea este codata cu rezolutii multiple.

Imaginea sursa ce trebuie codata consta din 1 pāna la 255 de planuri de imagine fiecare cu alt numar de pixeli. De exemplu se pot coda imagini īn format RGB (3 plane cu aceeasi rezolutie) sau YUV (3 plane cu rezolutii diferite). Toti pixelii dintr-un plan sunt codati cu acelasi numar de biti.

Schema bloc a codorului si a decodorului JPEG pentru codarea secventiala este prezentata īn fig.9.4.

Codorul JPEG consta din trei blocuri principale

Blocul de transformare cosinus discret (DCT)

Cuantizorul

Codorul entropic

La intrarea codorului esantioanele din gama [0, 2p -1] sunt translatate īn gama [-2p-1 , 2p-1-1]. De exemplu, pentru imagini cu p=8, esantioanele originale din gama [0, 255] sunt translatate īn gama

Apoi imaginea este divizata īn blocuri de esantioane de dimensiune 8x8, asupra carora se efectueaza transformata cosinus discreta (DCT)




unde   


iar pentru u si v diferite de 0

Coeficientul F(0,0) se numeste coeficient DC iar ceilalti 63 de coeficienti se numesc coeficienti AC. Pentru p coeficientii DCT sunt īn gama [-1024,+1023], ceea ce implica trei biti aditionali pentru reprezentarea lor.

Pentru un bloc tipic de imagine majoritatea coeficientilor DCT au valori zero sau apropiate de zero. Pe acest lucru se bazeaza compresia de spectru.



Fig.4.5 Codor si decodor JPEG. Schema bloc



Īn etajul urmator, cuantizorul, cei 64 de coeficienti DCT sunt cuantizati utilizānd un tabel de cuantizare cu 64 de elemente specificat de aplicatie. Cuantizarea reduce amplitudinea coeficientilor care a caror contributie este neglijabila la calitatea imaginii, avānd ca scop cresterea numarului de coeficienti DCT egali cu zero. Cuantizarea se face īn conformitate cu urmatoarea ecuatie

unde [ ] simbolizeaza partea īntreaga iar Q(u,v) sunt coeficientii specificati īn tabelul de cuantizare. Fiecare element Q(u,v) este un numar īntreg cuprins īntre 1 si 255, care specifica pasul de cuantizare pentru coeficientul DCT corespunzator.

Dupa cuantizare cei 63 de coeficienti AC sunt ordonati īntr-o secventa īn zig-zag. Aceasta ordonare īn zig-zag va facilita īn pasul urmator codarea entropica pentru ca se poate vedea pe imagini reale ca probabilitatea ca sa fie īn aceasta secventa coeficienti egali cu zero creste monoton cu indexul coeficientilor.

Coeficientii DC, care sunt valoarea medie a esantioanelor dintr-un bloc 8x8, sunt codati printr-o tehnica de codare adaptiva, prin transmisia diferentei dintre doi coeficienti DC de la doua blocuri adiacente. Acest lucru se face pentru ca exista o corelatie puternica īntre coeficientii DC de la blocuri adiacente.

Īn final, codarea entropica ofera o compresie de spectru aditionala. Standardul JPEG specifica doua metode de codare entropica codarea Huffman si codarea aritmetica. Standardul de baza secvential JPEG utilizeaza codare Huffman. Codarea Huffman converteste coeficientii DCT īntr-o secventa binara compacta utilizānd doua etape

Formarea secventei de simbol intermediare

Conversia acestei secvente īn secventa binara cu tabelele Huffman.

Īn secventa de simboluri intermediare fiecare coeficient AC este reprezentat printr-o pereche de simboluri

Simbol 1    (RUNLENGTH, SIZE)

Simbol 2    (AMPLITUDINE)

RUNLENGTH este numarul de coeficienti AC consecutivi cu valoare zero care preced un coeficient AC diferit de zero. Gama sa de valori este īntre 0 si 15, ceea ce necesita 4 biti.

SIZE este numarul de biti necesari pentru codarea AMPLITUDE. Numarul de biti pentru AMPLITUDE este īntre 0 si 10 biti, astfel īncāt sunt necesari 4 biti pentru a coda SIZE.

AMPLITUDE este amplitudinea coeficientului AC diferit de zero care poate fi īn gama [+1024, -1023], ceea ce necesita 10 biti pentru codare.

De exemplu, daca secventa coeficentilor AC este


reprezentarea secventei de simboluri este :


unde RUNLENGTH=6, SIZE=9, AMPLITUDE=476.

Daca RUNLENGTH este mai mare decāt 15, atunci simbolul (15,0) este interpretat ca extensia cu RUNLENGTH 16. Pot exista pāna la trei extensii consecutive (15,0).

Pentru coeficientii DC reprezentarea simbolurilor intermediare este

Simbol-1 (SIZE)

Simbol-2 (AMPLITUDE)

Deoarece coeficientii DC sunt codati diferential aceasta gama este dubla fata de gama coeficentilor AC si este

A doua etapa īn codarea Huffman este conversia secventei intermediare de simboluri īn secventa binara. Simbolurile sunt īnlocuite coduri cu lungime variabila, īncepānd cu coeficientul Dc si continuānd cu coeficientii AC. Fiecare Simbol-1 (pentru coeficientii AC si DC este codat cu un cod cu lungime variabila (VLC=Variable Length Code) obtinut dintr-un tabel Huffman specificat pentru fiecare componenta de imagine YUV. Simbolurile-2 sunt codate utilizānd un cod cu lungime variabila de tip VLI (Variable Length Integer, a carui lungime īn biti este data īn tabelul 4.3.



Tabelul 4.3

Lungime cod

Gama amplitudinilor
























Decodarea standardului secvential JPEG cuprinde īn ordine inversa toate etapele procesului de codare asa cum se prezinta īn figura 9.4.


Decodorul entropic (Huffman) este primul bloc īn care secventa binara este convertita īntr-o secventa de simboluri utilizānd tabelele Huffman (pentru coeficientii codati VLC) si decodarea VLI, dupa care simbolurile se convertesc īn coeficienti DCT. Apoi se face decuantizarea conform ecuatiei

Unde Q(u,v) sunt coeficientii de cuantizare din tabelul de cuantizare utilizat si la codare.

Este efectuata apoi transformarea cosinus discreta inversa (IDCT) care face transformarea īn domeniul spatial

unde C(u) si C(v) au aceleasi expresii ca la transformarea cosinus discreta directa..

Ultimul pas consta īn translatarea esantioanelor īn gama [0, 2p-1].


4.5.2 Standardele din familia MPEG

Standardele MPEG (Moving Picture Experts Group) sunt propuse pentru compresia imaginilor cu miscare.

Primul standard introdus īn 1991 (MPEG-1 , ISO/IEC 11172 din 1993) este destinat compresiei imaginilor video cu miscare cu rezolutie 320x240 (calitate VHS) pāna la viteze de transmisie de 1-1,5 Mbit/s.

Standardul MPEG-2 introdus īn 1994 (ISO/IEC 13818 din 1996) este destinat transmisiei imaginilor de cu rezolutie mai buna (720x480), similara cu cea din standardului digital de studio. Fluxul de date MPEG-2 ajunge la 4-10 Mbit/s. Standardul permite transmisia imaginilor cu īntretesere. MPEG-2 permite transmisia imaginilor pentru o larga varietate de aplicatii care necesita rezolutii diverse cum sunt comunicatiile video prin retele ISDN utilizānd ATM.

Metoda de compresie īn standardele MPEG-1 si MPEG-2 este hibrida si utilizeaza transformata cosinus discreta (DCT) intracadru si codare cu predictie cu compensarea miscarii intercadre. Raportul de compresie poate ajunge pāna la 200

Pentru televiziunea de īnalta definitie (HDTV High Definition Television) s-a stabilit initial sa se creeze un standard special, MPEG-3. Ulterior s-a constatat ca nu este necesar un astfel de standard si ca se poate folosi tot standardul MPEG-2, evident cu cresterea vitezei de transmisie dupa compresie fata de viteza necesara pentru semnale video pentru imagini cu rezolutie normala codate MPEG-2.

Standardele MPEG-1 si MPEG-2 au creat posibilitatea dezvoltarii televiziunii digitale si, de asemenea posibilitatea televiziunii interactive pe CD-ROM si apoi pe DVD (Digital Video Disk)..

Standardul MPEG-4 (ISO/IEC 14496-2 din anul 2000) a fost dezvoltat pentru a oferi utilizatorilor un nou nivel de interactiune cu continutul vizual. Metodele de compresie sunt diferite de cele din standardele MPEG-1 si MPEG-2. Standardul MPEG-4 ofera tehnologii pentru a vizualiza, accesa si manevra obiecte īn locul esantioanelor, tehnologii robuste la erori si pentru o gama larga de viteze de transmisie. Domeniile de aplicatie sunt televiziunea digitala, aplicatii grafice interactive (continut sintetic) si multimedia interactiva.

Īn loc sa considere imaginea ca fiind formata din esantioane (pixeli) de diverse amplitudini si cu variatie īn timp pentru imagini cu miscare (asa cum se īntāmpla la MPEG-1 si MPEG-2), standardul MPEG-4 considera imaginea formata din obiecte care se afla īn fata unui fundal, atāt obiectele cāt si fundalul putānd sa-si modifice īn timp pozitia si forma pentru imagini cu miscare. Este un mod de descriere a imaginilor mai apropriat de ceea ce se īntāmpla īn cadrul sistemului vizual uman, lucru ce poate explica obtinerea unor imagini de buna calitate la viteze de bit relativ scazute.


Standardele MPEG-1 si MPEG-2

Tabelul 4.4 prezinta mai multe formate de secvente video si parametrii corespunzatori ai standardului MPEG-1 si MPEG-2.


Tabelul 4.4

FORMAT

PARAMETRI VIDEO

VITEZĂ DE BIT DUPĂ COMPRESIE

STANDARD MPEG

SIF

352x240    30 Hz

1,2-3 Mbit/s

MPEG-1

CCIR 601

720X486    30 Hz

5-10 Mbit/s

MPEG-2

EDTV

960x486    30 Hz

7-15 Mbit/s

MPEG-2

HDTV

1920x1080    30Hz

20-40 Mbit/s

MPEG-2


Standardul MPEG-2 este utilizat atāt pentru aplicatii simetrice cāt si pentru aplicatii asimetrice. Aplicatiile asimetrice sunt caracterizate prin utilizarea frecventa a decompresiei, īn timp ce procesul de compresie este efectuat o singura data. Exemplele includ televiziunea digitala ca si aplicatii interactive (filme la cerere, educatie la distanta, etc).

Aplicatiile simetrice necesita o utilizare egala a proceselor de compresie si decompresie. Exemple de astfel de aplicatii sunt posta multimedia si videoconferinta.

Standardul MPEG-2 consta din trei parti

Sincronizarea si multiplexarea secventelor video si audio.

Video.

Audio.

Se prezinta īn continuare principiile standardului video.

Se definesc 8 frecvente de cadre

23,976 Hz ; 24 Hz ; 25 Hz ; 29,97 Hz ; 30 Hz ; 50 Hz ; 59,94 Hz ; 60 Hz .

Fiecare imagine se īmparte īn zone numite macroblocuri cu dimensiunea de 16 x 16 pixeli pentru Y si 8 x 8 pixeli pentru U si V.

Īn standardul MPEG-2 cadrele de imagine sunt codate utilizānd trei algoritmi diferiti, asa cum se prezinta īn figura 4.6.

Fig.4.6 Tipuri de cadre īn standardul MPEG-2


Cadrele de tip I sunt codate intracadru utilizānd transformata cosinus discreta (DCT) īn mod sismilar cu standardul JPEG. Aceste cadre sunt puncte de acces aleator īn fluxul de date MPEG-2 si au cea mai scazuta rata de compresie.

Cadrele de tip P sunt codate cu predictie temporala avānd ca referinta cadre de tip P sau de tip I anterioare. Raportul de compresie pentru aceste cadre este net superior fata de cadrele I.

Cadrele de tip B sunt codate bidirectional īn timp utilizānd doua cadre de referinta (unul anterior si unul posterior) care pot fi de tip I sau P. Aici se obtine rata de compresie cea mai mare.

Din cele expuse mai sus rezulta ca ordinea de decodare va fi diferita de ordinea de codare. Cadrul P (5) trebuie sa fie decodat īnaintea cadrelor B (2,3,4), iar cadrul I (9) īnaintea cadrelor B (6,7,8). La transmisia semnalului MPEG ordinea de transmisie trebuie sa fie 1,5,2,3,4,9,6,7,8.

Daca este necesar acces aleator rapid cea mai buna solutie ar fi codarea tuturor cadrelor drept cadre I (MPEG devine identic cu MJPEG). Cea mai mare rata de compresie se obtine cu un numar cāt mai mare de cadre de tip B.

Procesul de codare pentru cadrele de tip B si P include estimarea miscarii pentru extragerea informatiei de miscare din secventa video. Pentru fiecare bloc 16 x 16 din cadrele B si P se calculeaza unul sau doi vectori de miscare. Pentru cadrele B se calculeaza un vector de miscare, iar pentru cadrele B interpolate se calculeaza doi vectori de miscare. Standardul MPEG-2 nu indica un anumit algoritm pentru estimarea miscarii dar specifica modul de codare a rezultatului. Se codeaza vectorul de miscare si diferenta dintre blocuri. Zona de cautare (amplitudinea vectorului de miscare) nu este definita īn standard dar este restrānsa prin definirea gamei vectorului. Cu cāt zona de cautare este mai mare, cu atāt estimarea miscarii este mai buna (desi calculul este mai complex) si rata de compresie mai mare.


Standardul MPEG-4

Aplicatiile multimedia atrag atentia din ce īn ce mai mult industriei telecomunicatiilor, a bunurilor de consum electronice si industriei de calculatoare. Īntr-un sens larg multimedia este cadrul general de interactiune cu informatiile provenite din mai multe surse, inclusiv video.

Un standard multimedia este de asteptat sa ofere suport pentru un mare numar de aplicatii. Aceste aplicatii se traduc īntr-un set specific de cerinte care pot sa fie foarte diferite. Un domeniu comun pentru majoritatea aplicatiilor este necesitatea de a suporta interactivitatea cu diverse tipuri de date. Aplicatiile legate de informatia vizuala pot fi gruoate pe baza mai multor trasaturi :

Codarea formei poate fi realizata īn mod binar (forma fiecarui obiect fiind descrisa printr-o masca binara) , sau īn modul corespunzator unei scari de gri (permitānd astfel transparemta obiectelor afisate si reducānd fenomenele de aliere la marginile obiectului).

Compensarea miscarii se face pe blocuri, cu modificarea corespunzatoare pentru marginile obiectului. Marimea blocurilor poate fi 16 x 16 sau 8 x 8, cu rezolutie spatiala de jumatate de esantion.

Codarea zonelor cu texturi se bazeaza pe utilizarea transformatei cosinus discreta (DCT) pe blocuri 8 x 8, cu modificari corespunzatoare pentru blocurile de la marginea obiectelor. Zonele statice cu texturi se pot coda cu transformarea wavelet.

Rezistenta la erori se realizeaza prin utilizarea unor markeri de sincronizare, coduri de extensie pentru header si coduri reversibile cu lungime variabila.

Scalabilitatea se realizeaza atāt spatial cīt si temporal. MPEG-4 realizeaza scalabilitate pe baza de obiect, cu restrictia ca forma obiectului sa fie rectangulara.


Punctele de conformitate pentru MPEG-4 sunt definite ca Profilul Simplu (Simple Profile), Profilul Nucleu (Core Profile) si Profilul Principal (Main Profile). Primele doua profile sunt specifice pentru imagini cu rezolutie tipica QCIF si CIF (vezi paragraful 4.5.3.), cu viteze de bit dup[ compresie de 64 kbit/s, 128 kbit/s, 384 kbit/s si 2 Mbit/s. Profilul principal se foloseste pentru imagini cu rezolutie tipica CIF, ITU-R 601 si HDTV, cu viteze de bit dup[ compresie de 2 Mbit/s, 15 Mbit/s si 38,4 Mbit/s.


4.5.3 Alte standarde de compresie a imaginilor

Recomandarea CCITT H.261 din 1990 (cunoscuta si sub denumirea de p x 64) este optimizata pentru a obtine rapoarte foarte mari de compresie pentru imagini color cu miscare. Ea se utilizeaza īn videotelefonie si videoconferinta.

Algoritmul de compresie combina codarea intracadru DCT cu codarea cu predictie intercadre. Deoarece īn aplicatiile de videoconferinta si videotelefonie nu exista miscare foarte rapida, iar majoritatea timpului miscarea lipseste, algoritmul utilizeaza strategii de estimare si compensare a miscarii limitate spatial la 15 pixeli. Se pot obtine rapoarte de compresie īntre 100 si 2000

Standardul este utilizat pe canale ISDN cu viteze de transmisie multipli ai vitezei de baza de 64 Kbit/s. Numarul p poate fi cuprins īntre 1 si 30, de unde rezulta ca viteza de transmisie este cuprinsa īntre 64 Kbit/s si 2 048 Kbit/s. Pentru p egal cu 1 sau 2 se pot implementa doar comunicatii de tip videotelefon. Pentru p mai mare decāt 6 se poate transmite o videoconferinta.

Spre deosebire de JPEG care admite o mare varietate de formate de imagine, standardul H.261 precizeaza foarte exact formatul de imagine. Imaginile au frecventa cadrelor de 29,97 Hz (59,94 Hz : 2) iar īn procesul de codare este posibil sa se genereze o secventa comprimata cu 10 - 15 cadre/s. Componentele imaginii , luminanta si cele doua diferente de culoare sunt subesantionate conform Rec. CCIR 601 (standardul digital de studio) la 6,75 MHz pentru luminanta si 3,375 MHz pentru cele doua diferente de culoare.

Sunt specificate doua formate de rezolutie cu raport de aspect al imaginii de 4

a)     Formatul comun intermediar (CIF=Common Intermediate Format) cu rezolutie egala cu 288 linii x 352 pixeli pentru semnalul de luminanta si 144 linii x 176 pixeli pentru semnalele diferenta de culoare.

b)    Formatul sfert CIF (QCIF Quarter CIF) care are rezolutia redusa la jumatate pe fiecare directie (orizontala si verticala) fata de formatul CIF (144 linii x 176 pixeli pentru luminanta si 72 linii x 88 pixeli pentru diferentele de culoare), adica o rezolutie de 4 ori mai mica pe ansamblu decāt la formatul CIF.

Formatul QCIF necomprimat are viteza de transmisie de 9,115 Mbit/s , iar formatul CIF necomprimat are viteza de transmisie de 36,45 Mbit/s.

Algoritmul de codare cuprinde :

Codare intracadru (corespunde codarii tip I din MPEG).

Codare intercadre (corespunde codarii tip P din MPEG).

Conform standardului H.261 nu este obligatoriu ca dispozitivul codor sa determine un vector de miscare, de unde rezulta ca o implementare simpla considera doar diferentele dintre macroblocurile situate īn aceeasi pozitie īn cadre succesive (vector de miscare egal cu 0). Daca se utilizeaza o implementare mai complexa componentele vectorului de miscare se codeaza entropic cu un sistem VLC (Variable Length Coding). Cuantizarea este liniara si pasul de cuantizare se regleaza īn conformitate cu cantitatea de date din registrul tampon (buffer). Acest mecanism forteaza o viteza de date constanta la iesirea codorului.

Recomandarea 723 CCIR este un alt standard de compresie pentru transmisia semnalelor video care se refera la codarea pentru transmisie a imaginilor din standardul digital de studio 4 : 2 : 2. Viteza de transmisie este cuprinsa īntre 34 Mbit/s si 140 Mbit/s.












































Document Info


Accesari: 6560
Apreciat: hand-up

Comenteaza documentul:

Nu esti inregistrat
Trebuie sa fii utilizator inregistrat pentru a putea comenta


Creaza cont nou

A fost util?

Daca documentul a fost util si crezi ca merita
sa adaugi un link catre el la tine in site


in pagina web a site-ului tau.




eCoduri.com - coduri postale, contabile, CAEN sau bancare

Politica de confidentialitate | Termenii si conditii de utilizare




Copyright © Contact (SCRIGROUP Int. 2024 )