REPREZENTAREA DATELOR IN CALCULATOR

Informatica

ALTE DOCUMENTE

NTRAREA DATELOR TELEMETRICE ÎN SISTEM

FIGURI

Obiecte de desen

METODA BACKTRAKCING

BAZELE INFORMATICII - Marketing, Profilul: Economic

Elemente de sisteme deschise

PowerDoc - UZINEXPORT

NetWare-Security

PROGRAM GESTIUNE & SETARE NEI_PM

Utilizarea computerelor si organizarea fisierelor (WINDOWS)

REPREZENTAREA DATELOR ÎN CALCULATOR

Se stie cã un calculator numeric prelucreazã numere binare. Acest lucru tine de suportul fizic de manipulare, transport si stocare a datelor interne, mai bine zis este legat de faptul cã semnalul fizic purtãtor de informatie este o tensiune continuã cu douã valori: una înaltã (High) si una joasã (Low). Acestor douã valori li se asociazã natural douã valori logice: T (true, adevãrat) si F (false, fals) sau cele douã cifre binare1 si 0.

Ca urmare a acestei asocieri spunem, prin abuz de limbaj, cã un calculator numeric prelucreazã numere binare. Ca si un numãr zecimal, un numãr binar are mai multe cifre binare. Sistemul de numeratie binar folosit pentru reprezentarea informatiei în calculatoare este un sistem de numeratie ponderal, întocmai ca sistemul de numeratie zecimal.

Reprezentarea naturalã a numerelor la nivelul perceptiei umane este cea zecimalã, pe când reprezentarea proprie masinilor de calcul este cea binarã. De aici rezultã necesitatea compatibilizãrii sau interfatãrii între aceste douã moduri de reprezentare a numerelor. Cum cele douã sisteme de numeratie sunt ponderale, o primã diferentã este aceea cã sistemul zecimal foloseste ca ponderi puterile întregi (pozitive sau negative) ale lui 10 (zece) iar sistemul binar va folosi puterile întregi (pozitive sau negative) ale lui 2.

În altã ordine de idei, dacã pentru reprezentarea externã sunt semnificative simbolurile de reprezentare (cifre, semnele + sau -, punct zecimal sau binar, mantisã sau exponent), pentru reprezentarea internã sunt necesare conventii de reprezentare: indiferent de tipul datelor, acestea vor fi colectii sau siruri de cifre binare cãrora, prin conventie, li se atribuie semnificatii.

Într-o primã instantã, este foarte important sã facem o distinctie între tipurile de date recunoscute de un calculator (sau mai bine zis de microprocesorul cu care este dotat calculatorul personal) si formatele de reprezentare ale acestor date ce reprezintã conventii pentru reprezentarea tipurilor de date, atât la nivel intern (în memoria calculatorului) cât si la nivel extern, al perceptiei umane.

Din punctul de vedere al tipurilor de date care sunt implementate în limbajul C putem spune cã distingem douã mari categorii, date de tip întreg (integer) si date de tip real (float). Formatele de reprezentare internã/externã vor fi prezentate în cele ce urmeazã. Cel mai simplu de reprezentat sunt numerele naturale. Se face apoi trecerea la numerele întregi negative si apoi la numerele reale care au o parte întreagã si una fractionarã.

2.1. Reprezentarea internã/externã a numerelor

Reprezentarea internã a numerelor se referã la modul în care se stocheazã datele în memoria RAM a calculatorului sau în registrii microprocesorului. În acest format se prelucreazã numerele pentru implementarea diverselor operatii aritmetice. La nivelul calculatorului informatia nu poate fi decât binarã. În aceastã reprezentare putem scrie numere întregi pozitive sau negative sau numere reale.

Existã un standard IEEE care reglementeazã modul de reprezentare internã a datelor.

Reprezentarea externã este reprezentarea numerelor la nivelul utilizatorului uman, deci în principiu se poate folosi orice bazã de numeratie pentru reprezentarea numerelor. La nivel de reprezentare externã se foloseste semnul "-" în fata unui numãr în cazul în care acesta este negativ sau punctul care separã partea întreagã de cea fractionarã. De asemenea, numerele întregi interpretate fãrã semn se pot afisa si în format binar, octal sau hexazecimal, deci în bazele 2, 8 sau 16.

În cele ce urmeazã ne vom pune urmãtoarele probleme:

cum se reprezintã extern un numãr natural

cum se reprezintã intern un numãr natural

cum se reprezintã extern un numãr întreg negativ

cum se reprezintã intern un numãr întreg negativ

cum se face conversia de la reprezentarea externã la cea internã

cum se face conversia de la reprezentarea internã la cea externã

Reprezentarea externã a numerelor

În ceea ce priveste reprezentarea externã, nu sunt nici un fel de dificultãti deoarece fiecare este familiarizat cu reprezentarea zecimalã a numerelor naturale sau reale. Trebuie mentionat de la început cã orice tip de reprezentare pe care o vom folosi este ponderalã în sensul cã pozitia cifrelor în numãr nu este întâmplãtoare ci conformã cu o pondere corespunzãtoare unei puteri a bazei de numeratie.

O caracteristicã a reprezentãrilor externe este folosirea unor conventii de format unanim acceptate si de altfel foarte naturale pentru un utilizator uman. Spre exemplu, pentru a exprima numere negative se foloseste semnul "-" iar pentru reprezentarea numerelor reale se foloseste punctul "." pentru delimitarea pãrtii întregi de cea fractionarã. De asemenea, suntem familiarizati si cu notatia stiintificã în care intervine mantisa si exponentul (în virgulã mobilã).

Reprezentarea zecimalã este cea mai naturalã pentru utilizatorul uman. Vom oferi în continuare câteva exemple de reprezentãri zecimale externe:

Numãr	Reprezentare normalã	Reprezentare stiintificã
		0.37x10²
		-0.37x10²
		0.375x10⁰
		-0.375x10⁰
		0.375x10^-2
		-0.375x10^-2
		0.12375x10²
		-0.12375x10²

În general dorim sã obtinem rezultatele numerice ale programelor pe care le concepem într-o formã de reprezentare accesibilã. Totusi, calculatorul trebuie informat asupra formatului de reprezentare în care dorim sã se afiseze datele necesare. Aceasta înseamnã cã va trebui sã specificãm câte cifre se vor folosi la partea întreagã si câte la partea fractionarã sau dacã dorim reprezentare stiintificã sau nu. De altfel si operatorul uman face aceleasi conventii de reprezentare. Spre exemplu stim cã numãrul nu poate fi exact reprezentat ca un numãr zecimal, deci fixãm un format de reprezentare. Dacã formatul ale se limiteazã la 4 cifre zecimale, atunci vom scrie

Limbajul C are o serie de functii de reprezentare cu format a datelor numerice sau alfanumerice prin care programatorul poate impune un format extern cu care se manipuleazã datele.

Reprezentarea externã a numerelor întregi

Numerele naturale se pot reprezenta fie în baza de numeratie 10, fie în orice altã bazã.

În general, un numãr întreg în baza b se poate reprezenta cu un numãr predeterminat de cifre . Multimea B reprezintã multimea cifrelor sau simbolurilor de reprezentare. Spre exemplu:

Noi suntem obisnuiti sã folosim multimea cifrelor zecimale. Dacã totusi se foloseste o bazã de reprezentare mai mare decât 10, atunci multimea cifrelor zecimale nu mai este suficientã pentru reprezentarea numerelor în acea bazã. Spre exemplu sã considerãm baza b = 16 care va folosi 16 cifre hexazecimale (sau mai simplu hexa). Prin conventie, cele 16 cifre hexazecimale vor fi:

Cifra	Simbol	Cifra	Simbol


			A
			B
			C
			D
			E
			F

Forma generalã de reprezentare externã a numerelor întregi este de forma:

Valoarea numericã zecimalã a numãrului va fi:

În continuare vom studia urmãtoarele probleme:

cum se face conversia unui numãr din baza în baza

cum se face conversia inversã, din baza în baza

cum se face conversia dintr-o bazã oarecare în altã bazã

Pentru a reprezenta un numãr natural din baza 10 în baza 2, se împarte succesiv numãrul la 2 si se utilizeazã resturile la aceste împãrtiri în ordinea inversã de cum au fost obtinute.

a) Conversia din baza 10 în baza 2 si invers

Fie de exemplu numãrul zecimal 37. Reprezentarea sa binarã va fi obtinutã astfel:

Conversia inversã, din baza 2 în baza 10 este simplã si utilizeazã ponderea 2:

Cu aceste numere naturale putem face o serie de operatii aritmetice. Adunarea numerelor naturale binare se face întocmai ca la cele în reprezentare în baza 10, dupã regula:

transport 1 spre rangul urmãtor

Astfel, sã facem adunarea 37+25 în binar:

Se observã cum se obtine rezultatul corect.

Înmultirea se face în mod asemãnãtor, ca o adunare repetatã. Spre exemplu, sã calculãm 37x25

1110011101₂ = 1x2⁰ + 1x2² + 1x2³ +1x2⁴ +1x2⁷ +1x2⁸+1x2⁹ = 1+4+8+16+128+256+512 = 925₁₀

b) Conversia dintr-o bazã oarecare într-o altã bazã .

Fie spre exemplu numãrul care se doreste scris în baza 13.

Pentru a realiza aceastã conversie, vom folosi baza intermediarã 10. Vom converti mai întâi în baza 10 si apoi numãrul zecimal obtinut îl vom trece în baza 13. Se observã cum un numãr în baza 11 poate contine si cifra A=10 iar un numãr în baza 13 poate contine cifrele A=10, B=11, C=12.

Reprezentarea externã a numerelor reale

Semnificativã pentru utilizatorul uman este reprezentarea zecimalã (în baza b=10) a numerelor reale, cu care suntem obisnuiti. Fatã de reprezentarea numerelor întregi, la numerele reale intervine simbolul punct "." care delimiteazã partea întreagã de partea fractionarã. Cu alte cuvinte, cu ajutorul numerelor reale putem reprezenta si numere care nu sunt întregi. Forma generalã a unui numãr real reprezentat într-o bazã oarecare b este:

Valoarea zecimalã a numãrului de mai sus va fi:

Se observã cum punctul delimiteazã partea întreagã (exprimatã printr-o combinatie de puteri pozitive ale bazei b) si partea fractionarã (exprimatã printr-o combinatie de puteri negative ale bazei b).

Semnificatie pentru programator si pentru producãtorii de software sau microprocesoare au bazele de reprezentare si , deoarece baza 10 este naturalã pentru reprezentarea externã a numerelor iar baza 2 este naturalã pentru reprezentarea binarã, internã, a numerelor.

În formulele de mai sus avem o reprezentare a unui numãr real cu n cifre pentru partea întreagã si m cifre pentru partea fractionarã.

Asa cum în sistemul zecimal reprezentãm cu un numãr finit de cifre zecimale numerele reale, acelasi lucru se va întâmpla si în sistemul binar. Punctul binar va avea o semnificatie asemãnãtoare cu punctul zecimal, care face separarea între partea întreagã si cea fractionarã. Cifrele binare situate dupã punctul binar vor corespunde puterilor negative ale lui 2.

Astfel, în general, un numãr real va avea reprezentarea binarã:

Spre exemplu, numãrul 12.25 va avea reprezentarea binarã:

Partea întreagã a unui numãr real se reprezintã binar precum numerele întregi (cu sau fãrã semn). Pentru a determina partea fractionarã, se procedeazã în mod invers ca la partea întreagã.

Astfel, dacã partea fractionarã zecimalã se reprezintã binar, atunci aceasta se înmulteste succesiv cu 2. Dacã rezultatul depãseste valoarea 1, atunci se înscrie un bit 1. Se continuã mai departe cu dublarea valorii care depãseste 1. Dacã rezultatul nu depãseste valoarea 1, atunci se înscrie un bit 0 si se continuã multiplicarea cu 2. Spre exemplificare, vom vedeaa cum se obtine reprezentarea binarã a lui 12.25. Partea întreagã este 12. Ea se reprezintã binar prin împãrtiri succesive la 2 si considerarea resturilor. Partea fractionarã este 0.25

Partea fractionarã P.F.	P.F. x 2	Noua P.F.	Bitul înscris

Obtinem exact rezultatul cãutat: 12.25 = 1100.01

Sã mai considerãm un alt exemplu. Sã reprezentãm numãrul 5.37

Partea întreagã are reprezentarea 5₁₀ =101₂

Partea fractionarã P.F.	P.F. x 2	Noua P.F.	Bitul înscris









Etc..			Etc..

Obtinem: 5.37₁₀ = 101.010111101...₂

Cu cât mai multe cifre binare vom retine dupã punctul binar, cu atât vom fi mai aproape de valoarea exactã 5.37.

Obtinem un rezultat foarte important: Desi un numãr zecimal poate avea un numãr finit de cifre zecimale dupã punctul zecimal, reprezentarea sa binarã internã poate avea un numãr infinit de cifre binare. Este valabilã si reciproca: un numãr real zecimal cu un numãr infinit de cifre se poate reprezenta într-o altã bazã pe un numãr finit de cifre ( ex: ). Cum orice reprezentare binarã internã este pe un numãr finit de biti, numãrul poate sã nu fie reprezentat exact în calculator, ci cu o anumitã aproximatie. Acest lucru este decisiv pentru a întelege importanta lungimii reprezentãrii numerelor în calculator. Cu cât un numãr binar se reprezintã pe un numãr mai mare de biti, cu atât precizia de reprezentare creste.

2.3 Reprezentarea internã a numerelor

Deoarece semnalul intern purtãtor de informatie într-un calculator este de tip binar, un numãr zecimal (întreg sau real) se va reprezenta intern în baza 2 cu ajutorul unui numãr binar. O cifrã binarã se numeste bit (Binary Digit) si poate fi fie 0 fie 1.

În reprezentarea externã a numerelor am vãzut cã se poate folosi orice bazã de numeratie (cu cifrele corespunzãtoare). De asemenea, numerele pot fi prefixate cu un simbol de semn si pot include în reprezentare si punctul de saparatie între partea întreagã si cea fractionarã.

În reprezentarea internã acest lucru nu mai este posibil deoarece semnele plus (+), minus (-) sau punct (.) nu au nici o semnificatie pentru calculator. Orice numãr (orice tip de datã) este reprezentat la nivel intern de un numãr prestabilit de biti. Specialistii din industria software au ajuns la un consens de reprezentare concretizat prin standardul IEEE 754 de reprezentare a internã a numerelor reale în computere.

Reprezentarea internã a numerelor a impus în limbajul C definirea asa-numitelor tipuri de date.

Tipul unei date reprezintã modul în care microprocesorul stocheazã în memorie si prelucreazã cu ajutorul registrilor interni o datã. Tipul unei date se referã la lungimea sa de reprezentare (pe câti biti se reprezintã data) precum si ce semnificatie au anumite câmpuri de biti din cadrul reprezentãrii.

2.3.1 Reprezentarea internã a numerelor întregi

Un numãr binar este o colectie de cifre binare ponderate fiecare cu o putere a lui 2. Bitul corespunzãtor ponderii celei mai mari, situat cel mai în stânga, se numeste MSB (Most Significand Bit) iar cel corespunzãtor ponderii celei mai mici, situat cel mai în dreapta, se numeste LSB (Less Significand Bit). În cazul reprezentãrii binare a numerelor naturale, reprezentarea externã (cea perceputã de operatorul uman) si cea internã (cea prelucratã de procesorul calculatorului) sunt asemãnãtoare. Cum pentru operatorul uman operatorii '+' sau '-' semnificã faptul cã un numãr este pozitiv sau negativ, este necesarã o conventie pentru reprezentarea internã a numerelor întregi negative.

Aceastã conventie prevede folosirea MSB pentru reprezentarea semnului numerelor întregi. Dacã numãrul este pozitiv, se adaugã în pozitia MSB bitul de semn '0', iar dacã numãrul este negativ se utilizeazã în pozitia MSB bitul de semn '1'. Mai mult, numerele negative se reprezintã în asa numitul complement fatã de 2.

Reprezentarea numerelor întregi negative în complement fatã de 2

Aceastã formã de reprezentare a numerelor negative necesitã parcurgerea urmãtorilor pasi:

pas1. Se reprezintã modulul numãrului negativ, folosind bit de semn (egal cu 0, evident)

pas2. Se complementeazã toti bitii numãrului astfel obtinut. Complementarea înseamnã transformarea bitului 0 în bitul 1 si a bitului 1 în bitul 0.

pas3. Numãrul astfel obtinut se adunã cu 1.

De exemplu, sã reprezentãm numãrul -37.

pas 1. |-37| = 37

pas2. 0100101---->1011010

pas3. 1011010 + 1 = 1011011 => -37₁₀ = 1011011₂

Evident, MSB este bitul de semn si este egal cu 1.

La o primã vedere, este posibil sã credem cã prin utilizarea complementului fatã de 2 putem pierde semnificatia numãrului negativ. Pentru a vedea ce numãr negativ este reprezentat, putem repeta procedeul de mai sus si obtinem reprezentarea numãrului pozitiv dat de modulul sãu.

O modalitate mai simplã este alocarea ponderii corespunzãtoare bitului de semn dar pe care o considerãm cã reprezintã un numãr negativ. Astfel:

011011₂ = -1x2⁶ + 1x2⁴ + 1x2³ + 1x2¹ + 1x2⁰ = -64 + 27 = -37

2.3.2 Adunarea, scãderea si înmultirea numerelor întregi

Aceste operatii se executã folosind reprezentarea în complement fatã de 2 a numerelor întregi, sau, mai bine zis, se executã folosind în algoritmi bitul de semn ca pe un bit obisnuit.

De exemplu, dorim sã calculãm:

(-25)x37

(-25)x(-37)

Pentru efectuarea acestor calcule, vom scrie reprezentãrile cu bit de semn ale numerelor implicate:

Se observã cã 25 si (-25) se reprezintã pe 6 biti iar 37 si (-37) pe 7 biti.

Deoarece am observat cã bitii unui întreg cu semn nu au toti aceeasi semnificatie, este nevoie sã reprezentãm numerele cu care lucrãm pe un acelasi numãr de biti. La adunãri sau scãderi, bitii de semn se vor afla în aceeasi pozitie (vor avea aceeasi pondere) si vom obtine astfel rezultate corecte. Pentru a avea o scriere pe un acelasi numãr de biti, se adaugã (completeazã) la stânga bitul de semn de un numãr corespunzãtor de ori. Astfel:

În continuare vom pune în evidentã importanta gamei de reprezentare, adicã a domeniului de valori ale datelor. Sã considerãm, spre exemplu, adunarea a douã numere cu semn reprezentate pe un octet (8 biti). Aceste numere sunt cuprinse în gama

Dacã vom dori sã adunãm douã numere din acest domeniu si sã reprezentãm rezultatul tot pe un octet, putem avea surprize. De exemplu, sã considerãm operatiile (117-12) si (117+12). Se observã cã operanzii sunt în gama de reprezentare a numerelor cu semn pe 8 biti. Prin prima scãdere, ne asteptãm sã obtinem un rezultat, 105, în aceeasi gamã de reprezentare.

117-12=117+(-12) = 01110101+11110100 = 01101001 = 105₁₀, rezultat corect.

rezultat evident incorect.

Incorectitudinea provine de la faptul cã rezultatul a depãsit gama de reprezentare. Dacã rezultatul este interpretat pe 9 biti de exemplu, gama de reprezentare devine si rezultatul va fi

117+12 = 001110101+000001100 = 010000001 = 129₁₀, rezultat corect.

Ca o concluzie preliminarã, retinem cã pentru a obtine rezultate corecte este necesar sã precizãm dacã se lucreazã sau nu cu bit de semn si pe câti biti se face reprezentarea, pentru cã numai în acest context interpretarea rezultatelor este corectã.

În ceea ce priveste înmultirea numerelor întregi cu semn (cu bit de semn), aici problema nu mai are o rezolvare asemãnãtoare, în sensul cã nu putem trata bitii de semn la fel cu cei de reprezentare ai valorii. Astfel, procesorul studiazã bitii de semn si ia o decizie în privinta semnului rezultatului. De fapt, se realizeazã functia logicã XOR a bitilor de semn. Numerele negative se vor lua în modul, iar operatiile de înmultire se vor face numai cu numere pozitive. La final, functie de semnul rezultatului, se ia decizia reprezentãrii corecte a rezultatului.

Spre exemplu, sã calculãm (-25)x37. Pentru aceasta, procesorul va primi pentru procesare urmãtoarele douã numere:

Se analizeazã separat bitii de semn si se ia decizia cã rezultatul va fi negativ, deci, la final, se va reprezenta în complement fatã de 2. Mai departe se va lucra cu 25, modulul numãrului (-25), care se obtine prin complementarea fatã de 2 a numãrului binar 1100111:

Se va retine pentru procesare numai numãrul (fãrã semn) 11001, care se va înmulti cu numãrul (fãrã semn) 100101, obtinând, asa cum am arãtat mai sus, valoarea 1110011101. Mai departe, se adaugã bitul de semn, 0 pentru numere pozitive, obtinându-se 01110011101. Acest ultim numãr se va complementa fatã de 2, obtinându-se 10001100010+1=[1]0001100011, adicã valoarea -1024+99 = -925, valoarea corectã.

Ca o concluzie, pentru a furniza rezultate corecte, procesorul va trebui informat în permanentã despre ce fel de numere prelucreazã (cu sau fãrã semn) si care este lungimea lor de reprezentare (toate trebuie sã aibã aceeasi lungime).

Reprezentarea în complement fatã de 2 se poate folosi si pentru numerele reale negative, bitul de semn fiind MSB de la partea întreagã. Astfel, -12.25 poate avea reprezentarea:

Pentru înmultirea numerelor reale rãmân valabile considerentele de la numere întregi.

În cazul de mai sus, problema reprezentãrii numãrului negativ a fost rezolvatã cu ajutorul bitului de semn dar problema reprezentãrii punctului binar va avea altã rezolvare.

2.3.3 Reprezentarea internã a numerelor reale

Din considerentele de la reprezentarea externã a datelor putem trage alte concluzii importante din punct de vedere al reprezentãrii interne.

Numerele binare întregi fãrã semn au aceeasi reprezentare atât externã cât si internã.

Numerele întregi cu semn (care în reprezentare externã sunt prefixate cu ) au ca reprezentare internã un bit de semn, dar care se trateazã deosebit de ceilalti biti ai reprezentãrii. Toti întregii cu semn, care au MSB=1, sunt reprezentati intern în complement fatã de 2.

Numerele reale se pot reprezenta identic cu cele întregi cu semn, cu o precizare: nu se face o deosebire netã între bitii reprezentãrii pãrtii întregi si cei ai reprezentãrii pãrtii fractionare. Acest tratament nediferentiat provine de la reprezentarea stiintificã uzualã cu mantisã si exponent. Fie, spre exemplu, reprezentarea binarã a numãrului 12.25:

Calculatorul poate reprezenta sirul de biti 110001 si retine faptul cã punctul se pune dupã primii 4 biti ai reprezentãrii. Acest lucru se întâmplã si în realitate. Deci, singura deosebire între reprezentarea numerelor reale si a celor întregi constã în faptul cã numerele reale necesitã o informatie suplimentarã despre asa numitul exponent, în cazul nostru numãrul pozitiv 4.

În cele ce urmeazã, vom prezenta tipurile de bazã pe care le pot avea datele în reprezentarea internã.

Tipul unei date determinã modul în care procesorul stocheazã si prelucreazã data respectivã. Cum primele procesoare care au condus la aparitia pe piatã a primelor calculatoare pentru neprofesionisti (asa numitele Home Computers) au fost procesoare capabile sã prelucreze si sã transmitã în paralel 8 biti, a fost naturalã gruparea a 8 biti într-o entitate numitã byte.

1B = 8b (adicã un byte reprezintã 8 biti)

Procesoarele au evoluat, ajungându-se în prezent la procesoare pe 64 de biti. Cum evolutia lor s-a fãcut trecându-se succesiv prin multipli de 8 biti, s-au impus si alte entitãti de reprezentare a informatiei, pe care le vom prezenta sintetic în tabelul de mai jos.

	Denumire		Dimensiune				Denumire echivalentã		Notatie
			Nr. byte		Nr. biti		Denumire echivalentã
Byte		1B		8 b		octet		B
Word		2B		16 b		cuvânt		W
Double_Words		4B		32 b		Cuvânt dublu		DW
Quad_Words		8B		64 b		Cuvânt cvadruplu		QW
Ten_Words		10B		80 b				TW

A determina reprezentarea internã înseamnã sã determinãm lungimea reprezentãrii (de obicei în multipli de octeti), modul de interpretare al bitilor ce compun reprezentarea si gama de reprezentare, adicã sã determinãm magnitudinea (valorile minime si maxime pozitive si negative) ce pot fi reprezentate în formatul respectiv.

În limbajul C, existã douã tipuri de reprezentare pe care le putem numi principale: tipul întreg si tipul real, fiecare având si anumite particularizãri. Astfel, tipul întreg (int) include si tipul caracter (char) iar tipul real (float) include si tipul real extins (double).

Tipurile de date le vom reprezenta de la simplu la complex, în ordinea char, int, float, double.

Tipurile de bazã sunt char, int, float, double si cu ajutorul modificatorilor de tip putem obtine diverse particularizãri. Modificatorii pot fi signed, unsigned, short, long.

Ca o generalitate, numerele sunt reprezentate intern luându-se în considerare bitul de semn, deci implicit numerele întregi sau reale au MSB bit de semn. Dacã se specificã explicit, prin modificatorul unsigned, nu se mai considerã (interpreteazã) bitul de semn.

Tipul char

Codul ASCII (American Standard Code for Information Interchange) este un cod de reprezentare a caracterelor. Prin caracter întelegem unitãtile de bazã care se pot tasta (intrãri de la tastaturã), tipãri la imprimantã sau afisa pe ecran. Tastatura reprezintã, de exemplu, dispozitivul de intrare care contine de fapt o întreagã colectie de caractere ce pot fi emise prin apãsarea unei taste. Pentru a fi receptat, emis sau prelucrat de cãtre calculator, fiecare caracter are asociat un cod binar (o combinatie de biti) care îl identificã în mod unic. Cum cu un octet putem codifica 2⁸ = 256 caractere, octetul s-a dovedit o entitate suficientã pentru codificarea caracterelor utilizate în informaticã. În 256 de coduri distincte se pot include literele mari si mici ale alfabetului anglo-saxon (inclusiv litere specifice diverselor alfabete precum cel chirilic sau particularitãti ale diferitelor tãri: s, t, â, î, s... în românã, de exemplu). Se mai pot include caractere ce reprezintã numere, semne de punctuatie sau alte caractere de control. Codul ASCII a standardizat aceastã codificare, astfel încât el este folosit în cvasitotalitatea calculatoarelor (doar mainframe-urile IBM mai folosesc un alt cod, mai vechi, numit EBCIDIC). Dacã se declarã o datã de tip char, ea este consideratã explicit de tipul signed char (cu MSB bit de semn), deci reprezentarea internã este de forma:

Gama de reprezentare este cuprinsã între

Dacã se declarã tipul unsigned char, atunci nu se mai considerã (interpreteazã) bitul de semn si data se considerã întreagã pozitivã, în gama

Tabelele de mai sus contin codurile ASCII ale primelor 128 de caractere. Coloana D semnificã valoarea zecimalã (decimal) a octetului, coloana H reprezintã aceeasi valoare reprezentatã în format hexazecimal (baza 16) iar în coloana Sym se reprezintã simbolul afisat pe monitoarele PC.

Întregul alfabet al limbajului C se regãseste în multimea primelor 128 de caractere ASCII. Restul de 128 de caractere se mai numeste si set de caractere extins ASCII si poate fi vizualizat printr-un program simplu.

Trebuie mentionat faptul cã reprezentarea datelor în format hexazecimal este foarte rãspânditã în tehnica programãrii calculatoarelor. Avantajul reprezentãrii interne a datelor în format hexazecimal constã în folosirea unui numãr mai mic de cifre (de 4 ori mai mic decât numãrul de cifre binare).

Reprezentarea unui numãr natural în format hexazecimal se realizeazã cu metoda împãrtirii succesive la 16 sau, mai simplu, pornind de la reprezentarea binarã a numãrului.

Cum multimea cifrelor hexa contine 16 simboluri (0.9 si A.F), pentru codificarea celor 16 cifre avem nevoie de 4 cifre binare (). Pentru a reprezenta un octet vom avea nevoie de 2 cifre hexazecimale si vom proceda astfel:

se divide octetul în douã grupe de câte 4 biti

se înlocuieste fiecare grup de 4 biti cu cifra hexazecimalã pe care o codificã.

De exemplu, sã presupunem cã avem numãrul 217.

În acest mod, dacã un numãr are o reprezentare internã pe un numãr de k octeti, se poate reprezenta simplu cu ajutorul a cifre hexazecimale.

În tabelele de mai jos se prezintã codificarea ASCII a caracterelor.

Codurile corespunzãtoare simbolurilor alfanumerice din tabel sunt exact semnalele binare care se transmit în reprezentarea internã. Cu alte cuvinte, dacã la tastaturã se tasteazã simbolul "a", atunci circuitele corespunzãtoare transmit spre calculator semnale binare corespunzãtoare codului 1010 0001, adicã 61H sau 97 în zecimal.

La fel se întâmplã când se lucreazã cu procesoare de text sau când se tipãreste un document la imprimantã. Sistemul de calcul manevreazã codurile ASCII corespunzãtoare literelor si cifrelor pe care utilizatorul le poate interpreta.

D	H	Sym	D	H	Sym	D	H	Sym	D	H	Sym
		Null

								"



								&



	a	LF		1a			2a			3a
	b			1b			2b			3b
	c			1c			2c			3c	<
	d	CR		1d			2d			3d
	e			1e			2e			3e	>
	f			1f			2f			3f

D	H	Sym	D	H	Sym	D	H	Sym	D	H	Sym
			80		P	96					p
		A	81		Q	97		a			q
		B	82		R	98		b			r
		C	83		S	99		c			s
		D	84		T			d			t
		E	85		U			e			u
		F	86		V			f			v
		G	87		W			g			w
		H	88		X			h			x
		I	89		Y			i			y
	4a	J	90	5a	Z		6a	j		7a	z
	4b	K	91	5b			6b	k		7b
	4e	N	94	5e			6e	n		7e
	4f	O	95	5f			6f	o		7f

Tipul int

Acest tip se foloseste pentru reprezentarea numerelor întregi cu sau fãrã semn. Odatã cu standardizarea ANSI C din 1989, s-a trecut la modul de reprezentare a întregilor impus de noul procesor Intel 80386 dotat si cu coprocesorul matematic Intel 80387.

Tipul int este identic cu signed int si utilizeazã o reprezentare pe 4B a numerelor întregi cu semn. Reprezentarea pe 4 octeti duce la posibilitatea mãririi gamei de reprezentare astfel:

Rezultã cã putem reprezenta numere întregi în gama:

unsigned int nu va mai lua în considerare bitul de semn, astfel încât reprezentarea internã este de forma din figura de mai jos. Evident,

Gama de reprezentare se poate schimba cu ajutorul modificatorilor short sau long.

short int se va reprezenta pe 2B, sub forma

.

unsigned short int va schimba gama de reprezentare în

long int se va reprezenta pe 8B si va conduce la o gamã imensã de reprezentare a numerelor întregi, lucru dovedit de

unsigned long int va considera numai numere întregi pozitive în gama .

Tipul float

Acest tip de reprezentare este de tip real, fiind cunoscut si ca reprezentare în virgulã mobilã (floating point). Acest tip descrie mecanismul de bazã prin care se manipuleazã datele reale. Conceptul fundamental este acela de notatie stiintificã, prin care orice numãr se poate exprima ca un numãr zecimal (deci, cu punct zecimal) multiplicat cu o putere a lui zece sau ca un numãr real binar (cu punct binar) multiplicat cu o putere a lui 2.

Se observã cum stocarea în calculator a unei date floating-point necesitã trei pãrti:

bitul de semn (sign)

mantisa, fractia (significand)

exponent (exponent)

Folosind formatul specific I80386, în limbajul C se disting trei tipuri de date reale:

float , cu reprezentare pe 4 octeti (32 biti, double word)

double, cu reprezentare pe 8 octeti (64 biti, quad word)

long double, cu reprezentare pe 10 octeti (80 biti, ten word)

Tipurile float si double sunt formate pentru numere reale ce existã numai în memorie. Când un astfel de numãr este încãrcat de procesor în stiva pentru numere reale (flotante) pentru prelucrare sau ca rezultat al prelucrãrii, el este automat convertit la formatul long double (sau extended).

În cazul în care acest numãr se stocheazã în memorie, el se converteste la tipul float sau double. Toate cele trei subtipuri reale au un format comun, care va fi prezentat în continuare. Ceea ce le deosebeste este numãrul de biti alocati pentru exponent si pentru mantisã, precum si interpretarea bitilor mantisei (significand).

Semnul are alocat în toate formatele un singur bit: 0 pentru numere pozitive si 1 pentru numere negative.

Mãrimea câmpului exponent variazã cu formatul si valoarea sa determinã câti biti se mutã la dreapta sau la stânga punctului binar.

Câmpul significand este analogul mantisei în notatia stiintificã. El contine totii bitii semnificativi ai reprezentãrii, deci bitii semnificativi atât ai pãrtii întregi cât si ai pãrtii fractionare cu singura restrictie ca acesti biti sã fie consecutivi. Deoarece punctul binar este mobil, cu cât sunt mai multi biti alocati pãrtii întregi, cu atât vor fi mai putini pentru partea fractionarã si invers. Cu cât formatul este mai larg, cu atât se vor reprezenta mai precis numerele.

Pentru a salva un spatiu pretios de stocare, nici unul dintre cele trei formate float nu stocheazã zerouri nesemnificative. De exemplu, pentru numãrul câmpul significand va stoca numãrul 101, nu si cele 4 zerouri nesemnificative ale pãrtii fractionare. Pentru a salva si mai mult spatiu, pentru formatele float si double câmpul significand nu va contine primul bit semnificativ care obligatoriu este 1. Câstigând acest bit (numit bit phantom), se dubleazã gama de reprezentare. Formatul long double va contine totusi bitul de semn 1 cel mai semnificativ. Punctul binar se pune exact înaintea primului bit din câmpul significand, adicã dupã bitul 1 implicit (phantom). În cazul long double, se aplicã dupã primul bit 1.

Pentru a usura operarea cu aceste numere, câmpul exponent nu este stocat ca un numãr întreg cu semn, ci este decalat (normalizat, cu bias) pentru a reprezenta numai numere pozitive (deci exponentul este interpretat ca numãr natural fãrã semn). Biasul adãugat se scade pentru a afla exponentul exact. Avantajul exponentului decalat constã,pe lângã faptul cã nu mai are nevoie de bit de semn, în faptul cã pentru a compara douã numere reale putem începe prin compararea bitilor pornind de la MSB cãtre LSB, cel mai mare fiind cel care are 1 la primul bit diferit. Se decide astfel foarte rapid care numãr este cel mai mare. Ca exemplu, sã considerãm un format float în care se stocheazã:

Sign

Exponent

Significand

Valoarea realã a exponentului va fi 130 - 127 = 3

Bitii câmpului significand se obtin adãugând MSB phantom, deci acestia vor fi 11001000...00

Numãrul real care s-a stocat este:

0.110010...00 x 2⁴ = 1100.1 =12.5

Reprezentarea internã a numãrului 12.5, pe 4 octeti (float), este urmãtoarea:

Cu alte cuvinte, putem spune cã reprezentarea internã a numãrului real 12.5 este (în format hexazecimal):

În cazul în care dorim sã reprezentãm numãrul negativ -12.5, singurul bit care se va modifica va fi bitul de semn, care devine 1. Astfel, reprezentarea internã în format float a numãrului negativ real -12.5 este:

Dacã numãrul 12.5 se reprezintã în formatul double, deci pe 8 octeti, atunci reprezentarea sa internã se va realiza astfel:

bitul de semn va fi 0

exponentul nu va mai fi pe 8 biti ca la tipul float, ci pe 11 biti, deci se va schimba si bias, care va fi 1023. Atunci:

significand va fi acelasi ca la tipul float, dar reprezentat pe 52 de biti

Retinem cã la numere reale numai bitul de semn indicã dacã numãrul este pozitiv sau negativ, mantisa si exponentul se reprezintã ca numere naturale fãrã bit de semn. Formatele prezentate mai sus respectã standardul IEEE 754 de reprezentare a internã a numerelor reale în computere.

Se poate pune o întrebare legitimã: de ce bias-ul în cazul float spre exemplu este 127? Pentru a rãspunde la aceastã întrebare, putem face urmãtorul rationament:

exponentul cu semn este reprezentat pe 8 biti, deci este în gama de reprezentare .

pentru a obtine un exponent pozitiv, adãugãm numãrul 128.

deoarece bitul phantom nu este reprezentat, exponentul trebuie micsorat cu o unitate pentru a indica unde anume se pozitioneazã exact punctul binar.

Exponent pozitiv = exponent +128 - 1 = exponent + bias

de unde rezultã evident faptul cã bias = 127 în cazul tipului float.

În final sã analizãm un exemplu de procesare a produsului a douã numere reale. Vrem sã calculãm valoarea 5.25 x 1.5. Pentru aceasta, vom scrie cei doi factori ai produsului în forma:

Se observã cum câmpurile exponent si significand sunt procesate separat, în final corelându-se forma de reprezentare internã.

Game de reprezentare pentru numerele reale

Gama de reprezentare pentru fiecare din tipurile reale prezentate mai sus se calculeazã luând în considerare cel mai mare numãr si cel mai mic numãr posibil a fi scris în respectiva reprezentare. Astfel, exponentul este decisiv pentru gama de reprezentare.

La tipul float, avem

Valoarea maximã exactã, calculatã fãrã a aproxima ca mai sus:

este

Valoarea pozitivã minimã exactã este

La tipul double vom obtine:

Valoarea maximã exactã este

Valoarea pozitivã minimã exactã este

Efectuând aceleasi consideratii si calcule pentru tipul long double, vom obtine

Codificare BCD

Procesorul I80386 este considerat primul procesor care are capacitatea de a procesa operatii aritmetice asupra unor numere reprezentate în zecimal codificat binar (BCD, binary-coded decimal) în locul formatelor binare standard. Reprezentarea numerelor în cod BCD este folositã pentru a face numerele binare mai accesibile operatorului uman. Neajunsul acestei reprezentãri este faptul cã numerele BCD ocupã spatiu de stocare mai mare decât numerele binare. Ele sunt mai usor de interpretat de cãtre programatorul uman, pentru computer neavând nici un fel de relevantã. Procesorul 80386 poate manevra douã tipuri de formate BCD: înpachetat si neînpachetat (packed BCD si unpacked BCD). În formatul unpacked BCD, o cifrã zecimalã se stocheazã pe un octet. Spre exemplu, cifra zecimalã 5 va fi reprezentatã intern sub forma 00001001. Formatul packed BCD stocheazã douã cifre zecimale pe un octet, crescând capacitatea de stocare internã precum si gama de reprezentare pe un acelasi numãr de octeti. Ambele codificãri folosesc reprezentarea pe 4 biti a cifrelor zecimale. Spre exemplu, numãrul 9817 se stocheazã pe 4 octeti în format unpacked BCD si pe 2 octeti în format packed BCD:

unpacked BCD:

packed BCD 9817 = 1001 1000 0001 0111

Se observã cum valoarea maximã care se poate stoca pe un octet este 9 pentru unpacked BCD, 99 pentru packed BCD si 255 pentru codificarea binarã fãrã semn standard.

Toate formatele reale prezentate se conformeazã standardului IEEE 754 pentru reprezentarea numerelor în virgulã mobilã în format binar.

Ca o concluzie la acest capitol, decisiv pentru întelegerea dezvoltãrilor ulterioare, putem sintetiza urmãtoarele:

Reprezentarea externã a numerelor se referã la modul în care operatorul uman acceptã schimbul de date cu calculatorul. Acest schimb de date are dublu sens: de la operatorul uman cãtre calculator si invers.

Reprezentarea externã este de obicei zecimalã si are un format aproape identic cu formatul matematic uzual: simbol de semn prefixat, punct zecimal, mantisã sau exponent. Numerele naturale se mai pot reprezenta si în format octal sau hexazecimal. În format extern se introduc datele de la tastaturã pentru prelucrare si se obtin pe monitor sau la imprimantã rezultatele oferite de calculator.

Reprezentarea internã a numerelor se referã la modul în care se stocheazã datele în memoria RAM a calculatorului si respectiv în registrii interni ai microprocesorului. Aceastã reprezentare internã este legatã de notiunea de tip de datã.

Tipul de datã întreg (integer) se reprezintã intern pe 2, 4 sau 8 octeti în complement fatã de 2, cu cel mai semnificativ bit (MSB) bit de semn: 1 pentru numere întregi negative si 0 pentru numere întregi pozitive. Un caz particular de datã de tip întreg este tipul character, interpretat ca întreg pe un octet.

Tipul de datã real (float) se reprezintã intern pe 4, 8 sau 10 octeti si contine 3 câmpuri de biti distincte: bit de semn, câmp mantisã si câmp exponent, de lungimi corespunzãtoare.

Dacã se specificã explicit, toate numerele se pot defini fãrã semn (unsigned), caz în care calculatorul nu mai interpreteazã bitul de semn (MSB) diferit ci îl include în câmpul de reprezentare al mãrimii, crescând gama de reprezentare.

Document Info

Accesari: 15121
Apreciat:

Comenteaza documentul:

Nu esti inregistrat
Trebuie sa fii utilizator inregistrat pentru a putea comenta

Creaza cont nou

A fost util?

Daca documentul a fost util si crezi ca merita
sa adaugi un link catre el la tine in site

Copiaza codul:
in pagina web a site-ului tau.

eCoduri.com - coduri postale, contabile, CAEN sau bancare

Politica de confidentialitate | Termenii si conditii de utilizare