Documente online.
Zona de administrare documente. Fisierele tale
Am uitat parola x Creaza cont nou
 HomeExploreaza
upload
Upload




PROIECT DE DIPLOMA MECANICA

tehnica mecanica







STUDIUL COMPARATIV AL SOFTURILOR

DE STOCARE ELECTRONICA A DOCUMENTELOR




CUPRINS


CAPITOLUL I - CONSERVAREA DOCUMENTELOR PRIN DIGITIZARE


Digitizare - obiective

1.2 Elemente ale procesului de digitizare


CAPITOLUL II - PREZENTAREA PRINCIPALELOR SOFTURI

Hitachi Data Systems

EMC

Biblioteci / Jukebox-uri optice

2.2.a) Plasmon

2.2.b) Disc

Autoloadere si biblioteci de Benzi Magnetice

2.3.a) Quantum

2.3.b) Overland Storage

2.4. Infrastructura SAN (Storage Area Network)

2.4.a) Brocade

2.4.b) EMC Legato

2.4.c) EMC Legato EmailXtender

2.4.d) EMC Captiva






CAPITOLUL III - STUDIUL COMPARATIV

CAPITOLUL IV - PREZENTAREA SOFTULI

Prezentarea soft-ului DjVu

4.2 Metoda de comprimare DjVu

4.3 Segmentarea bazata pe MDL

4.4 Concluzii

4.5 Transformarea documentului DjVu in imagine JPEG

Transformare Documentului DjVu in Adobe PDF

4.7 Comparatii intre DjVu si LDF

4.8 Comparatii grafice intre DjVu si alte softuri de stocare a informatiei electronice

CAPITOLUL V - APLICATIE PRACTICA

VI - BIBLIOGRAFIE
















STUDIUL COMPARATIV AL SOFTURILOR

DE STOCARE ELECTRONICA A DOCUMENTELOR


I ) CONSERVAREA DOCUMENTELOR PRIN DIGITIZARE

1.1 Digitizare - obiective

- îmbunatatirea pastrarii si conservarii documentelor originale (metoda de salvare a documentelor rare, pretioase, fragile, voluminoase)
- îmbunatatirea posibilitatilor de acces (mai rapid, consultare simultana de catre mai multi utilizatori, acces de la distanta) cu impact asupra cresterii numarului de utilizatori si a categoriilor acestora
- îmbunatatirea calitatii procesului de consultare (documentul digitizat poate permite o mai buna citire, faciliteaza analiza detaliilor, compararea diverselor documente etc.)
- favorizarea valorificarii documentelor în sensul punerii în valoare a unor colectii, fonduri prestigioase de documente rare, uneori nepublicate prin transferul pe diverse suporturi digitale ce pot fi puse la dispozitia utilizatorilor
- modalitatea cea mai puternica de distributie pe scara larga a informatiei
- îmbunatatitrea procesului de formare si pregatire a utilizatorilor
- promovarea valorilor nationale
- contributie la fondul international digital





1.2 Elemente ale procesului de digitizare

Din cauza unor probleme cum ar fi complexitate, scalabilitate (utilizarea de catre un mare numar de persoane) si sustenabilitate (viabilitate pe termen lung si deci valoare din punct de vedere investitional) devine din ce in ce mai evident ca in viitor va fi necesar sa proiectezi si sa gestionezi serviciile de informatii publice interconectate cel putin la nivel national. O problema majora va fi luarea de masuri pentru ca bibliotecile publice sa joace un rol important în aceste evolutii.

Procesul de digitizare pare în aparenta simplu întrucât este suficient un PC cu scanner ieftin prevazut cu soft-uri standard pentru a crea copia digitala a oricarui document citibil. Totusi, când se iau în considerare probleme precum calitatea imaginii rezultate, formatul utilizat pentru stocarea ei, descrierea, destinatia de utilizare, pastrarea ei, procesul devine mult mai complex. Simplitatea procesului de baza poate crea factorilor de decizie si practicienilor neexperimentati falsa impresie ca un program de digitizare este lipsit de complicatii si ieftin. El nu este nici una nici alta. Pentru a reusi, trebuie planificat cu grija si gestionat cu competenta de la început pâna la sfarsit.

Având în vedere complexitatea unei asemenea actiuni se pot mentiona urmatoarele elemente ce ar trebui luate în discutie:

1. Analiza unor proiecte de digitizare deja aplicate (a se vedea roata din informarea trimisa)

2. Identificarea proiectelor de digitizare ce se deruleaza la nivelul bibliotecilor/institutiilor din tara si stadiul în care se gasesc (ce colectii se digitizeaza, cum se va asigura accesul la ele, ce echipamente si software se utilizeaza, costuri,care sunt corectiile aduse proiectului initial pe masura desfasurarii procesului inclusiv observatiile echipei direct implicate în realizarea proiectului etc.).

3. Identificarea echipamentelor si a software-ului deja existente în biblioteci ce ar putea fi incluse în proiectului national de digitizare.


4. Identificarea prioritatilor bibliotecilor si alinierea proiectului la acestea.
5. Determinarea potentialilor utilizatori ai documentelor digitizate

6. Identificarea modurilor de utilizare ulterioara a materialelor digitizate

7. Selectia documentelor/colectiilor ce urmeaza a fi digitizate - criterii
- valoarea documentara (uneori si estetica)
- pastrarea si conservarea documentelor originale
- valorificarea prin punerea lor la dispozitia unui public larg
- asigurarea de servicii de distributie pe scara larga a documentelor
- alte motive

8. Identificarea tipurilor de documente (caracteristici, cerinte, specificitate)
Documente cu cerinte speciale de manevrare si digitizare care impun abordari diferentiate:
- colectii speciale
- documente cu regim special de depozitare
- documente uzate fizic ce necesita reconditionari

Ceea ce s-a punctat pâna acum are impact asupra modului de abordare a procesului de digitizare si conduce la determinarea specificatiilor tehnice ale echipamentelor, softurilor de prelucrare, a tehnologiilor de digitizare, a planificarii în timp a acestui proces si la dimensionarea bugetului.
Trebuie mentionat ca o abordare care sa nu particularizeze procesul de digitizare în functie de utilizatori si acces (use-neutral) este de preferat în locul uneia specifice (use-specific) chiar daca aceasta conduce la derularea proiectului pe o perioada de timp mai îndelungata si cu cheltuieli mai mari.
Rezultatul va fi un document digital de calitate superioara, realizat pe baza normelor/standardelor existente, s 848b18i uportând multiple aplicatii (web-sites, high-end



publications, etc.) cu impact asupra utilizarii pe termen lung (ceea ce duce la si la protectia orginalului)

9. Formate

Colaborarea la un astfel de proiect ar trebui sa se materializeze într-o adoptare mai larga de standarde, ceea ce ar face ca interoperabilitatea între colectii sa devina realizabila. Situatia ideala ar fi cea în care utilizatorul final are posibilitatea sa caute orice document în format digital, sa-l poata descarca si utiliza fara a fi obligat sa stie unde se gaseste. Acest lucru implica nu numai adoptarea standardelor tehnice ci si reconcilierea divergentelor legate de drepturile de autor.
Aspecte ce vizeaza standardele
- rezolutii utilizate la digitizare
- formate de imagini digitale utilizate (color, alb-negru, grey sau combinatii )
- formate de fisiere imagine, audio, video etc. pentru mastere si copii
- software de prelucrare
- utilizare de seturi de caractere si alfabete
- utilizare software OCR pentru texte (ce software se utilizeaza ?)
- altele

10. Echipamente si software de digitizare - de detaliat dupa clarificarea problemelor de mai sus.

11. Producerea de materiale dupa documentele digitizate
- CD-ROM
- Fotografie
- Audio CD
- Document pe hârtie



12. Pastrare, conservare
- existenta unei politici de pastrare, conservare a documentelor în forma digitala
- este permis accesul la documentul original daca exista cel digital (în anumite conditii)
- cum se pastreaza originalele
o în conditii speciale
o în aceleasi conditii ca si restul documentelor din biblioteca
o exista o politica de transfer a datelor pe cele mai recente platforme tehnologice

De retinut

1. exista un interes comun pentru digitizare între toate tipurile de institutii de memorie (biblioteci, muzee, arhive, etc.)
2. digitizarea ar trebui sa constituie o fateta importanta a planificarii infrastructurilor nationale si internationale de informatii
3. anvergura unui proiect de digitizare trebuie analizata cu grija (exista riscul subestimarii efortului de care ai nevoie pentru a digitiza materialele traditionale si este aproape inevitabil ca doar parti din majoritatea colectiilor sa fie procesate.   

4. bibliotecile publice trebuie sa fie extrem de atente pentru a nu încalca drepturile de autor prin digitizarea de materiale pentru care nu poseda licenta, încercând în acelasi timp protejarea propriilor investitii
5. trebuie rezolvata problema depozitului legal de materiale digitizate


II ) PREZENTAREA PRINCIPALELOR SOFTURI


2.1 Sisteme de discuri magnetice


Unitatile de discuri magnetice functioneaza pe baza principiului electromagnetismului.


Conform acestui principiu, în jurul unui conductor prin care trece un curent electric se genereaza un câmp magnetic. Câmpul magnetic astfel creat polarizeaza materialele magnetice aflate sub influenta sa. Daca se schimba sensul curentului electric, se inverseaza si polaritatea câmpului magnetic.

Un alt efect al electromagnetismului este acela ca într-un conductor aflat într-un câmp magnetic variabil se induce un curent electric. Sensul curentului electric indus se schimba odata cu schimbarea polaritatii câmpului magnetic. Aceste efecte ale electromagnetismului permit înregistrarea

informatiilor pe un disc si citirea lor ulterioara.

Capetele de citire/scriere din unitatile de disc au forma de U, si au înfasurate spire prin care poate trece un curent electric. Atunci când circuitele unitatii de disc comanda trecerea unui curent electric prin spire, în capul de citire/scriere se induce un câmp magnetic. Daca polaritatea curentului electric se schimba, se schimba si polaritatea câmpului magnetic indus. Aceste capete sunt deci electromagneti a caror polaritate poate fi schimbata foarte rapid.

La capatul în forma de U al capului de citire/scriere exista un întrefier. Liniile de forta ale câmpului magnetic din întrefier se curbeaza spre exterior, trecând prin stratul magnetic al discului aflat sub capul de citire/scriere, deoarece acest strat are o rezistenta magnetica mai mica decât cea a aerului

din întrefier. Câmpul magnetic care trece prin stratul magnetic aflat sub întrefier orienteaza particulele magnetice în acelasi sens cu el. Polaritatea câmpului magnetic, si deci cea a stratului magnetic de pe disc, depind de sensul curentului electric din înfasurarile capului.

Pe un disc neînregistrat, polaritatile câmpurilor magnetice ale particulelor materialului magnetic sunt orientate aleator, fiecare din aceste mici câmpuri fiind anulat de unul de polaritate opusa, astfel încât suprafata discului este nepolarizata. Particulele aflate imediat sub întrefierul capului de scriere sunt orientate de câmpul magnetic al



acestuia în acelasi sens cu câmpul. Dupa ce se produce orientarea câmpurilor individuale, acestea nu se mai anuleaza reciproc, si în regiunea respectiva de pe suprafata discului apare un câmp magnetic.

Acest câmp este generat de mai multe particule, ele producând un câmp magnetic cumulativ care poate fi detectat. Câmpul magnetic cu o anumita directie se numeste flux magnetic. Pe masura ce discul se roteste sub capul de scriere, acesta poate induce în stratul magnetic de pe disc un flux magnetic. La inversarea sensului curentului electric din înfasurarea capului, se inverseaza polaritatea câmpului din întrefier, ca si polaritatea fluxului magnetic indus pe suprafata discului. Schimbarile sensului orientarii particulelor magnetice de pe suprafata discului se numesc inversari de flux sau tranzitii de flux.

Un cap de scriere induce pe disc tranzitii de flux, pentru a înregistra informatii. Pentru fiecare bit (sau grup de biti) de informatie care este înregistrat pe disc, în stratul magnetic sunt induse secvente de tranzitii de flux, pe zone bine determinate, numite celule de tranzitii sau celule de bit.

Aceste celule sunt zone de pe suprafata discului, determinate de viteza de rotatie si de timpul în care capul de scriere induce tranzitiile de flux.

Secventa specifica de tranzitii de flux dintr-o celula de tranzitii, utilizata pentru memorarea unui anumit bit sau a mai multor biti de informatie, se numeste metoda de codificare. Controlerul de disc preia informatiile care trebuie înregistrate si le codifica într-o serie de tranzitii de flux de durata bine determinata, conform metodei de înregistrare care se utilizeaza. În timpul procesului de scriere, capului de scriere i se aplica o tensiune, inversarea polaritatii acestei tensiuni ducând si la inversarea polaritatii câmpului magnetic care se înregistreaza. Tranzitiile de flux sunt înscrise în punctele în care se inverseaza polaritatea înregistrarii.

La citire, capul de citire nu genereaza aceeasi forma de unda care a fost utilizata pentru scrierea pe disc, ci genereaza câte un impuls de tensiune la fiecare trecere peste o tranzitie de flux.


Daca tranzitia este de la polaritatea pozitiva la cea negativa, impulsul indus este o tensiune negativa.

Daca tranzitia este de la polaritatea negativa la cea pozitiva, impulsul indus va fi o tensiune pozitiva.

Deci, în timpul citirii informatiei de pe disc, capul devine un detector de tranzitii de flux, generând impulsuri de tensiune la fiecare trecere peste o tranzitie de flux. Zonele fara tranzitii de flux nu genereaza impulsuri.


Figura ilustreaza relatia dintre formele de unda la scriere si la citire si tranzitiile de flux înregistrate pe disc.

Procesele de scriere si citire magnetica.


Semnalul de scriere are o forma de unda dreptunghiulara, cu valori pozitive sau negative ale tensiunii, care polarizeaza continuu stratul magnetic de pe disc, într-un sens sau în celalalt. La trecerea formei de unda de la tensiunea pozitiva la cea negativa sau


invers, se schimba si polaritatea fluxului magnetic de pe disc. La citire apar impulsuri numai atunci când capul de citire trece peste zonele în care apar tranzitii de flux pe disc.

Impulsurile detectate de capul de citire sunt foarte slabe ca intensitate si pot contine zgomote.

Circuitele din unitatea de disc si din controler amplifica semnalul peste nivelul zgomotelor si decodifica trenul de impulsuri pentru a reconstitui datele înregistrate.


a)      Hitachi Data Systems

Hitachi Data Systems, parte a grupului Hitachi, Ltd. (NYSE: HIT), cea mai mare companie de produse electronice din Japonia, dezvolta solutii de stocare cu scopul de a maximiza recuperarea investitiei si a reduce la minim riscul. Acestea includ solutii de management al ciclului de viata al informatiei în vederea adaptarii la cerintele specifice ale clientilor sau ale legislatiei în vigoare.

Renumita companie de analiza si consultanta IT, Gartner Dataquest, a recunoscut în Hitachi Data Systems un lider pe piata sistemelor de stocare de tip enterprise si compania cu cea mai mare crestere în domeniul dezvoltarii aplicatiilor de management pentru sisteme de stocare. Cresterea rapida a cotelor de piata pentru sistemele de stocare din familia modulara si premiile dobândite pentru programele de parteneriat, au facut de asemenea din Hitachi Data Systems o forta importanta pe piata sistemelor de stocare de gama medie.

    Modelele AMS 200 si AMS 500 ale familiei TagmaStore Adaptable Modular Storage reprezinta actualmente sistemele de stocare modulare cele



mai scalabile, de cea mai înalta performanta si care ofera cea mai mare diponibilitate a datelor.

Sistemele AMS (Adaptable Modular Storage) si WMS (Workgroup Modular Storage) completeaza modelele high-end Universal Storage Platform si Network Storage Controller în configuratii de stocare pe niveluri/tier-uri (tiered storage), gazduind date cu cerinte de performanta si retentie/arhivare diverse.

Atât modelele Adaptable Modular Storage, cât si modelul Workgroup Modular Storage suporta partitionarea memoriei cache, o inovatie unica pe piata sistemelor de stocare midrange, adusa de catre Hitachi de la familia high-end TagmaStore Universal Storage Platform.

Caracteristicile sistemelor HDS TagmaStore WMS 100 / AMS 200 / AMS 500:

SOFTWARE

  • Ofera suport pentru urmatoarele sisteme de operare: Microsoft Windows NT, Microsoft Windows 2000, Microsoft Windows 2003, Sun Solaris. HP-UX, IBM AIX, Red Hat Linux, SuSE Linux, Turbo Linux, Novell NetWare, HP OpenVMS, HP Tru64 UNIX, SGI IRIX, NetApp Data ONTAP; 
  •  Aplicatie pentru managementul resurselor de stocare, ce permite vizualizarea configuratiei sistemului, crearea de utilizatori ai interfetei de management, crearea grupurilor RAID fizice, crearea volumelor logice, alocarea volumelor catre servere, extinderea capacitatii volumelor, stergerea volumelor, schimbarea controllerului ce administreaza un anumit volum (owner) - Hitachi Resource Manager;
  • Posibilitatea de a configura pâna la 128 de porturi FC virtuale pe un singur port FC fizic, creându-se astfel mai multe "domenii virtuale de stocare". Pe fiecare port FC virtual se pot configura parametrii specifici de comunicatie ai serverelui

  • (sistemului de operare) conectat la acel port. De asemenea, pentru fiecare port virtual poate fi configurat câte un volum cu LUN-ul 0 - Hitachi Host Storage Domains;
  • Posibilitatea de a aloca un întreg volum (LUN) în cache pentru a optimiza accesul la acel volum, ce contine date foarte des accesate. Astfel, accesul la acest volum se va face la viteza memoriei cache, fara întârzierile datorate aducerii datelor de pe disk-uri în cache, în cazul citirilor - Hitachi Cache Residency Manager/FlashAccess;
  • Posibilitatea de a partitiona memoriei cache, pentru alocarea mult mai eficienta a memoriei cache catre anumite aplicatii, optimizându-se astfel folosirea memoriei cache si îmbunatatindu-se performantele aplicatiilor - Hitachi Cache Partitioning Manager;
  • Agent SNMP ce permite monitorizarea si administrarea sistemului de stocare prin intermediul unei console centralizate de management, bazate pe SNMP - Hitachi SNMP Agent;
  • Sistem de monitorizare si mentenanta preventiva de tip Call-Home - Hitachi HiTrack;
  • Functie de copiere interna a unui volum (Point-in-Time Copy) prin clonare, pentru mentinerea de copii ale datelor în vederea backup-ului, testarii sau dezvoltarii de software - Hitachi ShadowImage In-System Replication;
  • Functie de copiere interna instantanee a unui volum (Point-in-Time Copy) prin snapshot de tip copy-on-write, pentru mentinerea de copii ale datelor în vederea backup-ului, testarii sau dezvoltarii de software - Hitachi Copy-on-Write Snapshot/QuickShadow;


  • Aplicatie pentru managementul multiplelor cai de acces dintre servere si sistemul de stocare ce îmbunatateste accesul la stocare si disponibilitatea accesului la stocare, prin redistribuirea (failover) încarcarii de pe o cale activa pe una pasiva (aflata în stand-by), în cazul unei defectiuni. De asemenea, tot prin intermediul acestei aplicatii, se poate realiza functia de load balancing, pentru servere ce acceseaza sistemul de stocare pe doua sau mai multe porturi ale aceluiasi controller - Hitachi HiCommand Dynamic Link Manager (HDLM);
  • Functie de replicare a volumelor, la nivelul sistemului de stocare (între sisteme de stocare de acelasi tip - numai pentru TagmaStore AMS 500), pentru mentinere de copii ale datelor la distanta. Volumele sunt copiate si resincronizate (la nivel de block) între doua sisteme de stocare aflate la distanta unul de celalalt, prin intermediul unei conexiuni FC. Toate operatiile TrueCopy se realizeaza online (sunt non-disruptive) si permit ca volumul primar sa ramâna accesibil atât la citire, câtssi la scriere, pe durata crearii sau resincronizarii volumului secundar - Hitachi TrueCopy;
  • Functie de copiere a volumelor, la nivelul sistemului de stocare (tntre sisteme de stocare diferite - TagmaStore WMS/AMS si TagmaStore NSC/USP) - Hitachi Cross-System Copy/HiCopy;
  • Posibilitatea de a configura volume de tip WORM (Write Once Read Many) pe disk, pentru a impiedica modificarea datelor extrem de importante aflate pe sistemul de stocare, facând imposibila stergerea sau rescrierea acestor date -Hitachi Data Retention Utility/LDEV Guard;




    Hitachi Data Systems TagmaStore USP ( Universal Storage Platform)

Modelele din clasa Universal Storage Platform exceleaza în îndeplinirea nevoilor critice de zi cu zi pentru stocarea si arhivarea datelor si pentru asigurarea continuitatii afacerii în caz de dezastru. De asemenea, Tagma Store USP permite agregarea stocarii interne si externe într-un singur spatiu de stocare comun si partitionarea logica a resurselor de stocare, chiar si în situatia în care acestea provin de la sistemele altor producatori. Aceasta platforma de stocare ofera, totodata, capabilitati de replicare si migrare a datelor.

Software-ul de management al stocarii permite migrarea datelor între ierarhii de stocare si asocierea acestor ierarhii la aplicatiile de business specifice.


b)      EMC

EMC EMC CLARiiON Modular Networked Storage Family

EMC® CLARiiON® este lider în zona midrange a pietei sistemelor de stocare asigurând solutii eficiente din punct de vedere financiar, care furnizeaza un nivel înalt de performanta, functionalitate si fiabilitate.

Puternica serie CX3 UltraScale - CX3 model 20, CX3 model 40 si CX3 model 80 - sunt ideale atât pentru aplicatii departamentale, cât si suport pentru sisteme de clasa


data-center pentru aplicatii business-critical. Pentru companiile care cauta cai mai bune de a raspunde provocarilor IT, seria CX3 UltraScale aduce capabilitati de stocare avansate unice pentru sistemele de stocare midrange. Aceste facilitati include sisteme de protectie pentru a asigura integritatea si disponibilitatea continua a datelor, replicarea informatiilor avansata, tehnologie virtual LUN si mobilitatea datelor în si între sisteme. Toate aceste facilitati sunt disponibile la alegere în gama de produse de la solutiile entry-level economice pâna la configuratiile cu performanta înalta si capacitate maxima pentru cele mai solicitante cerinte.

Noua arhitectura CLARiiON CX3 UltraScale, bazata pe un design pentru performanta mare si disponibilitate mare, permite seriei CX3 UltraScale sa se adreseze unei plaje largi de aplicatii. Toate sistemele seriei CX3 UltraScale sunt construite pe aceasi arhitectura modulara redundanta si ruleaza mediul de operare de stocare FLARE®, oferind clientilor modalitati de crestere modulara pornind de la CX3 model 20 si fiind scalabile pâna la CX3 model 80, suportând capacitati de stocare de la 365 GB pâna la 239 TB intr-un singur sistem.

Pentru a asigura o performanta si scalabilitate crescuta, arhitectura inovativa UltraScale incorporeaza CPU-uri de vârf, cele mai performante subsisteme de memorie, latenta redusa, tehnologie de interconectare PCI Express cu latime de banda mare care permite accelerarea la 4 Gb/s.

CLARiiON furnizeaza un nivel înalt de protectie prin capabilitatile sale de sistem, incluzând:

. Detectie / corectie continua a integritatii datelor si cache-ului, diagnoza automata si capabilitati avansate de call-home pentru disponibilitate sporita
. Tehnologia UltraPointT combina designul avansat al DAE (disk array enclosure) Fibre Channel 4 Gb/s de tip point-to-point cu capabilitatile de detectie a erorilor si izolare mai granulara din mediul de operare FLARE pentru a completa algoritmii


patentati existenti RAID, verificarea paritatii, utilitarul pentru integritatea datelor SNiiFER si discuri hot spare globale pentru cresterea robustetii sistemului si pentru maximum de fiabilitate si disponibilitate.

Flexibilitatea de a alege modelul, tehnologia retelei si tipul discurilor care corespund necesitatilor

Oferind discuri cu tehnologie Fibre Channel atât de mare performanta, cât si cu cost redus, clientii au flexibilitatea de a veni în întâmpinarea cerintelor aplicatiilor prin prisma ambilor parametrii, cost sî performanta. Deoarece seria CLARiiON CX3 UltraScale poate mixa tipurile de discuri in cadrul aceleiasi matrici, pentru solutii de stocare pe tier-uri de tip all-in-one, clientii pot pastra informatiile online pentru mai mult timp pentru:

Aplicatii backup-on-disk - imbunatatind performantele fata de solutiile tradfditionale de backup-on-tape
Aplicatii cu fisiere mari - permitând procesarea mai rapida la un cost mai mic pentru aplicatiile care lucreaza cu volume mari de date.

EMC EMC Centera Content Addressed Storage Systems


EMC Centera reprezinta o solutie de stocare scalabila, bazata pe discuri magnetice, destinata în mod special continutului fix, cum ar fi: arhive de voce, radiografii, documente electronice, arhive de e-mail-uri, schite CAD/CAM. Conferind un înalt nivel de protectiei a datelor, EMC Centera pune la dispozitia organizatiilor toate beneficiile asociate arhivarii online.


Reprezentând o solutie bazata pe medii de stocare de tip WORM (write once read many), EMC Centera faciliteaza complianta cu prevederile legislative si politicile interne ale organizatiei în ceea ce priveste stabilirea perioadelor de retentie în functie de tipul continutului, asigurând, în acelasi timp accesul rapid si securizat la informatiile dorite. Astfel, gestiunea continutului este asigurata prin intermediul functionalitatilor avansate destinate stabilirii regulilor de retentie, cum ar fi:

- Perioade de retentie conditionate de declansarea unui anumit eveniment

- Restrictii de stergere ale unui anumit tip de continut

- Stabilirea perioadelor minime/maxime de retentie pentru un anumit tip de continut


Biblioteci / Jukebox-uri optice


a)     Plasmon

Plasmon proiecteaza si produce propriile echipamente cu discuri optice, jukebox-uri, sisteme de stocare cu încarcare automata de pe suporturi multiple ("autoloaders"), biblioteci optice sau cu unitati de banda, si medii optice. Compania detine în prezent cea mai vasta gama de produse amovibile pentru stocare, destinate clientilor din organizatiile medii spre cele corporative, acoperind unitati si biblioteci optice pentru sisteme WORM de 12" ("Write Once, Read Many"), unitati MO de 5" ("Magneto Optic"), unitati CD-ROM/CR-R, DVD-RAM si suporturile respective de stocare.

În plus, compania ofera unitati si biblioteci cu unitati de banda, compatibile cu ambele formate Magstar MP si NCTP. Plasmon furnizeaza totodata o gama de solutii pentru software-ul managementului sistemelor de stocare si pentru sistemele NAS ("Network Attached Storage").

Discurile optice sunt, de obicei, utilizate pentru stocarea volumelor masive de date. Tipurile de date stocate se situeaza în gama ce porneste de la înregistrarile tranzactionale provenind de la mainframe-uri, la materialele audio si video utilizate în


industria de divertisment, si pâna la imaginile medicale cum ar fi cele rezultate de la razele X si scanari.

Aplicatiile pentru stocarea datelor se situeaza într-o gama pornind de la extensia capacitatilor curente de stocare la nivel de server, si pâna la publicarea cu sisteme de înregistrare cu CD-uri si stocarea imaginilor în industria tipografica (pre-press).

Plasmon Seria G

Librariile optice din seria G reprezinta solutia ideala pentru arhivarea profesionala. Suportand atat configuratii in format UDO cat si MO, acestea ofera o capacitate de stocare si o fiabilitate impresionante. Pornind de la un numar de 24 sloturi (putandu-se ajunge pana la 638) si de la 720 GB (putandu-se ajunge la 20 TB folosind medii UDO), aceste biblioteci pot acoperi practic cerintele oricarei organizatii.

Pentru asigurarea unor performante maxime dar si a disponibilitatii ridicate a datelor, aceste librarii ofera capabilitati avansate de tip "dual pickers", drive-uri "hot-swappable", surse de alimentare redundante, etc.


Plasmon Diamond


Diamond reprezinta solutia ideala de management al stocarii, destinata dezvoltatorilor, integratorilor de sistem si corporatiilor, pentru care se impune nevoia gestionarii, într-un mod eficient, a unui volum semnificativ de informatii în format


electronic. Solutia este compatibila cu întreaga gama de medii de stocare UDO atât rescriptibile, cât si Write Once.


Diamond detine capacitatea de a detecta, în mod automat, librariile Plasmon si de a-si seta configuratiile în functie de caracteristicile acestora. Astfel, utilizatorii vor putea citi/adauga informatii din/în sistemul de stocare prin intermediul unui share în retea.


De asemenea, interfata intuitiva web based (Graphical user Interface)  permite administrarea facila si securizata a solutiei, prin intermediul Internetului, chiar si din locatii remote.


În plus, interfata API (Application Program Interface) permite integrarea transparenta a sistemelor de stocare pe discuri optice direct în aplicatiile frecvent utilizate.


b)    Disc

Compania DISC îsi concentreaza activitatea în productia de echipamente de stocare dedicate de tip "NearLine" ce ofera capacitati de stocare de pâna la 10TB. DISC si-a extins prezenta pe piata, întarindu-si în acelasi timp pozitia în topuri, prin fuzionarea cu compania NSM Storage în anul 2001. Evolutia cronologica a companiei este urmatoarea:



Disc NSM Series


Librariile modulare Disc NSM Series pentru CD-uri si DVD-uri sunt special create pentru a raspunde cerintelor de stocare ale organizatiilor adptându-se perfect nevolior specifice, aflate într-o continua schimbare ale acestora. Designul modular al celor 6 modele din aceasta gama confera utilizatorilor un înalt nivel de flexibilitate, raspunzând astfel cu succes cerintelor de stocare ale companiilor.


NSM3000 ofera o capacitate de stocare medie de pâna la 2.5 TB; datele fiind usor accesibile în orice moment. NSM3000 permite, de asemenea, instalarea a pâna la 6 drivere, în timp ce tehnologia DISC SmartPack asigura o capacitate nelimitata de stocare offline.


Prin intermediul NSM7000 si NSM4000, aproximativ 6TB de informatii pot fi usor stocate si accesate. În plus, NSM7000 permite instalarea a pâna la 14 drivere, asigurând astfel acces performant "multiuser" la informati, în timp ce NSM 4000 suporta pâna la 7 drivere si 415 sloturi de disc.


Disc PDD Series


Modelele din gama de librarii DISC PDD Series (DISC3000(U) PDD, DISC4000(U) PDD si DISC7000(U) PDD), dotate cu tehnologie Blue Laser, reprezinta


solutia ideala de stocare de tip "enterprise". DISC PDD Series ofera o capacitate de stocare de 16TB, sau de 23,3GB per disc.

De asemenea, tehnologia Sony ProData ofera suport mediilor de stocare de tip WORM si rescriptibile, asigurând o rata de scriere/citire a informatiilor de pâna la 11 MB/s.

În ceea ce priveste numarul de drivere suportate, acesta este de pâna la 6 pentru modelele DISC3000(U) PDD si DISC4000(U) PDD si de pâna la 14 pentru DISC7000(U) PDD.

 Designul modular al modelelor din aceasta gama, asigura adaptabilitatea la nevoile si cerintele specifice de stocare ale organizatiilor.


Disc Series


Familia de produse Disc Series utilizeaza tehnologia de stocare Blu-ray (BD), oferind capacitati de 25 pâna la 50 GB per suport media.

Blu-ray, una dintre cele mai importante tehnologii de stocare ofera capacitati de stocare de 25 pâna la 50GB per suport media, previziunile situându-se în jurul valorilor de 100 pâna la 200GB.

Driverele Blu-ray prezinta un diametru de 120 mm si o suprafata dura, fiind compatibile cu mediile de stocare de tip CD si DVD. Ratele de transfer citire/scriere al datelor prin intermediul tehnologiei Blu-ray sunt de 9MB/s, estimarile pentru generatiile viitoare fiind de 18MB/s pana la 36MB/s.

Disc BD Series ofera capacitati de stocare de la 1TB la 35TB si asigura pâna la 14 fluxuri de date paralele la o rata de transfer de 9MB/s.



Disc BD Series ofera suport mediilor de stocare WORM si rescriptibile, managementul datelor stocate offline fiind asigurat de tehnologia "SmartPack".


2.3 Autoloadere si biblioteci de Benzi Magnetice

a)      Quantum

Detinând un portofoliu complex de solutii automate de backup pe banda, compania este lider mondial în drive-uri de banda si benzi de stocare. Indiferent de domeniul de activitate, sau de dimensiunile organizatiilor, Quantum pune la dispozitia acestora solutii complete adaptate nevoilor si cerintelor specifice. De asemenea, solutiile software de management al informatiilor puse la dispozitie de Quantum reprezinta un adevarat standard al tehnologiilor destinate lucrului colaborativ si arhivarii electronice.

Quantum Scalar i500

ADIC Scalar i500 reprezinta trecerea intre cele doua categorii de biblioteci de benzi, cele de tip midrange si cele de tip enterprise. Astfel, acest nou model al familiei Scalar de la ADIC, imbina perfect modularitatea specifica bibliotecilor de tip midrange cu disponibilitatea, sistemul avansat de management si sistemele de monitorizare, specifice categoriei de tip enterprise.

Inteligenta arhitecturii unice iPlatform a Scalar i500, îmbunatateste performantele si fiabilitatea printr-o viziune unica privind administrarea, ce include biblioteca, drive-urile si conectivitatea, prin intermediul infrastructurii de switch-uri FC. Verificarile asupra legaturii de date, optimizarea performantelor drive-urilor, redundanta la nivelul cailor si comutarea acestora in cazul aparitiei unei defectiuni, contribuie la functionarea neintrerupta a proceselor de backup/restore.


Quantum Scalar i2000


Biblioteca Scalar i2000 este o biblioteca din gama enterprise care automatizeaza controlul backup - ului si al mediului de backup nefiind necesara interventia operatorului uman.

Are un format liniar, constând dintr-o serie de module care permit atât o instalare usoara cât si upgrade - uri care nu necesita reconfigurari majore în cazul unor extinderi. Scalar i2000 este o biblioteca de benzi care creste odata cu necesitatile utilizatorului. Configuratia minima consta dintr-un modul de control, o unitate de banda si 100 de sloturi ( LTO sau SDLT ). În cazul în care se doreste o extindere se pot adauga pâna la 7 module de expansiune 48 de unitati de banda si 3,492 de sloturi LTO ( sau 2910 SDLT ). Poate fi echipata si cu unitati SDLT. În cazul unitatilor SDLT 600 se poate ajunge la o capacitate de backup de 1,746 TB iar în cazul unitatilor LTO 3 la 2,794 TB. (Cea mai înalta densitate a slot-urilor intr-o biblioteca cu medii de o jumatate de tol: 720 cartuse/mp, depasind cu 80% performantele oferite de competitie)

Pentru partea de import-export contine un mailslot cu o capacitate de maxim 96 de sloturi LTO sau 80 SDLT (Cea mai mare capacitate de import/export a unei biblioteci de benzi existente).







b)      Overland Storage

Overland proiecteaza si produce dispozitive de back-up si recovery bazate pe banda (librarii de banda si autoload-ere) sau pe disc, câstigatoare ale unor distinctii prestigioase.

Biblioteci si autoloader-ele.

Pentru librariile si autoloader-ele sale, cu capacitate de la 50 GB pana la 200 TB, Overland Storage ofera o larga varietate de tehnologii de banda, incluzând LTO, SDLT si AIT si compatibilitate demonstrata cu aplicatiile importante de back-up. Caracteristici avansate de conectivitate furnizeaza clientilor posibilitatea de a încorpora librariile Overland în retele de stocare Fibre Channel, SCSI, etc. si cresc capabilitatile de back-up si restore în mediile SUN si NAS, permitând LAN-free si server-free back-up.

Familia de librarii NEO furnizeaza protectie a datelor de nivel enterprise, cu operare non-stop, extindere la cerere, protectia investitiei, management al librariei de la distanta si serverless back-up în mediu SAN. Tehnologia NEO de la Overland a câstigat mai multe distinctii decât oricare alt furnizor, incluzând distinctia "Produsul Anului", acordata de cea mai importanta revista în domeniu, Storage Magazin. Cel mai nou produs din gama NEO este NEO 8000, librarie de clasa data-center, oferind pâna la 200 TB de stocare, într-un spatiu cu o amprenta de numai 19 inch. NEO 8000 furnizeaza performanta, scalabilitate, valabilitate a datelor la cel mai înalt nivel, printr-o tehnologie ce a fost demonstrata prin utilizare ca fiind cea mai buna din clasa sa.

Despre Overland Storage

Overland Storage furnizeaza solutii de protectia datelor de înalta clasa, gândite sa asigure continuitatea afacerii, cu focus pe back-up si recovery. Acestea includ seria NEO, câstigatoarea celor mai multe distinctii pentru librarii cu stocare automata, care a setat noi standarde pentru stocare inteligenta, automata si scalabila si seria REO, ce ofera solutii de accelerarea back-up-ului.

Overland Storage ArcVAULT


Primele modele ale gamei ARCvault, ARCvault 12 autoloader si ARCvault 24 biblioteca optimizata pentru rack, ofera cea mai mare capacitate de stocare pentru backup, restaurare si aplicatii de arhivare necesar afacerilor mici si medii. Aceasta serie asigura pâna la 19.2 TB capacitate de stocare - cu 50% mai mult la un cost per gigabyte cu pâna la 45% mai mic decât produsele similare ale competitiei. Familia ARCvault este gândita sa reduca complexitatile printr-o instalare si un management simplu, in timp ce se reduce costul total de utilizare (TCO). Rezultatul investitiei în cercetare si dezvoltare, focalizat pe utilizatorul final, familia ARCvault de la Overland, ofera multe facilitati de vârf, printre care:

ARCvault ofera pâna la 9.6 TB capacitate de backup si arhivare, în timp ce ARCvault 24 asigura pâna la 19.2 TB. ARCvault 24 combina capacitatea gasita în mod traditional în biblioteci de benzi mult mai scumpe cu accesibilitatea si simplitatea unui autoloader.

Overland Neo 2000

Libraria NEO 2000 este creata pentru a raspunde celor mai importante cerinte de stocare pentru volume medii de date: fereastra mica de back-up, bugete restranse, cresterea volumului de date, resurse IT limitate, "downtime" costisitor, nevoia de a consolida stocarea si retele interne complexe. Gandita pentru o diversitate de retele si SAN-uri, NEO 2000 iti ofera intotdeauna o platforma simpla, ieftina si scalabila care va face fata cresterilor ulterioare.



Libraria NEO 2000 seteaza standardul de inalta disponibilitate cu care celelalte librarii trebuie sa se compare. Caracteristici ca NEO LiveSwap pentru drive-uri si surse de alimentare permit indepartarea / inlocuirea componentelor fara intreruperea magistralei SCSI sau a surselor de tensiune, asigurand functionarea neintrerupta a solutiei de backup / restore. Capacitatea de fail-over de la distanta permite transferarea de la distanta a controlului de la un modul la altul, asigurand ca procesul de backup / restore este reluat si ruleaza cat de rapid si sigur este posibil.

Libraria NEO 2000 este proiectata pentru a ajuta sa tii pasul cu cresterea rapida a datelor. Fiecare modul are 26 (SDLT) sau 30 (LTO) sloturi si pana la 2 drive-uri, furnizand capacitate de pana la 24 TB pe modul si viteza de scriere de peste 1 TB/ora.

Overland Storage Neo 8000

Seria NEO 8000 de la Overland Storage furnizeaza capabilitati de stocare unice, adresandu-se organizatiilor cu cantitati mari de date critice. Arhitectura premiata a Neo 8000 este gandita pentru a raspunde solicitarilor de backup si arhivare in medii complexe SAN, asigurand utilizatorilor o protectie a datelor crescuta, imbunatatind disponibilitatea datelor si micsorand cheltuielile totale.

Valabile atat in configuratii SCSI cat si nativ Fibre Channel, NEO 8000 asigura capacitatea si viteza cerute de mediile SAN performante. Proiectate pentru a suporta atat tehnologiile LTO, cat si SDLT, Neo 8000 furnizeaza pana la 800 TB de stocare la o rata de transfer de peste 14 TB/ora.

Indiferent de dimensiunea centrului de date, este probabila cresterea rapida a volumului de date, odata cu trecerea la SAN si consolidarea mai multor centre de date.


Neo 8000 este conceputa pentru a se adapta acestor cerinte, fiind scalabila de la un minim de 85 la un maxim de 1,000 de benzi, si de la 2 drive-uri la 24 de drive-uri.

2.4. Infrastructura SAN (Storage Area Network)

a) Brocade

Brocade a dezvoltat un mediu Intelligent Fabric Operating ce încorporeaza inteligenta direct în platforma de stocare în retea - creând un mediu accesibil, scalabil si sigur pentru aplicatiile de storage. Tapestry: solutii inovatoare pentru gestiunea infrastructurii IT

Cu familia de date Tapestry si cu solutiile de gestiune a infrastructurii IT, Brocade ofera organizatiilor noi instrumente ce se adreseaza unei varietati de probleme legate de costuri, complexitate, control si compatibilitate în întreaga companie. Aceste produse sunt menite sa simplifice managementul într-o arie vasta de medii si sa ajute la oferirea unui ROI rapid pentru multe elemente ale infrastructurii IT.

Brocade 200E Switch


Noul switch Brocade 200E cu performante de 4 Gbit/sec si suport pentru 8-16 porturi  reprezinta solutia ideala pentru SAN-urile noi, de dimensiuni reduse, sau pentru SAN-urile upgrad-ate cu noi tehnologii. În acest sens, Brocade 200 E pune la dispozitia utilizatorilor wizard-ul EZSwitchSetup alaturi de o serie de alte facilitati care permit implementarea rapida a SAN-urilor si configurarea usoara a switch-urilor.

Brocade 200 E permite adaptarea automata a vitezei (1, 2, si 4 Gbit/sec) si a sensului de trafic.

Switch-uri Fibre Channel cu performante de 4 Gbit/sec pentru SAN-uri Entry-Le




Brocade 4900 Switch

De asemenea, fiind compatibil cu tehnologiile anterioare Brocade, cu performante de 1 si 2 Gbit/sec, Brocade 4900 protejeaza investitiile existente în cadrul organizatiilor.

b) EMC Legato

EMC Legato NetworkerLegato NetWorker este cea mai performanta solutie software de backup/restore ce asigura protejarea datelor critice de business si simplificarea, centralizarea si automatizarea proceselor de backup si restore, independent de platformele de operare existente in retea: Windows, Linux, UNIX (Solaris, AIX, HP-UX, Tru64, IRIX), OpenVMS, NetWare, Mac OS sau Vmware (masini virtuale).

https://www.legato.com/products/networker/benchmark/docs/nwbenchmark.pdf


EMC Legato EmailXtender


EmailXtender este o solutie completa pentru arhivarea si managementul e-mail-urilor, care captureaza (în timp real), indexeaza (full text) si arhiveaza e-mail-urile, mesajele instantanee si atasamentele.

În acest mod, solutia permite arhivarea si gestiunea centralizata a e-mailurilor, asigurând scalabilitate maxima si regasirea rapida a înregistrarilor. EmailXtender este un sistem centralizat de stocare si recuperare a datelor, care trensfera automat datele de pe serverele de e-mail într-un sistem arhiva de e-mail-uri, capturând si indexând toate e-mail-urile primite sau trimise. Un singur server EmailXtender poate administra mai multe servere de mesagerie - astfel, în total pot fi  procesate mai mult de 110.000 mesaje pe ora, indiferent de tipul acestora. În plus, mesajele instantanee pot fi, de asemenea, capturate si stocare în sistemul EmailXtender. Arhivarea este complet


transparenta pentru utilizatorii, care continua sa vada în propriile casute de e-mail referinte catre mesajele stocate în arhiva, ce pot fi accesate, ca si pâna acum, printr-un simplu click. Mesajele arhivate sunt indexate full-text, duplicatele sunt eliminate, iar datele sunt compresate.

EmailXtender asigura:

·        îmbunatatirea managementul conturilor de e-mail

·        reducerea costurilor asociate cu stocarea email-urilor prin micsorarea spatiului de stocare necesar cu pâna la 80% prin eliminarea duplicatelor si folosirea compresiei, pentru mesajele din arhiva

·        cresterea eficientei operationale prin reducerea încarcarii server-ului de e-mail si sporirea performantelor sale

·        cresterea productivitatii utilizatorilor, carora le sunt puse la dispozitie conturi de e-mail de capacitate 'infinita', administrate din interfata Outlook sau Notes cu care sunt familiarizati; accesul la mesajele arhivate se face într-o maniera identica accesarii acestora de pe serverul de e-mail

·        micsorarea considerabila a timpilor de salvare si restaurare a serverelor de e-mail, prin degrevarea acestora de mesajele si atasamentele mutate în arhiva

·        posibilitatea realizarii de cautari full-text ale unor mesaje pierdute sau chiar sterse

·        eliminarea nevoii de restrictionare a dimensiunii mesajelor si casutelor de e-mail ale utilizatorilor

·        monitorizarea respectarii politicilor companiei cu privire la utilizarea mesageriei electronice prin realizarea, de catre persoanele autorizate, de cautari full-text în întreaga baza de date de e-mail-uri

·        securizarea mesajelor din arhiva prin criptarea acestora cu algoritmi puternici pe 64 si 128 de biti

·        asigurarea compliantei cu reglementarile legislative privitoare la pastrarea înregistrarilor e-mail (Sarbanes-Oxley, SEC, HIPAA, DoD etc.), furnizând o arhiva completa si autentica


·        reducerea costurilor si riscurilor legate de cererile legale de informatii prin capacitatea de a dovedi respectarea de catre companie a politicilor de retentie  si prin capacitatea de a descoperi rapid datele

·        spatiu de stocare nelimitat pentru arhivele de email-uri si reducerea costurilor asociate stocarii acestora prin folosirea oricarui mediu de stocare secundara pentru arhivare (discuri optice/magneto-optice, benzi magnetice).


d) EMC Captiva

Captiva - O solutie completa

Captiva este unul dintre providerii mondiali de top ce ofera solutii de EIM (Enterprise Input Management).  Solutiile Captiva sunt create pentru a optimiza livrarea informatiilor vitale pentru misiunea companiei, transformând hârtiile, formularele si documentele electronice în date corecte si de valoare ce pot fi stocate si accesate rapid, zilnic. Se reduc astfel costurile, se îmbunatateste relatia cu clientii si totodata se vine în întâmpinarea initiativelor de complianta.

EMC Captiva Input Accel

InputAccel este o solutie de captura completa a informatiei ce va furniza afacerii dumneavoastra o modalitate mai eficienta de asimilare, validare si coordonare a documentelor.In prezent, InputAccel este o solutie client-server utilizata de sute de companii ale caror filiale sunt raspindite in diverse zone ale globului, contribuind decisiv la colectarea si integrarea informatiilor din exterior in propriile sisteme.Serverul Inputaccel este capabil de balansarea automata a incarcarii, ceea ce asigura un grad inalt de productivitate pentru toti utilizatorii, evitand gatuirile printr-o buna coordonare a fluxurilor.




EMC Captiva QuickScan Pro

lista ApplicationXtender (AX) si dedicat acelor aplicatii care necesita captura unui numar mic - pâna la mediu de documente si unde se preteaza atasarea unui scanner la statia de lucru. Quick Scan Pro reprezinta solutia ideala pentru organizatiile de talie mica si mijlocie care doresc sa înlocuiasca procesele manuale laborioase de gestiune a documentelor cu o solutie completa de document management, care contribuie, în mod semnificativ, la reducerea costurilor asociate stocarii si, în paralel, la crestrerea eficientei.


Abbyy

ABBYY Software House este în Rusia principalul dezvoltator de solutii pentru Inteligenta Artificiala si software lingvistic, având o linie de produse de OCR si procesare de text. Suita de produse ABBYY include:

Abby FineReader este o aplicatie puternica, usor de folosit pentru conversie profesionala de calitate a imaginilor documentelor si fisierelor in format PDF in fisiere electronice usor de folosit si modificat. Produsul ofera o acuratete uimitoare in conversia unor tipuri de documente, incluzand tabele, articole din ziare, faxuri, etc. Imbunatatirile versiunii 8.0 ofera produsului FineReader mai multa inteligenta, ii ofera mai multa acuratete, flexibilitate si adaptabilitate pentru o varietate mai mare de utilizatori .

ABBYY FineReader 8.0. redefineste acuratetea si performanta OCR , oferind:

  • o cresterere semnificativa in ceea ce priveste acuratetea recunoasterii - acuratetea este imbunatatita cu 30 de procente pentru citirea documentelor dificile, precum faxurile si documentele scanate cu rezolutie mica.
  • o conversie PDF mai inteligenta - cu o procesare mai inteligenta, mai rapida si capacitatea de a cauta, securiza si indexa fisierele PDF

  • productivitate mai mare si o arie de folosire mai mare - cu noi instrumente de automatizare, optiuni pentru procesare rapida si posibilitatea de a folosi FineReader pentru o arie mai larga de aplicatii, incluzand suport pentru camera digitala si OCR "instant", cu o noua aplicatie "Screenshot Reader".

Imbunatatiri pentru recunoastere

  • Abordarea inteligenta a programului ABBYY FineReader desfasoara selectiv cea mai buna combinatie de algoritmi de recunoastere si ajustari de pre-procesare bazat pe calitate si atributele cheie ale fiecarui document. Rezultatul este o acuratete mult mai mare. Beneficiile pentru noua conversie de documente ale programului ABBYY FineReader 8.0.

Conversie PDF mai inteligenta si mai rapida

FineReader 8.0. ofera trei tipuri diferite de functie de conversie intr-o singura aplicatie: utilizatorii pot deschide un fisier PDF si sa il transforme in formate editabile (precum Word si Excel); pot deschide un fisier PDF, sa modifice textul si sa salveze fisierul tot in format PDF; sau sa creeze fisiere PDF ce pot fi regasite din documente de hartie. FineReader 8.0. creste viteza de conversie PDF de doua ori mai mult decat versiunea anterioara si de asemenea ofera urmatoarele imbunatatiri tehnice:

  • Proces inteligent de conversie PDF. FineReader ofera acuratete superioara in conversia fisierelor PDF prin abordarea duo-optionala. Cand proceseaza fisiere PDF, FineReader determina daca textul poate fi extras, examineaza integritatea spatiului unde este scris textul si decide daca sa extraga textul sau sa aplice procedura OCR. Examineaza fiecare parte individual, si selecteaza cea mai buna metoda de aplicat pentru fiecare parte. Acest proces asigura o conversie corecta si rapida chiar si atunci cand proceseaza documente PDF cu probleme, precum documente cu texte incorect codate, sau fisiere PDF prezentate numai ca fisiere imagine, fisiere fara text (imagini MFP). Daca este necesar, utilizatorii ajunsi la

  • un nivel avansat de cunoastere a programului pot selecta modulul "Recunoaste PDF ca Imagine" pentru a procesa toate documentele PDF ca imagini.
  • Setarile de securitate PDF si suportul de criptare. FineReader 8.0. ofera suport pentru urmatoarele setari de securitate, facand acest program sa fie potrivit pentru a fi folosit intr-un mediu de lucru guvernamental sau pentru organizatii care cer securitate sporita:
    • Suport pentru parole sau acces liber
    • Le permite utilizatorilor sa restrictioneze printarea, editarea sau extragerea continutului documentelor
    • Suport bazat pe RC4, 40 bit, 128 bit si AES (Advanced Encryption Standard = Standard de Criptare Avansata)
  • Legaturi si proprietatile documentelor. In conversia fisierelor PDF, FineReader creaza legaturi interne si hiperlinkuri in cadrul fisierului PDF. De asemenea capteaza proprietatile documentului PDF definite de autor ca: subiect, autor, titlu si cuvinte cheie si transfera aceste informatii in locatii similare in documentele create, format: DOC, RTF, XLS, HTML, PDF, si LIT

Abbyy Form Reader 6.5 (Desktop si Enterprise


Introducerea manuala a datelor de pe formulare este o munca migaloasa si plictisitoare. Ea implica aparitia unor probleme: intarzieri in procesul de culegere a datelor, greseli in operare, cheltuieli mari, inchirieri de spatii pentru angajati, etc.


Exista o alternativa la toate aceste probleme: un sistem automat de captura a datelor.

ABBYY FormReader este un software performant pentru captura automata si export a datelor culese din surse printate in sisteme de management al informatiilor sau baze de date, bazat pe tehnologiile de procesare imaginii si recunoastere incorporate in excelentul produs FineReader OCR.

Procesarea automata a formularelor utilizand ABBYY FormReader presupune parcurgerea urmatorilor pasi:

Plasarea unui lot de documente in alimentatorul automat de documente al scanerului si apasarea butonului "Scan"

Apasarea butonului "Match Template". Aplicatia localizeaza automat toate campurile completate de pe formular, le recunoaste si le verifica

+ 4. Verificarea si corectarea manuala a tuturor caracterelor nerecunoscute de aplicatie

5. Se apasa "Save" pentru salvarea rezultatelor recunoasterii

Pe scurt, ABBYY FormReader reduce timpul cheltuit cu introducerea datelor, creste calitatea procesarii si simplifica procesele de corectie .

ABBYY FormReader poate fi folosit local: scanarea / importul imaginilor, precum si recunoasterea si verificarea vizuala - toate pot avea loc pe acelasi computer, daca se cere acest lucru. Volumul documentelor care poate fi procesat zilnic poate varia intre 100 de formulare complexe, multipagina si 1000 de formulare simple, de o singura pagina.

Toate tipurile de formulare pot fi procesate utilizand ABBYY FormReader: cecuri, facturi, chestionare, formulare de primire, cupoane, etc - lista poate fi fara sfarsit.


Singura cerinta este ca formularele sa fie "machine readable" - sa poata fi citite de calculator. Pentru a putea fi procesate. Din acest motiv, ABBYY FormReader vine insotit de:

  • un ghid complet de creare a formularelor
  • un set de sabloane pentru crearea formularelor utilizand MS Visio 2000
  • instructiuni privind crearea de formulare utilizand MS Word

Scanarea

  • pot fi utilizate atat scanere flatbed cat si scanere cu alimentare automata
  • pot fi deschise formate: TIFF, JPG, PCX si BMP
  • detectare automata a calitatii imaginii, rotirea imaginii, detectarea orientarii paginii, deskewing, despackle

Recunoasterea

  • Imaginile sunt procesate utilizand tehnologiile FineReader: OCR (recunoastere scris de masina), ICR (recunoastere scris de mana), OMR (recunoasterea bifelor), recunoastere coduri de bare
  • Toate elementele standard ale formularelor sunt recunoscute:
    • Scrisul la masina sau printurile
    • Caracterele scrise de mana
    • Bifele si grupurile tip radio
    • Codurile de bare
  • Potrivirea automata a sabloanelor permite procesarea in acelasi lot a mai multor tipuri de formulare

  • Calitatea recunoasterii poate fi imbunatatita utilizand dictionare interene si externe

Verificarea

  • Sunt disponibile trei moduri de verificare:
    • Verificarea contextului, pentru verificarea continutului campurilor
    • Verificarea grupurilor de digiti (pana la 300 de caractere pe secunda)
    • Verificarea in formular pentru simpla verificare a formularului si corectarea erorilor de validare
  • Regulile automate de validare incorporate (comparatie cu dictionarul) reduc la minimum numarul erorilor in datele rezultate

Export

  • in fisier (DBF, Excel, CSV, text)
  • intr-o baza de date via ODBC
  • in orice sistem de management al informatiilor via API sau utilizand un limbaj de programare
  • Nota: imaginile (fotografii, semnaturi, stampile, etc) pot fi si ele salvate in baze de date.

d) STAR STORAGE

A fost fondata în anul 1999, ca urmare a nevoilor evidente în piata de solutii integrate la cheie, în domeniul stocarii, arhivarii si managementului de date si documente, devenind unul dintre furnizorii de top pe piata romaneasca în aceste domenii.


Furnizând numai "cele mai bune" produse, care îndeplinesc cerintele existente de aplicatii "mission critical", STAR STORAGE ofera solutii integrate la preturi competitive, solutii care sunt raspunsul la nevoile evidentiate în domeniul IT, în acest moment. Portofoliul nostru de produse include echipamente de stocare (primara on-line pe discuri magnetice, secundara near-line pe discuri optice, off-line pe benzi magnetice), scanere profesionale, software de captura de documente si date, aplicatii software pentru arhivare electronica, management de documente si workflow, kituri de dezvoltare.
Pe lânga furnizarea de produse de cea mai înalta calitate, STAR STORAGE ofera solutii la cheie în domeniul: stocare si arhivare de date si documente, solutii bazate pe produse de calitate (hardware si software) dar si pe o analiza complexa si o consultanta profesionala.
Solutiile STAR STORAGE sunt completate de o lista completa de servicii profesionale.
Scopul nostru principal este sa descoperim si sa întelegem nevoile reale ale clientilor nostrii, mai bine decât oricine altcineva în domeniu si sa gasim solutiile cele mai potrivite pentru acestia.
Misiunea noastra este sa construim relatii de lunga durata cu clientii nostrii si am constatat ca, pentru a realiza acest lucru, trebuie sa concentram întreaga forta intelectuala si creativitatea echipei noastre de profesionisti.

Star Storage Star Capture

Documentele pe hartie au o prezenta si un rol deosebit de important in orice organizatie. In multe cazuri informatiilor prezente in aceste documente nu se afla in nici un sistem informatic structurat ceea ce duce la necesitatea pastrarii documentelor fizice cat mai aproape de spatiul de lucru zilnic.



StarCapture este un produs destinat convertirii documentelor din hartie in format electronic astfel incat informatia din acestea sa fie disponibila mai usor si mai rapid. Prin integrarea StarCapture cu alte sisteme (ex. de Document Management, de tip ERP sau CRM) informatia inchisa initial in documentele pe hartie este imediat disponibila catre utilizatori.

StarCapture poate fi folosit intr-o multitudine de scenarii printre care si acolo unde este nevoie de captura zilnica sau ocazionala a documentelor curente. De exemplu, poate fi folosit in cadrul unei organizatii sau al unui departament pentru a scana toate documentele sosite din exterior si apoi a le distribui electronic catre un sistem integrat (inclusiv realizarea de OCR si/sau preluare de date din formulare).

Figure 1 - Procesele principale sustinute de StarCapture






III) STUDIUL COMPARATIV

Modelele AMS 200 si AMS 500: 67.5 TB - 88.5 TB

  • Numar de discuri suportate: 105 discuri SATA (WMS 100), 105 discuri FC si SATA (AMS 200) si 225 discuri FC si SATA (AMS 500);
  • Sisteme modular cu capacitate de stocare bruta maxima de pâna la 67.5 TB cu discuri FC de 300 GB/10000 RPM, sau 88.5 TB cu discuri SATA de 400 GB/7200 RPM (modelul de varf AMS 500 cu 225 discuri);
  • Tip discuri: FC-AL dual-port active/active, hot-swappable, cu capacitati de 73 GB/10000 RPM, 73 GB/15000 RPM, 146 GB/10000 RPM, 146 GB/15000 RPM si 300 GB/10000 RPM sau SATA, hot-swappable, cu capacitati de 250 GB/7200 RPM si 400 GB/7200 RPM; sistemele beneficiaza de 2 (WMS 100 si AMS 200) sau 4 (AMS 500) bucle FC-AL la 2 Gbps pentru conectarea discurilor FC-AL (backend loops);

EMC EMC CLARiiON Modular Networked Storage Family: 365 GB - 239 TB

. latime de banda mare care permite accelerarea la 4 Gb/s.

. Write cache, unde fiecare procesor de stocare mentine atât datele primare pentru LUN-urile sale, cât si o copie secundara a datelor pentru procesorul sau de stocare pereche.
. Battery backup pentru controlere si cache, acestea permitând protejarea datelor în cazul unei caderi de tensiune.
. Nivele de protectie RAID 0, 1, 1/0, 3, 5, toate putând coexista în cadrul aceleiasi matrici simultan, pentru a satisface diferite nivele de protectie a datelor.
. Cai de date redundante, surse redundante, conexiuni ale discurilor redundante, procesoare de stocare redundante - toate cu capabilitati de înlocuire non-distructive



Aplicatii backup-on-disk - imbunatatind performantele fata de solutiile tradfditionale de backup-on-tape
Aplicatii cu fisiere mari - permitând procesarea mai rapida la un cost mai mic pentru aplicatiile care lucreaza cu volume mari de date.

Plasmon Seria G: 720 GB 20 TB

-Pornind de la un numar de 24 sloturi putandu-se ajunge pana la 638


Disc NSM Series: 2.5 TB - 6TB

suporta pâna la 7 drivere si 415 sloturi de disc.

-          Design modular

-          Modulul CapacityDoubler pentru medii de tip double side

-          Tehnologie Intelligent pack

-          Suport pentru standardele CD si DVD

-          Integrat pentru sistem de diagnosticare

-          Interfata intuitiva, parola de acces

-          Sursa de alimentare de tip "auto sensing"

-          Conectivitate NAS, Fibre channel

-          Kit de montare în Rack


Disc PDD Series: 23,3GB - 16TB

rata de scriere/citire a informatiilor de pâna la 11 MB/s.

-          Design modular

-          Tehnologie SmartPack de management offline

-          Tehnologie PDD

-          Sistem integrat pentru diagnosticare

-          Interfata intuitiva, acces pe baza de parola

-          Sursa de alimentare standard redundanta

-          Porturi SCSI LVD multiple


Disc Series: 1TB - 35TB

Ratele de transfer citire/scriere al datelor sunt de 9MB/s

-          Design modular

-          Tehnologie SmartPack pentru managementul offline

-          Tehnologie Blu-Ray

-          Posturi SCSI LVD multiple

-          Sistem integrat de diagnosticare

-          Facilitate de montare în rack

-          Facilitati de conectivitate NAS, Fiber Channel, interfata i-SCSI


Quantum Scalar i500 1,746 TB - 2,794 TB

  • Un sistem de management intelligent
  • Monitorizare si diagnosticare proactiva, de la distanta
  • Design specific retelelor de stocare de tip SAN (Storage Area Network)
  • Suport optimizat pentru backup de tip disk-to-disk-to-tape.
  • Reduce cheltuielile generale si de administrare, prin oferirea unor functii de biblioteca avansate, fara costul si complexitatea componentelor externe
  • Permite extinderea de la 36 cartuse LTO, pâna la 404 cartuse LTO si 18 drive-uri LTO, prin utilizarea unor module de expansiune cu costuri reduse si a unui sistem cu robot unic   
  • Capacitatea la cerere ("capacity-on-demand") permite platirea numai pentru capacitatea necesara initial si extinderea pe masura nevoii
  • Sursele duale de alimentare protejeaza drive-urile si biblioteca in cazul defectarii oricareia dintre surse, furnizând cu adevarat redundanta totala (2N)


  • Functionalitate fara întrerupere prin componente hot-swap ca: drive-uri, surse de alimentare, interfete de tip blade si ventilatoare

Quantum Scalar i2000 1,746 TB - 2,794 TB

- Are 3,492 de sloturi LTO ( sau 2910 SDLT

  • Simplifica consolidarea backup-ului, prin partitionarea bibliotecii si prin mixarea tehnologiilor de banda
  • Alerteaza administratorul despre probleme, înainte ca backup-ul sa înceapa si, de asemenea, furnizeaza un sistem de avertizare care anticipeaza defectarea sistemului.
  • Designul sistemului Scalar i2000 creste performanta si fiabilitatea backup-urilor în mediile SAN foarte pretentioase.
  • Verificarea proactiva a canalelor de date prin reteaua de stocare SAN - de la toate serverele catre toate drive-urile - asigura o disponibilitate maxima a sistemului, înainte de începerea backup-ului.
  • Facilitati precum comenzi în asteptare (cozi de comenzi) si servirea cererilor de date in avans accelereaza backup-ul, prin reducerea intarzierilor si mentinerea unui flux constant de date între server si drive
  • Gruparea drive-urilor reduce cu pana la 75% necesarul de cabluri FC si porturi in switch-urile FC, micsorand, in consecinta, costurile.

Librarii si autoloader-ele Overland Storage: 50 GB - 200 TB

. Format compact 2U pentru maximizarea utilizarii spatiului costisitor din rack
. Suport pentru unitati de banda cu tehnologie LTO-2 si LTO-3
. Magazie(ii) cu 12 casete retractabile pentru stocare off-site facila
. Management la distanta usor de folosit pentru control si mentenanta
. Componente care pot fi schimbate de utilizator pentru suport facil, cu costuri reduse


. Suport pentru coduri de bare pentru managementul avansat al cartuselor
. Politica de înlocuire în 24 de ore

Overland Storage ArcVAULT: pâna la 19.2 TB

Overland Neo 2000: pana la 24 TB

Overland Storage Neo 8000: pana la 800 TB

Brocade:

. Conecta servere cu dispozitive de storage si sa le scaleze independent
. Consolida si partaja servere si resurse de stocare
. Partaja resurse de backup valoroase în cadrul companiei
. Centraliza gestiunea informatiilor pentru a le putea utiliza fara prea multe resurse personale

Tapestry:

. O mai buna perfomanta pentru accesul îmbunatatit la informatii
. Operatiuni de automatizare si template-based pentru cresterea productivitatii si consistentei
. Resurse centralizate de management pentru o administrare simplificata si pentru o mai buna utilizare de resurse
. Control crescut pentru informatiile locale si pentru cele gestionate remote

Brocade 200E Switch:

Rutare Fabric Shortest Path First (FSPF)  

Sisteme de ventilatie redundante

Scalabilitate la nivelul porturilor suporta 8, 12 sau 16 porturi\ Compatibilitate cu toate modelele de switch-uri Brocade



Performante de 1,2 si 4 Gbit/sec pentru a permite pâna la 128 Gbit/sec, trafic necongestionat

Adaptare automata a vitezei (1, 2, si 4 Gbit/sec) si a sensului de trafic

Wizard-ul Brocade EZSwitchSetup pentru implementari SAN rapide prin configurarea în 3 pasi a switch-urilor

Servicii Avansate pentru Fabric pentru îmbunatatirea operatiunilor de business

Statistici la nivelul porturilor pentru diagnosticarea si izolarea eventualelor probleme

Crearea de zone de acces în retea, implementate hardware, prin folosirea adreselor World Wide Name (WWN)

Interfete având la baza SNMP v3

Acces securizat Telnet prin SSH (Secure Shell)

Instrumentele Web Brocade pentru un management al SAN-urilor cât mai facil

Integrare cu mediile eterogene: Windows 2000, Windows NT, UNIX, LINUX, HPUX si Solaris

Brocade 4900 Switch

Asigura o densitate de 64 de porturi într-un singur domeniu si o dimensiune în rack de 2 U

Performante de 4 Gbit/sec la o distanta de 100 km (500 de km la 1 Gbit/sec)

Optimizarea performantelor retelei prin intermediul facilitatii Brocade ISL Trunking, care permite o viteza de transfer de 32 Gbit/sec

Nivel ridicat de scalabilitate la nivelul porturilor (de la 32 la 64 de porturi)


Usor de adaptat si upgrad-at la noile nevoi sau la cresterea organizatiei

Încarcare si activare online a firmware-lui

Sisteme de ventilatie si surse de alimentare redundante

Crearea de zone de acces în retea prin intermediul adreselor WWN

Utilizarea instrumentelor Brocade Web Tools prin intermediul unui protocol securizat

Consolidarea switch-urilor prin intermediul unei densitati ridicate de porturi

Protectia investitiilor existente prin posibilitatea de upgrade de la versiunile anterioare de 1 si 2 Gbit/sec

EMC Legato

  • 10.1 TB/ora backup la nivel de fisiere, cu o viteza de restaurare de 4.5 TB/ora
  •  7.2 TB/ora backup de tip imagine (la nivel de block), cu o viteza de restaurare de 7.9 TB/ora

Captiva EIM

. Limiteze costurile operationale permitând utilizatorilor sa automatizeze sarcinile manuale si sa foloseasca o singura platforma de Input Management pentru gestiunea tuturor documentelor
. Îmbunatateasca informatiile din punct de vedere calitativ reducând erorile de introducere manuala a datelor si costurile de procesare ulterioara
. Accelereze procesele de business oferind o vedere unica în privinta fluxurilor de informatii si tendintele afacerii
. Reduca costurile totale integrând aceste solutii cu toate aplicatiile companiei pentru



cresterea performantelor operationale
. Realizeze un amortizare completa a investitiei în maxim 12 luni

ABBYY Software House

  • FineReader OCR - familie de solutii pentru recunoasterea textelor tiparite, tabelelor si fisierelor PDF;
  • FormReader - un produs ICR pentru recunoasterea si procesarea formularelor scrise de mâna;
  • FineReader Bank - un program bancar dedicat pentru captura si prelucrarea ordinelor de plata;
  • ABBYY Retrieval & Morphology Engine - un set de unelte pentru dezvoltarea solutiile pentru efectuarea de cautari în documente si integrarea posibilitatilor lingvistice în produse software;

IV. PREZENTAREA SOFTULI


4.1 Prezentarea soft-ului DjVu

Djvu este o tehnologie de compresie a imaginilor optimizata pentru documentele scanate.

Avantajele utilizari softului DjVu:

- marimea pe care o ocupa documentele listate in DjVu

- posibilitatea de a lista paginile

- posibilitatea de a citi documente foarte vechi, harti

- posibilitatea de a schimba fundalul imagini


Cu imaginile alb-negru face minuni si e superioara concurentei chiar si la compresia imaginilor color. Dezvoltat in 1996 de AT&T Labs, software-ul a fost


licentiat sub GPL de Lizardtech si poate fi folosit gratuit peLinux , Mac si Windows . partea cea mai interesanta este rorusi randarea paginilor . Oricat de mare ar fi imaginea ,este decodata si tinuta in memorie doar partea afisata pe ecran necesitand deci mai putina memorie decat un JPG viewer sau un PDF reader , lucru ce se simte la harti . Zoom-ul si panning-ul se fac foarte rapid chiar pe calculatoare mai vechi. Cu browser plugingurile disponibile nu-mi ramane decat sa ma mir ca o astfel de alternativa superioara PDF-ului si pe deasupra gratuita are o raspandire asa redusa. Pentru Windows si Mac OS X sunt disponibile plugin-uri pentru browser de pe pagia de download a LizardTech si viewere stand-alone de la WinDjView , iar pentru Linux avem proiectul DjVuLibre si un driver pentru ghostscropt - GSDjVu - care ,fiind sub licenta CPL , nu poate fi distribuit impreuna cu GS asa ca trebui compilat de fiecare in parte: se ia driverul, ghostscript-8.15, fronturile standard si se urmaresc instructiunile de compilare. Rezultatul poate fi testat cu scriptul DjVudigital care converteste un fisier PS sau PDF in DjVu . Pentru cei mai putin aventurosi exista serviciul de conversie online unde pot uploda documentele.


4.2 Metoda de comprimare DjVu:


Ideea de baza a DjVu este sa separe textul de fundal si poze si sa foloseasca tehnici diferite de compresie pt fiecare din aceste elemente.Metodele traditionale sunt concepute sa comprime imaginile naturale cu cateva imargini (jpeg ) , sau sa comprime imaginile alb negru compuse aproape in totalitate din margini ascutite.(jbig1).Tehnica djvu combina ce e mai bun din aceste 2 metode.Un algoritm de separare intre fundal si prim plan segmenteaza imaginile in 2 straturi separate:

- stratul fundal are rezolutie joasa (100 dpi)imaginea din fundal fiind codata cel mai bine folosind o tehnica pt. a creea o nuanta continua.Aceasta include de obicei funadll docmentului si imaginile.



-statul prim plan cu rezolutie mare contine o "masca" in doua nuante (300 dpi) care defineste exact forma detaliilor cu margini ascutite cum ar fi textul.Informatia culorii este codata fie ca o culoare compacta pt. componenta conectata mastii , fie ca imagine de fundal la rezolutie joasa ale carei culori sunt aplicate folosind masca , ca si matrita.


Schema generala de segmentare pentru comprimare documentelor DjVu:

-transformarea valurel poate fi produsa in intregime fara multiplicarea operatiilor ,bazandu-se in exclusivitate pe schimbari si adaugari, reducand astfel foarte mult cerintele necesare calculelor.

- reprezentarea intermediara a imaginii este proiectata pentru a permite un rafinament progresiv a coeficientilor valurel (wavelet), in timp ce ocupa o memorie proportionala cu numarul coeficientilor fara zero, nu a numarului de pixeli.

- structura datelor permite interpretarea 'din mers' a oricarei sub imagini la o rezolutie prestabilita n intr-un timp proportional cu numarul de pixeli interpretati.



Marimea fisierelor compresate pt. 8 documente folosind urmatoarele metode de compresie : fara compresie , imagine GIF la 150 dpi , imagine JPEG la 300 dpi,si djvu cu masca la 300 dpi , si fundal 100 dpi.






Marimea fisierelor si timpii de compresie pt diferite documente. Rezultatele pt segmentele propuse , reprezentate in ultima coloana.



4.3 Segmentarea bazata pe MDL:


Pentru a coda componentele ca parte a funadalului "neted" este nevoie doar de schema de codare a culorii funadalului cu costul     Pentru a coda componentat ca o bucata a prim planului care se lipeste de fundal este nevoie de schema de codare a culorii primpalnului , o schema de codare a mastii si o schema de codare a culorii funadalului , aceasta schema nefolosind biti pe primplanul deja codat)

Componenta este clasificata ca prim plan daca :

si ca fundal alfel.


Selectarea electronica a documentului :

Publicarea implementarilor


Algoritmul propus face un numar mare de operatii booleene intre ' tablouri' (i.e. B F si forma componetelor). Implementarea noastra reprezinta aceste tablouri folosind codarea



detaliata si indeplinirea operatiilor boolene intr-un timp proportional cu numarul de rulari ale liniilor de scanare relevante.

Algoritmul propus necesita deasemenea cantitatile Pclipped si Pbackground.

Schema generala a segmentarii

comprimarea documentelor DjVu


- Cantitatea Pclipped este perimetrul perforatiei formei componentei calculata la pasul (ii) din algoritm.Perimetrul detalierii tabloului codat este deasemenea calculat in timp liniar facand o singura trecere pe tablou si calcule simultane ale sumei R a traseului perimetrului si suma L a lungimii segmentelor de contact dintre traseele situate pe liniile de scanare adiacente.Perimtrul P este egal R-2L.

- Cantitatea Pbackground este usor calculata folosind relatia ilustrata din figura.Este suficient sa calculam perimetrul Punclipped al formei componentei dupa pasul (i) si perimetrul Pocclusion al tabloului reprezentand componenta formei pixelilor existenti ai obiectelor din prim plan.Acest tablou este calculat in pasul (ii) al algoritmului.Cantitatea dorita Pbackground = Punclipped+Pclipped−Pocclusio






4.4 Concluzii:

DjVu este unic in mai multe feluri : felul de segmentare , compresare si disignul softwarew-ului se combina pentru a creea o platforma atat de intuitiva si puternica in asa fel incat majoritatea celor care il folosesc cu greu realizeaza cat de avansata este tehnologia ce sta in spatele DjVu.Cu adaugarile recente da conversie ale documentelor electronice adaugate la portofoliul sau , DjVu devine un serios si puternic convertor de documente , capabil sa satisfaca nevoile une mari categorii de utilizatori.

O categorie de produse DjVu , de la software necomercial la cel ce include toate caliatile, pachete avansate proiectate pentru intreprinderi , este disponsibila la LizardTech.Acesta tehnologie este partial disponibila ca si sursa deschisa la sourceforge.net,unde noi contributii sunt binevenite. In completare un numar in crestere de unelte aditionale , de la

pachete pentru imagini ca irfanview , la motoare de cautare ca jss,sunt compatibile cu DjVu.

Performantele unice ale DjVu vin din faptul ca se preteaza la documente ca imagini cu maimulte straturi , rezultand o reprezenatre inalt optimizata.Ofera multe posibilitati de a aplica imagini noi sau deja existente tehnologiilor de convertire a documentelor, care va creste exploziv in urmatorul deceniu.

Dat fiind faptul ca bibliotecile digitale devin o obisnuinta acestea vor avea nevoie de un standard universal pentru depozitare , primire si transmitere a documentelor si imaginilor cu calitate inalta.

Munca descrisa in aceasta lucrare este un pas important referitor la nevoia propunerii unei comprimari de calitate DjVu impreuna cu un browser ce permite acces rapid la internet. Cu acelasi nivel de liziblitate , puncte per inch, DjVu realizeaza ratii mai mari de compresie pe timp fata de JPEG.

Pentru realizarea acestor noi algoritmi ce se adreseaza unei largi varietati de probleme de procesare a imaginilor clasice , a fost propusa o adunare a Multiscale



bicolore care face o separare a mastilor fundal-prim plan care va fi mai generalizata decat segmentarea standard text- imagine.

Cu algoritmii sablon potriviti, ratia de compresie a JIBIG cu pierderi este de 2 ori mai mare decat cea a compresiei JBIG fara pierderi, cel mai bun standard existent pentru imaginile bi-nivel.

Codificatorul ZP este mai rapid decat alte codificatoare aritmetice si ofera o compresie mai buna .

Proiectiile multi-scala alee algoritmilor pentru descompunerea undei imaginilor partial masacate reduce semnificativ marimea compresiei si poate manevra arbitrar masti complexe cu cerinte rezonabile de calcul. Toti acesti algoritmi au fost integrati intr-un decodor de sine statator DjVu.

Acest decodor este deasemea disponibil pentru cercetare.

Este posibila optimizarea ratei de compresie , o versiune a DjVu care decodeaza cateva pagini impreuna va fi in masura sa imparta dictionare JBIG intre pagini.Probleme ca separarea mastii fundal- prim plan sau repetare componentelor legate sunt reformulate in scopul de a optimiza cresterea ratiei.

Completarea asezarii analizei textului si recunoastera caracterelor optice OCR va face posibila insemnarea si editarea textului extras din documentele DjVu decodate .


Pentru un fundal si un prim plan date ,acesta figura compara 3 sub imagini ,umatoarele configuratii fara compresie , folosesc metode standard de compresie ca JPEG si CCITTG si tehnicile de compresie folosite in DjVu.Deducand ca pornim de la o imagine document , marimea medie asteptata pt fiecare subimagine este raportata blocului de date corespunzator.Sagetile arata tehnicile de comprimare folosite si ratiile de comprimare obtinute.


Cele trei straturi ale DjVu viewer

- stratul care incarca si depoziteaza componentele documentului

- stratul decodant construieste reprezenatrea intermediara

- stratul de interpretare calculeaza pixelii imaginii






Formatul djvu ("deja-viu") a fost elaborat în anul 1996 de catre firma AT&T special pentru pastrarea si transmiterea prin internet a documentelor scanate. Acesta este un format grafic ce are prioritati importante fata de alte formate de grafica: 1. liniile textuale sunt privite ca straturi deosebite de fon, de aceea însusi textul practic nu-si pierde din calitate, se comprima doar imaginea de fon, ceea ce permite sa se atinga o comprimare de 5-10 ori mai mare decât la alte formate grafice care dau aceeasi calitate. În acelasi timp, nu se permite spalarea textului (de ex., ca în cazul jpg); 2. diferitele pagini ale documentelor scanate se pastreaza într-un singur fisier, însa lucrând pe internet, primele pagini pot fi vizionate deodata, fara ca celelalte pagini sa fie încarcate. aceasta este comod pentru a întelege daca aveti nevoie de carte, adica daca face sa o încarcati deplin; 3. în cele din urma, însusi formatul e specificat sub licenta GPL, ceea ce-l face deschis si fara plata pentru utilizare, cu toate ca exista si aplicatiii comerciale pe baza lui (pe care le promoveaza firma LizardTech Inc.).



4.5 Transformarea documentului DjVu in imagine JPEG


Universal Document Converte(Convertorul universal de documente) este un software gen "imprimanta virtuala " ce salveaza orice document ca pe un fisier imgine.Acesta va lasa sa transformati documentul dvs. DjVu in JPEG la fel de usor ca si cum le-ati trimite imprimantei.

Imaginile JPEG rezultate sunt complet independente de documentul de baza, si pot fi vizionate sau printate pe calculatorul dvs. Aceste ase pot folosi ca prezentari, trimite prin e-mail si multe multe altele.


Pentru transformarea documentului DjVu in imagine JPEG:


1.Daca nu aveti inca insatlat plugin-ul pentru browser-ul DjVu il puteti instala de pe acest site: (https://www.lizardtech.com/download/files/win/djvuplugin/index.php


2.Deschideti documentul DjVu in Internet explorer si apasati butonul print din bara plug-in-ului browser-ului DjVu







3. Selectati Universal Document Converter din lista imprimantelor si apoi apasati butonul Properties (proprietati).




4.In fereastra the Printing Preferences (preferinte pt. imprimare), delectati cel mai bun profil necesar nevoilor dvs. Daca trebuie sa schimbati formatul imaginii sau rezolutia ei mergeti la How to change output image file format topic.




5.Apasati OK in preferintele Universal Document Converter si in fereastra de printare. Documentul va incepe printarea . Imaginea JPEG rezultata va fi salvata in folderul :

C:\UDC Snapshots

Daca vreti sa schimabati locatia documentului rezultat sau numele imaginii mergeti la :

How to change output image location or filename




6.Fisierul jpeg rezultat va fi deschis cu orice program pt. vizulaizarea imaginilor care este insalat pe calculator.(Windows Picture an Fax Viewer , Irafan View, ACDSee etc.).




Acum documentul poate fi vazut pe orice computer indifferent de sistemul de operare (Windows, Linux, Mac, Unix, etc.).



4.6 Transformare Documentului DjVu in Adobe PDF


Universal Document Converter este o "unealta" care ajuta la exportarea documentelor inntr-un tipar PDF care permite mentinerea exacta a aspectului si continutului documentului original , incluzand fontul si partile grafice.

Tiparul PDF este cea mai buna solutie pt. imaprtilre si arhivarea documentelor pt ca este un format protejat schimabrilor si independent. Dat fiind faptul ca orice calculator are un program ce deschide PDF , poti fi increzator in faptul ca documentul tau va fi vazut si printat corect , in culorile originale si fara pierderea calitatii.


Pentru a transforma un document DjVu in fisier Adobe PDF

1.Daca nu aveti inca insatlat plugin-ul pentru browser-ul DjVu il puteti instala de pe acest site (https://www.lizardtech.com/download/files/win/djvuplugin/index.php

2.Deschideti documentul DjVu in Internet explorer si apasati butonul print din bara plug-in-ului browser-ului DjVu


3. Selectati Universal Document Converter din lista imprimantelor si apoi apasati butonul Properties (proprietati).


4.Selectati profilul numit Document to PDF, Color, Multipage in fereastra proprietati a Universal Document Converter. Daca aveti nevoie sa schimbati formatul imagini rezultate sau rezolutia paginii ,mergeti la to How to change output file format


5.Apasati OK in preferintele Universal Document Converter si in fereastra de printare. Documentul va incepe printarea . Fiierul PDF rezultat va fi salvat in C:\UDC Snapshots.

Daca vreti sa schimabati locatia documentului rezultat sau numele imaginii mergeti la :

How to change output image location or filename



Fisierul PDF rezultat va fi deschis cu programul instalat pt deschiderea acestui tip de fisier.



4.7 Comparatii intre DjVu si LDF


Se pot suma roate rezultatele in urmatorul tabel:


Format

Schema textului

Mascarea

textului

Ascunderea fundalului textului

Ascunderea imagini

Marimea


DjVu

JB2

300 dpi pierduti

25 dpi

100 dpi 

75 QF

68.1 KB

100 dpi

90.7 KB

300 dpi

Fara pierderi

25 dpi

81.4 KB

100 dpi

104.0 KB

LDF

LDF

300 dpi

NA


300 dpi mediu

160.5 KB

300 dpi

jos

123.0 KB

100 dpi

99.0 KB

CCITT G4

300 dpi

NA

100 dpi

jos

152.9 KB







Analizand straturile:



LDF

DjVu

Performante generale

1-bit

segment

Multe informatii

Putine informatii

DjVu/JB2 este substantial superior

Culoarea


segmentului


Putine informatii

Multe informatii

LDF/LWF este foarte usor superior


4.8 Comparatii grafice intre DjVu si alte

softuri de stocare a informatiei electronice


Pentru a avea o viziune a compresiuni aplicatiei dintre DjVu si LDF se foloseste o componenta apropiata a MRC:


Mai mult reduce adancimea culori



Adancimea culori din imaginea textului se reduce la 256 culori in afara celor 16 culori.





Imagini alb-negru pe 1 bit

Se reduce numarul culorilor negru si alb numai ca compresarea imagini avand mai multa pierdere si incurcarea metodei.

Comparatia grafica dinte 1-bit si imaginea MRC





Nuanta grii a continutul textului

In acest caz, se observa ca o parte a stratului textului se misca de la schema MRC in invalurelul fundalului segmentului compresat. In DjVu ,o pagina de un 1-bit are 87 KB numai ca un strat de 1-bit in solutia MRC are numai 80 KB

Comparatii intre softul DjVu si celelalte softuri pentru stocarea informatiei:




Comparatii intre DjVu si alte softuri din punctul de vedere al dimensiuni memoriei ocupate.



Dintre aceste softuri de stocare dupa cum se vede si in figura de mai sus softul DjVu ocupa un spatiu foarte mic comparativ cu celelalte softuri de stocare a imagin.





Fisierele listate in DjVu vor avea un astfel de forma:








V APLICATIE PRACTICA

In continuare ca studiu aplicativ am scanat Revista Padurilor, editia 1886-1887, partea I, unicata in Romania, care are 450 pagini, folosind soft-ul DjVu, care o voi prezenta ca aplicatie a proiectului de diploma.


CONCLUZIILE CERCETARII SOFT-ULUI DjVu


In urma cercetari acestui soft, comparand-ul cu alte softuri de stocare al informatiilor electronice am ajuns la urmatoarele concluzii:


Am luat primele 10 pagini din revista padurilor si am utilizat pentru scanare soft-ul DjVu


Am comparat din punct de vedere al marimi pe care il ocupa aceste 10 pagini scanate cu DjVu cu alte programe pe care am putut sa copiez aceste pagini si am obtinut urmatoarele rezultate:


- la DjVu 0,211 KB/10 pagini

- in word 4,254 KB/10 pagini

- in windows picture 58,380 KB/10 pagini





V. Bibliografie:


https://www.lizardtech.com/products/doc/

www.wbcom.pl/djvu/

https://digit.nkp.cz/

https://www.opendoc.it/

https://www.sanhestar.com

https://www.cmis.csiro.au

https://www.lizardtech.es

https://www.print-driver.com

ttp://www.anbpr.org.ro

https://www.star-storage.ro/

https://stefantalpalaru.wordpress.com




Document Info


Accesari: 6067
Apreciat: hand-up

Comenteaza documentul:

Nu esti inregistrat
Trebuie sa fii utilizator inregistrat pentru a putea comenta


Creaza cont nou

A fost util?

Daca documentul a fost util si crezi ca merita
sa adaugi un link catre el la tine in site


in pagina web a site-ului tau.




eCoduri.com - coduri postale, contabile, CAEN sau bancare

Politica de confidentialitate | Termenii si conditii de utilizare




Copyright © Contact (SCRIGROUP Int. 2024 )