Deci, numărul 1 - „Sisteme de stocare a datelor”.

Sisteme de stocare a datelor.

În engleză, acestea sunt numite într-un singur cuvânt - stocare, ceea ce este foarte convenabil. Dar acest cuvânt este tradus în rusă destul de stângaci - „depozitare”. Adesea, în argoul „IT-Schnikov”, ei folosesc cuvântul „storazh” în transcrierea rusă sau cuvântul „khranilka”, dar aceasta este o manieră destul de proastă. Prin urmare, vom folosi termenul „sisteme de stocare”, sisteme de stocare prescurtate sau pur și simplu „sisteme de stocare”.

Dispozitivele de stocare includ orice dispozitiv pentru înregistrarea datelor: așa-numitul. „Unități flash”, discuri compacte (CD, DVD, ZIP), unități de bandă (bandă), hard disk-uri (Hard disk-ul, acestea sunt numite și la vechiul mod „hard disk-uri”, deoarece primele lor modele semănau cu un clip cu cartușe cu pușca din același nume din secolul al XIX-lea) etc. de exemplu, unul dintre primele iPod-uri a fost un mic hDD diametru 1,8 inch, cu ieșire pentru căști și ecran încorporat.

ÎN timpuri recente câștigă din ce în ce mai multă popularitate așa-numitele. Sistemele de stocare SSD (Solid State Disk, sau Solid State Drive), care sunt în principiu similare cu o „unitate flash” pentru o cameră sau un smartphone, au doar un controler și o cantitate mai mare de date stocate. Spre deosebire de hard disk, SSD-ul nu are părți în mișcare mecanică. În timp ce prețurile pentru astfel de sisteme de stocare sunt destul de mari, acestea scad rapid.

Toate acestea sunt dispozitive pentru consumatori și, printre sistemele industriale, ar trebui evidențiate, în primul rând, sistemele de stocare hardware: matrice de discuri, așa-numitele. Controlere RAID pentru acestea, sisteme de stocare a benzii pentru stocarea pe termen lung a datelor. În plus, o clasă separată: controlere pentru sisteme de stocare, pentru gestionarea copiilor de siguranță a datelor, crearea „instantaneelor” (Instantanee) în sistemul de stocare pentru recuperarea lor ulterioară, replicarea datelor etc.). Sistemele de stocare includ, de asemenea dispozitive de rețea (HBA, comutatoare Fibre Channel, cabluri FC / SAS etc.). Și, în cele din urmă, au fost dezvoltate soluții la scară largă pentru stocarea datelor, arhivarea, recuperarea datelor și recuperarea în caz de dezastru.

De unde provin datele care trebuie stocate? De la noi, cei dragi, utilizatori, de la programe de aplicații, e-mail, precum și de la diverse echipamente - servere de fișiere și servere de baze de date. În plus, furnizorul de cantități mari de date - așa-numitul. Dispozitive M2M (comunicare Mașină-Mașină) - tot felul de senzori, senzori, camere, etc.

În funcție de frecvența utilizării datelor stocate, sistemele de stocare pot fi împărțite în sisteme de stocare pe termen scurt (stocare online), stocare de durată medie (stocare aproape linie) și sisteme de stocare pe termen lung (stocare offline).

Primele includ un hard disk (sau SSD) calculator personal... Al doilea și al treilea sunt sisteme de stocare externe DAS (Direct Attached Storage), care pot fi o serie de discuri externe computerului (Disk Array). La rândul lor, acestea pot fi, de asemenea, subdivizate în doar o grămadă de discuri (JBOD) și un controler inteligent de stocare pe discuri (iDAS).

Sistemele de stocare externe sunt disponibile în trei tipuri: DAS (Direct Attached Storage), SAN (Storage Area Network) și NAS (Network Attached Storage). Din păcate, chiar și mulți specialiști IT cu experiență nu pot explica diferența dintre SAN și NAS, spunând că odată această diferență a existat, iar acum se presupune că nu mai există. De fapt, există o diferență și una semnificativă (vezi Fig. 1).

Figura 1. Diferența dintre SAN și NAS.

Într-un SAN, serverele în sine sunt de fapt conectate la sistemul de stocare prin SAN. În cazul NAS, serverele de rețea sunt conectate printr-o rețea locală (LAN) la un sistem de fișiere comun în RAID.

Protocoale de conexiune de stocare de bază

Protocol SCSI (Small Computer System Interface), pronunțat „skazi”, un protocol dezvoltat la mijlocul anilor 1980 pentru conectarea dispozitivelor externe la mini-mini-computere. Versiunea sa SCSI-3 este baza pentru toate protocoalele de comunicații de stocare și folosește un set de comenzi SCSI comun. Principalele sale avantaje sunt: \u200b\u200bindependența față de serverul utilizat, posibilitatea funcționării în paralel a mai multor dispozitive, rata mare de transfer de date. Dezavantaje: număr limitat de dispozitive conectate, gama de conexiuni este foarte limitată.

Protocol FC(Fibre Channel), protocol intern între server și stocare partajată, controler, discuri. Este un protocol de comunicație serial utilizat pe scară largă, care funcționează la 4 sau 8 Gigați pe secundă (Gbps). După cum sugerează și numele, funcționează prin fibră, dar poate funcționa și pe cupru. Fibre Channel este protocolul principal pentru sistemele de stocare FC SAN.

Protocol ISCSI(Internet Small Computer System Interface), un protocol standard pentru transferul blocurilor de date prin intermediul binecunoscutului protocol TCP / IP adică SCSI peste IP. iSCSI poate fi privit ca o soluție de stocare de mare viteză și costuri reduse pentru sistemele de stocare conectate de la distanță prin Internet. iSCSI încapsulează comenzi SCSI în pachete TCP / IP pentru transmisie pe o rețea IP.

Protocol SAS(Serial Attached SCSI). SAS utilizează transmisia de date în serie și este compatibil cu hard disk-urile SATA. În prezent, SAS poate transfera date la 3Gpbs sau 6Gpbs și acceptă modul full duplex, adică poate transfera date în ambele direcții cu aceeași viteză.

Tipuri de sisteme de stocare.

Se pot distinge trei tipuri principale de sisteme de stocare:

  • DAS (Direct Attached Storage)
  • NAS (stocare conectată la rețea)
  • SAN (Network Area Network)

Stocarea directă atașată DAS a fost dezvoltată târziu


Figura 2. DAS

Anii '70, din cauza creșterii explozive a datelor utilizatorilor, care pur și simplu nu se încadrau fizic în memoria internă pe termen lung a computerelor (pentru tineri, vom nota că nu este vorba despre computere personale, ele nu existau atunci, ci calculatoare mari, așa-zisul mainframes). Rata de transfer de date în DAS nu a fost foarte mică, de la 20 la 80 Mbit / s, dar a fost suficientă pentru nevoile de atunci.

NAS cu conectivitate la rețea a apărut la începutul anilor '90. Motivul a fost dezvoltarea rapidă a rețelelor și cerințele critice pentru partajarea unor cantități mari de date în rețeaua întreprinderii sau a operatorului. NAS a folosit un sistem de fișiere de rețea special CIFS (Windows) sau NFS (Linux), astfel încât diferite servere de utilizatori diferiți ar putea citi același fișier din NAS în același timp. Rata de transfer a datelor era deja mai mare: 1 - 10Gbps.


Figura 3. NAS

La mijlocul anilor 90, au apărut rețele pentru conectarea dispozitivelor de stocare FC SAN. Dezvoltarea lor a fost determinată de necesitatea organizării datelor împrăștiate prin rețea. Un singur dispozitiv de stocare pe un SAN poate fi împărțit în mai multe noduri mici numite Număr unitate logică (LUN), fiecare dintre acestea aparținând unui singur server. Viteza de transfer a datelor a crescut la 2-8 Gbps. Astfel de sisteme de stocare ar putea oferi tehnologii pentru protejarea datelor împotriva pierderii (instantaneu, backup).


Figura 4. FC SAN

Un alt tip de SAN este IP SAN (IP Storage Area Network), dezvoltat la începutul anilor 2000. SAN-urile FC erau scumpe, dificil de administrat, iar rețelele IP erau la vârf, motiv pentru care s-a născut standardul. Sistemele de stocare au fost conectate la servere utilizând un controler iSCSI prin switch-uri IP. Rata de transfer a datelor: 1 - 10 Gbps.


Fig. 5. IP SAN.

Tabelul prezintă câteva caracteristici comparative ale tuturor sistemelor de stocare considerate:

DAS NAS SAN
FC SAN IP SAN
Tipul de transfer SCSI, FC, SAS IP FC IP
Tipul de date Bloc de date Fişier Bloc de date Bloc de date
Aplicație tipică Orice Server de fișiere Bază de date CCTV
Avantaj Ușurința de înțelegere,

Compatibilitate excelentă

Ușor de instalat, cost redus Scalabilitate bună Scalabilitate bună
dezavantaje Dificultate de gestionare.

Utilizarea ineficientă a resurselor. Scalabilitate slabă

Performanta slaba.

Nu se aplică pentru unele aplicații

Preț mare.

Complexitatea configurației

Productivitate scăzută

Pe scurt, SAN-urile sunt concepute pentru a transfera blocuri masive de date către sistemele de stocare, în timp ce NAS oferă acces la date la nivel de fișier. Cu combinația SAN + NAS, se poate realiza o integrare înaltă a datelor, acces de înaltă performanță și partajare de fișiere. Astfel de sisteme se numesc stocare unificată - „sisteme de stocare unificate”.

Sisteme de stocare unificate:o arhitectură de stocare în rețea care acceptă atât fișiere NAS, cât și SAN bazate pe blocuri. Astfel de sisteme au fost dezvoltate la începutul anilor 2000 pentru a rezolva problemele administrative și costul total ridicat de deținere a sistemelor separate într-o singură întreprindere. Acest sistem de stocare acceptă aproape toate protocoalele: FC, iSCSI, FCoE, NFS, CIFS.

Hard disk-uri

Toate hard diskurile pot fi împărțite în două tipuri principale: HDD (Hard Disk Drive, care, de fapt, este tradus ca „hard disk”) și SSD (Solid State Drive, - așa-numitul „ unitate SSD"). Adică ambele unități sunt hard disk-uri. Ce este atunci un "soft disk", există asemenea? Da, în trecut erau, erau numite „dischete” (așa că erau numite din cauza sunetului caracteristic „popping” din unitate în timpul funcționării). Unitățile pentru acestea pot fi încă văzute în unitățile de sistem ale computerelor vechi, care au fost păstrate în unele instituții de stat. Cu toate acestea, cu toată dorința, astfel de discuri magnetice pot fi greu atribuite SISTEMELOR de stocare. Acestea erau niște analogi ai actualelor „unități flash”.

Diferența dintre HDD și SSD constă în faptul că HDD-ul are mai multe discuri magnetice coaxiale în interior și mecanici complexe care mută capetele magnetice de citire-scriere, iar SSD-ul nu are părți în mișcare mecanică și este, de fapt, doar un microcircuit turnat în plastic. Prin urmare, este incorect să apelați numai HDD-urile „hard disk”.

Hard diskurile pot fi clasificate în funcție de următorii parametri:

  • Proiectare constructivă: HDD, SSD;
  • Diametrul HDD-ului în inci: 5,25, 3,5, 2,5, 1,8 inci;
  • Interfață: ATA / IDE, SATA / NL SAS, SCSI, SAS, FC
  • Clasa de utilizare: individual (clasa desktop), corporativă (clasa enterprsie).
SATA SAS NL-SAS SSD
Viteza de rotație (RPM) 7200 15000/10000 7200 N / A
Capacitate tipică (TB) 1T / 2T / 3T 0.3T / 0.6T / 0.9T 2T / 3T / 4T 0,1T / 0,2T / 0,4T
MTBF (oră) 1 200 000 1 600 000 1 200 000 2 000 000
Note Evoluția unităților de disc ATA seriale.

SATA 2.0 acceptă rate de transfer de 300 MB / s, SATA3.0 acceptă până la 600 MB / s.

Rata de eșec anualizată (AFR) pentru unitățile SATA este de aproximativ 2%.

Hard disk-urile SATA cu interfață SAS sunt potrivite pentru niveluri. Rata de eșec anualizată (AFR) pentru unitățile NL-SAS este de aproximativ 2%. Unități în stare solidă realizate din cipuri de memorie electronice, inclusiv un dispozitiv de control și un cip (FLASH / DRAM). Specificațiile interfeței, funcția și metoda de utilizare sunt aceleași ca HDD, dimensiunea și forma sunt aceleași.

Specificații pentru hard disk:

  • Capacitate

În modern hard diskx capacitatea se măsoară în gigaocteți sau terabiți. Pentru HDD, această valoare este un multiplu al capacității unuia disc magnetic în interiorul cutiei, înmulțit cu numărul de magnetice, dintre care există de obicei mai multe.

  • Viteza de rotație (numai pentru HDD)

Viteza de rotație a discurilor magnetice din interiorul unității, măsurată în RPM (Rotation Per Minute), este de obicei 5400 RPM sau 7200 RPM. HDD-urile cu interfețe SCSI / SAS au o viteză de rotație de 10.000-15.000 RPM.

  • Timp mediu de acces \u003dTimp mediu de căutare + Timp mediu de așteptare, adică timpul pentru preluarea informațiilor de pe disc.
  • Rată de transmisie

Aceasta este viteza de citire și scriere a datelor pe un hard disk, măsurată în megaocteți pe secundă (MB / S). De obicei, diferă între ele prin mărime.

  • IOPS (intrare / ieșire pe secundă)

Operații de intrare / ieșire pe secundă, unul dintre principalii indicatori pentru măsurarea performanței discului. Pentru aplicațiile cu operații frecvente de citire și scriere, cum ar fi OLTP (Online Transaction Processing), IOPS este cel mai important indicator deoarece performanța aplicației comerciale depinde de aceasta. Un alt indicator important este transferul de date, care poate fi tradus aproximativ ca „transfer de date”, adică cât de multe date pot fi transferate pe unitate de timp.

RAID

Indiferent cât de fiabile sunt hard disk-urile, uneori datele se pierd în ele, din diverse motive. Prin urmare, tehnologia a fost propusă RAID (Redundant Array of Independent Disks) - o serie de discuri independente cu stocare de date redundantă. Redundanță înseamnă că toți octeții de date atunci când sunt scrise pe un disc sunt duplicate pe alt disc și pot fi utilizate în cazul în care primul disc eșuează. Mai mult, această tehnologie ajută la creșterea IOPS.

Conceptele de bază ale RAID sunt eliminarea (așa-numita „striping” sau separare) și oglindirea (așa-numita „oglindire” sau duplicare) a datelor. Combinațiile lor definesc diferite tipuri de matrice RAID pe hard disk.

Există următoarele niveluri de matrice RAID:

Combinațiile de aceste tipuri dau naștere la mai multe tipuri noi de RAID:

Următoarea figură explică modul în care este realizat RAID 0 (striping):


Figura: 6. RAID 0.

Și așa se realizează RAID 1 (duplicare):


Figura: 7. RAID 1.

Așa funcționează RAID 3. XOR este o funcție EXclusivă SAU logică. Calculează valoarea parității pentru blocurile de date A, B, C, D ..., care este scrisă pe un disc separat.


Figura: 8. RAID 3.

Diagramele de mai sus ilustrează bine principiul funcționării RAID și nu necesită comentarii. Nu vom arăta diagramele celorlalte niveluri RAID, cei care doresc le pot găsi pe Internet.

Principalele caracteristici ale tipurilor RAID sunt prezentate în tabel.

Software de stocare

Software-ul de stocare poate fi clasificat după cum urmează:

  1. Management și administrare (Management): gestionarea și setarea parametrilor infrastructurii: ventilație, răcire, moduri de funcționare a discului etc., controlul orei din zi etc.
  2. Protejarea datelor: Instantaneu, copiere de conținut LUN, oglindă divizată, replicare la distanță, CDP (Continuous Data Protection) etc.
  3. Fiabilitate sporită:diverse programe pentru copierea multiplă și copierea de rezervă a rutelor de transmisie a datelor în cadrul centrului de date și între acestea.
  4. Îmbunătățirea eficienței: Aprovizionare subțire, stocare automată pe niveluri, deduplicare, gestionare QoS, preluare cache, partiționare, migrare automată a datelor , reducând viteza de rotație a discului (rotirea discului în jos)

Tehnologia este foarte interesantă „ aprovizionare slaba". Așa cum se întâmplă adesea în IT, termenii sunt adesea dificil de tradus în mod adecvat în limba rusă, de exemplu, este dificil de tradus cu exactitate cuvântul „aprovizionare” („furnizare”, „suport”, „furnizare” - niciunul dintre acești termeni nu transmite sensul complet). Și când este „subțire” ...

De exemplu, un împrumut bancar funcționează pe principiul „provizionării subțiri”. Când o bancă emite zece mii de împrumuturi cu o limită de 500 de mii, nu trebuie să aibă 5 miliarde în cont, deoarece utilizatorii de carduri nu cheltuiesc de obicei întregul împrumut simultan. Cu toate acestea, fiecare utilizator poate utiliza în mod individual întreaga sau aproape întreaga sumă a împrumutului, dacă suma totală a fondurilor băncii nu este epuizată.

Companiile de instalații sanitare și electrice fac același lucru. Furnizând servicii de apă sau electricitate, se așteaptă ca toți locuitorii să nu deschidă toate robinetele simultan sau să aprindă toate aparatele electrice din casele lor. Datorită consumului mai flexibil de resurse, este posibil să economisiți prețul și capacitatea resurselor acestora.


Figura: nouă. Aprovizionare slaba.

Astfel, utilizarea provizionării subțiri vă permite să rezolvați problema alocării ineficiente a spațiului în SAN, să economisiți spațiu, să simplificați procedurile administrative pentru alocarea spațiului aplicațiilor de pe stocare și să utilizați așa-numita suprasubscriere, adică să alocați mai mult spațiu aplicațiilor decât avem fizic, contând pe că aplicațiile nu vor revendica tot spațiul în același timp. Pe măsură ce nevoia apare mai târziu, este posibilă creșterea capacității fizice de stocare.

Stocarea pe nivele presupune că diferite date sunt stocate în dispozitivele de stocare care răspund la cât de des sunt accesate aceste date. De exemplu, datele utilizate frecvent pot fi plasate în „stocare online” la unități SSD cu viteză mare de acces, performanță ridicată. Cu toate acestea, prețul unor astfel de discuri este încă ridicat, deci este recomandabil să le folosiți doar pentru stocarea online (deocamdată).

Unitățile FC / SAS sunt, de asemenea, rapide și la un preț rezonabil. Prin urmare, astfel de discuri sunt potrivite pentru „stocarea aproape de linie”, unde sunt stocate date, accesul la care are loc nu atât de des, dar în același timp și nu atât de rar.

În cele din urmă, unitățile SATA / NL-SAS au o viteză de acces relativ lentă, dar au o capacitate mare și relativ ieftine. Prin urmare, stocarea offline se face de obicei pe ele, pentru date de utilizare rară.

De îndată ce sistemul de control observă că accesul la date în spațiul de stocare offline a devenit mai frecvent, acesta le transferă către stocarea aproape de linie și cu activarea în continuare a utilizării lor - la stocarea online ”pe discurile SSD.

Deduplicarea (eliminarea duplicării) datelor (deduplicare, DEDUP): După cum sugerează și numele, elimină duplicarea datelor în spațiul pe disc utilizat în mod obișnuit în backupurile de date. Deși sistemul nu poate determina ce informații sunt redundante, poate detecta prezența datelor duplicate. Acest lucru face posibilă reducerea semnificativă a cerințelor de capacitate ale sistemului de rezervare.

Reducerea vitezei de rotație a discului (rotirea discului) - ceea ce se numește de obicei „hibernare” (adormirea) discului. Datele de pe unele discuri nu pot fi folosite mult timp, în acest caz, tehnologia de reducere a vitezei discului le pune în modul de hibernare pentru a reduce consumul de energie pentru rotația inutilă a discului la viteza normală. Aceasta crește, de asemenea, durata de viață a discului și crește fiabilitatea sistemului în ansamblu. Când sosește prima cerere de date pe acest disc, „se trezește”, viteza de rotație crește. Prețul de plătit pentru economiile de energie și fiabilitatea sporită este o anumită latență atunci când datele sunt accesate pentru prima dată pe disc, dar costul este justificat.

Instantaneu de disc (Instantaneu). Un instantaneu este o copie complet utilizabilă a unui anumit set de date de pe disc în momentul în care a fost făcută copia (de aceea se numește „instantaneu”). O astfel de copie este utilizată pentru a restabili parțial starea sistemului în momentul copierii. În același timp, continuitatea sistemului nu este afectată deloc, iar performanța nu se deteriorează.

Replicare la distanță: Funcționează folosind tehnologia de oglindire. Poate menține mai multe copii ale datelor pe două sau mai multe site-uri pentru a preveni pierderea datelor în caz de dezastre naturale. Există două tipuri de replicare: sincronă și asincronă, diferența dintre ele este explicată în figură.


Figura: 10. Replicarea la distanță a datelor (Replicare la distanță).

CDP de protecție continuă a datelor (Continuous protejarea datelor) , cunoscută și sub numele de backup continuu sau backup în timp real, este crearea de rezervă automat la fiecare modificare a datelor. În același timp, devine posibilă restaurarea datelor în caz de dezastre în orice moment și este disponibilă o copie actualizată a datelor, și nu a celor care au fost acum câteva minute sau ore.

Software de management:aceasta include diverse software pentru gestionarea și administrarea diferitelor dispozitive: programe simple configurație (asistenți de cofigurare), programe de monitorizare centralizate: mapare topologică, mecanisme de monitorizare în timp real pentru generarea rapoartelor de defecțiuni. De asemenea, include programe de garantare a afacerii: statistici de performanță multidimensionale, rapoarte de performanță și interogări și multe altele.

Recuperare după dezastru (DR)... Aceasta este o componentă destul de importantă a sistemelor de depozitare industriale serioase, deși destul de costisitoare. Dar aceste costuri trebuie suportate pentru a nu pierde peste noapte „ceea ce a fost dobândit prin spargerea muncii înapoi” și acolo unde s-au investit deja fonduri semnificative. Sistemele de protecție a datelor de mai sus (Instantaneu, replicare la distanță, CDP) sunt bune atâta timp cât nu există un dezastru natural în așezarea în care se află sistemul de stocare: tsunami, inundații, cutremur sau (pah-pah-pah) - nuclear război. Și orice război poate, de asemenea, să strice foarte mult viața oamenilor care se angajează în lucruri utile, de exemplu, stocarea datelor și nu alergarea cu o mitralieră pentru a tăia teritoriile altor oameni sau a pedepsi unii „necredincioși”. Replicarea de la distanță presupune că sistemul de stocare a replicării este situat în același oraș sau cel puțin în apropiere. Asta, de exemplu, nu ajută la un tsunami.

Tehnologia de recuperare a dezastrelor presupune că centrul de rezervă utilizat pentru recuperarea datelor în caz de dezastre naturale este situat la o distanță considerabilă de centrul de date principal și interacționează cu acesta printr-o rețea de transmisie de date suprapusă unei rețele de transport, cel mai adesea una optică. Cu un astfel de aranjament al centrelor de date principale și de rezervă, de exemplu, va fi pur și simplu imposibil de utilizat tehnologia CDP.

Tehnologia DR utilizează trei concepte fundamentale:

  • BW (fereastră de rezervă) - „fereastră de rezervare”, timpul necesar sistemului de rezervare pentru a copia volumul de date primite al sistemului de lucru.
  • RPO (obiectivul punctului de recuperare) - „Punct de recuperare valid”, perioada maximă de timp și cantitatea corespunzătoare de date care poate fi pierdută pentru utilizatorul de stocare.
  • RTO (obiectiv de recuperare a timpului) - „timpul acceptabil de indisponibilitate”, timpul maxim în care sistemul de stocare poate fi indisponibil, fără impact critic asupra activității de bază.


Figura: 11. Trei concepte fundamentale ale tehnologiei DR.

Acest eseu nu pretinde a fi complet și explică doar principiile de bază ale sistemului de stocare, deși este departe de a fi complet. Diverse surse de pe Internet conțin numeroase documente care descriu mai detaliat toate punctele prezentate aici (și care nu sunt prezentate).


Ce sunt sistemele de stocare a datelor (DSS) și la ce servesc? Care este diferența dintre iSCSI și FiberChannel? De ce această expresie a devenit cunoscută doar în ultimii ani unei game largi de specialiști IT și de ce problemele sistemelor de stocare a datelor îngrijorează mințile din ce în ce mai atent?

Cred că mulți au observat tendințele de dezvoltare din lumea computerelor din jurul nostru - trecerea de la un model extins de dezvoltare la unul intensiv. Creșterea procesorului megahertz nu mai dă un rezultat vizibil, iar dezvoltarea unităților de stocare nu ține pasul cu cantitatea de informații. Dacă în cazul procesoarelor totul este mai mult sau mai puțin clar - este suficient să asamblați sisteme multiprocesor și / sau să folosiți mai multe nuclee într-un singur procesor, atunci în cazul problemelor de stocare și procesare a informațiilor, nu este atât de ușor să scăpați de probleme. Panaceul actual pentru epidemia informațională este stocarea. Numele înseamnă rețea de stocare sau sistem de stocare a datelor. În orice caz, acesta este sp

Principalele probleme rezolvate prin stocare

Deci, ce sarcini este proiectat să rezolve sistemul de stocare? Să ne uităm la problemele tipice asociate cu volumul tot mai mare de informații din orice organizație. Să presupunem că acestea sunt cel puțin câteva zeci de computere și mai multe birouri dispersate geografic.

1. Descentralizarea informațiilor - dacă mai devreme toate datele puteau fi stocate literalmente pe un singur hard disk, acum orice sistem funcțional necesită o stocare separată - de exemplu, servere de e-mail, SGBD, domeniu și așa mai departe. Situația devine mai complicată în cazul birourilor distribuite (sucursale).

2. Creșterea informațiilor avalanșă - adesea numărul de discuri pe care le puteți instala pe un anumit server nu poate acoperi capacitatea cerută de sistem. Prin urmare:
Incapacitatea de a proteja pe deplin datele stocate este într-adevăr, deoarece este destul de dificil chiar să faci backup unor date care nu sunt doar pe servere diferite, ci și dispersate geografic.
Viteza insuficientă de procesare a informațiilor - canalele de comunicație între site-urile la distanță lasă încă de dorit, dar chiar și cu un canal suficient de „gros”, nu este întotdeauna posibilă utilizarea pe deplin a rețelelor existente, de exemplu, IP, pentru muncă.
Complexitatea copierii de rezervă - dacă datele sunt citite și scrise în blocuri mici, atunci poate fi nerealist să arhivați complet informațiile de pe un server la distanță prin canalele existente - trebuie transferată întreaga cantitate de date. Arhivarea la fața locului este adesea impracticabilă din punct de vedere financiar - sunt necesare sisteme de rezervă (unități de bandă, de exemplu), software dedicat (care poate costa mulți bani), personal calificat și calificat.

3. Este dificil sau imposibil să se prevadă volumul necesar spațiu pe disc în timpul implementării sistem informatic... Prin urmare:
Există probleme cu extinderea capacităților discurilor - este destul de dificil să obțineți capacități de ordinul terabyților în server, mai ales dacă sistemul rulează deja pe discurile existente de mică capacitate - cel puțin o închidere a sistemului și sunt necesare investiții financiare ineficiente.
Utilizarea ineficientă a resurselor - uneori nu puteți ghici în ce server vor crește mai repede datele. Un server de e-mail poate avea o cantitate foarte mică de spațiu pe disc liber, în timp ce un alt departament va utiliza doar 20% din volumul unui subsistem de disc scump (de exemplu, SCSI).

4. Grad scăzut de confidențialitate a datelor distribuite - este imposibil să controlați și să restricționați accesul în conformitate cu politica de securitate a întreprinderii. Acest lucru se aplică atât accesului la date prin canalele existente (rețeaua locală), cât și accesului fizic la mass-media - de exemplu, furtul unităților de hard disk, distrugerea acestora (pentru a complica afacerea organizației) nu sunt excluse. Acțiunile necalificate de către utilizatori și personalul de întreținere pot provoca și mai mult rău. Atunci când o companie din fiecare birou este forțată să rezolve probleme minore de securitate locală, acest lucru nu dă rezultatul dorit.

5. Complexitatea gestionării fluxurilor de informații distribuite - orice acțiune care vizează schimbarea datelor din fiecare ramură care conține o parte a datelor distribuite creează anumite probleme, variind de la complexitatea sincronizării diferitelor baze de date, versiuni ale fișierelor dezvoltatorilor și încheierea cu duplicarea inutilă a informațiilor.

6. Efect economic scăzut al implementării soluțiilor „clasice” - odată cu creșterea rețelei de informații, cantități mari de date și o structură din ce în ce mai distribuită a întreprinderii, investițiile financiare nu sunt atât de eficiente și adesea nu pot rezolva problemele care apar.

7. Costuri ridicate ale resurselor utilizate pentru menținerea stării de sănătate a întregului sistem informațional al întreprinderii - de la necesitatea menținerii unui personal mare de personal calificat și terminând cu numeroase soluții hardware scumpe care sunt concepute pentru a rezolva problema volumelor și a vitezei de acces la informație, împreună cu fiabilitatea stocării și protecția împotriva defecțiunilor.

Având în vedere problemele de mai sus, care mai devreme sau mai târziu, total sau parțial, depășesc orice companie în dezvoltare dinamică, vom încerca să schițăm sistemele de stocare a datelor - așa cum ar trebui. Să luăm în considerare schemele tipice de conectare și tipurile de sisteme de stocare a datelor.

Megaocteți / Tranzacții?

Dacă hard disk-urile anterioare erau în interiorul unui computer (server), acum acestea sunt înghesuite și nu prea fiabile acolo. Cea mai simplă soluție (dezvoltată cu mult timp în urmă și utilizată peste tot) este tehnologia RAID.

imagini \\ RAID \\ 01.jpg

Atunci când organizăm RAID în orice sistem de stocare a datelor, pe lângă protejarea informațiilor, obținem mai multe avantaje incontestabile, dintre care unul este viteza de acces la informații.

Din punct de vedere al utilizatorului sau al software-ului, viteza este determinată nu numai de fluxul de sistem (MB / s), ci și de numărul de tranzacții - adică de numărul de operațiuni de intrare-ieșire pe unitate de timp (IOPS). Creșterea IOPS este facilitată, ceea ce este destul de logic, de un număr mai mare de discuri și de acele tehnici de îmbunătățire a performanței pe care le oferă un controler RAID (de exemplu, cache).

Dacă lățimea de bandă generală este mai importantă pentru vizionarea de videoclipuri în flux sau organizarea unui server de fișiere, atunci pentru un SGBD, orice aplicație OLTP (procesare tranzacții online), este esențial numărul de tranzacții pe care sistemul este capabil să le proceseze. Și cu acest parametru, hard disk-urile moderne nu sunt la fel de roz ca și cu volumele în creștere și, parțial, cu viteza. Toate aceste probleme sunt concepute pentru a rezolva sistemul de stocare în sine.

Niveluri de protecție

Trebuie să înțelegeți că în centrul tuturor sistemelor de stocare a datelor se află practica protejării informațiilor bazate pe tehnologia RAID - fără aceasta, orice sistem de stocare avansat din punct de vedere tehnic va fi inutil, deoarece hard disk-urile din acest sistem sunt cea mai nesigură componentă. Organizarea discurilor în RAID este „veriga de jos”, primul eșalon de protecție a informațiilor și creșterea vitezei de procesare.

Cu toate acestea, pe lângă schemele RAID, există și o protecție a datelor de nivel inferior implementată „pe partea de sus” a tehnologiilor și soluțiilor implementate chiar pe hard disk de către producătorul său. De exemplu, unul dintre principalii furnizori de stocare, EMC, are o metodologie pentru analiza suplimentară a integrității datelor la nivelul sectorului de unitate.

După ce ne-am ocupat de RAID, să trecem la structura sistemelor de stocare. În primul rând, sistemele de stocare sunt împărțite în funcție de tipul de interfețe de conexiune gazdă (server) utilizate. Interfețele de conexiune externă sunt în principal SCSI sau FibreChannel, precum și standardul iSCSI destul de tânăr. De asemenea, nu reduceți stocurile inteligente mici care pot fi chiar conectate prin USB sau FireWire. Nu vom considera interfețe mai rare (uneori pur și simplu nereușite într-un fel sau altul), cum ar fi SSA de la IBM sau interfețe dezvoltate pentru mainframe - de exemplu, FICON / ESCON. Depozitele NAS conectate la rețeaua Ethernet se separă. Cuvântul „interfață” înseamnă practic un conector extern, dar nu uitați că conectorul nu definește protocolul de comunicație al celor două dispozitive. Vom analiza mai jos aceste caracteristici.

imagini \\ RAID \\ 02.gif

Acesta înseamnă Small Computer System Interface (citiți „povești”) - interfață paralelă semi-duplex. În sistemele moderne de stocare, acesta este reprezentat cel mai adesea de conectorul SCSI:

images \\ RAID \\ 03.gif

images \\ RAID \\ 04.gif

Și un grup de protocoale SCSI, și mai precis - SCSI-3 Parallel Interface. Diferența dintre SCSI și IDE-ul familiar este numărul mai mare de dispozitive pe canal, lungimea mai mare a cablului, rata de transfer de date mai mare, precum și caracteristicile „exclusive”, cum ar fi semnalizarea diferențială de înaltă tensiune, coada de comandă și altele - nu vom intra în această problemă.
Dacă vorbim despre principalii producători de componente SCSI, de exemplu, adaptoare SCSI, controlere RAID cu interfață SCSI, atunci orice specialist își va aminti imediat două nume - Adaptec și LSI Logic. Cred că acest lucru este suficient, nu au existat revoluții pe această piață de mult timp și, probabil, nu sunt de așteptat.

Interfața FibreChannel

Interfață serial full duplex. Cel mai adesea în echipamentele moderne este reprezentat de conectori optici externi de tip LC sau SC (LC este mai mic):

imagini \\ RAID \\ 05.jpg

imagini \\ RAID \\ 06.jpg

... și protocoalele FibreChannel (FCP). Există mai multe scheme de comutare pentru dispozitivele FibreChannel:

Punct la punct - conexiune directă de la un punct la altul a dispozitivelor între ele:

imagini \\ RAID \\ 07.gif

Crosspoint comutat - conectarea dispozitivelor la un switch FibreChannel (similar cu implementarea unei rețele Ethernet pe switch-uri):

imagini \\ RAID \\ 08.gif

Buclă arbitrată - FC-AL, buclă cu acces de arbitraj - toate dispozitivele sunt conectate între ele într-un ring, schema este oarecum similară cu Token Ring. Se poate utiliza și un comutator - atunci topologia fizică va fi implementată conform schemei „stea”, iar cea logică - conform schemei „buclă” (sau „inel”):

imagini \\ RAID \\ 09.gif

Conexiunea FibreChannel Switched este cea mai comună schemă, în ceea ce privește FibreChannel, o astfel de conexiune se numește Fabric - în limba rusă există o copie a acesteia - „fabrică”. Trebuie remarcat faptul că comutatoarele FibreChannel sunt dispozitive destul de avansate, în ceea ce privește complexitatea umplerii, aproape de comutatoarele de nivel IP 3. Dacă comutatoarele sunt interconectate, atunci acestea funcționează într-o singură țesătură, având un grup de setări care sunt eficiente pentru întreaga țesătură simultan. Schimbarea unor opțiuni pe unul dintre comutatoare poate duce la comutarea completă a întregii fabrici, fără a menționa setările de autorizare a accesului, de exemplu. Pe de altă parte, există modele SAN care implică mai multe țesături într-un singur SAN. Astfel, doar un grup de comutatoare interconectate poate fi numit fabrică - două sau mai multe dispozitive neconectate introduse în SAN pentru a îmbunătăți toleranța la erori formează două sau mai multe fabrici diferite.

Componentele care permit ca gazdele și sistemele de stocare să fie combinate într-o singură rețea sunt denumite în mod obișnuit „conectivitate”. Conectivitatea este, desigur, cabluri de conectare duplex (de obicei cu o interfață LC), switch-uri și adaptoare FiberChannel (HBA, Host Base Adapters) - adică acele plăci de expansiune care, atunci când sunt instalate în gazde, vă permit să conectați o gazdă la o rețea SAN. HBA-urile sunt de obicei implementate ca carduri PCI-X sau PCI-Express.

imagini \\ RAID \\ 10.jpg

Nu confundați fibra și fibra - mediul de propagare a semnalului poate fi diferit. FibreChannel poate funcționa pe cupru. De exemplu, toate unitățile de disc FibreChannel au contacte metalice, iar comutarea obișnuită a dispozitivelor pe „cupru” nu este neobișnuită, doar treptat toată lumea trece la canale optice ca fiind cea mai promițătoare tehnologie și un înlocuitor funcțional pentru „cupru”.

Interfață ISCSI

De obicei, este reprezentat de un conector RJ-45 extern pentru conectarea la o rețea Ethernet și de protocolul iSCSI (Internet Small Computer System Interface). După cum este definit de SNIA: "iSCSI este un protocol bazat pe TCP / IP conceput pentru a comunica și gestiona sistemele de stocare, serverele și clienții." Să ne oprim asupra acestei interfețe mai puțin detaliată, doar datorită faptului că fiecare utilizator este capabil să utilizeze iSCSI chiar și într-o rețea normală „acasă”.

Rețineți că iSCSI definește, cel puțin, un protocol de transport pentru SCSI care rulează pe partea de sus a TCP și o tehnologie pentru încapsularea comenzilor SCSI într-o rețea bazată pe IP. Pur și simplu, iSCSI este un protocol care permite accesul la nivel de bloc la date folosind comenzi SCSI trimise printr-o rețea cu un teanc TCP / IP. iSCSI a apărut ca un înlocuitor pentru FibreChannel și în sistemele moderne de stocare are mai multe avantaje față de acesta - capacitatea de a combina dispozitive pe distanțe uriașe (folosind rețele IP existente), capacitatea de a oferi un anumit nivel de QoS (Calitatea serviciului, calitatea serviciului), costul de conectivitate mai mic. Cu toate acestea, principala problemă a utilizării iSCSI ca înlocuitor pentru FibreChannel este timpul de latență ridicat care apare în rețea datorită particularităților implementării stivei TCP / IP, care neagă unul dintre avantajele importante ale utilizării sistemelor de stocare - viteza de acces la informații și latența scăzută. Acesta este un dezavantaj grav.

O mică notă despre gazde - acestea pot fi utilizate ca plăcile de rețea obișnuite (atunci se va face manipularea stivei iSCSI și încapsularea comenzilor prin software) și carduri specializate care acceptă tehnologii similare cu TOE (TCP / IP Offload Engines). Această tehnologie asigură procesarea hardware a porțiunii corespunzătoare a stivei de protocol iSCSI. Metoda programului mai ieftin, dar încarcă mai mult procesorul central al serverului și, teoretic, poate duce la latențe mai mari decât un procesor hardware. Cu viteza Ethernet actuală de 1 Gbps, se poate presupune că iSCSI va funcționa exact de două ori mai lent decât FibreChannel la 2 Gbps, dar în utilizarea reală diferența va fi și mai vizibilă.

Pe lângă cele deja discutate, vom menționa pe scurt câteva protocoale care sunt mai rare și sunt concepute pentru a oferi servicii suplimentare rețelelor de stocare existente (SAN-uri):

FCIP (Fibre Channel over IP) Este un protocol de tunelare construit pe TCP / IP și conceput pentru a conecta rețele SAN dispersate geografic într-un mediu IP standard. De exemplu, puteți combina două SAN-uri într-unul pe Internet. Acest lucru se realizează utilizând un gateway FCIP care este transparent pentru toate dispozitivele de pe SAN.
iFCP (Internet Fibre Channel Protocol) - un protocol care permite combinarea dispozitivelor cu interfețe FC prin rețele IP. O diferență importantă față de FCIP este că este posibilă combinarea exactă a dispozitivelor FC printr-o rețea IP, ceea ce permite diferitelor perechi de conexiuni să aibă un nivel QoS diferit, ceea ce este imposibil la tunelarea prin FCIP.

Am acoperit pe scurt interfețele fizice, protocoalele și tipurile de comutare pentru sistemele de stocare, fără a ne opri să listăm toate opțiunile posibile. Acum să încercăm să ne imaginăm ce parametri caracterizează sistemele de stocare a datelor?

Parametrii hardware de bază ai stocării

Unele dintre ele au fost enumerate mai sus - acestea sunt tipul de interfețe de conexiune externă și tipurile de unități interne (hard disk-uri). Următorul parametru, care are sens să fie luat în considerare după cei doi de mai sus, atunci când alegeți sistem de disc stocare, - fiabilitatea sa. Fiabilitatea poate fi evaluată nu prin banalul MTBF al unor componente individuale (faptul că acest timp este aproximativ același pentru toți producătorii), ci prin arhitectura internă. Un sistem de stocare „obișnuit” este adesea „extern” un raft de disc (pentru montare într-un dulap de 19 inci) cu hard disk-uri, interfețe externe pentru conectarea gazdelor și mai multe surse de alimentare. În interior, tot ceea ce asigură sistemul de stocare este de obicei instalat - unități de procesor, controlere de disc, porturi I / O, memorie cache și așa mai departe. De obicei, raftul este controlat de la linie de comanda sau interfață web, configurarea inițială necesită adesea o conexiune serială. Utilizatorul poate „împărți” discurile disponibile în sistem în grupuri și le poate combina în RAID (de diferite niveluri), spațiul pe disc rezultat este împărțit în unul sau mai multe blocuri logice (LUN), la care gazdele (serverele) au acces și le „pot vedea” ca hard disk-uri locale. Numărul de grupuri RAID, LUN-uri, logica cache-ului, disponibilitatea LUN-urilor pentru anumite servere și orice altceva este configurat de administratorul de sistem. De obicei, sistemele de stocare sunt concepute pentru a conecta nu unul, ci mai multe (până la sute, teoretic) la ele - prin urmare, un astfel de sistem trebuie să aibă performanțe ridicate, un sistem flexibil de gestionare și monitorizare și instrumente bine gândite de protecție a datelor. Protecția datelor este asigurată în mai multe moduri, dintre care cel mai simplu știți deja - combinarea discurilor în RAID. Cu toate acestea, datele trebuie să fie disponibile în mod constant - la urma urmei, oprirea unui sistem de stocare a datelor, central pentru întreprindere, poate provoca pierderi semnificative. Decât mai multe sisteme stochează date pe sistemul de stocare, trebuie asigurat accesul mai fiabil la sistem - deoarece în cazul unei defecțiuni a sistemului de stocare, activitatea tuturor serverelor care stochează date acolo se oprește simultan. Disponibilitatea ridicată a rack-ului este asigurată de redundanța internă completă a tuturor componentelor sistemului - căi de acces la rack (porturi FibreChannel), module procesor, memorie cache, surse de alimentare etc. Să încercăm să explicăm principiul redundanței 100% (duplicare) cu următoarea figură:

imagini \\ RAID \\ 11.gif

1. Sistem de stocare controler (modul procesor), inclusiv:
* procesor central (sau procesoare) - de obicei sistemul rulează software special care acționează ca un „sistem de operare”;
* interfețe pentru comutarea cu hard disk - în cazul nostru, acestea sunt carduri care asigură conectarea unităților FibreChannel conform schemei loopback cu acces de arbitraj (FC-AL);
* memorie cache;
* Controlere de port externe FibreChannel
2. Interfață FC externă; după cum putem vedea, există 2 dintre ele pentru fiecare modul de procesor;
3. Hard disk-uri - capacitatea este extinsă cu rafturi de disc suplimentare;
4. Memoria cache dintr-o astfel de schemă este de obicei oglindită pentru a nu pierde datele stocate acolo atunci când orice modul eșuează.

În ceea ce privește partea hardware, rack-urile de discuri pot avea interfețe diferite pentru conectarea gazdelor, interfețe diferite pentru hard disk-uri, scheme diferite pentru conectarea rafturilor suplimentare care servesc la creșterea numărului de discuri din sistem, precum și alți „parametri de fier” pur.

Software de stocare

Bineînțeles, puterea hardware a sistemelor de stocare trebuie cumva gestionată, iar sistemele de stocare în sine sunt pur și simplu necesare pentru a oferi un nivel de serviciu și funcționalitate care nu este disponibil în schemele convenționale server-client. Dacă ne uităm la figura „Diagrama structurală a sistemului de stocare”, devine clar că atunci când serverul este conectat direct la rack în două moduri, acestea trebuie conectate la porturile FC ale diferitelor module de procesor pentru ca serverul să continue să funcționeze chiar dacă întregul modul de procesor eșuează. Bineînțeles, pentru a utiliza multipathing, această funcționalitate trebuie să fie susținută de hardware și software la toate nivelurile implicate în transferul de date. Desigur, redundanța completă fără instrumente de monitorizare și alertare nu are sens - motiv pentru care toate sistemele de stocare serioase au această capacitate. De exemplu, notificarea oricărui eveniment critic poate avea loc prin diferite mijloace - aceasta este o notificare prin e-mail, un apel automat de modem către un centru de asistență tehnică, un mesaj de pager (acum mai relevant decât SMS), mecanisme SNMP etc.

Ei bine, așa cum am menționat deja, există controale puternice pentru toată această splendoare. De obicei, aceasta este o interfață web, o consolă, capacitatea de a scrie scripturi și de a încorpora controlul în pachete software externe. Despre mecanismele care oferă productivitate ridicată Stocare, vom menționa doar pe scurt - arhitectură non-blocantă cu mai multe autobuze interne și un număr mare de hard disk-uri, puternice unități centrale de procesare, un sistem de control specializat (OS), o cantitate mare de memorie cache, multe interfețe I / O externe.

Serviciile furnizate de sistemele de stocare sunt de obicei determinate de software-ul care rulează pe rack-ul propriu-zis. Aproape întotdeauna, acestea sunt pachete software complexe achiziționate sub licențe separate, care nu sunt incluse în costul sistemului de stocare în sine. Să menționăm imediat software-ul pentru multipathing cu care sunteți deja familiarizați - funcționează doar pe gazde, și nu pe rack în sine.

Următoarea soluție cea mai populară este software-ul pentru crearea copiilor instantanee și complete ale datelor. Diferiti producatori au denumiri diferite produse software și mecanismele de creare a acestor copii. Putem manipula cuvintele instantanee și clone pentru generalizare. Clona se face cu ajutorul unui rack de discuri din interiorul rackului - acesta este o copie internă completă a datelor. Domeniul de aplicare este destul de larg - de la o copie de rezervă până la crearea unei „versiuni de testare” a datelor inițiale, de exemplu, pentru actualizări riscante, în care nu există certitudine și care nu sunt sigure de utilizat pe datele reale. Oricine a urmărit îndeaproape toate farmecele sistemelor de stocare pe care le-am analizat aici se va întreba - de ce avem nevoie de o copie de siguranță a datelor în interiorul rackului, dacă are o fiabilitate atât de mare? Răspunsul la această întrebare este la suprafață - nimeni nu este imun la erorile umane. Datele sunt stocate în siguranță, dar dacă operatorul însuși a făcut ceva greșit, de exemplu, a șters tabelul necesar din baza de date, niciun truc hardware nu va salva acest lucru. Clonarea datelor se face de obicei la nivelul LUN. Funcționalitatea mai interesantă este oferită de mecanismul instantaneu. Într-o oarecare măsură, obținem toate deliciile unei copii interne complete a datelor (clonă), în timp ce nu preluăm 100% din volumul de date copiate în interiorul rackului, deoarece un astfel de volum nu este întotdeauna disponibil pentru noi. În esență, un instantaneu este un „instantaneu” instantaneu de date care nu ocupă timp și resurse de procesare de stocare.

Desigur, nu se poate omite menționarea software-ului de replicare a datelor, care este adesea numit oglindire. Este un mecanism de replicare (duplicare) sincronă sau asincronă a informațiilor de la un sistem de stocare la unul sau mai multe sisteme de stocare la distanță. Replicarea este posibilă pe diferite canale - de exemplu, rack-urile cu interfețe FibreChannel pot fi reproduse asincron, pe internet și pe distanțe mari, pe un alt sistem de stocare. O astfel de soluție asigură fiabilitatea stocării informațiilor și protecția împotriva dezastrelor.

În plus față de toate cele de mai sus, există un număr mare de alte mecanisme de manipulare a datelor software ...

DAS și NAS și SAN

După ce ne-am familiarizat cu sistemele de stocare a datelor în sine, cu principiile construcției lor, cu capacitățile pe care le oferă și cu protocoalele de funcționare, este timpul să încercăm să combinăm cunoștințele acumulate într-o schemă de lucru. Să încercăm să luăm în considerare tipurile de sisteme de stocare și topologia conexiunii lor într-o singură infrastructură de lucru.

Dispozitive DAS (Direct Attached Storage) - sisteme de stocare conectate direct la server. Aceasta include atât cele mai simple sisteme SCSI conectate la controlerul SCSI / RAID al serverului, cât și dispozitivele FibreChannel conectate direct la server, deși sunt proiectate pentru SAN-uri. În acest caz, topologia DAS este un SAN degenerat (rețea de stocare):

imagini \\ RAID \\ 12.gif

În această schemă, unul dintre servere are acces la datele stocate pe sistemul de stocare. Clienții accesează datele accesând acest server prin rețea. Adică, serverul are acces blocat la datele din sistemul de stocare, iar clienții folosesc deja accesul la fișiere - acest concept este foarte important de înțeles. Dezavantajele acestei topologii sunt evidente:
* Fiabilitate redusă - în caz de probleme de rețea sau de blocare a serverului, datele devin inaccesibile tuturor pentru o dată.
* Latență ridicată datorită procesării tuturor cererilor de către un singur server și transport utilizat (cel mai adesea - IP).
* Încărcare ridicată în rețea, definind deseori limitele de scalabilitate prin adăugarea de clienți.
* Administrare slabă - toată capacitatea este disponibilă pentru un singur server, ceea ce reduce flexibilitatea distribuției de date.
* Utilizare scăzută a resurselor - este dificil să se prevadă cantitatea necesară de date, unele dispozitive DAS dintr-o organizație pot avea capacitate excesivă (discuri), altele s-ar putea să nu aibă suficientă capacitate - redistribuirea este adesea imposibilă sau consumă mult timp.

Dispozitive NAS (Network Attached Storage) - dispozitive de stocare conectate direct la rețea. Spre deosebire de alte sisteme, NAS oferă acces la fișiere la date și nimic altceva. Dispozitivele NAS sunt o combinație între sistemul de stocare și serverul la care este conectat. În forma sa cea mai simplă, cea obișnuită server de rețeafurnizarea de partajări de fișiere este un dispozitiv NAS:

imagini \\ RAID \\ 13.gif

Toate dezavantajele acestei scheme sunt similare topologiei DAS, cu unele excepții. Dintre dezavantajele adăugate, menționăm costul crescut și adesea semnificativ - totuși, costul este proporțional cu funcționalitatea și aici există adesea „ceva de plătit”. Dispozitivele NAS pot fi cele mai simple „cutii” cu un port Ethernet și două hard disk-uri în RAID1, permițând accesul la fișiere folosind un singur protocol CIFS (Common Internet File System) la sisteme uriașe în care pot fi instalate sute de hard disk-uri și acces la fișiere furnizat de o duzină de servere dedicate din sistemul NAS. Numărul de porturi Ethernet externe poate ajunge la multe zeci, iar capacitatea de stocare poate fi de câteva sute de terabyți (de exemplu, EMC Celerra CNS). Astfel de modele pot ocoli multe dispozitive SAN midrange în ceea ce privește fiabilitatea și performanța. Interesant este faptul că dispozitivele NAS pot face parte dintr-o rețea SAN și nu au propriile unități, ci oferă doar acces la fișiere la datele aflate pe dispozitivele de stocare bloc. În acest caz, NAS își asumă funcția de server specializat puternic și dispozitivele de stocare SAN, adică obținem o topologie DAS compusă din componente NAS și SAN.

Dispozitivele NAS sunt foarte bune în medii eterogene în care accesul rapid la fișiere la date este necesar pentru mulți clienți în același timp. De asemenea, oferă o fiabilitate excelentă a stocării și o flexibilitate de gestionare a sistemului, împreună cu ușurința întreținerii. Nu ne vom opri asupra fiabilității - acest aspect al stocării este discutat mai sus. În ceea ce privește un mediu eterogen, accesul la fișiere dintr-un singur sistem NAS poate fi obținut prin TCP / IP, CIFS, NFS, FTP, TFTP și altele, inclusiv capacitatea NAS de a funcționa ca țintă iSCSI, ceea ce îi permite să funcționeze cu sisteme de operare diferite. instalat pe gazde. În ceea ce privește ușurința întreținerii și flexibilitatea gestionării, aceste capacități sunt furnizate de un sistem de operare specializat, care este dificil de dezactivat și nu trebuie întreținut, precum și simplitatea diferențierii drepturilor de acces la fișiere. De exemplu, este posibil să lucrați într-un mediu Windows Active Directory cu suport pentru funcționalitatea necesară - poate fi LDAP, autentificare Kerberos, DNS dinamic, ACL-uri, alocarea cotelor, obiectele politicii de grup și istoricul SID. Deoarece accesul este oferit fișierelor, iar numele acestora pot conține caractere limbi diferite, multe NAS oferă suport pentru codificări UTF-8, Unicode. Alegerea unui NAS ar trebui abordată chiar mai atent decât dispozitivele DAS, deoarece este posibil ca astfel de echipamente să nu accepte serviciile de care aveți nevoie, de exemplu, criptarea sistemelor de fișiere (EFS) de la Microsoft și IPSec. Apropo, se poate observa că NAS sunt mult mai puțin frecvente decât dispozitivele SAN, dar procentul de astfel de sisteme este în continuare constant, deși lent, în creștere - în principal din cauza deplasării DAS.

Dispozitive pentru conectare la SAN (Network Area Network) - dispozitive pentru conectarea la o rețea de stocare. O rețea de stocare (SAN) nu trebuie confundată cu o rețea locală - acestea sunt rețele diferite. Cel mai adesea, un SAN se bazează pe stiva de protocol FibreChannel și, în cel mai simplu caz, constă din sisteme de stocare, switch-uri și servere, unite prin canale de comunicații optice. În figură, vedem o infrastructură extrem de fiabilă în care serverele sunt conectate simultan la rețeaua locală (stânga) și la rețeaua zonei de stocare (dreapta):

imagini \\ RAID \\ 14.gif

După o privire destul de detaliată a dispozitivelor și a principiilor de funcționare a acestora, ne va fi destul de ușor să înțelegem topologia SAN. În figură, vedem un singur sistem de stocare pentru întreaga infrastructură, la care sunt conectate două servere. Serverele au căi de acces redundante - fiecare are două HBA (sau un port dual, ceea ce reduce toleranța la erori). Dispozitivul de stocare are 4 porturi care îl conectează la 2 comutatoare. Presupunând că există două module de procesor redundante în interior, este ușor de ghicit că cea mai bună schemă de conexiune este atunci când fiecare comutator este conectat atât la primul, cât și la al doilea modul de procesor. Această schemă oferă acces la orice date din sistemul de stocare în caz de eșec al oricărui modul de procesor, comutator sau cale de acces. Am studiat deja fiabilitatea sistemelor de stocare, a două comutatoare și a două fabrici crește și mai mult disponibilitatea topologiei, astfel încât, din cauza unei defecțiuni sau a unei erori de administrator, unul dintre blocurile de comutare eșuează brusc, al doilea va funcționa normal, deoarece aceste două dispozitive nu sunt interconectate.

Conexiunea de server afișată este denumită o conexiune de înaltă disponibilitate, deși pot fi instalate mai multe HBA-uri pe server, după cum este necesar. Din punct de vedere fizic, fiecare server are doar două conexiuni în SAN, cu toate acestea, în mod logic, sistemul de stocare este accesibil prin patru căi - fiecare HBA oferă acces la două puncte de conectare din sistemul de stocare, la fiecare modul de procesor separat (această caracteristică este asigurată de conexiunea dublă a comutatorului la sistemul de stocare). În această diagramă, cel mai nesigur dispozitiv este serverul. Două comutatoare oferă o fiabilitate de aproximativ 99,99%, dar serverul poate eșua din diferite motive. Dacă este necesară o funcționare extrem de fiabilă a întregului sistem, serverele sunt combinate într-un cluster, schema dată nu necesită hardware suplimentar pentru a organiza o astfel de muncă și este considerată o schemă de referință pentru organizarea unui SAN. Cel mai simplu caz sunt serverele conectate într-un singur mod printr-un singur comutator la sistemul de stocare. Cu toate acestea, sistemul de stocare, dacă există două module de procesor, trebuie să fie conectat la comutator cu cel puțin un canal pe modul - porturile rămase pot fi utilizate pentru a conecta direct servere la sistemul de stocare, ceea ce este uneori necesar. Și nu uitați că este posibil să construiți un SAN nu numai pe baza FibreChannel, ci și pe baza protocolului iSCSI - în acest caz, puteți utiliza numai dispozitive ethernet standard pentru comutare, ceea ce face sistemul mai ieftin, dar are o serie de dezavantaje suplimentare (specificate în secțiunea despre iSCSI ). De asemenea, este interesantă posibilitatea de a porni servere din sistemul de stocare - nici măcar nu este necesar să aveți hard disk-uri interne în server. Astfel, sarcina de stocare a oricăror date este complet eliminată de pe servere. În teorie, un server specializat poate fi transformat într-un concasor obișnuit fără nicio unitate, ale cărei blocuri determinante sunt procesoare centrale, memorie, precum și interfețe pentru interacțiunea cu lumea exterioară, de exemplu, porturile Ethernet și FibreChannel. Un fel de astfel de dispozitive sunt servere blade moderne.

Aș dori să observ că dispozitivele care pot fi conectate la un SAN nu se limitează doar la sistemele de stocare pe disc - acestea pot fi biblioteci de discuri, biblioteci de benzi (streamere), dispozitive pentru stocarea datelor pe discuri optice (CD / DVD și altele) și multe altele.
Dintre minusurile SAN, observăm doar costul ridicat al componentelor sale, dar plusurile sunt incontestabile:
* Fiabilitate ridicată a accesului la date localizate pe sisteme de stocare externe. Independența topologiei SAN față de sistemele și serverele de stocare utilizate.
* Stocare centralizată a datelor (fiabilitate, securitate).
* Management centralizat convenabil al comutării și al datelor.
* Descărcați trafic I / O intens către o rețea separată, descărcați LAN.
* Performanță ridicată și latență scăzută.
* Scalabilitate și flexibilitate a structurii logice SAN
* Din punct de vedere geografic, dimensiunea unui SAN, spre deosebire de clasicul DAS, este practic nelimitată.
* Capacitatea de a distribui rapid resursele între servere.
* Posibilitatea de a construi soluții de cluster tolerante la erori fără costuri suplimentare bazate pe SAN existent.
* Circuit simplu backup - toate datele sunt într-un singur loc.
* Disponibilitate oportunități suplimentare și servicii (instantanee, replicare la distanță).
* Grad ridicat de securitate SAN.

In cele din urma
Cred că am acoperit destul de complet principala gamă de probleme legate de sistemele moderne de stocare. Să sperăm că astfel de dispozitive vor evolua și mai rapid din punct de vedere funcțional, iar numărul mecanismelor de gestionare a datelor va crește doar.

În concluzie, putem spune că soluțiile NAS și SAN se confruntă în prezent cu un adevărat boom. Numărul producătorilor și varietatea soluțiilor sunt în creștere, iar alfabetizarea tehnică a consumatorilor este în creștere. Putem presupune în siguranță că, în viitorul apropiat, aproape fiecare mediu de calcul va avea un fel de sisteme de stocare a datelor.

Orice date ne sunt prezentate sub formă de informații. Punctul de funcționare al oricărui dispozitiv de calcul este prelucrarea informațiilor. Recent, volumul creșterii sale este uneori înspăimântător, astfel încât sistemele de stocare a datelor și software-ul specializat vor fi, fără îndoială, cele mai solicitate produse ale pieței IT în următorii ani.

Ce este?
Rețea de stocare, sau Storage Area Network este un sistem format din dispozitivele de stocare reale - disc sau RAID - tablouri, biblioteci de benzi și alte lucruri, suporturi de transmisie de date și servere conectate la acesta. De obicei, este utilizat de companii destul de mari, cu o infrastructură IT dezvoltată pentru stocarea fiabilă a datelor și acces rapid la acestea.
Simplificat, stocarea este un sistem care permite serverelor să fie furnizate cu discuri fiabile, rapide, cu capacitate variabilă de la o varietate de dispozitive de stocare.

Un pic de teorie.
Serverul poate fi conectat la depozitul de date în mai multe moduri.
Primul și cel mai simplu este DAS, Direct Attached Storage (conexiune directă), pur și simplu punem discuri într-un server sau o matrice într-un adaptor de server - și obținem mulți gigaocteți de spațiu pe disc cu un acces rapid, și atunci când se utilizează o matrice RAID - fiabilitate suficientă, deși au existat de mult sulițe pe tema fiabilității.
Cu toate acestea, această utilizare a spațiului pe disc nu este optimă - un server rămâne fără spațiu, altul are mult din acesta. Soluția la această problemă este NAS, Network Attached Storage (stocare conectată prin rețea). Cu toate acestea, cu toate avantajele acestei soluții - flexibilitate și gestionare centralizată - există un dezavantaj semnificativ - viteza de acces, nu toate organizațiile au implementat încă o rețea de 10 gigabit. Și ajungem la rețeaua zonei de stocare.

Principala diferență între SAN și NAS (pe lângă ordinea literelor din abrevieri) este modul în care sunt văzute resursele conectate de pe server. Dacă resursele NAS sunt conectate la protocoalele NFS sau SMB, în SAN obținem o conexiune la disc, cu care putem lucra la nivelul operațiilor de blocare I / O, care este mult mai rapid conexiune retea (plus un controller de matrice cu un cache mare adaugă viteză la multe operații).

Prin utilizarea SAN, combinăm avantajele DAS - viteză și simplitate, și NAS - flexibilitate și manevrabilitate. În plus, avem capacitatea de a scala sistemele de stocare atâta timp cât sunt suficienți bani, ucigând simultan câteva păsări cu o singură piatră, care nu sunt vizibile imediat:

* eliminăm restricțiile privind gama de conexiuni a dispozitivelor SCSI, care sunt de obicei limitate la un fir de 12 metri,
* reducem timpul de rezervă,
* putem porni de la SAN,
* în caz de refuz de la NAS descărcăm rețeaua,
* obținem viteză mare de I / O datorită optimizării din partea sistemului de stocare,
* avem ocazia să conectăm mai multe servere la o singură resursă, apoi ne oferă următoarele două păsări cu o singură piatră:
o folosiți capacitățile complete ale VMWare - de exemplu VMotion (migrarea unei mașini virtuale între fizice) și altele ca acestea,
o putem construi clustere tolerante la erori și putem organiza rețele distribuite geografic.

Ce face?
În plus față de stăpânirea bugetului de optimizare a stocării, obținem, pe lângă ceea ce am scris mai sus:

* performanță sporită, echilibrare a sarcinii și disponibilitate ridicată a sistemelor de stocare datorită căilor multiple de acces la matrice;
* economii pe discuri prin optimizarea locației informațiilor;
* recuperare accelerată după eșecuri - puteți crea resurse temporare, implementa o copie de rezervă pe acestea și conecta servere la acestea și restaura independent informațiile fără grabă sau transfera resurse către alte servere și face față cu calm hardware-ului mort;
* Timp redus de rezervă - datorită ratei de transfer ridicate, puteți face copii de rezervă mai repede în biblioteca de benzi sau chiar puteți face un instantaneu (instantaneu) cu sistemul de fișiere și arhivează-l în liniște;
* spațiu pe disc la cerere - atunci când avem nevoie de el - putem adăuga oricând câteva rafturi la sistemul de stocare.
* reducem costul stocării unui megabyte de informații - în mod firesc, există un anumit prag de la care aceste sisteme sunt profitabile.
* un loc de încredere pentru stocarea datelor critice pentru misiune și pentru afaceri (fără de care o organizație nu poate exista și poate funcționa normal).
* Vreau să menționez separat VMWare - toate cipurile, cum ar fi migrarea mașinilor virtuale de la server la server și alte bunuri, sunt disponibile numai pe SAN.

În ce constă?
După cum am scris mai sus, sistemul de stocare este format din dispozitive de stocare, un mediu de transmisie și servere conectate. Să luăm în considerare în ordine:

Sisteme de stocare constau de obicei din hard diskuri și controlere, într-un sistem care se respectă, de regulă, există doar 2 - 2 controlere, 2 căi către fiecare disc, 2 interfețe, 2 surse de alimentare, 2 administratori. Cei mai respectați producători de sisteme includ HP, IBM, EMC și Hitachi. Aici voi cita un reprezentant EMC la seminar - „HP produce imprimante grozave. Așa că las-o să le facă! " Bănuiesc că și HP îi place foarte mult EMC. Cu toate acestea, concurența dintre producători este serioasă, ca și în alte părți. Consecințele concurenței sunt uneori prețuri corecte pe megabyte de stocare și probleme de compatibilitate și suport pentru standarde concurente, în special cu hardware mai vechi.

Mediu de transmitere a datelor... De obicei, SAN-urile sunt construite pe optică, ceea ce oferă în acest moment o viteză de 4, în unele locuri 8 gigați pe canal. La construcție, au fost utilizate anterior hub-uri specializate, acum există mai multe switch-uri, în principal de la Qlogic, Brocade, McData și Cisco (nu le-am văzut niciodată pe ultimele două pe site-uri). Cablurile sunt utilizate tradițional pentru rețelele optice - monomod și multimod, monomod, cu rază mai lungă de acțiune.
Pe plan intern, se utilizează FCP - Fibre Channel Protocol, un protocol de transport. De regulă, SCSI clasic rulează în interiorul său, iar FCP asigură adresarea și livrarea. Există o opțiune cu o conexiune printr-o rețea obișnuită și iSCSI, dar de obicei folosește (și încarcă puternic) o rețea locală și nu o rețea dedicată pentru transferul de date și necesită adaptoare cu suport iSCSI, ei bine, viteza este mai mică decât cea optică.

Există, de asemenea, topologia cuvintelor buzz, care se găsește în toate manualele SAN. Există mai multe topologii, cea mai simplă opțiune este punct la punct, conectăm 2 sisteme împreună. Acesta nu este un DAS, ci un cal sferic în vid, cea mai simplă versiune a unui SAN. Urmează bucla controlată (FC-AL), funcționează conform principiului „trece mai departe” - emițătorul fiecărui dispozitiv este conectat la receptorul celui următor, dispozitivele sunt închise într-un inel. Lanțurile lungi tind să dureze mult timp pentru a inițializa.

Ei bine, opțiunea finală este o structură comutată (Fabric), este creată folosind comutatoare. Structura conexiunilor este construită în funcție de numărul de porturi conectate, precum și la momentul construirii retea locala... Principiul de bază al construcției este că toate căile și conexiunile sunt duplicate. Aceasta înseamnă că există cel puțin 2 căi diferite către fiecare dispozitiv din rețea. Și aici se folosește cuvântul topologie, în sensul organizării unei diagrame de conectare a dispozitivului și a comutatoarelor de conectare. În acest caz, de regulă, comutatoarele sunt configurate astfel încât serverele să nu vadă nimic, cu excepția resurselor destinate acestora. Acest lucru se realizează prin crearea rețele virtuale și se numește zonare, cea mai apropiată analogie este VLAN. Fiecărui dispozitiv din rețea i se atribuie un analog al adresei MAC din rețeaua Ethernet, se numește WWN - World Wide Name. Este alocat fiecărei interfețe și fiecărei resurse de stocare (LUN). Tablourile și comutatoarele pot delimita accesul WWN pentru servere.

Server conectat la sistemul de stocare prin adaptoare HBA - Host Bus. Prin analogie cu carduri de rețea există adaptoare cu unu, două, patru porturi. Cei mai buni crescători de câini recomandă instalarea a 2 adaptoare pe server, ceea ce permite atât echilibrarea încărcării, cât și asigurarea fiabilității.

Și apoi resursele sunt tăiate pe sistemele de stocare, sunt, de asemenea, discuri (LUN) pentru fiecare server și spațiul este lăsat în stoc, totul pornește, instalatorii de sistem prescriu topologia, prind erori în configurarea comutatoarelor și a accesului, totul pornește și toată lumea trăiește fericit pentru totdeauna *.
Nu ating în mod specific diferite tipuri de porturi din rețeaua optică, cine are nevoie de el - știe deja sau citește, cine nu are nevoie - doar deranjează. Dar, ca de obicei, dacă tipul de port este setat incorect, nimic nu va funcționa.

Din experiență.
De obicei, atunci când creați un SAN, sunt comandate matrici cu mai multe tipuri de discuri: FC pentru aplicații de mare viteză și SATA sau SAS pentru cele nu foarte rapide. Astfel, primiți 2 grupuri de discuri cu costuri diferite pe megabyte - scumpe și rapide, și lente și triste, ieftine. Pe cel rapid, de obicei închide toate bazele de date și alte aplicații cu I / O activă și rapidă, pe cel lent - resurse de fișiere și orice altceva.

Dacă SAN este creat de la zero, este logic să-l construim pe baza soluțiilor de la un singur producător. Faptul este că, în ciuda conformității declarate cu standardele, există o greutate subacvatică a problemelor de compatibilitate a echipamentelor și nu este un fapt faptul că unele dintre echipamente vor funcționa între ele fără a dansa cu o tamburină și a se consulta cu producătorii. De obicei, pentru a soluționa astfel de probleme, este mai ușor să apelați un integrator și să-i dați bani, decât să comunicați cu producătorii care își transferă săgețile între ei.

Dacă un SAN este creat pe baza unei infrastructuri existente, totul poate fi dificil, mai ales dacă există matrici SCSI vechi și o grădină zoologică cu echipamente vechi de la diferiți producători. În acest caz, are sens să apelăm la ajutorul teribilei fiare a integratorului, care va dezlega problemele de compatibilitate și va face o a treia vilă în Insulele Canare.

Adesea, atunci când creează sisteme de stocare, firmele nu comandă asistență de la producător. Acest lucru este de obicei justificat în cazul în care compania are un personal de administratori competenți competenți (care deja mi-au spus un ceainic de 100 de ori) și o cantitate echitabilă de capital care vă permite să achiziționați piese de schimb în cantitățile necesare. Cu toate acestea, administratorii competenți sunt de obicei atrași de integratori (am văzut-o eu însumi), dar nu alocă bani pentru cumpărare, iar după eșecuri, un circ începe cu strigături de „Voi concedia pe toată lumea!” în loc să cheme asistență și sosirea unui inginer cu o piesă de schimb.

Suportul se reduce de obicei la înlocuirea discurilor și controlerelor moarte, bine, adăugarea rafturilor de discuri și a serverelor noi în sistem. O mulțime de probleme se întâmplă după o întreținere preventivă bruscă a sistemului de către specialiștii locali, mai ales după o oprire completă și demontarea-asamblarea sistemului (și acest lucru se întâmplă).

Despre VMWare. Din câte știu eu (experți în virtualizare, corectați-mă), doar VMWare și Hyper-V au funcționalități care vă permit să transferați mașini virtuale între servere fizice din mers. Și pentru implementarea sa este necesar ca toate serverele între care vă mutați mașină virtualăau fost conectate la aceeași unitate.

Despre clustere. Similar cu cazul VMWare, sistemele pentru construirea clusterelor de failover (Sun Cluster, Veritas Cluster Server) despre care știu necesită stocare conectată la toate sistemele.

În timpul redactării articolului - am fost întrebat - ce RAID sunt de obicei utilizate pentru a combina discurile?
În practica mea, de obicei au făcut fie RAID 1 + 0 pentru fiecare raft de discuri cu discuri FC, lăsând 1 disc de rezervă (Hot Spare) și au tăiat LUN-urile din această piesă pentru sarcini, fie au făcut RAID5 de pe discuri lente, lăsând din nou 1 disc a inlocui. Dar aici întrebarea este complicată și, de obicei, modul de organizare a discurilor într-o matrice este ales pentru fiecare situație și justificat. Același EMC, de exemplu, merge chiar mai departe și au o configurație suplimentară a matricei pentru aplicațiile care funcționează cu aceasta (de exemplu, pentru OLTP, OLAP). Nu am săpat atât de adânc cu restul vânzătorilor, dar cred că reglaj fin Toți au.

* înainte de primul eșec major, după care asistența este de obicei achiziționată de la producător sau furnizorul de sistem.
Deoarece nu există comentarii în sandbox, îl voi posta pe blogul meu personal.

Etichete: Adăugați etichete

Și alte lucruri, mediul de transmisie a datelor și serverele conectate la acesta. De obicei, este utilizat de companii destul de mari, cu o infrastructură IT dezvoltată pentru stocarea fiabilă a datelor și acces rapid la acestea.
Simplificat, stocarea este un sistem care permite serverelor să fie furnizate cu discuri fiabile, rapide, cu capacitate variabilă de la o varietate de dispozitive de stocare.

Un pic de teorie.
Serverul poate fi conectat la depozitul de date în mai multe moduri.
Primul și cel mai simplu este DAS, Direct Attached Storage (conexiune directă), pur și simplu punem discurile în server sau matricea în adaptorul de server - și obținem mulți gigaocteți de spațiu pe disc cu acces relativ rapid și atunci când folosim o matrice RAID - fiabilitate suficientă, deși sulițele pe tema fiabilității se rup de mult timp.
Cu toate acestea, această utilizare a spațiului pe disc nu este optimă - un server rămâne fără spațiu, altul are mult din acesta. Soluția la această problemă este NAS, Network Attached Storage (stocare conectată prin rețea). Cu toate acestea, cu toate avantajele acestei soluții - flexibilitate și gestionare centralizată - există un dezavantaj semnificativ - viteza de acces, nu toate organizațiile au implementat încă o rețea de 10 gigabit. Și ajungem la rețeaua zonei de stocare.

Principala diferență între SAN și NAS (pe lângă ordinea literelor din abrevieri) este modul în care sunt văzute resursele conectate de pe server. Dacă resursele NAS sunt conectate la protocoalele NFS sau SMB, în SAN obținem o conexiune pe disc cu care putem lucra la nivelul I / O bloc, care este mult mai rapid decât o conexiune de rețea (plus un controller de matrice cu o memorie cache mare adaugă viteză la multe operații).

Prin utilizarea SAN, combinăm avantajele DAS - viteză și simplitate, și NAS - flexibilitate și manevrabilitate. În plus, avem capacitatea de a scala sistemele de stocare atâta timp cât sunt suficienți bani, ucigând simultan câteva păsări cu o singură piatră, care nu sunt vizibile imediat:

* eliminăm restricțiile privind gama de conexiuni a dispozitivelor SCSI, care sunt de obicei limitate la un fir de 12 metri,
* reducem timpul de rezervă,
* putem porni de la SAN,
* în caz de refuz de la NAS descărcăm rețeaua,
* obținem viteză mare de I / O datorită optimizării din partea sistemului de stocare,
* avem ocazia să conectăm mai multe servere la o resursă, aceasta ne oferă următoarele două păsări cu o singură piatră:
- folosim pe deplin capacitățile VMWare - de exemplu, VMotion (migrarea unei mașini virtuale între fizice) și altele asemenea acestora,
- putem construi clustere tolerante la erori și putem organiza rețele distribuite geografic.

Ce face?
În plus față de stăpânirea bugetului de optimizare a stocării, obținem, pe lângă ceea ce am scris mai sus:

* performanță sporită, echilibrare a sarcinii și disponibilitate ridicată a sistemelor de stocare datorită căilor multiple de acces la matrice;
* economii pe discuri prin optimizarea locației informațiilor;
* Recuperare accelerată după eșecuri - puteți crea resurse temporare, puteți implementa o copie de rezervă pe ele și vă puteți conecta servere la acestea și puteți restabili în mod independent informațiile fără grabă sau puteți transfera resurse către alte servere și puteți face față cu calm hardware-ului mort;
* Timp redus de backup - datorită vitezei mari de transfer, puteți face copii de rezervă mai rapide la o bibliotecă de benzi, sau chiar puteți face o captură instantanee (instantanee) din sistemul de fișiere și arhivați-o calm;
* spațiu pe disc la cerere - când avem nevoie de el - putem adăuga oricând câteva rafturi la sistemul de stocare.
* reducem costul stocării unui megabyte de informații - în mod firesc, există un anumit prag de la care aceste sisteme sunt profitabile.
* un loc de încredere pentru stocarea datelor critice pentru misiune și pentru afaceri (fără de care o organizație nu poate exista și poate funcționa normal).
* Vreau să menționez separat VMWare - toate cipurile, cum ar fi migrarea mașinilor virtuale de la server la server și alte bunuri, sunt disponibile numai pe SAN.

În ce constă?
După cum am scris mai sus, sistemul de stocare este format din dispozitive de stocare, un mediu de transmisie și servere conectate. Să luăm în considerare în ordine:

Sisteme de stocare constau de obicei din hard diskuri și controlere, într-un sistem care se respectă, de regulă, există doar 2 - 2 controlere, 2 căi către fiecare disc, 2 interfețe, 2 surse de alimentare, 2 administratori. Cei mai respectați producători de sisteme includ HP, IBM, EMC și Hitachi. Aici voi cita un reprezentant EMC la seminar - „HP produce imprimante grozave. Așa că las-o să le facă! " Bănuiesc că și HP îi place foarte mult EMC. Cu toate acestea, concurența dintre producători este serioasă, ca și în alte părți. Consecințele concurenței sunt uneori prețuri corecte pe megabyte de stocare și probleme de compatibilitate și suport pentru standarde concurente, în special cu hardware mai vechi.

Mediu de transmitere a datelor.

De obicei, SAN-urile sunt construite pe optică, ceea ce oferă în acest moment o viteză de 4, în unele locuri 8 gigați pe canal. La construcție, au fost utilizate anterior hub-uri specializate, acum există mai multe switch-uri, în principal de la Qlogic, Brocade, McData și Cisco (nu le-am văzut niciodată pe ultimele două pe site-uri). Cablurile sunt utilizate tradițional pentru rețelele optice - monomod și multimod, monomod, cu rază mai lungă de acțiune.
Pe plan intern, se utilizează FCP - Fibre Channel Protocol, un protocol de transport. De regulă, SCSI clasic rulează în interiorul său, iar FCP asigură adresarea și livrarea. Există o opțiune cu o conexiune printr-o rețea obișnuită și iSCSI, dar de obicei folosește (și încarcă puternic) o rețea locală și nu o rețea dedicată pentru transferul de date și necesită adaptoare cu suport iSCSI, ei bine, viteza este mai mică decât cea optică.

Există, de asemenea, topologia cuvintelor buzz, care se găsește în toate manualele SAN. Există mai multe topologii, cea mai simplă opțiune este punct la punct, conectăm 2 sisteme împreună. Acesta nu este un DAS, ci un cal sferic în vid, cea mai simplă versiune a unui SAN. Urmează bucla controlată (FC-AL), funcționează conform principiului „trece mai departe” - emițătorul fiecărui dispozitiv este conectat la receptorul celui următor, dispozitivele sunt închise într-un inel. Lanțurile lungi tind să dureze mult timp pentru a inițializa.

Ei bine, opțiunea finală este o structură comutată (Fabric), este creată folosind comutatoare. Structura conexiunilor este construită în funcție de numărul de porturi conectate, ca atunci când se construiește o rețea locală. Principiul de bază al construcției este că toate căile și conexiunile sunt duplicate. Aceasta înseamnă că există cel puțin 2 căi diferite către fiecare dispozitiv din rețea. Și aici se folosește cuvântul topologie, în sensul organizării unei diagrame de conectare a dispozitivului și a comutatoarelor de conectare. În acest caz, de regulă, comutatoarele sunt configurate astfel încât serverele să nu vadă nimic, cu excepția resurselor destinate acestora. Acest lucru se realizează prin crearea de rețele virtuale și se numește zonare, cea mai apropiată analogie este VLAN. Fiecărui dispozitiv din rețea i se atribuie un analog al adresei MAC din rețeaua Ethernet, se numește WWN - World Wide Name. Este alocat fiecărei interfețe și fiecărei resurse de stocare (LUN). Tablourile și comutatoarele pot delimita accesul WWN pentru servere.

Server conectat la sistemul de stocare prin adaptoare HBA - Host Bus. Prin analogie cu plăcile de rețea, există adaptoare cu unu, două, patru porturi. Cei mai buni "crescători de câini" recomandă instalarea a 2 adaptoare pe server, aceasta permite atât echilibrarea încărcării, cât și asigurarea fiabilității.

Și apoi resursele sunt tăiate pe sistemele de stocare, sunt, de asemenea, discuri (LUN) pentru fiecare server și spațiul este lăsat în stoc, totul pornește, instalatorii de sistem prescriu topologia, prind erori în configurarea comutatoarelor și a accesului, totul pornește și toată lumea trăiește fericit pentru totdeauna *.
Nu ating în mod specific diferite tipuri de porturi din rețeaua optică, cine are nevoie de el - știe deja sau citește, cine nu are nevoie - doar deranjează. Dar, ca de obicei, dacă tipul de port este setat incorect, nimic nu va funcționa.

Din experiență.
De obicei, atunci când creați un SAN, sunt comandate matrici cu mai multe tipuri de discuri: FC pentru aplicații de mare viteză și SATA sau SAS pentru cele nu foarte rapide. Astfel, primiți 2 grupuri de discuri cu costuri diferite pe megabyte - scumpe și rapide, și lente și triste ieftine. Pe cel rapid, de obicei închide toate bazele de date și alte aplicații cu I / O activă și rapidă, pe cel lent - resurse de fișiere și orice altceva.

Dacă SAN este creat de la zero, este logic să-l construim pe baza soluțiilor de la un singur producător. Faptul este că, în ciuda conformității declarate cu standardele, există o greutate subacvatică a problemelor de compatibilitate a echipamentelor și nu este un fapt faptul că unele dintre echipamente vor funcționa între ele fără a dansa cu o tamburină și a se consulta cu producătorii. De obicei, pentru a soluționa astfel de probleme, este mai ușor să apelați un integrator și să-i dați bani, decât să comunicați cu producătorii care își transferă săgețile între ei.

Dacă un SAN este creat pe baza unei infrastructuri existente, totul poate fi dificil, mai ales dacă există matrici SCSI vechi și o grădină zoologică cu echipamente vechi de la diferiți producători. În acest caz, are sens să apelăm la ajutorul teribilei fiare a integratorului, care va dezlega problemele de compatibilitate și va face o a treia vilă în Insulele Canare.

Adesea, atunci când creează sisteme de stocare, firmele nu comandă asistență de la producător. Acest lucru este de obicei justificat în cazul în care compania are un personal de administratori competenți competenți (care deja mi-au spus un ceainic de 100 de ori) și o cantitate echitabilă de capital care vă permite să achiziționați piese de schimb în cantitățile necesare. Cu toate acestea, administratorii competenți sunt de obicei atrași de integratori (am văzut-o eu însumi), dar nu alocă bani pentru cumpărare, iar după eșecuri, un circ începe cu strigături de „Voi concedia pe toată lumea!” în loc să cheme asistență și sosirea unui inginer cu o piesă de schimb.

Suportul se reduce de obicei la înlocuirea discurilor și controlerelor moarte, bine, adăugarea rafturilor de discuri și a serverelor noi în sistem. O mulțime de probleme se întâmplă după o întreținere preventivă bruscă a sistemului de către specialiștii locali, mai ales după o oprire completă și demontarea-asamblarea sistemului (și acest lucru se întâmplă).

Despre VMWare. Din câte știu eu (experți în virtualizare, corectați-mă), doar VMWare și Hyper-V au funcționalități care vă permit să transferați mașini virtuale între servere fizice din mers. Și pentru implementarea sa, este necesar ca toate serverele între care se deplasează mașina virtuală să fie conectate la același disc.

Despre clustere. La fel ca în cazul VMWare, sistemele pentru construirea clusterelor de failover (Sun Cluster, Veritas Cluster Server) despre care știu necesită stocare conectată la toate sistemele.

În timpul redactării articolului - am fost întrebat - ce RAID sunt de obicei utilizate pentru a combina discurile?
În practica mea, de obicei au făcut fie RAID 1 + 0 pentru fiecare raft de discuri cu discuri FC, lăsând 1 disc de rezervă (Hot Spare) și au tăiat LUN-urile din această piesă pentru sarcini, fie au făcut RAID5 de pe discuri lente, lăsând din nou 1 disc a inlocui. Dar aici întrebarea este complicată și, de obicei, modul de organizare a discurilor într-o matrice este ales pentru fiecare situație și justificat. Același EMC, de exemplu, merge chiar mai departe și au o configurație suplimentară a matricei pentru aplicațiile care funcționează cu aceasta (de exemplu, pentru OLTP, OLAP). Nu am săpat atât de adânc cu alți furnizori, dar cred că toată lumea are reglaje fine.

* înainte de primul eșec major, după care asistența este de obicei achiziționată de la producător sau furnizorul de sistem.

Problema stocării fișierelor nu a fost niciodată atât de acută pe cât este astăzi.

Apariția hard disk-urilor cu o capacitate de 3 și chiar 4 TB, discuri Blu-Ray cu o capacitate de 25 până la 50 GB, stocare în cloud nu rezolvă problema. Există din ce în ce mai multe dispozitive în jurul nostru care generează conținut greu în jurul nostru: camere foto și video, smartphone-uri, HD-TV și video, console de jocuri etc. Generăm și consumăm (în principal de pe Internet) sute și mii de gigaocteți.

Acest lucru duce la faptul că computerul unui utilizator mediu stochează un număr mare de fișiere, sute de gigaocteți: o arhivă foto, o colecție de filme preferate, jocuri, programe, documente de lucru etc.

Toate acestea nu trebuie doar să fie stocate, ci și protejate de eșecuri și alte amenințări.

Pseudo-soluții la problemă

Puteți echipa computerul cu un hard disk mare. Dar în acest caz apare întrebarea: cum și unde să arhivăm, să zicem, datele de pe un disc de 3 terabyte?!

Puteți introduce două unități și le puteți utiliza în modul oglindă RAID sau pur și simplu faceți backup regulat de la una la alta. Aceasta nu este nici cea mai bună opțiune. Să presupunem că computerul dvs. este atacat de viruși: cel mai probabil, acestea vor infecta datele de pe ambele unități.

Puteți stoca date importante pe discuri optice organizând o arhivă Blu-ray de acasă. Dar va fi extrem de incomod să-l folosiți.

Depozitarea atașată în rețea este soluția la problema! Parțial ...

Stocare atașată în rețea (NAS) - stocare fișier de rețea. Dar poate fi explicat și mai simplu:

Să presupunem că aveți două sau trei calculatoare acasă. Acestea sunt cel mai probabil conectate la o rețea locală (cu fir sau fără fir) și la Internet. Spațiul de stocare atașat la rețea este un computer specializat care este încorporat în rețeaua de domiciliu și se conectează la internet.

Ca urmare, NAS poate stoca oricare dintre datele dvs. și le puteți accesa de pe orice computer sau laptop de acasă. Privind în perspectivă, merită spus că rețeaua locală trebuie să fie suficient de modernă, astfel încât să puteți „pompa” rapid și ușor zeci și sute de gigaocteți între server și computere. Dar mai multe despre asta mai târziu.

Unde pot obține un NAS?

Prima metodă: cumpărare. Un NAS mai mult sau mai puțin decent cu 2 sau 4 unități de disc poate fi achiziționat pentru 500-800 USD. Un astfel de server va fi ambalat într-o carcasă mică și gata de lucru, așa cum se spune, „din cutie”.

Cu toate acestea, PLUS acest 500-800 USD adaugă costul unităților de hard disk! Ca de obicei NAS se vând fără ele.

Pro: veți obține un dispozitiv gata făcut și petreceți un timp minim.

Dezavantaje ale acestei soluții: NAS costă ca un computer desktop, dar are capabilități incomparabil mai mici. De fapt, este doar o rețea unitate externă pentru mulți bani. Pentru destul de mulți bani, veți obține un set limitat de caracteristici dezavantajoase.

Soluția mea: construiește-o singur!

Acest lucru este mult mai ieftin decât cumpărarea unui NAS separat, deși durează puțin mai mult, deoarece asamblați singur mașina). Cu toate acestea, veți obține un server de acasă cu drepturi depline, care, dacă se dorește, poate fi utilizat în întreaga gamă de capabilități.

ATENŢIE!Descurajez puternic crearea unui server de acasă folosind computer vechi sau componente vechi, uzate. Nu uitați că serverul de fișiere este depozitul pentru datele dvs. Nu fi zgârcit pentru a-l face cât mai fiabil posibil, astfel încât într-o zi toate fișierele tale să nu se „ardă” împreună cu hard disk-uri, de exemplu, din cauza unei defecțiuni a circuitului de alimentare al plăcii de bază ...

Deci, am decis să construim un server de fișiere de acasă. Un computer ale cărui unități de disc sunt disponibile pe rețeaua LAN de acasă pentru utilizare. În consecință, avem nevoie ca un astfel de computer să fie economic din punct de vedere al consumului de energie, silențios, compact, nu generează multă căldură și are performanțe suficiente.

Pe baza acestui lucru, soluția ideală este o placă de bază cu un procesor integrat și răcire pasivă, Dimensiune compactă.

Am ales placa de bază ASUS С-60M1-I . A fost achiziționat de la magazinul online dostavka.ru:



Pachetul conține un manual de utilizare de înaltă calitate, un CD cu drivere, un autocolant pentru carcasă, 2 cabluri SATA și un panou posterior pentru carcasă:



ASUS, ca întotdeauna, a inclus pachetul foarte generos. Specificațiile complete ale plăcii pot fi găsite aici: http://www.asus.com/Motherboard/C60M1I/#specifications. Voi menționa doar câteva puncte importante.

La un cost de numai 3300 de ruble - oferă 80% din tot ce avem nevoie pentru server.

La bord bordul este procesor dual core AMD C-60 cu cip grafic integrat. Procesorul are o frecvență 1 GHz(poate crește automat la 1,3 GHz). Astăzi este instalat în unele netbook-uri și chiar laptopuri. Clasa procesorului Intel Atom D2700. Dar toată lumea știe că Atom are probleme cu calculul paralel, care deseori îi neagă performanța. Dar C-60 este lipsit de acest dezavantaj și, în plus, este echipat cu o grafică destul de puternică pentru această clasă.

Două sloturi de memorie disponibile DDR3-1066, cu posibilitatea de a instala până la 8 GB de memorie.

Placa conține 6 porturi la bord SATA 6Gbps... Acest lucru vă permite să vă conectați la sistem până la 6 discuri (!), Și nu doar 4, ca într-un NAS obișnuit pentru acasă.

Ce este cel mai important - tabloul se bazează pe UEFI, și nu BIOS-ul cu care suntem obișnuiți. Aceasta înseamnă că sistemul va putea funcționa în mod normal cu hard diskuri mai mari de 2,2 TB. Ea le va „vedea” întregul volum. Plăcile de bază bazate pe BIOS nu pot funcționa cu hard disk-uri mai mari de 2,2 GB fără „utilitare cârje” speciale. Desigur, utilizarea unor astfel de utilități este inacceptabilă dacă vorbim despre fiabilitatea stocării datelor și despre servere.

C-60 este un procesor destul de rece, deci este răcit doar cu un radiator din aluminiu. Acest lucru este suficient pentru ca chiar și în momentul încărcării complete, temperatura procesorului să nu crească mai mult de 50-55 de grade. Care este norma.



Setul de porturi este destul de standard, singura dezamăgire este lipsa unui nou USB 3.0. Și aș dori în mod special să răspund la prezența unui port de rețea gigabit complet:


Pe această placă, am instalat 2 module de 2 GB DDR3-1333 de la Patriot:


Windows 7 Ultimate a fost instalat pe un hard disk WD 500GB verde, iar pentru date am achiziționat un HDD Hitachi-Toshiba 3TB:



Toate aceste echipamente sunt alimentate de o unitate de alimentare FSP de 400 Watt, care, desigur, cu o marjă.

Etapa finală a fost asamblarea tuturor acestor echipamente într-o carcasă mini-ATX.

Imediat după asamblare, am instalat pe computer Windows 7 Ultimate (instalarea a durat aproximativ 2 ore, ceea ce este normal având în vedere viteza redusă a procesorului).

După toate acestea, am deconectat tastatura, mouse-ul și monitorul de la computer. De fapt, a rămas singur unitate de sistem conectat la rețeaua locală prin cablu.

Este suficient să vă amintiți IP-ul local al acestui PC din rețea pentru a vă conecta la acesta de la orice aparat prin intermediul utilitarului Windows standard „Conectați-vă la Desktop la distanță”:


Nu am instalat în mod deliberat specializat oS pentru organizarea stocării fișierelor, cum ar fi FreeNAS. Într-adevăr, în acest caz, nu ar avea prea mult sens să asamblați un computer separat pentru aceste nevoi. S-ar putea cumpăra un NAS.

Dar un server de acasă separat, care poate fi încărcat cu muncă peste noapte și lăsat, este mai interesant. În plus, familiar interfața Windows 7 este convenabil de operat.

Costul total al unui server de acasă FĂRĂ hard disk-uri a fost de 6.000 de ruble.

Adăugare importantă

Când utilizați orice NAS, lățimea de bandă a rețelei este foarte importantă. Mai mult, nici rețeaua de cablu obișnuită de 100 Megabit nu încântă atunci când, să zicem, efectuați arhivarea de pe computer pe serverul de acasă. Transferul de 100 GB pe o rețea de 100 Megabit este deja de câteva ore.

Ce putem spune despre Wi-Fi. Este bine dacă utilizați Wi-Fi 802.11n - în acest caz, viteza rețelei este menținută în jur de 100 Megabiți. Și ce zici de standardul 802.11g, unde viteza este rareori mai mare de 30 Megabiți? Acest lucru este foarte, foarte mic.

Ideal atunci când comunicați cu serverul printr-o rețea cu fir Gigabit Ethernet... În acest caz, este foarte rapid.

Dar vă voi spune cum să creați o astfel de rețea rapid și cu costuri minime într-un articol separat.