شماره 1 - "سیستم های ذخیره داده".

سیستم های ذخیره داده

در انگلیسی آنها را در یک کلمه صدا می کنند - ذخیره سازی ، که بسیار راحت است. اما این کلمه نسبتاً ناشیانه به روسی ترجمه شده است - "ذخیره سازی". آنها اغلب در زبان عامیانه "IT-Schnikov" از کلمه "storaj" در رونویسی روسی یا کلمه "khranilka" استفاده می کنند ، اما این رفتار بسیار بدی است. بنابراین ، ما از اصطلاح "سیستم های ذخیره سازی" ، سیستم های ذخیره سازی مختصر ، یا به سادگی "سیستم های ذخیره سازی" استفاده خواهیم کرد.

دستگاه های ذخیره داده شامل هر دستگاهی برای ضبط داده ها هستند: اصطلاحاً "درایوهای فلش" ، دیسک های کم حجم (CD ، DVD ، ZIP) ، درایوهای نوار (نوار) \u200b\u200b، دیسکهای سخت (دیسک سخت ، آنها به روش قدیمی "درایوهای سخت" نامیده می شوند ، زیرا اولین مدل آنها شبیه یک کلیپ با کارتریج های تفنگ قرن 19 به همین نام است) ، و غیره از دیسک های سخت نه تنها در داخل رایانه ها ، بلکه همچنین به عنوان دستگاه های USB خارجی برای ضبط اطلاعات و حتی استفاده می شود به عنوان مثال ، یکی از اولین مدل های iPod کوچک است hDD قطر 1.8 اینچ ، با خروجی هدفون و صفحه داخلی.

در اخیرا در حال کسب محبوبیت بیشتر و بیشتر به اصطلاح هستند. سیستم های ذخیره سازی "حالت جامد" SSD (Solid State Disk یا Solid State Drive) که در اصل مشابه "درایو فلش" برای دوربین یا تلفن هوشمند هستند ، فقط دارای یک کنترل کننده و مقدار بیشتری از داده های ذخیره شده هستند. بر خلاف هارد دیسک، SSD هیچ قسمت متحرک مکانیکی ندارد. در حالی که قیمت چنین سیستم های ذخیره سازی بسیار بالا است ، به سرعت در حال کاهش است.

همه اینها دستگاه های مصرفی هستند و در میان سیستم های صنعتی ، باید اول از همه ، سیستم های ذخیره سازی سخت افزار را برجسته کرد: آرایه های دیسک سخت ، به اصطلاح کنترل کننده های RAID برای آنها ، سیستم های ذخیره سازی نوار برای ذخیره طولانی مدت داده ها. علاوه بر این ، یک کلاس جداگانه: کنترل کننده ها برای سیستم های ذخیره سازی ، برای مدیریت پشتیبان گیری از داده ها ، ایجاد "عکس های فوری" (Snapshots) در سیستم ذخیره سازی برای بازیابی بعدی آنها ، تکثیر داده ها و غیره). سیستم های ذخیره سازی نیز شامل می شوند دستگاه های شبکه (HBA ، فیبر کانال سوئیچ ها ، کابل های FC / SAS و غیره). سرانجام ، راه حل های گسترده ای برای ذخیره سازی داده ها ، بایگانی ، بازیابی داده ها و بازیابی اطلاعات ارائه شده است.

داده های ذخیره شده از کجا می آیند؟ از ما ، عزیزان ، کاربران ، از برنامه های کاربردی ، پست الکترونیک، و همچنین از تجهیزات مختلف - سرورهای پرونده و سرورهای پایگاه داده. علاوه بر این ، ارائه دهنده مقدار زیادی داده - به اصطلاح دستگاه های M2M (ارتباط ماشین به ماشین) - انواع سنسورها ، سنسورها ، دوربین ها و ...

با استفاده از فراوانی استفاده از داده های ذخیره شده ، سیستم های ذخیره سازی را می توان به سیستم های ذخیره کوتاه مدت (ذخیره آنلاین) ، ذخیره سازی با مدت متوسط \u200b\u200b(ذخیره نزدیک به خط) و سیستم های ذخیره سازی بلند مدت (ذخیره سازی آفلاین) تقسیم کرد.

مورد اول شامل هارد دیسک (یا SSD) از هر کدام است کامپیوتر شخصی... سیستم دوم و سوم سیستم ذخیره سازی خارجی DAS (Direct Attached Storage) است که می تواند آرایه ای از دیسک های خارجی رایانه باشد (Disk Array). آنها ، به نوبه خود ، می توانند به فقط یک دسته دیسک (JBOD) و یک کنترل کننده ذخیره سازی آرایه دیسک هوشمند (iDAS) تقسیم شوند.

سیستم های ذخیره سازی خارجی در سه نوع وجود دارند: DAS (ذخیره مستقیم ضمیمه) ، SAN (شبکه ذخیره سازی) و NAS (ذخیره سازی متصل به شبکه). متأسفانه ، حتی بسیاری از متخصصان باتجربه فناوری اطلاعات نمی توانند تفاوت بین SAN و NAS را توضیح دهند و می گویند زمانی این اختلاف وجود داشت و اکنون نیز ادعا می شود که دیگر وجود ندارد. در واقع ، یک تفاوت وجود دارد و یک تفاوت قابل توجه (نگاه کنید به شکل 1).

شکل 1. تفاوت بین SAN و NAS.

در یک SAN ، خود سرورها در واقع از طریق SAN به سیستم ذخیره سازی متصل می شوند. در مورد NAS ، سرورهای شبکه از طریق یک شبکه محلی (LAN) به یک سیستم فایل مشترک در RAID متصل می شوند.

پروتکل های اتصال ذخیره سازی اساسی

پروتکل SCSI (Small Computer System Interface) ، تلفظ skazi ، پروتكلی است كه در اواسط دهه 1980 برای اتصال دستگاه های خارجی به مینی کامپیوترها تهیه شده است. نسخه SCSI-3 آن پایه و اساس کلیه پروتکل های ارتباطی ذخیره سازی است و از یک مجموعه دستور مشترک SCSI استفاده می کند. مزایای اصلی آن: استقلال از سرور مورد استفاده ، امکان عملکرد موازی چندین دستگاه ، سرعت انتقال داده بالا. معایب: تعداد محدودی از دستگاههای متصل ، دامنه اتصال بسیار محدود است.

پروتکل FC(کانال فیبر) ، پروتکل داخلی بین سرور و فضای ذخیره سازی مشترک ، کنترل کننده ، دیسک ها. این یک پروتکل ارتباط سریال است که به طور گسترده استفاده می شود و با سرعت 4 یا 8 گیگابیت در ثانیه (Gbps) کار می کند. همانطور که از اسمش پیداست از طریق فیبر کار می کند ، اما می تواند روی مس نیز کار کند. Fiber Channel پروتکل اصلی سیستم های ذخیره سازی FC SAN است.

پروتکل ISCSI(رابط سیستم کوچک رایانه ای اینترنت) ، یک پروتکل استاندارد برای انتقال بلوک داده ها از طریق پروتکل معروف TCP / IP SCSI از طریق IP. iSCSI را می توان به عنوان یک راه حل ذخیره سازی با سرعت بالا و کم هزینه برای سیستم های ذخیره سازی متصل از راه دور از طریق اینترنت مشاهده کرد. iSCSI دستورات SCSI را در بسته های TCP / IP برای انتقال از طریق شبکه IP محصور می کند.

پروتکل SAS(سریال پیوست شده SCSI). SAS از انتقال داده سریال استفاده می کند و با هارد دیسک های SATA سازگار است. در حال حاضر SAS می تواند داده ها را با 3Gpbs یا 6Gpbs انتقال دهد و از حالت دوبلکس کامل پشتیبانی می کند ، یعنی می تواند داده ها را با سرعت یکسان در هر دو جهت انتقال دهد.

انواع سیستم های ذخیره سازی.

سه نوع اصلی سیستم ذخیره سازی را می توان تشخیص داد:

  • DAS (ذخیره مستقیم متصل)
  • NAS (ذخیره سازی متصل به شبکه)
  • SAN (شبکه ذخیره سازی)

DAS Direct Attached Storage در اواخر سال توسعه داده شد


شکل 2. DAS

دهه 70 ، به دلیل افزایش قابل توجه اطلاعات کاربر ، که به سادگی از نظر جسمی در حافظه داخلی طولانی مدت رایانه ها جای نمی گرفت (برای جوانان ، یادداشت خواهیم کرد که این مربوط به رایانه های شخصی نیست ، آنها در آن زمان وجود نداشتند ، اما کامپیوترهای بزرگ، باصطلاح فریم های اصلی). سرعت انتقال داده در DAS از 20 به 80 مگابیت در ثانیه بسیار کم نبود ، اما کاملاً برای نیازهای آن زمان کافی بود.

ذخیره سازی شبکه NAS در اوایل دهه 90 ظاهر شد. دلیل آن توسعه سریع شبکه ها و الزامات اساسی برای اشتراک مقدار زیادی داده در شبکه سازمانی یا اپراتور بود. NAS از یک سیستم فایل شبکه خاص CIFS (ویندوز) یا NFS (لینوکس) استفاده می کند ، بنابراین سرورهای مختلف کاربران مختلف می توانند همزمان یک فایل را از NAS بخوانند. سرعت انتقال داده در حال حاضر بیشتر بود: 1 - 10Gbps.


شکل 3. NAS

در اواسط دهه 90 ، شبکه هایی برای اتصال دستگاه های ذخیره سازی FC SAN ظاهر شدند. توسعه آنها ناشی از نیاز به سازماندهی داده های پراکنده در شبکه بود. یک دستگاه ذخیره سازی واحد در SAN می تواند به چندین گره کوچک به نام Logical Unit Number (LUN) تقسیم شود که هر کدام از آنها به یک سرور اختصاص دارند. سرعت انتقال داده به 2-8 گیگابیت بر ثانیه افزایش یافته است. چنین سیستم های ذخیره سازی می توانند فناوری هایی برای محافظت از داده ها در برابر از دست دادن (عکس فوری ، پشتیبان گیری) فراهم کنند.


شکل 4. FC SAN

نوع دیگر SAN ، IP SAN (شبکه شبکه ذخیره سازی IP) است که در اوایل دهه 2000 توسعه یافته است. FC SAN گران بود ، مدیریت آن دشوار بود و شبکه های IP در اوج بودند ، به همین دلیل استاندارد متولد شد. سیستم های ذخیره سازی با استفاده از کنترل کننده iSCSI از طریق سوئیچ های IP به سرورها متصل شدند. سرعت انتقال داده: 1 - 10 گیگابیت بر ثانیه.


شکل 5 IP SAN.

جدول برخی از مشخصات مقایسه ای سیستم های ذخیره سازی در نظر گرفته شده را نشان می دهد:

DAS NAS سان
FC SAN IP SAN
نوع انتقال SCSI ، FC ، SAS IP FC IP
نوع داده بلوک داده فایل بلوک داده بلوک داده
برنامه معمولی هر سرور پرونده پایگاه داده دوربین مدار بسته
مزیت - فایده - سود - منفعت سهولت درک ،

سازگاری عالی

نصب آسان ، کم هزینه مقیاس پذیری خوب مقیاس پذیری خوب
معایب مشکل مدیریت.

استفاده ناکارآمد از منابع. مقیاس پذیری ضعیف

عملکرد ضعیف.

برای برخی از برنامه ها قابل استفاده نیست

قیمت بالا

پیچیدگی پیکربندی

بهره وری پایین

به طور خلاصه ، SAN ها برای انتقال بلوک های عظیم داده به سیستم های ذخیره سازی طراحی شده اند ، در حالی که NAS دسترسی به داده ها را در سطح فایل فراهم می کند. ترکیب SAN + NAS یکپارچه سازی داده ها ، دسترسی با عملکرد بالا و به اشتراک گذاری فایل را فراهم می کند. چنین سیستم هایی ذخیره سازی واحد - "سیستم های ذخیره سازی واحد" نامیده می شوند.

سیستم های ذخیره سازی واحد:یک معماری ذخیره سازی شبکه که هم از NAS مبتنی بر فایل و هم از SAN مبتنی بر بلوک پشتیبانی می کند. چنین سیستم هایی در اوایل سال 2000 برای حل مشکلات اداری و کل هزینه های بالای مالکیت سیستم های جداگانه در یک شرکت واحد ساخته شده اند. این سیستم ذخیره سازی تقریباً از همه پروتکل ها پشتیبانی می کند: FC ، iSCSI ، FCoE ، NFS ، CIFS.

دیسکهای سخت

همه درایوهای سخت را می توان به دو نوع اصلی تقسیم کرد: HDD (هارد دیسک ، که در واقع به "دیسک سخت" ترجمه می شود) و SSD (درایو حالت جامد ، - اصطلاحاً "درایو حالت جامد"). یعنی هر دو درایو هارد دیسک هستند. پس "دیسک نرم" چیست ، چنین مواردی وجود دارد؟ بله ، در گذشته وجود داشت ، آنها "فلاپی دیسک" نامیده می شدند (بنابراین آنها به دلیل صدای "پاپ" مشخص در درایو هنگام کار نامیده می شدند). درایوهای مربوط به آنها هنوز در واحدهای سیستم رایانه های قدیمی دیده می شود که در برخی از م institutionsسسات دولتی حفظ شده اند. با این حال ، با تمام تمایل ، به سختی می توان چنین دیسک های مغناطیسی را به سیستم های ذخیره سازی نسبت داد. اینها برخی از آنالوگهای "درایوهای فلش" فعلی بودند.

تفاوت HDD و SSD در این است که HDD دارای چندین دیسک مغناطیسی کواکسیال در داخل و مکانیک پیچیده ای است که هد های خواندن-نوشتن مغناطیسی را حرکت می دهد ، در حالی که SSD هیچ قسمت مکانیکی متحرکی ندارد و در واقع فقط یک میکرو مدار است که به صورت پلاستیکی ساخته شده است. بنابراین ، نامیدن فقط HDD ها "دیسک سخت" نادرست است.

هارد دیسک ها را می توان با توجه به پارامترهای زیر طبقه بندی کرد:

  • طراحی سازنده: HDD ، SSD ؛
  • قطر HDD در اینچ: 5.25 ، 3.5 ، 2.5 ، 1.8 اینچ؛
  • رابط: ATA / IDE ، SATA / NL SAS ، SCSI ، SAS ، FC
  • کلاس استفاده: فردی (کلاس دسکتاپ) ، شرکتی (کلاس enterprsie).
SATA SAS NL-SAS SSD
سرعت چرخش (دور در دقیقه) 7200 15000/10000 7200 NA
ظرفیت معمولی (سل) 1T / 2T / 3T 0.3T / 0.6T / 0.9T 2T / 3T / 4T 0.1T / 0.2T / 0.4T
MTBF (ساعت) 1 200 000 1 600 000 1 200 000 2 000 000
یادداشت تکامل هارد دیسک های ATA سریال.

SATA 2.0 از نرخ انتقال 300 مگابایت در ثانیه پشتیبانی می کند ، SATA3.0 تا 600 مگابایت در ثانیه را پشتیبانی می کند.

نرخ شکست سالانه (AFR) برای درایوهای SATA حدود 2٪ است.

درایوهای سخت SATA با رابط SAS برای طبقه بندی مناسب هستند. میانگین نرخ شکست سالانه (AFR) برای درایوهای NL-SAS حدود 2٪ است. دیسک های حالت جامد ساخته شده از تراشه های حافظه الکترونیکی ، از جمله دستگاه کنترل و تراشه (FLASH / DRAM). مشخصات رابط ، عملکرد و روش استفاده همان HDD است ، اندازه و شکل آن یکسان است.

مشخصات هارد دیسک:

  • ظرفیت

در مدرن هارد دیسکظرفیت x در گیگابایت یا ترابایت اندازه گیری می شود. برای HDD ، این مقدار مضربی از ظرفیت یک است دیسک مغناطیسی داخل جعبه ، ضرب شده در تعداد مغناطیسی ، که معمولاً تعداد زیادی از آنها وجود دارد.

  • سرعت چرخش (فقط برای HDD)

سرعت چرخش دیسک های مغناطیسی داخل درایو ، اندازه گیری شده در RPM (چرخش در هر دقیقه) ، معمولاً 5400 دور در دقیقه یا 7200 دور در دقیقه است. سرعت چرخش HDD با رابط های SCSI / SAS 10 تا 15 هزار دور در دقیقه است.

  • میانگین زمان دسترسی \u003dمیانگین زمان جستجو + میانگین زمان انتظار ، یعنی زمان بازیابی اطلاعات از دیسک است.
  • نرخ باود

این سرعت خواندن و نوشتن داده ها در یک هارد دیسک است که در مگابایت بر ثانیه (MB / S) اندازه گیری می شود. از نظر اندازه معمولاً با یکدیگر تفاوت دارند.

  • IOPS (ورودی / خروجی در هر ثانیه)

عملیات ورودی / خروجی در ثانیه ، یکی از شاخص های اصلی برای اندازه گیری عملکرد دیسک. برای برنامه های کاربردی با عملیات خواندن و نوشتن مکرر مانند OLTP (پردازش معاملات آنلاین) ، IOPS مهمترین معیار است زیرا عملکرد برنامه تجاری به آن بستگی دارد. شاخص مهم دیگر ، توان عملیاتی داده است که تقریباً می تواند به عنوان "توان عملیاتی داده" ترجمه شود ، یعنی چه مقدار داده می تواند در واحد زمان منتقل شود.

حمله

مهم نیست که هارد دیسک ها چگونه قابل اعتماد هستند ، به دلایل مختلف ، داده ها گاهی در آنها از بین می رود. بنابراین ، این فناوری RAID (آرایه زاید دیسک های مستقل) - آرایه ای از دیسک های مستقل با ذخیره سازی داده های زاید - پیشنهاد شد. افزونگی به معنای این است که تمام بایت های داده هنگام نوشتن در یک دیسک در دیسک دیگر کپی می شوند و در صورت خرابی دیسک اول می توانند استفاده شوند. علاوه بر این ، این فناوری به افزایش IOPS کمک می کند.

مفاهیم اساسی RAID سلب اطلاعات (اصطلاحاً "سلب" یا جداسازی) و بازتاب (به اصطلاح "آینه کردن" یا تکثیر) داده ها است. ترکیب آنها انواع مختلف آرایه های RAID دیسک سخت را تعریف می کند.

سطح زیر آرایه های RAID وجود دارد:

ترکیبی از این نوع باعث ایجاد چندین نوع جدید دیگر از RAID می شود:

شکل زیر نحوه انجام RAID 0 (راه اندازی) را توضیح می دهد:


شکل: 6. RAID 0.

و RAID 1 (تکثیر) به این ترتیب انجام می شود:


شکل: 7. RAID 1.

RAID 3 به این ترتیب عمل می کند. XOR یک عملکرد منطقی یا انحصاری است. این مقدار برابری را برای بلوک های داده A ، B ، C ، D ... که در یک دیسک جداگانه نوشته شده است ، محاسبه می کند.


شکل: 8. RAID 3.

نمودارهای فوق اصل عملکرد RAID را به خوبی نشان می دهد و نیازی به اظهارنظر نیست. ما قصد نداریم نمودارهای بقیه سطوح RAID را نشان دهیم ، کسانی که مایل هستند می توانند آنها را در اینترنت پیدا کنند.

مشخصات اصلی انواع RAID در جدول نشان داده شده است.

نرم افزار ذخیره سازی

نرم افزار ذخیره سازی را می توان به صورت زیر دسته بندی کرد:

  1. مدیریت و مدیریت (مدیریت): مدیریت و تنظیم پارامترهای زیرساخت: تهویه ، خنک کننده ، حالت های درایو و غیره ، کنترل زمان روز و غیره
  2. حفاظت اطلاعات: عکس فوری ، کپی محتوای LUN ، تقسیم آینه ، تکرار از راه دور ، CDP (محافظت مداوم از داده) و غیره
  3. افزایش قابلیت اطمینان:نرم افزارهای مختلف برای کپی و پشتیبان گیری چندگانه از مسیرهای انتقال داده در مرکز داده و بین آنها.
  4. افزایش کارایی: تهیه نازک ، ذخیره سازی طبقه بندی خودکار ، تکثیر ، مدیریت QoS ، پیش نصب حافظه پنهان ، پارتیشن بندی ، انتقال خودکار داده ها ، کاهش سرعت چرخش دیسک (چرخش دیسک به پایین)

این فناوری بسیار جالب است " تهیه نازک" همانطور که معمولاً در IT وجود دارد ، ترجمه اصطلاحات اغلب به روسی دشوار است ، به عنوان مثال ، ترجمه دقیق کلمه "تأمین" ("تأمین" ، "پشتیبانی" ، "تأمین" دشوار است - هیچ یک از این اصطلاحات معنی را به طور کامل منتقل نمی کنند). و وقتی "نازک" باشد ...

به عنوان مثال ، وام بانکی بر اساس اصل "تأمین نازک" کار می کند. وقتی بانکی ده هزار وام با سقف 500 هزار وام صادر می کند ، نیازی به 5 میلیارد در حساب خود ندارد ، زیرا کاربران کارت معمولاً یکباره کل وام را خرج نمی کنند. با این وجود ، اگر کل مبلغ بانک تمام نشود ، هر کاربر به صورت جداگانه می تواند از کل یا تقریباً کل وام استفاده کند.

شرکت های لوله کشی و برق نیز همین کار را می کنند. با ارائه خدمات آب یا برق ، آنها انتظار دارند که همه ساکنان همه شیرهای آب را یک باره روشن نکنند یا همه وسایل برقی خانه هایشان را روشن نکنند. با توجه به مصرف انعطاف پذیرتر منابع ، می توان در قیمت و ظرفیت منابع آنها صرفه جویی کرد.


شکل: نه. تهیه نازک.

بنابراین ، استفاده از تدارکات نازک به شما امکان می دهد مشکل تخصیص ناکارآمد فضا در SAN را حل کنید ، فضا را صرفه جویی کنید ، روشهای اداری را برای تخصیص فضا به برنامه های ذخیره سازی ساده کنید و به اصطلاح از اشتراک بیش از حد استفاده کنید ، یعنی فضای بیشتری را به برنامه های کاربردی اختصاص دهید ، از نظر فیزیکی که برنامه ها به طور همزمان ادعا نمی کنند با توجه به نیاز بعداً ، می توان ظرفیت ذخیره سازی فیزیکی را افزایش داد.

ذخیره سازی طبقه ای فرض می کند که داده های مختلف در دستگاه های ذخیره سازی ذخیره می شوند که پاسخگوی فرکانس دسترسی به آن داده ها هستند. به عنوان مثال ، داده های اغلب استفاده شده را می توان در "ذخیره سازی آنلاین" در درایوهای SSD با سرعت دسترسی بالا ، عملکرد بالا. با این حال ، قیمت چنین دیسک هایی هنوز بالا است ، بنابراین توصیه می شود از آنها فقط برای ذخیره سازی آنلاین استفاده کنید (در حال حاضر).

درایو های FC / SAS نیز سریع و با قیمت مناسب هستند. بنابراین ، چنین دیسک هایی برای "ذخیره نزدیک خط" ، جایی که داده ها ذخیره می شوند ، مناسب هستند و دسترسی به آنها نه چندان زیاد ، بلکه در همان زمان و به ندرت اتفاق می افتد.

سرانجام ، درایوهای SATA / NL-SAS سرعت دسترسی نسبتاً کمی دارند ، اما ظرفیت آنها زیاد و نسبتاً ارزان است. بنابراین ، ذخیره سازی آفلاین معمولاً برای استفاده از داده های استفاده نادر از آنها ، انجام می شود.

به محض اینکه سیستم کنترل متوجه شود که دسترسی به داده ها در ذخیره سازی آفلاین بیشتر شده است ، آنها را به حافظه ذخیره نزدیک خط و با فعال سازی بیشتر استفاده از آنها - به حافظه آنلاین "روی دیسک های SSD منتقل می کند.

تکثیر (حذف نسخه برداری) داده ها (deduplication ، DEDUP): همانطور که از نامش پیداست ، تکثیر داده ها را در فضای دیسک که معمولاً در پشتیبان گیری داده ها استفاده می شود ، از بین می برد. اگرچه سیستم قادر به تعیین اطلاعات اضافی نیست اما می تواند وجود داده های تکراری را تشخیص دهد. این امر باعث می شود ظرفیت مورد نیاز سیستم رزرواسیون به میزان قابل توجهی کاهش یابد.

کاهش سرعت چرخش دیسک (چرخش دیسک)) - آنچه معمولاً "خواب زمستانی" (به خواب رفتن) دیسک نامیده می شود. ممکن است از داده های موجود در برخی از دیسک ها مدت طولانی استفاده نشود ، در این حالت ، فناوری کاهش سرعت دیسک آنها را در حالت خواب زمستانی قرار می دهد تا مصرف انرژی برای چرخش بی فایده دیسک با سرعت نرمال کاهش یابد. این امر همچنین باعث افزایش عمر دیسک و افزایش قابلیت اطمینان سیستم به طور کلی می شود. وقتی اولین درخواست داده روی این دیسک رسید ، "بیدار می شود" ، سرعت چرخش آن افزایش می یابد. هزینه صرفه جویی در مصرف انرژی و بهبود قابلیت اطمینان تاخیر در اولین دسترسی به داده های روی دیسک است ، اما این هزینه کاملاً ارزش آن را دارد.

عکس فوری دیسک (عکس فوری)) عکس فوری یک کپی کاملاً قابل استفاده از مجموعه خاصی از داده ها روی دیسک در زمان گرفتن نسخه است (به همین دلیل به آن "عکس فوری" گفته می شود). از چنین نسخه ای برای بازگرداندن بخشی از وضعیت سیستم در زمان کپی استفاده می شود. در عین حال ، تداوم سیستم به هیچ وجه تحت تأثیر قرار نمی گیرد و عملکرد بدتر نمی شود.

تکثیر از راه دور: با استفاده از فناوری آینه کاری کار می کند. می تواند چندین نسخه از داده ها را در دو یا چند سایت نگهداری کند تا از از دست رفتن داده ها در صورت بروز بلایای طبیعی جلوگیری کند. دو تکرار وجود دارد: همزمان و ناهمزمان ، تفاوت بین آنها در شکل توضیح داده شده است.


شکل: 10. تکرار از راه دور داده ها (Remote Replication).

محافظت مداوم از داده ها CDP (مداوم) حفاظت اطلاعات) ، همچنین به عنوان پشتیبان مداوم یا پشتیبان گیری در زمان واقعی شناخته می شود ، ایجاد پشتیبان گیری به طور خودکار با هر تغییر داده. در همان زمان ، امکان بازیابی داده ها در صورت بروز هرگونه فاجعه در هر زمان امکان پذیر است ، و کپی به روز از داده ها در دسترس است ، و نه داده هایی که چند دقیقه یا چند ساعت پیش بوده است.

نرم افزار مدیریت:این شامل انواع مختلف است نرم افزار برای مدیریت و اداره دستگاه های مختلف: برنامه های ساده پیکربندی (جادوگران cofiguration) ، برنامه های نظارت متمرکز: نقشه برداری توپولوژی ، مکانیسم های نظارت بر زمان واقعی برای تولید گزارش های خرابی. این برنامه همچنین شامل برنامه های تضمین مشاغل: آمار عملکرد چند بعدی ، گزارش عملکرد و پرس و جوها و موارد دیگر است.

بازیابی فاجعه (DR)... این یک جز component نسبتاً مهم از سیستم های ذخیره سازی صنعتی جدی است ، اگرچه کاملاً هزینه بر است. اما این هزینه ها باید متحمل شود تا "آنچه با کار زیاد به دست آمده" و جایی که قبلا سرمایه های قابل توجهی سرمایه گذاری شده است ، از بین نرود. سیستم های محافظت از داده فوق (Snapshot ، Remote Replication ، CDP) تا زمانی که در شهرک محل استقرار سیستم ذخیره سازی فاجعه طبیعی رخ ندهد ، خوب هستند: سونامی ، سیل ، زلزله یا (pah-pah-pah) - هسته ای جنگ و هر جنگی همچنین می تواند زندگی افرادی را که مشغول کارهای مفیدی هستند ، به عنوان مثال ، ذخیره داده ها و دویدن با مسلسل برای از بین بردن قلمروهای دیگران یا مجازات برخی از "کافران" ، تا حد زیادی خراب کند. تکثیر از راه دور فرض می کند که سیستم ذخیره سازی تکثیر در همان شهر یا حداقل در نزدیکی آن واقع شده است. به عنوان مثال ، این امر به سونامی کمک نمی کند.

فناوری Disaster Recovery فرض می کند که مرکز پشتیبان مورد استفاده برای بازیابی اطلاعات در صورت بروز بلایای طبیعی در فاصله قابل توجهی از مرکز داده اصلی واقع شده و از طریق یک شبکه انتقال داده که روی یک شبکه حمل و نقل پوشانده شده و اغلب یک شبکه نوری است ، با آن ارتباط برقرار می کند. به عنوان مثال ، با چنین آرایش مراکز داده اصلی و پشتیبان ، استفاده از فناوری CDP به سادگی غیرممکن خواهد بود.

فناوری DR از سه مفهوم اساسی استفاده می کند:

  • BW (پنجره پشتیبان گیری) - "پنجره رزرو" ، زمان مورد نیاز برای سیستم رزرو برای کپی کردن حجم داده دریافتی سیستم کار.
  • RPO (هدف از نقطه بازیابی) - "نقطه بازیابی معتبر" ، حداکثر مدت زمان و مقدار متناظر با داده ای که می تواند برای کاربر ذخیره سازی از بین برود.
  • RTO (هدف زمان بازیابی) - "زمان قابل قبول عدم دسترسی" ، حداکثر زمانی که سیستم ذخیره سازی می تواند در دسترس نباشد ، بدون اینکه تأثیر اساسی روی تجارت اصلی بگذارد.


شکل: 11. سه مفهوم اساسی فناوری DR.

این مقاله ادعا نمی شود که کامل است و فقط اصول اساسی سیستم ذخیره سازی را توضیح می دهد ، گرچه کاملاً کامل نیست. منابع مختلف در اینترنت حاوی اسناد بسیاری است که تمام نکات ذکر شده (و ارائه نشده) در اینجا را با جزئیات بیشتری شرح می دهد.


سیستم های ذخیره اطلاعات (DSS) چیست و برای چه کاری استفاده می شود؟ تفاوت iSCSI با FiberChannel چیست؟ چرا این عبارت فقط در سال های اخیر برای طیف گسترده ای از متخصصان فناوری اطلاعات شناخته شده است و چرا مسائل سیستم های ذخیره اطلاعات هرچه بیشتر ذهن متفکر را نگران می کند؟

من فکر می کنم بسیاری از افراد متوجه روند توسعه در دنیای کامپیوتر در اطراف ما شده اند - انتقال از یک مدل توسعه گسترده به یک مدل فشرده. افزایش پردازنده های مگاهرتز دیگر نتیجه ای قابل مشاهده نمی دهد و توسعه درایوهای ذخیره سازی همگام با میزان اطلاعات نیست. اگر در مورد پردازنده ها همه چیز کم و بیش روشن است - کافی است سیستم های چند پردازنده ای را جمع کنید و / یا از چندین هسته در یک پردازنده استفاده کنید ، در صورت ذخیره سازی اطلاعات و پردازش مسائل ، خلاص شدن از شر مشکلات چندان آسان نیست. علائم فعلی اپیدمی اطلاعات ذخیره سازی است. این نام مخفف Storage Area Network یا Data Storage System است. در هر صورت ، این sp است

مشکلات اصلی با ذخیره سازی حل می شود

بنابراین ، سیستم ذخیره سازی برای حل چه وظایفی طراحی شده است؟ بیایید مشکلات معمولی مرتبط با افزایش حجم اطلاعات در هر سازمانی را بررسی کنیم. بیایید فرض کنیم که اینها حداقل چند ده رایانه و چندین دفتر پراکنده از نظر جغرافیایی هستند.

1. تمرکززدایی از اطلاعات - اگر قبلاً همه داده ها به معنای واقعی کلمه می توانستند روی یک دیسک سخت ذخیره شوند ، اکنون هر سیستم عملکردی به یک حافظه جداگانه احتیاج دارد - به عنوان مثال ، سرورهای ایمیل ، DBMS ، دامنه و غیره. در مورد دفاتر توزیع شده (شعب) وضعیت پیچیده تر می شود.

2. رشد بهمن اطلاعات - اغلب تعداد دیسک های سختی که می توانید در یک سرور خاص نصب کنید نمی تواند ظرفیت مورد نیاز سیستم را پوشش دهد. در نتیجه:
ناتوانی در محافظت کامل از داده های ذخیره شده در حقیقت است ، زیرا تهیه پشتیبان از داده هایی که نه تنها در سرورهای مختلف بلکه از نظر جغرافیایی پراکنده هستند ، کار بسیار دشواری است.
سرعت پردازش ناکافی - کانالهای ارتباطی بین سایتهای از راه دور هنوز مورد دلخواه باقی مانده است ، اما حتی با داشتن یک کانال "ضخیم" به اندازه کافی ، همیشه نمی توان به طور کامل از شبکه های موجود ، به عنوان مثال IP ، برای کار استفاده کرد.
پیچیدگی تهیه نسخه پشتیبان - اگر داده ها در بلوک های کوچک خوانده و نوشته شوند ، بایگانی کامل اطلاعات از یک سرور از راه دور از طریق کانال های موجود غیرواقعی است - کل مقدار داده باید منتقل شود. بایگانی در محل سایت اغلب از نظر مالی غیر عملی است - به سیستم های پشتیبان (به عنوان مثال درایو های نوار) \u200b\u200b، نرم افزار اختصاصی (که می تواند هزینه زیادی را هزینه کند) ، نیروهای آموزش دیده و واجد شرایط لازم است.

3. پیش بینی حجم مورد نیاز دشوار یا غیرممکن است فضای دیسک در هنگام استقرار سیستم کامپیوتری... در نتیجه:
در مورد گسترش ظرفیت دیسک مشکلاتی وجود دارد - بدست آوردن ظرفیت مرتبه ترابایت در یک سرور بسیار دشوار است ، خصوصاً اگر سیستم از قبل روی دیسک های با ظرفیت کوچک موجود کار کند - حداقل نیاز به خاموش شدن سیستم و سرمایه گذاری های مالی ناکارآمد است.
استفاده ناکارآمد از منابع - گاهی اوقات نمی توانید حدس بزنید که در کدام سرور داده ها سریعتر رشد می کنند. سرور ایمیل ممکن است فضای بسیار کمی از دیسک خالی داشته باشد ، در حالی که بخش دیگری فقط از 20٪ حجم زیر سیستم گران قیمت دیسک (به عنوان مثال SCSI) استفاده خواهد کرد.

4. درجه پایین محرمانه بودن داده های توزیع شده - کنترل و محدود کردن دسترسی مطابق با سیاست امنیتی شرکت غیرممکن است. این امر هم برای دسترسی به داده ها از طریق کانال های موجود (شبکه محلی) و هم برای دسترسی فیزیکی به رسانه ها صدق می کند - به عنوان مثال ، سرقت هارد دیسک ها ، تخریب آنها (به منظور پیچیده شدن مشاغل سازمان) مستثنی نیستند. اقدامات غیر ماهرانه کاربران و پرسنل تعمیر و نگهداری می تواند صدمات بیشتری وارد کند. وقتی شرکتی در هر دفتر مجبور به حل مشکلات جزئی امنیتی محلی شود ، این نتیجه مطلوبی نمی دهد.

5- پیچیدگی مدیریت جریانهای اطلاعاتی توزیع شده - هر عملی که با هدف تغییر داده ها در هر شاخه حاوی بخشی از داده های توزیع شده ایجاد شود ، مشکلات خاصی ایجاد می کند ، از پیچیدگی همگام سازی پایگاه های مختلف ، نسخه های پرونده های توسعه دهندگان و پایان دادن به تکثیر غیر ضروری اطلاعات.

6. اثر اقتصادی پایین اجرای راه حل های "کلاسیک" - با رشد شبکه اطلاعات ، مقدار زیادی داده و ساختار بطور فزاینده توزیع شده در شرکت ، سرمایه گذاری های مالی چندان م effectiveثر نیستند و اغلب نمی توانند مشکلات پیش آمده را برطرف کنند.

7. هزینه های بالای منابع مورد استفاده برای حفظ سلامت کل سیستم اطلاعاتی شرکت - از نیاز به نگهداری تعداد زیادی از پرسنل واجد شرایط و پایان دادن به راه حل های سخت افزاری متعدد گران قیمت که برای حل مشکل حجم و سرعت دسترسی به اطلاعات طراحی شده اند ، همراه با قابلیت اطمینان ذخیره سازی و محافظت در برابر خرابی ها.

با توجه به مشکلات فوق ، که دیر یا زود ، به طور کامل یا تا حدی ، هر شرکتی را که به صورت پویا در حال توسعه است ، تسخیر می کند ، سعی خواهیم کرد سیستم های ذخیره سازی داده ها را - همانطور که باید باشد - ترسیم کنیم. طرح های اتصال معمول و انواع سیستم های ذخیره داده را در نظر بگیرید.

مگابایت / معاملات؟

اگر اوایل دیسک های سخت داخل کامپیوتر (سرور) بود ، اکنون آنها تنگ هستند و در آنجا چندان قابل اعتماد نیستند. ساده ترین راه حل (که مدت ها پیش توسعه یافته و در همه جا مورد استفاده قرار گرفته است) فناوری RAID است.

تصاویر \\ RAID \\ 01.jpg

هنگام سازماندهی RAID در هر سیستم ذخیره سازی اطلاعات ، علاوه بر محافظت از اطلاعات ، چندین مزیت غیر قابل انکار نیز داریم که یکی از آنها سرعت دسترسی به اطلاعات است.

از دیدگاه کاربر یا نرم افزار ، سرعت نه تنها توسط توان سیستم (MB / s) ، بلکه همچنین توسط تعداد تراکنش ها تعیین می شود - یعنی تعداد عملیات ورودی-خروجی در هر واحد زمان (IOPS). افزایش تعداد IOPS توسط تعداد بیشتری دیسک و آن روشهای افزایش کارایی که یک کنترل کننده RAID فراهم می کند (به عنوان مثال حافظه پنهان) کاملاً منطقی است.

اگر پهنای باند کل برای مشاهده جریان ویدئو یا سازماندهی سرور پرونده مهمتر باشد ، برای DBMS ، هر برنامه کاربردی OLTP (پردازش معاملات آنلاین) ، تعداد تراکنشهایی که سیستم قادر به پردازش آنهاست بسیار مهم است. و با استفاده از این پارامتر ، هارد دیسک های مدرن به اندازه حجم های بزرگ و تا حدی سرعت ، گلگون نیستند. همه این مشکلات برای حل خود سیستم ذخیره سازی طراحی شده اند.

سطح محافظت

شما باید بدانید که در قلب همه سیستم های ذخیره داده ، عمل محافظت از اطلاعات مبتنی بر فناوری RAID وجود دارد - بدون این ، هر سیستم ذخیره سازی پیشرفته فنی بی فایده خواهد بود ، زیرا هارد دیسک های موجود در این سیستم ، غیر قابل اعتمادترین جز component هستند. سازماندهی دیسکها در RAID "پیوند پایین" ، اولین سطح محافظت از اطلاعات و افزایش سرعت پردازش است.

با این وجود ، علاوه بر طرح های RAID ، سطح پایین تری از حفاظت از داده ها نیز وجود دارد که "در بالای" فن آوری ها و راه حل های پیاده سازی شده در خود هارد دیسک توسط سازنده آن ، اجرا می شود. به عنوان مثال ، یکی از فروشندگان پیشرو ذخیره سازی ، EMC ، یک روش برای تجزیه و تحلیل داده های اضافی در سطح بخش درایو دارد.

پس از پرداختن به RAID ، اجازه دهید به ساختار سیستم های ذخیره سازی خود بپردازیم. اول از همه ، سیستم های ذخیره سازی با توجه به نوع رابط اتصال میزبان (سرور) تقسیم می شوند. رابط های اتصال خارجی عمدتا SCSI یا FibreChannel و همچنین استاندارد iSCSI نسبتاً جوان هستند. همچنین ، از ذخیره سازی هوشمند کوچک که حتی می تواند از طریق USB یا FireWire متصل شود ، تخفیف ندهید. ما رابط های نادرتر (گاهی اوقات به سادگی از یک طریق یا غیرمستقیم) را در نظر نخواهیم گرفت ، مانند SSA از IBM یا رابط های توسعه یافته برای فریم های اصلی - به عنوان مثال ، FICON / ESCON. انبارهای NAS که به شبکه اترنت متصل هستند از هم جدا هستند. کلمه "رابط" در اصل به معنی یک اتصال خارجی است ، اما فراموش نکنید که اتصال پروتکل ارتباطی دو دستگاه را تعریف نمی کند. در زیر به این ویژگی ها خواهیم پرداخت.

تصاویر \\ RAID \\ 02.gif

مخفف Small Computer System Interface (بخوانید "داستان ها") - رابط موازی نیمه دوبلکس. در سیستم های ذخیره سازی مدرن ، اغلب با اتصال SCSI نشان داده می شود:

تصاویر \\ RAID \\ 03.gif

تصاویر \\ RAID \\ 04.gif

و یک گروه از پروتکل های SCSI ، و به طور خاص تر - SCSI-3 Parallel Interface. تفاوت بین SCSI و IDE آشنا در تعداد بیشتر دستگاهها در هر کانال ، طول کابل بیشتر ، سرعت انتقال داده بیشتر و همچنین ویژگیهای "انحصاری" مانند سیگنالینگ دیفرانسیل ولتاژ بالا ، صف انتظار فرمان و برخی دیگر است - ما به این موضوع نمی پردازیم
اگر ما در مورد تولید کنندگان اصلی اجزای SCSI ، به عنوان مثال ، آداپتورهای SCSI ، کنترل کننده های RAID با رابط SCSI صحبت کنیم ، هر متخصص بلافاصله دو نام را به یاد می آورد - Adaptec و LSI Logic. من فکر می کنم این کافی است ، برای مدت طولانی هیچ انقلابی در این بازار رخ نداده است و احتمالاً انتظار نمی رود.

رابط FibreChannel

رابط سریال دوبلکس کامل اغلب در تجهیزات مدرن توسط اتصالات نوری خارجی از نوع LC یا SC نشان داده می شود (LC کوچکتر است):

تصاویر \\ RAID \\ 05.jpg

تصاویر \\ RAID \\ 06.jpg

... و پروتکل های FibreChannel (FCP). چندین طرح سوئیچینگ برای دستگاه های FibreChannel وجود دارد:

نقطه به نقطه - اتصال مستقیم دستگاه به یکدیگر از نقطه به نقطه:

تصاویر \\ RAID \\ 07.gif

Crosspoint سوئیچ شده است - اتصال دستگاه ها به سوئیچ FibreChannel (مشابه اجرای شبکه اترنت روی سوئیچ ها):

تصاویر \\ RAID \\ 08.gif

حلقه داوری - FC-AL ، حلقه ای با دسترسی داوری - همه دستگاه ها به صورت حلقه ای به یکدیگر متصل هستند ، این طرح تا حدودی شبیه Token Ring است. همچنین می توان از یک سوئیچ استفاده کرد - سپس توپولوژی فیزیکی طبق طرح "ستاره" و منطقی - طبق طرح "حلقه" (یا "حلقه") اجرا می شود:

تصاویر \\ RAID \\ 09.gif

اتصال FibreChannel رایج ترین طرح است ، از نظر FibreChannel چنین ارتباطی Fabric نامیده می شود - در روسی یک نسخه از آن وجود دارد - "کارخانه". لازم به ذکر است که سوئیچ های FibreChannel از نظر پیچیدگی پر کردن ، نزدیک به سوئیچ های سطح IP 3 دستگاه های بسیار پیشرفته ای هستند. اگر سوئیچ ها به هم متصل باشند ، پس آنها در یک پارچه عمل می کنند و دارای مجموعه ای از تنظیمات هستند که برای کل پارچه در یک زمان موثر هستند. تغییر برخی گزینه ها در یکی از سوئیچ ها می تواند منجر به تغییر مجدد کل کارخانه شود ، به عنوان مثال تنظیمات مجوز دسترسی را ذکر نکنید. از طرف دیگر ، طرح های SAN وجود دارد که شامل چندین پارچه در یک SAN است. بنابراین ، فقط یک گروه از سوئیچ های به هم پیوسته را می توان یک کارخانه نامید - دو یا چند دستگاه غیر متصل به SAN برای بهبود تحمل خطا از دو یا چند کارخانه متفاوت وارد شده اند.

از کامپوننت هایی که اجازه می دهند میزبان ها و سیستم های ذخیره سازی در یک شبکه واحد ترکیب شوند معمولاً "اتصال" نامیده می شود. اتصال ، البته ، کابل های اتصال دو طرفه است (معمولاً با رابط LC) ، سوئیچ ها و آداپتورهای FiberChannel (HBA ها ، آداپتورهای پایه میزبان) - یعنی کارتهای توسعه دهنده ای که وقتی در هاست نصب می شوند ، به شما امکان می دهند یک میزبان را به شبکه متصل کنید. سان HBA ها معمولاً به صورت کارت های PCI-X یا PCI-Express اجرا می شوند.

تصاویر \\ RAID \\ 10.jpg

فیبر و فیبر را اشتباه نگیرید - محیط انتشار سیگنال می تواند متفاوت باشد. FibreChannel می تواند روی مس کار کند. به عنوان مثال ، همه درایوهای سخت FibreChannel دارای تماس فلزی هستند و تعویض معمول دستگاه ها روی "مس" امری غیرمعمول نیست ، فقط به تدریج همه به عنوان امیدوار کننده ترین فن آوری و جایگزینی کاربردی برای "مس" ، به کانال های نوری تغییر می کنند.

رابط ISCSI

معمولاً توسط یک رابط خارجی RJ-45 برای اتصال به شبکه اترنت و توسط پروتکل iSCSI (رابط سیستم کوچک رایانه ای اینترنتی) نشان داده می شود. همانطور که توسط SNIA تعریف شده است: "iSCSI یک پروتکل مبتنی بر TCP / IP است که برای برقراری ارتباط و مدیریت سیستم های ذخیره سازی ، سرورها و کلاینت ها طراحی شده است." بگذارید کمی بیشتر با جزئیات در مورد این رابط صحبت کنیم ، البته فقط به این دلیل که هر کاربر قادر به استفاده از iSCSI حتی در یک شبکه "خانگی" عادی است.

توجه داشته باشید که iSCSI حداقل پروتكل حمل و نقل را برای SCSI كه در بالای TCP اجرا می شود و یك فن آوری برای محصور كردن دستورات SCSI در یك شبکه مبتنی بر IP را تعریف می كند. به زبان ساده ، iSCSI پروتکلی است که امکان دسترسی بلوک به داده ها را با استفاده از دستورات SCSI ارسال شده از طریق شبکه با پشته TCP / IP فراهم می کند. iSCSI به عنوان جایگزینی برای FibreChannel ظاهر شد و در سیستم های ذخیره سازی مدرن دارای چندین مزیت نسبت به آن است - توانایی ترکیب دستگاه ها در مسافت های بسیار زیاد (با استفاده از شبکه های IP موجود) ، توانایی ارائه سطح معینی از QoS (کیفیت خدمات ، کیفیت خدمات) ، هزینه کمتری برای اتصال. با این حال ، مشکل اصلی استفاده از iSCSI به عنوان جایگزین FibreChannel ، تأخیر زیاد ناشی از شبکه به دلیل ویژگی های اجرای پشته TCP / IP است که یکی از مزایای مهم استفاده از سیستم های ذخیره سازی - سرعت دسترسی به اطلاعات و تأخیر کم را نفی می کند. این یک ضرر جدی است.

یک یادداشت کوچک در مورد میزبان ها - می توان از آنها مانند کارت های شبکه عادی استفاده کرد (سپس مدیریت پشته iSCSI و کپسوله سازی دستور انجام می شود توسط نرم افزار) و کارتهای تخصصی پشتیبانی از فناوریهای مشابه TOE (TCP / IP Offload Engines). این فناوری پردازش سخت افزاری قسمت مربوط به پشته پروتکل iSCSI را فراهم می کند. روش نرم افزار ارزان تر است ، اما پردازنده مرکزی سرور را بیشتر بارگیری می کند و از لحاظ تئوری می تواند تاخیر بیشتری نسبت به پردازنده سخت افزاری داشته باشد. با سرعت فعلی اترنت 1 گیگابیت بر ثانیه ، می توان فرض کرد که iSCSI دقیقاً دو برابر کندتر از FibreChannel با سرعت 2 گیگابیت بر ثانیه کار خواهد کرد ، اما در استفاده واقعی تفاوت حتی بیشتر محسوس خواهد بود.

علاوه بر مواردی که قبلاً بحث شد ، ما به طور مختصر به چند پروتكل كه نادرتر هستند و برای ارائه خدمات اضافی به شبكه های ذخیره سازی موجود (SAN) طراحی شده اند اشاره خواهیم كرد:

FCIP (کانال فیبر از طریق IP) - یک پروتکل تونل زنی ساخته شده بر روی TCP / IP و برای اتصال SAN های پراکنده از نظر جغرافیایی بر روی یک محیط استاندارد IP طراحی شده است. به عنوان مثال ، شما می توانید از طریق اینترنت دو SAN را در یک مرکز ترکیب کنید. این امر با استفاده از دروازه FCIP که برای همه دستگاه های SAN قابل شفافیت است ، حاصل می شود.
iFCP (پروتکل کانال فیبر اینترنتی) - پروتكلی كه به شما اجازه می دهد دستگاه های دارای رابط FC از طریق شبكه های IP با هم تركیب شوند. یک تفاوت مهم از FCIP این است که می توان دقیقاً دستگاههای FC را از طریق شبکه IP ترکیب کرد ، که به جفت های مختلف اتصال اجازه می دهد سطح QoS متفاوتی داشته باشند ، که در هنگام تونل زدن از طریق FCIP غیرممکن است.

ما به طور خلاصه رابط های فیزیکی ، پروتکل ها و انواع تغییر سیستم های ذخیره سازی را بدون توقف در لیست تمام گزینه های ممکن ، پوشش دادیم. حال بیایید سعی کنیم تصور کنیم چه پارامترهایی سیستم های ذخیره داده را مشخص می کنند؟

پارامترهای اساسی سخت افزار ذخیره سازی

برخی از آنها در بالا ذکر شده اند - این انواع رابط های اتصال خارجی و انواع درایوهای داخلی (درایوهای سخت) هستند. پارامتر بعدی که منطقی است پس از دو مورد بالا هنگام انتخاب در نظر بگیرید سیستم دیسک ذخیره سازی ، - قابلیت اطمینان آن. قابلیت اطمینان را نه با MTBF پیش پا افتاده برخی از اجزای منفرد (این واقعیت که این زمان تقریباً برای همه تولیدکنندگان یکسان است) بلکه با معماری داخلی ارزیابی می شود. یک سیستم ذخیره سازی "معمولی" اغلب "از خارج" یک قفسه دیسک (برای نصب در کابینت 19 اینچی) با دیسک های سخت ، رابط های خارجی برای اتصال میزبان ها و چندین منبع تغذیه است. در داخل ، هر چیزی که سیستم ذخیره سازی را فراهم می کند ، معمولاً نصب می شود - واحدهای پردازنده ، کنترل کننده های دیسک ، پورت های ورودی / خروجی ، حافظه پنهان و غیره. معمولاً قفسه از کنترل می شود خط فرمان یا رابط وب ، پیکربندی اولیه اغلب به اتصال سریال نیاز دارد. کاربر می تواند دیسک های موجود در سیستم را به گروه ها تقسیم کرده و در RAID (از سطوح مختلف) ترکیب کند ، فضای دیسک حاصل به یک یا چند بلوک منطقی (LUN) تقسیم می شود که میزبان ها (سرورها) به آنها دسترسی دارند و آنها را به صورت "مشاهده" می کند. هارد دیسک های محلی تعداد گروه های RAID ، LUN ها ، منطق حافظه پنهان ، در دسترس بودن LUN ها برای سرورهای خاص و سایر موارد توسط مدیر سیستم پیکربندی شده است. معمولاً سیستم های ذخیره سازی به گونه ای طراحی شده اند که نه یک ، بلکه چندین سرور (از نظر تئوریک تا صدها) به آنها متصل شوند - بنابراین ، چنین سیستمی باید دارای کارایی بالا ، سیستم مدیریت و نظارت انعطاف پذیر و ابزار محافظت از داده های کاملاً تفکر شده باشد. حفاظت از داده ها از بسیاری جهات ارائه می شود ، ساده ترین روش آن را می دانید - ترکیبی از دیسک ها در RAID. با این حال ، داده ها باید دائماً در دسترس باشند - به هر حال ، متوقف کردن یک سیستم ذخیره داده ، مرکزی برای شرکت ، می تواند ضررهای قابل توجهی ایجاد کند. نسبت به. تا سیستم های بیشتر داده ها را بر روی سیستم ذخیره سازی ذخیره می کند ، دسترسی قابل اطمینان تری به سیستم باید فراهم شود - زیرا در صورت خرابی سیستم ذخیره سازی ، کار همه سرورهایی که داده ها را در آنجا ذخیره می کنند ، یک باره متوقف می شود. دسترسی زیاد به رک با تکثیر کامل داخلی تمام اجزای سیستم - مسیرهای دسترسی به رک (پورت های FibreChannel) ، ماژول های پردازنده ، حافظه نهان ، منابع تغذیه و غیره تضمین می شود. بیایید سعی کنیم اصل 100٪ افزونگی (تکثیر) را با شکل زیر توضیح دهیم:

تصاویر \\ RAID \\ 11.gif

1. سیستم ذخیره سازی کنترل کننده (ماژول پردازنده) ، از جمله:
* پردازنده مرکزی (یا پردازنده ها) - معمولاً سیستم نرم افزار خاصی را اجرا می کند که به عنوان "سیستم عامل" عمل می کند.
* رابط های سوئیچینگ با درایوهای سخت - در مورد ما ، این کارتها کارتهایی هستند که اتصال درایوهای FibreChannel را مطابق با طرح بازگشت با دسترسی داوری (FC-AL) فراهم می کنند.
* حافظه نهان ؛
* کنترل کننده های پورت خارجی FibreChannel
2. رابط خارجی FC ؛ همانطور که می بینیم ، برای هر ماژول پردازنده 2 مورد وجود دارد.
3. درایوهای سخت - ظرفیت با قفسه های دیسک اضافی افزایش می یابد.
4- حافظه نهان در چنین طرحی معمولاً منعکس می شود تا در صورت خرابی هر ماژول ، اطلاعات ذخیره شده در آنجا از بین نرود.

در مورد قسمت سخت افزاری ، قفسه های دیسک می توانند رابط های مختلفی برای اتصال میزبان ها ، رابط های مختلف برای هارددیسک ها ، طرح های مختلفی برای اتصال قفسه های اضافی که در خدمت افزایش تعداد دیسک ها در سیستم هستند ، و همچنین سایر "پارامترهای آهن" دیگر داشته باشند.

نرم افزار ذخیره سازی

به طور طبیعی ، قدرت سخت افزاری سیستم های ذخیره سازی باید به نوعی مدیریت شود ، و سیستم های ذخیره سازی نیز به سادگی موظف به ارائه سطحی از خدمات و عملکردهای موجود در طرح های متداول سرویس دهنده-سرویس گیرنده هستند. اگر به شکل "نمودار ساختاری سیستم ذخیره سازی" نگاهی بیندازیم ، مشخص خواهد شد که وقتی سرور از دو طریق مستقیم به رک متصل می شود ، باید به درگاه های FC ماژول های مختلف پردازنده متصل شوند تا سرور حتی در صورت خرابی کل ماژول پردازنده نیز به کار خود ادامه دهد. طبیعتاً ، برای استفاده از چند راهی ، این قابلیت باید توسط سخت افزار و نرم افزار در تمام سطوح درگیر در انتقال داده پشتیبانی شود. البته ، افزونگی کامل بدون ابزارهای نظارت و هشدار منطقی نیست - به همین دلیل است که تمام سیستم های ذخیره سازی جدی این قابلیت را دارند. به عنوان مثال ، اطلاع رسانی از وقایع مهم می تواند از طرق مختلفی اتفاق بیفتد - این یک اعلان ایمیل ، یک تماس مودم خودکار با یک مرکز پشتیبانی فنی ، یک پیام پیجر (اکنون از SMS بیشتر مناسب است) ، مکانیزم های SNMP و غیره

خوب ، همانطور که قبلاً اشاره کردیم ، کنترل های قدرتمندی برای این همه شکوه وجود دارد. معمولاً این یک رابط وب ، یک کنسول ، توانایی نوشتن اسکریپت ها و کنترل تعبیه شده در بسته های نرم افزاری خارجی است. درباره سازوکارهایی که فراهم می کنند بهره وری بالا ذخیره سازی ، ما فقط به طور خلاصه ذکر خواهیم کرد - معماری غیر مسدود کننده با چندین اتوبوس داخلی و تعداد زیادی هارد دیسک ، قدرتمند واحدهای پردازش مرکزی، یک سیستم کنترل تخصصی (سیستم عامل) ، مقدار زیادی حافظه نهان ، بسیاری از رابط های ورودی / خروجی خارجی.

سرویس های ارائه شده توسط سیستم های ذخیره سازی معمولاً توسط نرم افزاری که روی خود دیسک قرار دارد تعیین می شود. تقریباً همیشه ، این بسته های نرم افزاری پیچیده ای هستند که تحت مجوزهای جداگانه خریداری شده اند و در هزینه سیستم خود ذخیره سازی وجود ندارد. بیایید فوراً به نرم افزاری برای چند مسیریابی که قبلاً با آن آشنا هستید ، اشاره کنیم - این برنامه فقط روی میزبانها کار می کند و نه در خود رک.

محبوب ترین راه حل بعدی ، نرم افزار ایجاد نسخه های فوری و کامل از داده ها است. سازندگان مختلف نام های مختلفی برای خود دارند محصولات نرم افزاری و سازوکارهای ایجاد این نسخه ها. ما می توانیم کلمات snapshot و clone را برای کلی سازی دستکاری کنیم. کلون با استفاده از یک قفسه دیسک در داخل قفسه انجام می شود - این یک کپی داخلی کامل از داده ها است. دامنه کاربرد کاملاً گسترده است - از تهیه نسخه پشتیبان گرفته تا ایجاد "نسخه آزمایشی" داده های اولیه ، به عنوان مثال برای بروزرسانی های پرخطر ، که در آنها اطمینان وجود ندارد و استفاده از آنها بر روی داده های واقعی ایمن نیست. هرکسی که از نزدیک تمام جذابیت های سیستم های ذخیره سازی را که ما در اینجا مورد تجزیه و تحلیل قرار داده ایم را دنبال کند ، س askال خواهد کرد - چرا که اگر از قابلیت اطمینان بالایی برخوردار باشد ، به یک نسخه پشتیبان از داده در داخل رک نیاز داریم؟ پاسخ این سوال در ظاهر است - هیچ کس از خطاهای انسانی در امان نیست. داده ها به صورت ایمن ذخیره می شوند ، اما اگر اپراتور خود اشتباهی انجام داده باشد ، به عنوان مثال جدول لازم را در پایگاه داده حذف کرده است ، هیچ ترفند سخت افزاری این کار را ذخیره نمی کند. شبیه سازی داده ها معمولاً در سطح LUN انجام می شود. قابلیت های جالب تر توسط مکانیسم عکس فوری ارائه می شود. تا حدی ، با یک نسخه کامل داخلی از داده ها (کلون) لذت می بریم ، در حالی که 100٪ از حجم داده های کپی شده را در داخل رک نمی گیریم ، زیرا چنین حجمی همیشه در دسترس ما نیست. در واقع ، یک عکس فوری یک "عکس فوری" از اطلاعات است که باعث صرف وقت و ذخیره منابع پردازنده نمی شود.

البته نمی توان از ذکر نرم افزار تکثیر داده که اغلب به آن Mirroring گفته می شود ، نام برد. این مکانیزمی است برای تکثیر همزمان یا ناهمزمان (تکثیر) اطلاعات از یک سیستم ذخیره سازی به یک یا چند سیستم ذخیره سازی از راه دور. تکثیر از طریق کانالهای مختلف امکان پذیر است - به عنوان مثال ، قفسه هایی با رابط های FibreChannel را می توان به صورت غیر همزمان ، از طریق اینترنت و در مسافت های طولانی ، در یک سیستم ذخیره سازی دیگر تکثیر کرد. این راه حل اطمینان از ذخیره اطلاعات و محافظت در برابر بلایا را تضمین می کند.

علاوه بر همه موارد فوق ، تعداد زیادی مکانیسم دیگر برای دستکاری داده های نرم افزاری وجود دارد ...

DAS و NAS و SAN

پس از آشنایی با خود سیستم های ذخیره داده ، اصول ساخت آنها ، توانایی های ارائه شده و پروتکل های عملیاتی ، وقت آن است که سعی کنیم دانش بدست آمده را در یک طرح کاری ترکیب کنیم. بیایید سعی کنیم انواع سیستم های ذخیره سازی و توپولوژی اتصال آنها را به یک زیرساخت کاری واحد در نظر بگیریم.

دستگاهها DAS (ذخیره مستقیم متصل) - سیستم های ذخیره سازی مستقیماً به سرور متصل می شوند. این شامل ساده ترین سیستم های SCSI متصل به کنترل کننده SCSI / RAID سرور و دستگاه های FibreChannel است که مستقیماً به سرور متصل هستند ، اگرچه برای SAN ها طراحی شده اند. در این حالت ، توپولوژی DAS یک SAN منحط (شبکه منطقه ذخیره سازی) است:

تصاویر \\ RAID \\ 12.gif

در این طرح ، یکی از سرورها به داده های ذخیره شده در سیستم ذخیره دسترسی دارد. مشتریان با دسترسی به این سرور از طریق شبکه به داده ها دسترسی پیدا می کنند. یعنی سرور دسترسی بلوکی به داده های موجود در سیستم ذخیره سازی دارد و در حال حاضر کلاینت ها از دسترسی فایل استفاده می کنند - درک این مفهوم بسیار مهم است. مضرات این توپولوژی واضح است:
* قابلیت اطمینان پایین - در صورت بروز مشکلات شبکه یا خرابی سرور ، داده ها به یکباره برای همه غیرقابل دسترسی می شوند.
* تأخیر زیاد به دلیل پردازش تمام درخواست ها توسط یک سرور و حمل و نقل استفاده شده (اغلب - IP).
* بارگذاری بالای شبکه ، اغلب محدودیت های مقیاس پذیری را با اضافه کردن سرویس گیرنده ها تعریف می کند.
* مدیریت ضعیف - تمام ظرفیت برای یک سرور در دسترس است ، که انعطاف پذیری توزیع داده را کاهش می دهد.
* استفاده کم از منابع - پیش بینی مقدار مورد نیاز داده ها دشوار است ، ممکن است برخی از دستگاه های DAS در یک سازمان ظرفیت اضافی (دیسک) داشته باشند ، برخی دیگر از ظرفیت کافی برخوردار نیستند - توزیع مجدد اغلب غیرممکن یا زمان بر است.

دستگاهها NAS (ذخیره سازی متصل به شبکه) - دستگاه های ذخیره سازی که مستقیماً به شبکه متصل هستند. برخلاف سایر سیستم ها ، NAS دسترسی فایل به داده ها و هیچ چیز دیگری را فراهم نمی کند. دستگاه های NAS ترکیبی از سیستم ذخیره سازی و سروری است که به آن متصل است. در ساده ترین شکل ، معمول سرور شبکهارائه اشتراک فایل یک دستگاه NAS است:

تصاویر \\ RAID \\ 13.gif

تمام معایب این طرح ، به استثنای برخی موارد ، شبیه توپولوژی DAS است. از معایب اضافه شده ، ما به افزایش ، و اغلب به طور قابل توجهی ، هزینه اشاره می کنیم - با این حال ، هزینه متناسب با عملکرد است ، و در اینجا اغلب "چیزی برای پرداخت" وجود دارد. دستگاه های NAS می توانند ساده ترین "جعبه ها" با یک پورت اترنت و دو درایو سخت در RAID1 باشند ، اجازه دسترسی به پرونده ها را با استفاده از تنها یک پروتکل CIFS (سیستم پرونده مشترک اینترنت) به سیستم های عظیمی که صدها درایو سخت در آنها نصب می شود و دسترسی به پرونده ارائه شده توسط دوازده سرور اختصاصی در داخل سیستم NAS. تعداد پورت های اترنت خارجی می تواند به ده ها برسد و ظرفیت ذخیره سازی می تواند چند صد ترابایت باشد (به عنوان مثال ، EMC Celerra CNS). چنین مدل هایی می توانند از نظر قابلیت اطمینان و عملکرد بسیاری از دستگاه های میانی SAN را دور بزنند. جالب اینجاست که دستگاه های NAS می توانند بخشی از یک شبکه SAN باشند و درایو های خاص خود را ندارند ، اما فقط دسترسی فایل به داده های واقع در دستگاه های ذخیره بلوک را فراهم می کنند. در این حالت ، NAS عملکرد یک سرور تخصصی قدرتمند را بر عهده می گیرد و SAN دستگاه های ذخیره سازی را به عهده می گیرد ، یعنی توپولوژی DAS متشکل از اجزای NAS و SAN را بدست می آوریم.

دستگاه های NAS در یک محیط ناهمگن که دسترسی سریع پرونده به داده ها برای بسیاری از مشتریان همزمان لازم است ، بسیار خوب هستند. همچنین قابلیت اطمینان در ذخیره سازی و انعطاف پذیری مدیریت سیستم عالی ، همراه با سهولت تعمیر و نگهداری را فراهم می کند. ما در مورد قابلیت اطمینان صحبت نخواهیم کرد - این جنبه از ذخیره سازی در بالا مورد بحث قرار گرفت. با توجه به یک محیط ناهمگن ، دسترسی به پرونده ها در یک سیستم NAS تنها از طریق TCP / IP ، CIFS ، NFS ، FTP ، TFTP و سایر موارد حاصل می شود ، از جمله توانایی NAS برای کار به عنوان یک هدف iSCSI ، که به شما امکان می دهد با سیستم عامل های مختلف عمل کند. نصب شده بر روی میزبان ها. با توجه به سهولت نگهداری و انعطاف پذیری مدیریت ، این قابلیت ها توسط یک سیستم عامل تخصصی ارائه می شود که غیرفعال کردن آن دشوار است و نیازی به حفظ آن نیست و همچنین تمایز حقوق دسترسی به پرونده ها. به عنوان مثال ، امکان کار در محیط Windows Active Directory با پشتیبانی از قابلیت های مورد نیاز وجود دارد - این می تواند LDAP ، احراز هویت Kerberos ، DNS پویا ، ACL ، تعیین سهمیه ، اشیا Policy Policy Group و تاریخچه SID باشد. از آنجا که دسترسی به پرونده ها فراهم شده است ، و نام آنها می تواند حاوی نویسه باشد زبانهای مختلف، بسیاری از NAS پشتیبانی از رمزگذاری UTF-8 ، Unicode را فراهم می کنند. باید به انتخاب NAS حتی با دقت بیشتری نسبت به دستگاه های DAS نزدیک شد ، زیرا چنین تجهیزات ممکن است از خدمات مورد نیاز شما پشتیبانی نکند ، به عنوان مثال ، رمزگذاری فایل های سیستم (EFS) از مایکروسافت و IPSec. به هر حال ، می توان خاطر نشان کرد که NAS بسیار کمتر از دستگاه های SAN است ، اما درصد چنین سیستم هایی هنوز به طور مداوم ، البته به آرامی ، در حال رشد است - عمدتا به دلیل جابجایی DAS.

دستگاه های اتصال به SAN (شبکه ذخیره سازی) - دستگاه های اتصال به شبکه ذخیره سازی. یک شبکه منطقه ذخیره سازی (SAN) نباید با یک شبکه محلی اشتباه گرفته شود - اینها شبکه های مختلفی هستند. در بیشتر مواقع ، SAN بر پایه پروتکل FibreChannel استوار است و در ساده ترین حالت شامل سیستم های ذخیره سازی ، سوئیچ ها و سرورها است که توسط کانال های ارتباطی نوری متحد می شوند. در شکل ، یک زیرساخت بسیار قابل اعتماد مشاهده می کنیم که در آن سرورها به طور همزمان به شبکه محلی (چپ) و شبکه منطقه ذخیره سازی (راست) متصل می شوند:

تصاویر \\ RAID \\ 14.gif

پس از نگاهی دقیق به دستگاه ها و اصول کار آنها ، درک توپولوژی SAN برای ما بسیار آسان خواهد بود. در شکل ، یک سیستم ذخیره سازی واحد برای کل زیرساخت ها مشاهده می کنیم که دو سرور به آن متصل شده اند. سرورها مسیرهای دسترسی اضافی دارند - هر کدام دو HBA دارند (یا یک پورت دوگانه ، که باعث تحمل خطا می شود). دستگاه ذخیره سازی دارای 4 پورت است که آن را به 2 سوئیچ متصل می کند. با فرض وجود دو ماژول پردازنده زاید در داخل ، به راحتی می توان حدس زد که بهترین طرح اتصال زمانی است که هر سوئیچ به هر دو ماژول پردازنده اول و دوم متصل باشد. این طرح دسترسی به هرگونه داده موجود در سیستم ذخیره سازی را در صورت خرابی هر ماژول پردازنده ، سوئیچ یا مسیر دسترسی فراهم می کند. ما قبلاً قابلیت اطمینان سیستم های ذخیره سازی را مطالعه کرده ایم ، دو سوئیچ و دو کارخانه باعث افزایش بیشتر در دسترس بودن توپولوژی می شوند ، بنابراین اگر به دلیل خرابی یا خطای مدیر ، ناگهان یکی از بلوک های سوئیچ از کار بیفتد ، مورد دوم به طور عادی کار می کند ، زیرا این دو دستگاه به هم پیوسته نیستند.

از اتصال سرور نشان داده شده به عنوان اتصال با قابلیت دسترسی بالا یاد می شود ، اگرچه در صورت لزوم می توان تعداد بیشتری HBA را بر روی سرور نصب کرد. از نظر فیزیکی ، هر سرور فقط دو اتصال در SAN دارد ، با این حال ، به طور منطقی ، سیستم ذخیره سازی از طریق چهار مسیر قابل دسترسی است - هر HBA دسترسی به دو نقطه اتصال در سیستم ذخیره سازی ، به هر ماژول پردازنده را به طور جداگانه فراهم می کند (این ویژگی با اتصال دو سوئیچ به سیستم ذخیره سازی فراهم می شود). در این نمودار ، غیر قابل اعتمادترین دستگاه سرور است. دو سوئیچ در حدود 99.99٪ قابلیت اطمینان دارند اما سرور به دلایل مختلف از کار می افتد. اگر یک عملکرد کاملاً قابل اعتماد از کل سیستم مورد نیاز باشد ، سرورها به یک خوشه ترکیب می شوند ، طرح داده شده به هیچ سخت افزار اضافی برای سازماندهی چنین کاری احتیاج ندارد و یک طرح مرجع برای سازماندهی SAN محسوب می شود. ساده ترین حالت ، سرورهایی است که از طریق یک سوئیچ به سیستم ذخیره سازی به یک روش واحد متصل می شوند. با این حال ، سیستم ذخیره سازی ، اگر دو ماژول پردازنده وجود داشته باشد ، باید حداقل با یک کانال در هر ماژول به سوئیچ متصل شود - از پورت های باقی مانده می توان برای اتصال مستقیم سرورها به سیستم ذخیره سازی استفاده کرد ، که گاهی اوقات لازم است. و فراموش نکنید که ساختن SAN نه تنها بر اساس FiberChannel بلکه بر اساس پروتکل iSCSI نیز امکان پذیر است - در این حالت می توانید فقط از دستگاه های استاندارد اترنت برای تعویض استفاده کنید که این امر باعث ارزان شدن سیستم می شود اما دارای یکسری معایب اضافی نیز می باشد (در بخش iSCSI در بخش مشخص شده است) ) همچنین توانایی راه اندازی سرورها از سیستم ذخیره سازی جالب است - وجود درایوهای سخت داخلی نیز در سرور ضروری نیست. بنابراین ، وظیفه ذخیره سازی هر داده به طور کامل از سرورها برداشته می شود. از لحاظ تئوری ، یک سرور تخصصی را می توان به یک خرد کن معمولی و بدون هیچ درایو تبدیل کرد ، که بلوک های تعیین کننده آن پردازنده های مرکزی ، حافظه و همچنین رابط هایی برای تعامل با دنیای خارج ، به عنوان مثال پورت های اترنت و FibreChannel هستند. نوعی از این دستگاه ها سرورهای تیغه ای مدرن هستند.

می خواهم یادآوری کنم که دستگاههایی که می توانند به SAN متصل شوند فقط به سیستم های ذخیره سازی دیسک محدود نمی شوند - این می تواند کتابخانه دیسک ، کتابخانه نوار (پخش کننده جریان) ، دستگاه های ذخیره داده در دیسک های نوری (CD / DVD و دیگران) و بسیاری دیگر.
از منهای SAN ، ما فقط به هزینه بالای اجزای آن اشاره می کنیم ، اما مزایای آن غیرقابل انکار است:
* قابلیت اطمینان بالا در دسترسی به داده های واقع در سیستم های ذخیره سازی خارجی. استقلال توپولوژی SAN از سیستم های ذخیره سازی و سرورهای مورد استفاده.
* ذخیره سازی اطلاعات متمرکز (قابلیت اطمینان ، امنیت).
* کنترل متمرکز راحت سوئیچینگ و داده ها.
* ترافیک شدید ورودی / خروجی را به یک شبکه جداگانه منتقل کنید و LAN را بارگیری کنید.
* عملکرد بالا و تأخیر کم.
* مقیاس پذیری و انعطاف پذیری ساختار منطقی SAN
* از نظر جغرافیایی ، اندازه SAN ، برخلاف DAS کلاسیک ، عملا نامحدود است.
* امکان توزیع سریع منابع بین سرورها.
* امکان ساخت راه حلهای خوشه ای تحمل کننده خطا بدون هیچ هزینه اضافی بر اساس SAN موجود.
* طرح پشتیبان گیری ساده - همه داده ها در یک مکان قرار دارند.
* دسترسی فرصت های اضافی و خدمات (عکس فوری ، همانندسازی از راه دور).
* درجه بالایی از امنیت SAN.

سرانجام
من فکر می کنم ما طیف اصلی مسائل مربوط به سیستم های ذخیره سازی مدرن را کاملاً پوشش داده ایم. بیایید امیدوار باشیم که چنین دستگاههایی از نظر عملکردی حتی سریعتر پیشرفت کنند و تعداد مکانیزمهای مدیریت داده فقط رشد کنند.

در پایان ، می توان گفت که راه حل های NAS و SAN در حال حاضر یک رونق واقعی را تجربه می کنند. تعداد تولیدکنندگان و انواع راه حل ها در حال افزایش است و سواد فنی مصرف کنندگان نیز در حال افزایش است. با خیال راحت می توانیم فرض کنیم که در آینده ای نزدیک ، تقریباً هر محیط محاسباتی دارای نوعی سیستم ذخیره اطلاعات است.

هر داده ای در قالب اطلاعات به ما ارائه می شود. نقطه کار هر دستگاه محاسباتی پردازش اطلاعات است. اخیراً ، حجم رشد آن گاهی ترسناک است ، بنابراین بدون شک سیستم های ذخیره داده و نرم افزارهای تخصصی بیشترین تقاضای محصولات بازار IT در سال های آینده خواهند بود.

چیه؟
شبکه ذخیره سازییا Storage Area Network سیستمی متشکل از دستگاههای ذخیره سازی واقعی است - دیسک یا RAID - آرایه ها ، کتابخانه های نوار و سایر موارد ، رسانه های انتقال داده و سرورهای متصل به آن. این معمولاً توسط شرکتهای نسبتاً بزرگی با زیرساخت IT پیشرفته برای ذخیره اطلاعات قابل اعتماد و دسترسی سریع به آنها استفاده می شود.
ذخیره سازی ساده ، سیستمی است که به شما امکان می دهد دیسک های قابل اعتماد ، سریع و با ظرفیت متغیر از انواع دستگاه های ذخیره سازی به سرورها ارائه شود.

کمی تئوری.
سرور از چند طریق می تواند به انبار داده متصل شود.
اولین و ساده ترین آنها DAS ، Direct Attached Storage (اتصال مستقیم) است ، ما به راحتی دیسک ها را در یک سرور یا یک آرایه را در آداپتور سرور قرار می دهیم - و فضای گیگابایتی زیادی گیگابایت با نسبتاً دسترسی سریع، و هنگام استفاده از آرایه RAID - قابلیت اطمینان کافی ، اگرچه مدتهاست که نیزه هایی با موضوع قابلیت اطمینان وجود دارد.
با این حال ، این استفاده از فضای دیسک مطلوب نیست - فضای کافی برای یک سرور وجود دارد ، دیگری فضای زیادی دارد. راه حل این مشکل NAS ، Network Attached Storage (حافظه متصل از طریق شبکه) است. با این حال ، با تمام مزایای این راه حل - انعطاف پذیری و مدیریت متمرکز - یک اشکال قابل توجه وجود دارد - سرعت دسترسی ، هنوز همه سازمان ها شبکه 10 گیگابایتی را اجرا نکرده اند. و ما به شبکه منطقه ذخیره سازی می رسیم.

تفاوت اصلی بین SAN و NAS (علاوه بر ترتیب حروف به اختصار) نحوه مشاهده منابع متصل شده در سرور است. اگر منابع NAS به پروتکل های NFS یا SMB متصل باشند ، در SAN ما یک اتصال دیسک به دست می آوریم که می توانیم با آن در سطح ورودی و خروجی بلوک کار کنیم ، که بسیار سریعتر از اتصال شبکه است (به علاوه یک کنترل کننده آرایه با یک حافظه نهان بزرگ ، سرعت بسیاری از عملیات را اضافه می کند).

با استفاده از SAN ، ما مزایای DAS - سرعت و سادگی و NAS - انعطاف پذیری و مدیریت را ترکیب می کنیم. بعلاوه ، ما توانایی مقیاس گذاری سیستم های ذخیره سازی را داریم تا زمانی که پول کافی وجود دارد ، به طور همزمان چند پرنده را با یک سنگ از بین می بریم ، که بلافاصله قابل مشاهده نیستند:

* محدودیت های محدوده اتصال دستگاه های SCSI را که معمولاً به یک سیم 12 متری محدود می شوند ، برطرف می کنیم
* ما زمان پشتیبان را کاهش می دهیم ،
* ما می توانیم از SAN بوت کنیم ،
* در صورت امتناع از NAS ، ما شبکه را تخلیه می کنیم ،
* به دلیل بهینه سازی سیستم ذخیره سازی ، سرعت I / O بالایی داریم
* این فرصت را داریم که چندین سرور را به یک منبع متصل کنیم ، سپس دو پرنده زیر را با یک سنگ به ما می دهد:
از قابلیت های VMWare استفاده کامل کنید - به عنوان مثال ، VMotion (انتقال یک ماشین مجازی بین فیزیکی) و موارد دیگر مانند آنها ،
o ما می توانیم خوشه های مقاوم در برابر خطا ایجاد کنیم و شبکه های توزیع شده جغرافیایی را سازماندهی کنیم.

چه کار میکند؟
علاوه بر تسلط بر بودجه بهینه سازی ذخیره سازی ، علاوه بر آنچه در بالا نوشتم ، به دست می آوریم:

* افزایش عملکرد ، تعادل بار و در دسترس بودن زیاد سیستم های ذخیره سازی به دلیل مسیرهای دسترسی متعدد به آرایه ها.
* صرفه جویی در دیسک با بهینه سازی موقعیت مکانی اطلاعات.
* بازیابی سریع پس از خرابی ها - می توانید منابع موقت ایجاد کنید ، پشتیبان گیری را روی آنها قرار دهید و سرورها را به آنها متصل کنید ، و اطلاعات را بدون شتابزدگی به طور مستقل بازیابی کنید ، یا منابع را به سرورهای دیگر منتقل کنید و با سخت افزار سخت گیر برخورد کنید.
* کاهش زمان پشتیبان گیری - به لطف سرعت انتقال بالا ، می توانید سریعتر به یک کتابخانه نوار پشتیبان تهیه کنید ، یا حتی یک عکس فوری (عکس فوری) با آن بگیرید سیستم فایل و آن را بی سر و صدا بایگانی کنید.
* فضای دیسک در صورت تقاضا - در صورت نیاز - همیشه می توانیم دو قفسه به سیستم ذخیره سازی اضافه کنیم.
* ما هزینه ذخیره سازی یک مگابایت اطلاعات را کاهش می دهیم - به طور طبیعی ، یک آستانه خاص وجود دارد که این سیستم ها از آن سودآور هستند.
* مکانی قابل اعتماد برای ذخیره اطلاعات مهم و مهم تجاری (بدون آن سازمان نمی تواند وجود داشته باشد و به طور عادی کار کند).
* می خواهم VMWare را جداگانه ذکر کنم - تمام تراشه هایی مانند انتقال ماشین های مجازی از سرور به سرور و سایر موارد خوب فقط در SAN در دسترس هستند.

از چه چیزی تشکیل شده است؟
همانطور که در بالا نوشتم ، سیستم ذخیره سازی شامل دستگاه های ذخیره سازی ، رسانه های انتقال و سرورهای متصل است. بیایید به ترتیب در نظر بگیریم:

سیستم های ذخیره سازی معمولاً از دیسک های سخت و کنترل کننده تشکیل شده است ، به طور معمول در یک سیستم احترام به خود ، فقط 2 تا 2 کنترل کننده ، 2 مسیر به هر دیسک ، 2 رابط ، 2 منبع تغذیه ، 2 مدیر وجود دارد. از معتبرترین تولیدکنندگان سیستم می توان به HP ، IBM ، EMC و Hitachi اشاره کرد. در اینجا من یک نماینده EMC را در سمینار نقل می کنم - "HP چاپگرهای خوبی می سازد. پس بگذارید او آنها را انجام دهد! " من گمان می کنم HP همچنین علاقه زیادی به EMC دارد. رقابت بین تولید کنندگان جدی است ، اما ، مانند هرجای دیگر. پیامدهای این رقابت گاهی قیمت های معقول در هر مگابایت ذخیره سازی و مشکلات سازگاری و پشتیبانی از استانداردهای رقابتی ، به ویژه با سخت افزارهای قدیمی است.

رسانه انتقال داده... معمولاً SAN ها بر اساس اپتیک ساخته می شوند ، این در حال حاضر سرعت 4 ، در بعضی نقاط 8 گیگابیت در هر کانال را می دهد. هنگام ساخت ، قبلاً از هاب های اختصاصی استفاده می شد ، اکنون کلیدهای بیشتری وجود دارد ، عمدتا از Qlogic ، Brocade ، McData و Cisco (من دو مورد آخر را هرگز در سایتها ندیده ام). کابل ها به طور سنتی برای شبکه های نوری استفاده می شوند - تک حالته و چند حالته ، تک حالته ، برد بلندتر.
به صورت داخلی ، FCP استفاده می شود - پروتکل کانال فیبر ، یک پروتکل حمل و نقل. به طور معمول ، SCSI کلاسیک در داخل آن اجرا می شود و FCP آدرس دهی و تحویل را فراهم می کند. یک گزینه با اتصال از طریق یک شبکه عادی و iSCSI وجود دارد ، اما معمولاً از یک شبکه محلی (و به شدت بارگیری می کند) و نه یک شبکه اختصاصی برای انتقال داده استفاده می کند و به آداپتورهایی با پشتیبانی iSCSI نیاز دارد ، سرعت آن کمتر از نوری است.

همچنین یک توپولوژی کلمه زبانی وجود دارد که در همه کتابهای درسی SAN یافت می شود. چندین توپولوژی وجود دارد ، ساده ترین گزینه نقطه به نقطه است ، ما 2 سیستم را به هم متصل می کنیم. این یک DAS نیست ، بلکه یک اسب کروی در خلاuum است ، ساده ترین نسخه SAN. بعد حلقه کنترل شده (FC-AL) می آید ، طبق اصل "انتقال" کار می کند - فرستنده هر دستگاه به گیرنده بعدی متصل است ، دستگاه ها به صورت حلقه ای بسته می شوند. زنجیره های طولانی مدت زیادی طول می کشد تا شروع شود.

خوب ، گزینه نهایی یک ساختار سوئیچ شده (Fabric) است ، که با استفاده از سوئیچ ها ایجاد می شود. ساختار اتصالات بسته به تعداد درگاههای متصل شده ، همانند ساخت و ساز ساخته شده است شبکه محلی... اصل اساسی ساخت این است که همه مسیرها و اتصالات کپی می شوند. این بدان معنی است که حداقل 2 مسیر مختلف برای دسترسی به هر دستگاه در شبکه وجود دارد. در اینجا نیز از کلمه توپولوژی به معنای سازماندهی نمودار اتصال دستگاه و سوئیچ های اتصال استفاده می شود. در این حالت ، به طور معمول ، سوئیچ ها به گونه ای پیکربندی می شوند که سرورها به جز منابعی که برای آنها در نظر گرفته شده است ، چیزی نمی بینند. این با ایجاد ایجاد می شود شبکه های مجازی و منطقه بندی نامیده می شود ، نزدیکترین قیاس VLAN است. به هر دستگاه در شبکه ، آنالوگ آدرس MAC در شبکه اترنت اختصاص داده شده است ، WWN - نام جهانی نامیده می شود. این به هر رابط و هر منبع ذخیره (LUN) اختصاص داده شده است. آرایه ها و سوئیچ ها می توانند دسترسی WWN را برای سرورها متمایز کنند.

سرور از طریق HBA - Adapter Bus Bus به سیستم ذخیره سازی متصل می شود. به قیاس با کارتهای شبکه آداپتورهای یک ، دو ، چهار پورت وجود دارد. بهترین تولیدکنندگان سگ توصیه می کنند 2 آداپتور در هر سرور نصب کنید ، این امر هم به توازن بار کمک می کند و هم قابلیت اطمینان را تضمین می کند.

و سپس منابع در سیستم های ذخیره سازی قطع می شوند ، آنها همچنین دیسک (LUN) برای هر سرور هستند و فضای ذخیره ای باقی مانده است ، همه چیز روشن می شود ، نصب کنندگان سیستم توپولوژی را تجویز می کنند ، در تنظیم سوئیچ ها و دسترسی اشکالات ایجاد می کنند ، همه چیز شروع می شود و همه با شادی زندگی می کنند *.
من به طور خاص در شبکه های نوری به انواع مختلف پورت ها توجه نمی کنم ، چه کسی به آن نیاز دارد - او قبلاً می داند یا می خواند ، که نیازی به آن ندارد - فقط زحمت می کشم. اما طبق معمول ، اگر نوع پورت به اشتباه تنظیم شود ، هیچ مشکلی نخواهد داشت.

از تجربه
معمولاً هنگام ایجاد SAN ، آرایه ها با انواع مختلفی از درایوها مرتب می شوند: FC برای برنامه های پرسرعت و SATA یا SAS برای نمونه های خیلی سریع. بنابراین ، شما 2 گروه دیسک با هزینه های متفاوت برای هر مگابایت دریافت می کنید - گران و سریع ، و کند و غمگین ارزان. در سریع معمولاً همه پایگاه داده ها و برنامه های دیگر با I / O فعال و سریع ، در یک پرونده آهسته - منابع فایل و سایر موارد آویزان می شوند.

اگر SAN از ابتدا ایجاد شده باشد ، ساختن آن بر اساس راه حل های یک تولید کننده منطقی است. واقعیت این است که ، با وجود مطابقت مطابق با استانداردها ، مشکلات سازگاری تجهیزات زیر آب وجود دارد و این یک واقعیت نیست که برخی از تجهیزات بدون رقص با تنبور و مشاوره با تولید کنندگان با یکدیگر کار می کنند. معمولاً برای حل چنین مشکلاتی ، تماس با یک مجتمع و دادن پول به او آسان تر از برقراری ارتباط با تولیدکنندگانی است که تیرها را به یکدیگر منتقل می کنند.

اگر SAN بر اساس زیرساخت های موجود ایجاد شود ، همه چیز ممکن است دشوار باشد ، به خصوص اگر آرایه های قدیمی SCSI و باغ وحش تجهیزات قدیمی از تولید کنندگان مختلف وجود داشته باشد. در این مورد ، منطقی است که از جانور وحشتناک یکپارچه ، که مشکلات سازگاری را باز می کند و ویلای سوم را در جزایر قناری ایجاد می کند ، کمک بگیرید.

اغلب ، هنگام ایجاد سیستم های ذخیره سازی ، شرکت ها پشتیبانی را از سازنده سفارش نمی دهند. این شرط معمولاً در صورتی توجیه می شود که این شرکت دارای کارمندی از مدیران ذیصلاح ذی صلاح (که قبلاً 100 بار من را قوری نامیده اند) و مقدار قابل توجهی سرمایه باشد که به شما امکان می دهد قطعات یدکی را به مقدار لازم خریداری کنید. با این حال ، مدیران صالح معمولاً توسط مجتمعان فریب داده می شوند (من خودم آن را دیده ام) ، و آنها مبلغی را برای خرید اختصاص نمی دهند و پس از شکست ، سیرکی با فریاد "من همه را اخراج می کنم!" شروع می شود. به جای تماس با پشتیبانی و ورود یک مهندس با قطعات یدکی.

پشتیبانی معمولاً به جای جایگزینی دیسک ها و کنترل کننده های مرده خلاصه می شود ، همچنین قفسه های دیسک و سرورهای جدید به سیستم اضافه می شوند. مشکلات زیادی پس از نگهداری پیشگیرانه ناگهانی سیستم توسط متخصصان محلی اتفاق می افتد ، به ویژه پس از خاموش شدن کامل و جدا کردن سیستم از سیستم (و این اتفاق می افتد).

درباره VMWare. تا آنجا که من می دانم (کارشناسان مجازی سازی ، تصحیح کنید) ، فقط VMWare و Hyper-V دارای عملکردی هستند که به شما امکان می دهد ماشین های مجازی را بین سرورهای فیزیکی در حال پرواز منتقل کنید. و برای اجرای آن لازم است که همه سرورهایی که بین آنها حرکت می کنید ماشین مجازیبه همان درایو متصل شده بودند.

درباره خوشه ها. مشابه مورد VMWare ، سیستم های ساخت خوشه های خرابی (Sun Cluster ، Veritas Cluster Server) که من می دانم به ذخیره سازی متصل به همه سیستم ها نیاز دارند.

هنگام نوشتن مقاله - از من س Iال شد - معمولاً چه RAID هایی درایو های ترکیبی هستند؟
در عمل من ، آنها معمولاً RAID 1 + 0 را برای هر قفسه دیسک با دیسک های FC انجام می دادند ، 1 دیسک اضافی (Hot Spare) را می گذاشتند و LUN ها را برای کار از این قطعه می بریدند ، یا RAID5 را از دیسک های آهسته می ساختند ، دوباره 1 دیسک باقی می گذاشتند جایگزین کردن. اما در اینجا این س isال پیچیده است و معمولاً روش سازماندهی دیسک ها در یک آرایه برای هر موقعیت انتخاب و توجیه می شود. به عنوان مثال ، همان EMC حتی فراتر از این هم می رود و آنها یک تنظیم آرایه اضافی برای برنامه هایی دارند که با آن کار می کنند (مثلاً برای OLTP ، OLAP). من آنقدر عمیق با بقیه فروشندگان حفر نکرده ام ، اما حدس می زنم که تنظیم دقیق همه دارند.

* قبل از اولین خرابی بزرگ ، پس از آن پشتیبانی معمولاً از تولید کننده یا فروشنده سیستم خریداری می شود.
از آنجا که هیچ نظری در جعبه شن و ماسه وجود ندارد ، من آن را در وبلاگ شخصی خود ارسال خواهم کرد.

برچسب ها: افزودن برچسب ها

و موارد دیگر ، رسانه انتقال داده و سرورهای متصل به آن. این معمولاً توسط شرکتهای نسبتاً بزرگی با زیرساخت IT پیشرفته برای ذخیره سازی اطلاعات مطمئن و دسترسی سریع به آنها مورد استفاده قرار می گیرد.
ذخیره سازی ساده ، سیستمی است که به سرورها امکان توزیع دیسک های سریع و قابل اطمینان با ظرفیت متغیر را از انواع دستگاه های ذخیره سازی می دهد.

کمی تئوری.
سرور از چند طریق می تواند به انبار داده متصل شود.
اولین و ساده ترین مورد DAS ، Direct Attached Storage (اتصال مستقیم) است ، ما به راحتی دیسک ها را درون سرور قرار می دهیم یا آرایه را در آداپتور سرور قرار می دهیم - و فضای دیسک زیادی گیگابایت با دسترسی نسبتاً سریع به دست می آوریم ، و هنگام استفاده از یک آرایه RAID - قابلیت اطمینان کافی ، اگرچه نیزه ها با موضوع قابلیت اطمینان برای مدت طولانی شکسته شده اند.
با این حال ، این استفاده از فضای دیسک مطلوب نیست - فضای کافی برای یک سرور وجود دارد ، دیگری فضای زیادی دارد. راه حل این مشکل NAS ، Network Attached Storage (حافظه متصل از طریق شبکه) است. با این حال ، با تمام مزایای این راه حل - انعطاف پذیری و مدیریت متمرکز - یک اشکال قابل توجه وجود دارد - سرعت دسترسی ، هنوز همه سازمان ها شبکه 10 گیگابایتی را اجرا نکرده اند. و ما به شبکه منطقه ذخیره سازی می رسیم.

تفاوت اصلی بین SAN و NAS (علاوه بر ترتیب حروف به اختصار) نحوه مشاهده منابع متصل در سرور است. اگر منابع NAS به پروتکل های NFS یا SMB متصل باشند ، در SAN ما یک اتصال دیسک به دست می آوریم که می توانیم با آن در سطح ورودی و خروجی بلوک کار کنیم ، که بسیار سریعتر از اتصال شبکه است (به علاوه یک کنترل کننده آرایه با یک حافظه نهان بزرگ ، سرعت بسیاری از عملیات را اضافه می کند).

با استفاده از SAN ، ما مزایای DAS - سرعت و سادگی و NAS - انعطاف پذیری و مدیریت را ترکیب می کنیم. بعلاوه ، ما توانایی مقیاس گذاری سیستم های ذخیره سازی را داریم تا زمانی که پول کافی وجود دارد ، به طور همزمان چند پرنده را با یک سنگ از بین می بریم ، که بلافاصله قابل مشاهده نیستند:

* محدودیت های محدوده اتصال دستگاه های SCSI را که معمولاً به یک سیم 12 متری محدود می شوند ، برطرف می کنیم
* ما زمان پشتیبان را کاهش می دهیم ،
* ما می توانیم از SAN بوت کنیم ،
* در صورت امتناع از NAS ، ما شبکه را تخلیه می کنیم ،
* به دلیل بهینه سازی سیستم ذخیره سازی ، سرعت I / O بالایی داریم
* این فرصت را داریم که چندین سرور را به یک منبع متصل کنیم ، این دو پرنده زیر را با یک سنگ به ما می دهد:
- ما از قابلیت های VMWare به طور کامل استفاده می کنیم - به عنوان مثال ، VMotion (انتقال یک ماشین مجازی بین فیزیکی) و موارد دیگر مانند آنها ،
- ما می توانیم خوشه های مقاوم در برابر خطا ایجاد کنیم و شبکه های توزیع شده جغرافیایی را سازماندهی کنیم.

چه کار میکند؟
علاوه بر تسلط بر بودجه بهینه سازی ذخیره سازی ، علاوه بر آنچه در بالا نوشتم ، به دست می آوریم:

* افزایش عملکرد ، تعادل بار و در دسترس بودن زیاد سیستم های ذخیره سازی به دلیل مسیرهای دسترسی متعدد به آرایه ها.
* صرفه جویی در دیسک با بهینه سازی موقعیت مکانی اطلاعات.
* بازیابی سریع پس از خرابی ها - می توانید منابع موقت ایجاد کنید ، پشتیبان گیری را روی آنها قرار دهید و سرورها را به آنها متصل کنید و به طور مستقل بدون عجله اطلاعات را بازیابی کنید ، یا منابع را به سرورهای دیگر منتقل کنید و با آرامش با سخت افزارهای مرده برخورد کنید.
* کاهش زمان پشتیبان گیری - به لطف سرعت انتقال بالا ، می توانید سریعتر به یک کتابخانه نوار پشتیبان تهیه کنید ، یا حتی یک عکس فوری (عکس فوری) از سیستم فایل بگیرید و آن را با آرامی بایگانی کنید.
* فضای دیسک در صورت تقاضا - در صورت نیاز - همیشه می توانیم دو قفسه به سیستم ذخیره سازی اضافه کنیم.
* ما هزینه ذخیره سازی یک مگابایت اطلاعات را کاهش می دهیم - به طور طبیعی ، یک آستانه خاص وجود دارد که این سیستم ها از آن سودآور هستند.
* مکانی قابل اعتماد برای ذخیره اطلاعات مهم و مهم تجاری (بدون آن سازمان نمی تواند وجود داشته باشد و به طور عادی کار کند).
* می خواهم VMWare را جداگانه ذکر کنم - تمام تراشه هایی مانند انتقال ماشین های مجازی از سرور به سرور و سایر موارد خوب فقط در SAN در دسترس هستند.

از چه چیزی تشکیل شده است؟
همانطور که در بالا نوشتم ، سیستم ذخیره سازی از دستگاه های ذخیره سازی ، یک رسانه انتقال و سرورهای متصل تشکیل شده است. بیایید به ترتیب در نظر بگیریم:

سیستم های ذخیره سازی معمولاً از دیسک های سخت و کنترل کننده تشکیل شده است ، به طور معمول در یک سیستم احترام به خود ، فقط 2 تا 2 کنترل کننده ، 2 مسیر به هر دیسک ، 2 رابط ، 2 منبع تغذیه ، 2 مدیر وجود دارد. از معتبرترین تولیدکنندگان سیستم می توان به HP ، IBM ، EMC و Hitachi اشاره کرد. در اینجا من یک نماینده EMC را در سمینار نقل می کنم - "HP چاپگرهای خوبی می سازد. پس بگذارید او آنها را انجام دهد! " من گمان می کنم HP همچنین علاقه زیادی به EMC دارد. رقابت بین تولید کنندگان جدی است ، اما ، مانند هرجای دیگر. پیامدهای این رقابت گاهی قیمت های معقول در هر مگابایت ذخیره سازی و مشکلات سازگاری و پشتیبانی از استانداردهای رقابتی ، به ویژه با سخت افزارهای قدیمی است.

رسانه انتقال داده.

معمولاً SAN ها بر اساس اپتیک ساخته می شوند ، این در حال حاضر سرعت 4 ، در بعضی نقاط 8 گیگابیت در هر کانال را می دهد. هنگام ساخت ، قبلاً از هاب های اختصاصی استفاده می شد ، اکنون کلیدهای بیشتری وجود دارد ، عمدتا از Qlogic ، Brocade ، McData و Cisco (من دو مورد آخر را هرگز در سایتها ندیده ام). کابل ها به طور سنتی برای شبکه های نوری استفاده می شوند - تک حالته و چند حالته ، تک حالته ، برد بلندتر.
به صورت داخلی ، از FCP استفاده می شود - پروتکل کانال فیبر ، یک پروتکل حمل و نقل. به طور معمول ، SCSI کلاسیک در داخل آن اجرا می شود و FCP آدرس دهی و تحویل را فراهم می کند. یک گزینه با اتصال از طریق یک شبکه عادی و iSCSI وجود دارد ، اما معمولاً از یک شبکه محلی (و به شدت بارگیری می کند) و نه یک شبکه اختصاصی برای انتقال داده استفاده می کند و به آداپتورهایی با پشتیبانی iSCSI نیاز دارد ، سرعت آن کمتر از نوری است.

همچنین یک توپولوژی کلمه زبانی وجود دارد که در همه کتابهای درسی SAN یافت می شود. چندین توپولوژی وجود دارد ، ساده ترین گزینه نقطه به نقطه است ، ما 2 سیستم را به هم متصل می کنیم. این یک DAS نیست ، بلکه یک اسب کروی در خلاuum است ، ساده ترین نسخه SAN. بعد حلقه کنترل شده (FC-AL) می آید ، طبق اصل "انتقال" کار می کند - فرستنده هر دستگاه به گیرنده بعدی متصل است ، دستگاه ها به صورت حلقه ای بسته می شوند. زنجیره های طولانی مدت زیادی طول می کشد تا شروع شود.

خوب ، گزینه نهایی یک ساختار سوئیچ شده (Fabric) است ، که با استفاده از سوئیچ ها ایجاد می شود. ساختار اتصالات بسته به تعداد درگاه های متصل ، مانند هنگام ساخت یک شبکه محلی ساخته شده است. اصل اساسی ساخت این است که همه مسیرها و اتصالات کپی می شوند. این بدان معنی است که حداقل 2 مسیر مختلف برای دسترسی به هر دستگاه در شبکه وجود دارد. در اینجا نیز از کلمه توپولوژی به معنای سازماندهی نمودار اتصال دستگاه و سوئیچ های اتصال استفاده می شود. در این حالت ، به طور معمول ، سوئیچ ها به گونه ای پیکربندی می شوند که سرورها به جز منابعی که برای آنها در نظر گرفته شده است ، چیزی نمی بینند. این امر با ایجاد شبکه های مجازی حاصل می شود و منطقه بندی نامیده می شود ، نزدیکترین قیاس VLAN است. به هر دستگاه در شبکه ، آنالوگ آدرس MAC در شبکه اترنت اختصاص داده شده است ، WWN - نام جهانی نامیده می شود. این به هر رابط و هر منبع ذخیره (LUN) اختصاص داده شده است. آرایه ها و سوئیچ ها می توانند دسترسی WWN را برای سرورها متمایز کنند.

سرور از طریق HBA - Adapter Bus Bus به سیستم ذخیره سازی متصل می شود. با تشبیه کارت های شبکه ، آداپتورهای یک ، دو ، چهار پورت وجود دارد. بهترین "پرورش دهندگان سگ" توصیه می کنند 2 آداپتور در هر سرور نصب کنید ، این امر هم به توازن بار کمک می کند و هم قابلیت اطمینان را تضمین می کند.

و سپس منابع در سیستم های ذخیره سازی قطع می شوند ، آنها همچنین دیسک (LUN) برای هر سرور هستند و فضای ذخیره ای باقی مانده است ، همه چیز روشن می شود ، نصب کنندگان سیستم توپولوژی را تجویز می کنند ، در تنظیم سوئیچ ها و دسترسی اشکالات ایجاد می کنند ، همه چیز شروع می شود و همه با شادی زندگی می کنند *.
من به طور خاص در شبکه های نوری به انواع مختلف پورت ها توجه نمی کنم ، چه کسی به آن نیاز دارد - او قبلاً می داند یا می خواند ، که نیازی به آن ندارد - فقط مزاحم آن می شوم. اما طبق معمول ، اگر نوع پورت به اشتباه تنظیم شود ، هیچ مشکلی نخواهد داشت.

از تجربه
معمولاً هنگام ایجاد SAN ، آرایه ها با انواع مختلفی از درایوها مرتب می شوند: FC برای برنامه های پرسرعت و SATA یا SAS برای نمونه های خیلی سریع. بنابراین ، شما 2 گروه دیسک با هزینه های مختلف برای هر مگابایت دریافت می کنید - گران و سریع ، و کند و غم انگیز ارزان. در سریع معمولاً همه پایگاه داده ها و برنامه های دیگر با I / O فعال و سریع ، در یک پرونده آهسته - منابع فایل و سایر موارد آویزان می شوند.

اگر SAN از ابتدا ایجاد شده باشد ، ساختن آن بر اساس راه حل های یک تولید کننده منطقی است. واقعیت این است که ، با وجود مطابقت مطابق با استانداردها ، مشکلات سازگاری تجهیزات زیر آب وجود دارد و این یک واقعیت نیست که برخی از تجهیزات بدون رقص با تنبور و مشاوره با تولید کنندگان با یکدیگر کار می کنند. معمولاً برای حل چنین مشکلاتی ، تماس با یک مجتمع و دادن پول به او آسان تر از برقراری ارتباط با تولیدکنندگانی است که تیرها را به یکدیگر منتقل می کنند.

اگر SAN بر اساس زیرساخت های موجود ایجاد شود ، همه چیز ممکن است دشوار باشد ، به خصوص اگر آرایه های SCSI قدیمی و باغ وحش تجهیزات قدیمی از تولید کنندگان مختلف وجود داشته باشد. در این مورد ، منطقی است که از جانور وحشتناک یکپارچه ، که مشکلات سازگاری را باز می کند و ویلای سوم را در جزایر قناری ایجاد می کند ، کمک بگیرید.

اغلب ، هنگام ایجاد سیستم های ذخیره سازی ، شرکت ها پشتیبانی را از سازنده سفارش نمی دهند. این شرط معمولاً در صورتی توجیه می شود که این شرکت دارای کارمندی از مدیران ذیصلاح ذی صلاح (که قبلاً 100 بار من را قوری نامیده اند) و مقدار قابل توجهی سرمایه باشد که به شما امکان می دهد قطعات یدکی را به مقدار لازم خریداری کنید. با این حال ، مدیران صالح معمولاً توسط مجتمعان فریب داده می شوند (من خودم آن را دیده ام) ، و آنها مبلغی را برای خرید اختصاص نمی دهند و پس از شکست ، سیرکی با فریاد "من همه را اخراج می کنم!" شروع می شود. به جای تماس با پشتیبانی و ورود یک مهندس با قطعات یدکی.

پشتیبانی معمولاً به جای جایگزینی دیسک ها و کنترل کننده های مرده خلاصه می شود ، همچنین قفسه های دیسک و سرورهای جدید به سیستم اضافه می شوند. مشکلات زیادی پس از نگهداری پیشگیرانه ناگهانی سیستم توسط متخصصان محلی اتفاق می افتد ، به ویژه پس از خاموش شدن کامل و جدا کردن سیستم از سیستم (و این اتفاق می افتد).

درباره VMWare. تا آنجا که من می دانم (کارشناسان مجازی سازی ، تصحیح کنید) ، فقط VMWare و Hyper-V دارای عملکردی هستند که به شما امکان می دهد ماشین های مجازی را بین سرورهای فیزیکی در حال پرواز منتقل کنید. و برای اجرای آن لازم است که همه سرورهایی که ماشین مجازی بین آنها حرکت می کند به یک دیسک متصل شوند.

درباره خوشه ها. مشابه مورد VMWare ، سیستم های ساخت خوشه های خرابی (Sun Cluster ، Veritas Cluster Server) که من می دانم به ذخیره سازی متصل به همه سیستم ها نیاز دارند.

هنگام نوشتن مقاله - از من سال شد - معمولاً از چه RAID هایی برای ترکیب دیسک استفاده می شود؟
در عمل من ، آنها معمولاً RAID 1 + 0 را برای هر قفسه دیسک با دیسک های FC انجام می دادند ، 1 دیسک اضافی (Hot Spare) را می گذاشتند و LUN ها را برای کار از این قطعه می بریدند ، یا RAID5 را از دیسک های آهسته می ساختند ، دوباره 1 دیسک باقی می گذاشتند جایگزین کردن. اما در اینجا این س isال پیچیده است و معمولاً روش سازماندهی دیسک ها در یک آرایه برای هر موقعیت انتخاب و توجیه می شود. به عنوان مثال ، همان EMC حتی فراتر از این هم می رود و آنها یک تنظیم آرایه اضافی برای برنامه هایی دارند که با آن کار می کنند (مثلاً برای OLTP ، OLAP). با بقیه فروشندگان ، من خیلی عمیق حفاری نکرده ام ، اما حدس می زنم همه تنظیم دقیق داشته باشند.

* قبل از اولین خرابی بزرگ ، پس از آن پشتیبانی معمولاً از تولید کننده یا فروشنده سیستم خریداری می شود.

مشکل ذخیره سازی پرونده هرگز مانند امروز حاد نبوده است.

ظهور درایوهای سخت با ظرفیت 3 و حتی 4 ترابایت ، دیسک های Blu-Ray با ظرفیت 25 تا 50 گیگابایت ، فضای ذخیره سازی ابری مشکلی را حل نمی کند. دستگاه های بیشتری در اطراف ما تولید می شوند که محتوای سنگین اطراف ما تولید می کنند: دوربین های عکس و فیلم ، گوشی های هوشمند ، تلویزیون و فیلم HD ، کنسول های بازی و غیره. ما صدها و هزاران گیگابایت (عمدتا از طریق اینترنت) تولید و مصرف می کنیم.

این منجر به این واقعیت می شود که رایانه یک کاربر متوسط \u200b\u200bتعداد زیادی فایل ، صدها گیگابایت را ذخیره می کند: بایگانی عکس ، مجموعه ای از فیلم های مورد علاقه ، بازی ها ، برنامه ها ، اسناد کاری و غیره

همه اینها نه تنها باید ذخیره شود ، بلکه در برابر خطرات و تهدیدهای دیگر نیز محافظت می شود.

راه حل های شبه ای برای مسئله

می توانید کامپیوتر خود را به یک هارد دیسک بزرگ مجهز کنید. اما در این حالت این س arال مطرح می شود: مثلاً چگونه و از کجا بایگانی می شود ، داده های یک دیسک 3 ترابایتی؟!

می توانید دو درایو قرار دهید و از آنها در حالت RAID آینه استفاده کنید ، یا فقط به طور مرتب از یکی به دیگری پشتیبان بگیرید. این نیز بهترین گزینه نیست. فرض کنید کامپیوتر شما توسط ویروس ها مورد حمله قرار گرفته است: به احتمال زیاد ، آنها اطلاعات هر دو درایو را آلوده می کنند.

با سازماندهی بایگانی Blu-ray خانگی می توانید داده های مهم را بر روی دیسکهای نوری ذخیره کنید. اما استفاده از آن بسیار ناخوشایند خواهد بود.

فضای ذخیره سازی متصل به شبکه راه حل مشکل است! تا حدی ...

فضای ذخیره سازی متصل به شبکه (NAS) - ذخیره سازی پرونده شبکه. اما می توان حتی ساده تر توضیح داد:

فرض کنیم شما دو یا سه کامپیوتر در خانه دارید. آنها به احتمال زیاد به یک شبکه محلی (سیمی یا بی سیم) و به اینترنت متصل هستند. Network Attached Storage یک رایانه تخصصی است که در رایانه شما تعبیه شده است شبکه خانگی و به اینترنت متصل می شود.

در نتیجه ، NAS می تواند هر یک از داده های شما را ذخیره کند و شما می توانید از طریق هر رایانه خانگی یا لپ تاپ به آنها دسترسی داشته باشید. با نگاه به جلو ، گفتن این نکته ضروری است که شبکه محلی باید به اندازه کافی مدرن باشد تا بتوانید به سرعت ده ها و صدها گیگابایت را از طریق آن بین سرور و رایانه ها "پمپ کنید". بعداً در این باره بیشتر توضیح دهید.

از کجا می توان NAS گرفت؟

روش اول: خرید. NAS کم و بیش مناسب با 2 یا 4 هارد دیسک را می توانید با قیمت 500-800 دلار خریداری کنید. چنین سروری در یک مورد کوچک بسته بندی می شود و آماده کار است ، همانطور که می گویند ، "خارج از جعبه".

با این حال ، PLUS این 500-800 دلار هزینه هارد دیسک ها را اضافه می کند! به طور معمول NAS بدون آنها فروخته می شود.

جوانب مثبت: شما یک دستگاه آماده دریافت می کنید و حداقل زمان را صرف می کنید.

معایب این راه حل: هزینه NAS مانند رایانه رومیزی است اما از قابلیت های کم نظیر کمتری برخوردار است. در واقع ، این فقط یک شبکه است درایو خارجی برای پول زیاد با صرف هزینه زیادی ، مجموعه ای محدود و ناخوشایند از ویژگی های شما به دست می آید.

راه حل من: خودت بساز!

این بسیار ارزان تر از خرید NAS جداگانه است ، اگرچه کمی بیشتر طول می کشد زیرا ماشین را خودتان مونتاژ می کنید). با این حال ، یک سرور خانگی کامل دریافت می کنید که در صورت تمایل می تواند در دامنه کامل توانایی های آن استفاده شود.

توجه!من با استفاده از ساخت سرور خانگی به شدت دلسرد می شوم کامپیوتر قدیمی یا اجزای قدیمی و فرسوده. فراموش نکنید که سرور پرونده مخزن داده های شما است. در تهیه هرچه بیشتر قابل اعتماد بودن آن بخل ورزید تا روزی تمام پرونده های شما همراه با هارد دیسک ها "نسوزند" ، مثلاً به دلیل خرابی در مدار تغذیه مادربرد ...

بنابراین ، تصمیم گرفتیم یک سرور فایل خانگی بسازیم. رایانه ای که هارددیسک های آن برای استفاده در شبکه خانگی موجود است. بر این اساس ، ما به چنین رایانه ای نیاز داریم تا از نظر مصرف برق مقرون به صرفه باشد ، ساکت ، کم حجم ، گرمای زیادی تولید نمی کند و عملکرد کافی دارد.

بر این اساس ، راه حل ایده آل مادربرد با پردازنده یکپارچه و خنک کننده غیر فعال، اندازه جمع و جور

من مادربرد رو انتخاب کردم ASUS С-60M1-I . این از فروشگاه آنلاین dostavka.ru خریداری شده است:



این بسته شامل یک کتابچه راهنمای کاربر با کیفیت بالا ، یک سی دی همراه با درایورها ، یک برچسب برای کیس ، 2 کابل SATA و یک صفحه عقب برای کیس است:



ASUS ، مثل همیشه ، خیلی سخاوتمندانه هیئت مدیره را بهم پیوسته است. مشخصات کامل صفحه را می توانید در اینجا پیدا کنید: http://www.asus.com/Motherboard/C60M1I/# مشخصات. من فقط به چند نکته مهم اشاره می کنم.

فقط با هزینه 3300 روبل - 80٪ از تمام نیازهای سرور را تأمین می کند.

در هیئت مدیره است پردازنده دو هسته ای AMD C-60 با تراشه گرافیکی یکپارچه. پردازنده فرکانس دارد 1 گیگاهرتز(می تواند به طور خودکار به 1.3 گیگاهرتز افزایش یابد). امروزه در برخی از نت بوک ها و حتی لپ تاپ ها نصب شده است. کلاس پردازنده اتم اینتل D2700. اما همه می دانند که اتم در محاسبات موازی مشکل دارد ، که اغلب عملکرد آن را نفی می کند. اما C-60 فاقد این اشکال است و علاوه بر این مجهز به گرافیک کاملاً قدرتمندی برای این کلاس است.

دو اسلات حافظه موجود است DDR3-1066، با قابلیت نصب حداکثر 8 گیگابایت حافظه.

این برد شامل 6 پورت روی صفحه است SATA 6Gbps... این به شما امکان می دهد تا 6 دیسک (!) ، و نه فقط 4 ، مانند NAS معمولی برای خانه به سیستم متصل شوید.

مهمترین چیز چیست - هیئت مدیره بر اساس است UEFIو نه BIOS که ما به آن عادت کرده ایم. این بدان معنی است که سیستم می تواند با هارددیسک های بزرگتر از 2.2 TB به طور معمول کار کند. او کل حجم آنها را "می بیند". مادربردهای مبتنی بر BIOS نمی توانند با هارددیسک های بزرگتر از 2.2 گیگابایت بدون "برنامه های کاربردی عصا" ویژه کار کنند. البته ، اگر ما در مورد قابلیت اطمینان ذخیره اطلاعات و در مورد سرورها صحبت کنیم ، استفاده از چنین ابزارهای غیر قابل قبول است.

C-60 یک پردازنده نسبتاً سرد است ، بنابراین فقط با یک هیت سینک آلومینیومی خنک می شود. این کافی است تا حتی در لحظه بارگیری کامل ، دمای پردازنده بیش از 50-55 درجه افزایش پیدا نکند. هنجار چیست



مجموعه ای از درگاه ها کاملاً استاندارد است و تنها ناامیدکننده نبود USB 3.0 جدید است. و من به ویژه می خواهم به وجود یک پورت شبکه گیگابیتی کامل پاسخ دهم:


روی این صفحه 2 ماژول 2 گیگابایتی DDR3-1333 از پاتریوت نصب کردم:


Windows 7 Ultimate بر روی هارد دیسک WD 500 GB Green نصب شده است و برای داده های من یک هارد دیسک Hitachi-Toshiba 3TB خریداری کردم:



تمام این تجهیزات توسط یک واحد منبع تغذیه FSP 400 وات تأمین می شوند که البته با حاشیه.

مرحله نهایی مونتاژ همه این تجهیزات در یک مورد mini-ATX بود.

بلافاصله پس از مونتاژ ، من نصب کردم کامپیوتر ویندوز 7 Ultimate (نصب حدود 2 ساعت طول کشید ، که با توجه به سرعت کم پردازنده طبیعی است).

بعد از همه اینها ، صفحه کلید ، ماوس و مانیتور را از کامپیوتر جدا کردم. در واقع ، تنها مانده است واحد سیستم از طریق کابل به شبکه محلی متصل می شود.

کافی است IP محلی این رایانه در شبکه را بخاطر داشته باشید تا از طریق دستگاه استاندارد Windows "اتصال به دسک تاپ از راه دور" به آن متصل شوید:


من عمداً تخصصی نصب نکردم سیستم عامل برای سازماندهی ذخیره سازی پرونده ، مانند FreeNAS. در واقع ، در این مورد ، تهیه یک رایانه شخصی جداگانه برای این نیازها منطقی نیست. فقط می توان NAS خریداری کرد.

اما یک سرور خانگی جداگانه ، که می تواند یک شبه بارگیری شود و از آن خارج شود ، جالب تر است. علاوه بر این ، مدیریت رابط آشنا ویندوز 7 آسان است.

هزینه کل سرور خانگی بدون درایو های سخت 6000 روبل بود.

اضافه مهم

هنگام استفاده از هر NAS ، پهنای باند شبکه بسیار مهم است. بعلاوه ، حتی شبکه کابلی معمول 100 مگابایتی هم از این که مثلاً بایگانی را از رایانه خود در سرور خانه خود انجام می دهید خوشحال نمی شود. انتقال 100 گیگابایت از طریق یک شبکه 100 مگابیتی در حال حاضر چند ساعت است.

در مورد Wi-Fi چه می توانیم بگوییم. اگر از Wi-Fi 802.11n استفاده می کنید خوب است - در این حالت ، سرعت شبکه در حدود 100 مگابیت حفظ می شود. و در مورد استاندارد 802.11g که سرعت آن به ندرت بیش از 30 مگابیت است ، چه می کنید؟ این بسیار بسیار کوچک است.

هنگام برقراری ارتباط با سرور از طریق شبکه سیمی ایده آل است اترنت گیگابیت... در این حالت ، واقعا سریع است.

اما من نحوه ساخت چنین شبکه ای را به سرعت و با حداقل هزینه در یک مقاله جداگانه به شما خواهم گفت.