Typy procesorů Intel jsou numerické. Haswell - název čtvrté generace držení, de zastosovaya іnnovatsiyna arhіtektura.

Speciálně pro ně byla rozdělena rodina nových čipsetů osmé řady. Práce s SSD je optimalizována. Vydání architektury bylo na klasu černého rocku 2013.

Haswellův pohled

Od roku 2013 jsou vydávány anonymní modely procesorů. Samostatný procesor je umístěn jako prodejce pro použití v noteboocích, ultraboocích a tabletech pro nízkou spotřebu energie. Zvyšte produktivitu, aby maloobchodníci mohli zastupovat společnost Haswell as nejlepší procesory intel pro mobilní zařízení přítomný okamžik. Dvoujádrové procesory Core i3 haswell jsou dostupné ve třech různých typech:

  1. i3-4340;
  2. i3-4330;
  3. i3-4130.

Dělí je hodinová frekvence, kterou lze u tří modelů nastavit na 3,6, 3,5, 3,4 GHz. Nové grafické jádro u prvních dvou modelů představuje HD Graphics 4600, u třetího pak HD Graphics 4400. Frekvence celého jádra je 1150 MHz. L3 - platná mezipaměť 4, 4 a 3 MB. Cena se mírně liší - za první možnost - 160 USD, za druhou - 150 USD a za třetí - 130 USD.

i5 haswell je vybaven grafickým jádrem HD Graphics 4600. Taktovací frekvence je 3,2 GHz, s turbo boostem 3,6. 6 MB mezipaměti. Tepelný výkon je nízký a s aktivním spínačem není potřeba další chladič.

Ale procesor i7 převrátit i3 chi i5. Zastoupení jsou i7-4770K, i7-4770, i7-4770S, i7-4770T a i7-4765T. První dva pracují na choti-core procesoru pro 8 streamů, stejně jako reshta - pro chotiri.

Frekvence hodin na nejnižší úrovni zbytek modelu a dražší 2 GHz, první má 3,5 GHz. Mezipaměť 8 MB

Vlastnosti Haswell

Haswell je název nové architektury procesorů, procesory na ní založené jsou také nazývány. Výpočtové jádro rozšíření rozpoznalo změnu oproti předchozí verzi. Přední procesor se může změnit. Jádro dekodéru je chotyricanální, průměrný počet příkazů je nastavit 4 bajty, najednou můžete zpracovat až 16 bajtů. Skládá se z několika jednoduchých dekodérů a jednoho skládacího. Pokyny jsou dekódovány pomocí technologií Macro-Fusion a Micro-Fusion.

8kanálová mezipaměť dekódovaných operací ušetří 1500 mikrooperací na 4 bajty. Pleť z 8 bank za 32 kešu, z toho je v pleti zahrnuto až 6 mikrooperací. Smysl takové banky spočívá v tom, že nedekóduje opakovaně, ale dekóduje již dekódovanou operaci přímo z cache.

Změněny bloky ikon v jádru. Počet portů byl zvýšen na 8. Nyní lze v jednom cyklu napočítat až 8 mikrooperací. Byla zavedena nová sada pokynů.

Testy výkonu byly provedeny na bázi Windows a Android. Testování intel core i7 - 4770 probíhalo základními procesy a doplňky, jako ukazatel byla brána hodina zadaného provozu. V důsledku testu na neherních doplňcích se ukázaly indexy procesorů Intel Haswell vyšší, u starších modelů nižší.

Největší nárůst výkonu u doplňků Photoshopu, Adobe Premier Pro a dalších.

Za pomoci 3DMark Professional byl proveden test fungování herních programů. Výsledky ukazují, že v subsystému robotické grafiky došlo k pokroku. Gra bez zastavení samostatné grafické grafické karty je nemožné. Grafický procesor Vbudovana není dobrý.

Výhody procesoru Haswell

Haswell - generace Intel Core, Co může být málo odpůrců. Ten smrad ví, že na něj není dost peněz, tak se na tom odvíjí cena, nebo je potřeba platformu příliš často aktualizovat. Toto vlastnictví však může mít řadu plusů. Cena a vysoká účinnost a produktivita a funkční platforma a in.

  • Head plus, stejně jako procesor Volodymyr, je integrované grafické jádro. Vono se stalo konkurenceschopným. Bylo možné podporovat velké množství monitorů a výrazně zvýšit produktivitu;
  • Přídavné zařízení může zlepšit energetickou účinnost. Ve spojení s předchozími verzemi bylo možné snížit jógu o 5 Vativ v klidovém režimu. Cena není na stolní PC až tak skvělá, ale záleží, jestli si vyberete notebook nebo ultrabook. Úspory elektřiny při nízké poptávce;
  • Produktivita vzrostla o 5 - 10 % oproti minulým generacím. Vіdrіznyaєtsya zatuchlý a s myslí těsta. V okremih vpadkah může být vyšší nebo nižší. Maloobchod není tak významný, takže je třeba upgradovat základní systém předchozí generace, prote znachne, takže si vyberete procesor, který nahradí starý;
  • Systém přetaktování procesoru přes základní frekvenci se stal gnuchkishem. Tim sám bulo rozrobniki vіdpovіli na nároky koristuvachі v perednіy verze pristroїv.

procesory Intel pentium haswell rozroblyayutsya důležité pro zastosuvannya v notebookech. Sotva dostačující pro stolní PC zatím nejsou k dispozici a v notebookech není možné dosáhnout vysokých taktů, velké cache a výkonnějších 8 jader. V této kategorii budou mít fanoušci stacionárních počítačů možnost zkontrolovat si další distribuce.

Upgradováním Sandy Bridge až na doraz a jeho převedením na nový technický proces Intel přikročil k černému kameni „tock“, který byl dříve šířen samotným kamenem.

"Tik-tak" Intel - nespustí bombu, ale bez problémů symbol technologického pokroku

Na liniích tocku, jak křičí ilustrace, je nutné představit novou architekturu. Co se vyvinulo - svět vypracoval mikroarchitekturu pod kódovými názvy Haswell a 14 modelů procesorů Core i5 a i7, které jsou založeny na nejnovějších, pod LGA 1150 roses (také známé jako Socket H3), včetně nízkých Napájení. Vzagali, téma úspory energie (nebo přesněji „úspora energie, adekvátní tlaku pro výpočet průtoku“) se jako červená nit protáhne mikroarchitekturou Haswell, takže Intel má velkou budoucnost pro její vytvoření v mobilního segmentu a bez procesoru nebo SoC se sníženými chutěmi není nic. Jeho hlavní konkurent, soudě podle podobností v oboru, Intel používá procesory založené na ARM, střípky smradu se již v mobilním segmentu zabydlely a ukázaly svou vitalitu.

Na poli života už procesory Intelu hodně narostly. Kromě cob regulace TDP pouze pro dodatečné napětí napětí procesoru, které se přivádí na novou základní desku a taktovací frekvenci jader, přenesl Intel část konverze na CPU, čímž si umožnil zpřesnit ( a proto efektivně) dávkují napětí na kůži další bloky, které jsou na krystalu našity. V té době již procesor přestal být procesorem při primárním chápání slova a zapnul řadič paměti a další části pivnichnoy mostu (NB), což umožnilo jeho čas odpustit rozvod základní desky a snížit výkon spojení CPU + NB.

Práce s jídlem probíhala i v rámci racionálního vikoristánu, pokud ta chi jednotka fungovala (čti - šetří elektriku) jen v požadovaných okamžicích a v době nečinnosti byla zapnutá a nevynakládala energii na nic. Jedním z plodů této přímé práce bylo, že se v systémech Intel objevil řádově stav S0 stavu S0ix, což výrazně zkrátilo energii procesoru v okamžiku, kdy jsem byl nečinný, dokud se nestal „spánkový systém“ (stav S3, notebook se po zabouchnutí obrazovky v pracovní stanici přepne na nový). Ve skutečnosti by systém mohl „spát“ naprosto transparentně pro budícího volajícího, přechody S0ix mohly trvat 450 mikrosekund a probuzení - 3,2 milisekundy (0,00045 s a 0,0032 s za sekundu). Pro uložení obrazovky v aktivní stanici byla rozšířena technologie PSR (Panel Self-Refresh), která dokáže zohlednit přítomnost bufferu, který ušetří část zbývajících snímků. To vám umožní snížit tlak na grafický procesor, zejména pokud se informace na obrazovce neaktualizují často (například čtení textu), což vám samo o sobě dává příležitost snížit spotřebu energie grafiky. procesor.

Nový procesor Intel výrazně lépe šetří energii konkurentům

Pravda, pro jaké zařízení je potřeba monitor ze strany monitoru, aby se tento způsob úspory energie mohl široce uplatnit v mobilním segmentu, de monitor a počet dílů jsou jedním rozšířením. Ale pro demonstraci by měl být vhodnější zadek Intelu, tím spíše, že znali implementaci v procesorech založených na architektuře Haswell. Takže blok PCU (Power Control Unit) v Haswellu je ještě efektivnější při získávání energie pro bezmozkové „robotické režimy“, zatímco v skinu jsou potřeba pouze aktivní bloky. Tse, stejně jako Intel zapevnyayut, umožnil u poslední (třetí) generace procesorů pětkrát snížit spotřebu energie v době nečinnosti. Přechod mezi „režimy“ se zrychlil o čtvrtinu, což umožňuje aktivnější vytvrzování jader udržujících energii a „chrapot“ inspirující v tichých depresích, jako v minulé generaci, kdy byly koule nedostatečně napájeny přes dlouhou- termín zapnutí / postup vymazání. Tady jádro na pár milisekund „spalo“, ušetřili jsme zlomek miliwattu, tam „usnulo“ ... Takže ochrana je získána.

Vnitřní architektura procesoru byla také vážně upgradována, i když globálně se nic nezměnilo. Intel pokračuje ve zdokonalování a zdokonalování architektury, která uvízla v Conroe. Pravda je, že síla mezi Ivy Bridge a Haswell je výrazně větší, nižší mezi Sandy Bridge a Ivy Bridge. Zbytek, podle mého skromného názoru, vyšel jako restyling pro Sandy; iz suttєvih zmin je možné vidět pouze přechod z 32 nm na 22 nm technický proces.

Architektura Intel Haswell při pohledu na okruh

Blok procesoru Haswell ušetřil 14–19 fází pipeline, aniž by se změnily přechody a mezipaměť pro opakování tisíců mikroinstrukcí, a blok dekódovacích instrukcí je nyní jeden a nelze jej sdílet mezi dvěma vlákny. Rozšíření bloku Out-of-Order Window (OoO) se zvýšilo ze 168 na 192 záznamů a rezervační stanice získala dva porty, čímž se celkový počet zvýšil na osm. Sandy Bridge měl šest portů pro paralelní provádění šesti mikrooperací. Tři z nich se používají pro operace z paměti (čtení/zápis), tři pro matematické operace. Jeden z datových portů je vítězný pro vikonannya tsilih matematické operace a vyřazení z provozu a druhý - pro výpočet adresy.

Bloky FMA (Fused Multiply-Add) byly přestavěny na portech 0-1 a byla také přidána podpora instrukční sady AVX2 (Advanced Vector Extensions 2). To umožňuje výrazné zvýšení produktivity, jak se stejným typem, tak s jiným druhem ješitnosti, ale přesto se nejvíce zvýšil počet operací, což se vznáší - Intel deklaruje zvýšení produktivity.

Nové sady instrukcí - záruka budoucí účinnosti

V praxi se nárůst odhaduje při práci s multimediálním obsahem a ve 3D.

Nový blok FMA

Neztrácejte pózu respektu a KESh. Rychlost práce L1 a sběrnice mezi L1 a L2 byly větší, od 32 do 64 bajtů na cyklus v obou režimech; latence byla ztracena beze změny. Rozšířený univerzální TLB (Translation Lookaside Buffer): ze 4K na rozšířené 4K + 2M, šířka sběrnice zvýšena na dvě. Přístup k mezipaměti L3 je nyní širší, než je možné, pro zpracování datových a nedatových požadavků přes noc.

Zablokujte TSX, abyste rozšířili rozsah mezi jádry procesorů

Haswell přidal sadu instrukcí TSX (Transactional Synchronization eXtensions), která vám umožní posunout rychlost robotů pro „rozumnou“ operaci s těmito daty, na kterou lze vypálit spršku jader najednou. To může zvýšit efektivitu robotického procesoru s těmito úkoly, protože je důležité rozšířit paralelismus, a také dát programátorům možnost přenést část robotiky z rozložení napětí mezi jádry na procesor. TSX, jako a AVX2 - šikovný nástroj pro maloobchodníky, jako je, hezky je obsluhují, mohou dosáhnout značné velikosti swidcode pro své programy. Z tsієї způsobit rukavici k výsledku "tady a teď" ve formě nových sad kontrolních pokynů ne varto.

Intel se připravuje na vydání nového procesoru Haswell-EX, který povede ke třetí generaci serverových CPU Xeon E7.

Nejvyšší model Haswell EX obsahuje 18 jader s 36 vlákny a tepelný obraz procesoru činí 165 wattů. Tento procesor se bude jmenovat Xeon E7-8890 v3 a hodinová frekvence yogo jádra se stala časem 2,5 GHz. Cache třetího rovného má více než 45 MB, nicméně taková cache L3 cache je v dalších nových procesorech vymazána.

Vedle vlajkové lodi stojí Xeon E7-8867 v3 se stejným TDP a 16 jádry s frekvencí 2,5 GHz.

Mezi další procesory rodiny Haswell-EX patří 14, 12, 10 8 nebo 4 jádra a jejich termovizní je k dispozici v rozsahu od 115 W do 165 W. Hodinové frekvence mají také velký rozsah. Například 10jádrový Xeon E7-4820 v3 běží na 1,9 GHz a 4jádrový Xeon E7-8893 v3 běží na 3,2 GHz.

Třetí generace procesorů Xeon E7 z pochopitelných důvodů odebírá velké množství upgradů, jako je aktualizace instrukcí AVX a TSX a také aktualizace paměti DDR4.

Ceny procesorů Haswell Core i3 a Pentium odhaleny

27 sep 2013 roku

Na výstavě Computex předvedl Intel novou generaci procesorů s mikroarchitekturou Haswell.

První vlnou těchto produktů byly lokální jaderné čipy chotiriya v cenovém rozpětí od 180 do 400 amerických dolarů.

Ale, nedaleko se blíží pohroma CPU druhé generace. Ve verzi Intel prezentovat rozpočtové řešení, jako společnost uvolnit Pentium a Core i3 pod značkami. Představí se také Dekіlka Základní modely i5 a i7, včetně Core i5-4440, i5-4440S a Core i7-4771 a další jsou již k dispozici ke koupi v amerických obchodech.

Otzhe, Procesor Pentium G3220, G3420 a G3430 byly pořízeny na prodejně Shopbit cena forwardového uzávěru je rovna 70,61, 90,18 a 100,26 dolaru, samozřejmě, což jde nahoru s cenami za procesory generace Ivy Bridge modelů G2030, G2130 a G2140. Je pozoruhodné, že CPU nové generace může mít stejné vlastnosti jako předchozí, takže všechny zisky z produktivity budou dostupnější pro zlepšení architektury. Ceny ostatních nízkosegmentových procesorů jsou uvedeny v tabulce.

Modelka

jádra/protéká

Frekvence/Turbo

L3 cache

Grafika

Max. Frekvence GPU

TDP, W

Cena předního zámku

3,1/3,3 GHz

3,5/3,9 GHz

Co se týče Core i5-4440, stojí 197 dolarů. Tento čip nahradí Core i5-4430 za stejnou cenu. Cena předního zámku na akciích Core i7-4771 je 334 USD, což je pouze o 8 USD dražší než i7-4770 s architekturou Ivy Bridge.

Byl odhalen aktualizovaný plán pro procesory Intel

1 srp 2013 roku

Zgidno s novou silnicí karty Intel, Společnost, podle nejbližších osudů, může vyrůst na ultraboocích a rozšířeních 2 v 1, stejně jako na drahém podlahovém segmentu.

Základ podlahových procesorů Intel v ofenzivním rotačním mlýnu Z97 vychází z referenční architektury Haswell. Společnost vydala Ivy Bridge - E, jehož frekvence v režimu Turbo je až 4 GHz. V případě další změny v roce 2014 dojde k náhradám za Haswell-E, který pracuje s pamětí DDR4. Všimněte si, že do konce roku 2014 společnost vyhrála stejnou zásuvku - LGA 1150.

Krym řady Z, společnost plánuje připravit také čipové sady řady U a Y, v takovém případě, jak se ukázalo, odstraní čipové sady SATA3 a USB 3.0.

Prezentováno silniční mapa Demonstruji přechod Intelu na zadní stranu mobilních systémů. Trh s PC se rychle zmenšuje a Intel se snaží dohnat nastupující trendy. I na Computexu se ukázalo, že společnost mluví o vstupu na území dávno zvládnuté firmou ARM – tablety a smartphony.

Pokud chce Intel úspěšně konkurovat ARMu, pak je nutné snížit TDP jeho procesorů. Která společnost může dosáhnout se svými 14nm Haswell a Broadwell, zatímco ARM je stále o skálu napřed, bez ohledu na ty, kteří stojí za Intelem, architektura Broadwell vám umožňuje vytvářet procesory s tepelným zobrazováním méně než 5W a ne aktivním chlazením, zatímco koho to zajímá přílohy 10: 00 autonomní roboty na internetu.

Zvichayno, Úspěch Intelu na jakém trhu to má pro firmu malý význam, která v nejbližších letech pravděpodobně nebude úspěšná, už samotný fakt vstupu na trh mobilních zařízení může ukrást pozici ARM a zapojit se do budoucího rozvoje firem.

Intel Core i7 4770K taktuje až 5 GHz @ 0,9 V

16. května 2013 roku

Do vydání čtvrté generace Core procesorů jako Intel, za kódovými jmény Haswell, už nezbývají žádné dny, není divu, že v Merezh jsou oznámeny nové zprávy o testování těchto CPU. Po prvním zapnutí procesoru Core i7 4770K jej někteří nadšenci vyhnali až na 5 GHz s napětím jádra nižším než 0,9 V.

Na čínském fóru overclockerů Ocaholic.ch bylo oznámeno, že overclocker by mohl dosáhnout cíle přetaktování procesoru. Na ověřovacím snímku obrazovky s údaji CPU-Z je procesor Core i7 4770K taktovaný až na frekvenci 5005,83 MHz s napětím jádra pouze 0,904 V. Jak můžete vidět, Hyper-threading je během přetaktování zakázán. Neexistují také žádná nedávná potvrzení o stabilním provozu takového procesoru, ale pokud se na to cítíte, bez těchto okamžiků je to dokonce nepřátelské, zejména při pohledu na tak nízké napětí.

Mezi další charakteristiky posledního stojanu varto patří 4 GB paměti DDR3 s frekvencí 667,5 MHz a základní deska ASRock deska Z87 Extreme4, který se zatím v prodeji nenašel.

Vіdomosti o procesorech Xeon založených na Haswell

9. dubna 2013

Také procesor Xeon E7 v2 je vidět v roce 2013, Xeon E5-2600 v2 je vidět ve třetím čtvrtletí streamovacího roku. Třetí model, Xeon E5-2400 v2, by se měl rozzářit ve čtvrtém čtvrtletí roku 2014.

Procesor Xeon E7 v2 Brickland z pochopitelných důvodů zabírá až 15 jader a až 37,5 MB mezipaměti třetí vrstvy. CPU také odstraňuje technologii Hyper-threading, což znamená, že dokáže zpracovat až 30 paralelních počítacích vláken najednou. Okrim který procesor odebírá technologii virtualizace VT-x, VT-d a VT-c, Turbo Boost 2.0, Trusted Execution, Secure Key a OS Guard. Jako čipová sada bude platforma čipovat C602J a bude čipovat až 4 škálovací paměťové vyrovnávací paměti na soket. Vzhled s vyrovnávacími pamětmi, které jsou škálovatelné, bude podporovat až tři moduly DDR3-1600, s nimiž lze na procesor skinu nainstalovat maximálně 24 paměťových modulů. Další rozhraní Xeon E7 v2 zahrnují 3 linky QPI a sběrnici PCI Express 3.0 až pro 32 datových linek.

Xeon E5 bude zdemolován. Win bere 12 jader (24 vláken) a 30 MB mezipaměti dalšího rovného. Současně je odstraněno 40 řádků PCI Express 3.0 a 4 kanály paměti DDR3-1866. Třetí model Xeon E5-2400 má 10 jader (20 vláken). Procesor je podle všeho osazen v patici LGA1356.

Intel urychlil vydání Haswell

6. dubna 2012

Vzhledem k vydání procesorů Intel společnost plánuje urychlit vydávání procesorů Haswell a růst výrazně rychlejším tempem, čímž sníží vydání Ivy Bridge. Změňte názor, než Intel uvolní celou řadu CPU najednou, a ne jako Ivy Bridge, pokud existují nejprve některé modely s jádry a pak ty dvoujádrové.

Je zřejmé, že přechod na 22nm procesní technologii může představovat řadu potíží i samotný fakt, že Intel oddaloval vydání nových procesorů. V období od začátku do začátku roku 2013, pokud Intel plánuje uvolnit čipy Haswell, společnost bude jistě čelit technologickým potížím výroby mikroobvodů, takže to bude podobné těm, které se budeme bát nákazy, ale není vinen. Celá řada procesorů Haswell, včetně Core i7, Core i5 a Core i3, se tak přes noc provinila opomenutím.

Když mluvíme o příslibech warto, znamená to, že společnost plánuje spuštění v první polovině roku 2013. další dva procesory Haswell, nižší Ivy Bridge v první polovině roku 2012 Intel sice stejně jako dříve technologicky předčí svět, ale znamená to, že AMD i aliance ARM mají s přechodem na 22nm procesní technologii ještě hodně práce. Přítomnost takového vítězství je pro Intel klíčová, protože mu umožňuje bojovat o přední pozice ve výběru tabletů a možná i telefonů. Tito chlapci se bezpochyby nevzdají bez boje.

Proč se architektura Haswellu říká nová a přestavěná?

Během pěti let Intel prosazuje strategii „tick-tock“, která s uvedením nové architektury převádí konkrétní architekturu do jemnějších technologických norem.

Ve výsledku buď přijmeme novou architekturu, nebo přechod na nový technický proces. V roce 2013 byl projekt naplánován tak, že vydání nové architektury - Haswell. Procesory s novou architekturou jsou spuštěny pomocí stejného technického procesu jako předchozí generace Ivy Bridge: 22 nm, Tri-gate. Technický proces se nezměnil, zvýšil se počet jeho tranzistorů a také se zvětšila poslední oblast krystalu nového procesoru - a pak úspora energie.

V souladu s tradicí Intel v den oznámení Haswell představil produktivnější a dražší procesory Základní linie i5 a i7. Oznámení dvoujádrové procesory mladé čáry jako vodítko jít ven ze zatrimkoy. Warto respektuje, že ceny za nové procesory se ztratily na stejné úrovni jako u Ivy Bridge.

Stejné plochy krystalů různé generace Sbor základních procesorů:

Yak bachimo, chotiryaderny Haswell může mít celkovou plochu ​​177 mm², se kterou je integrován do nového pіvnіchny mіst, řadič operační paměti a grafického jádra. Počet tranzistorů se tak zvýšil o 200 milionů a plocha se zvětšila o 17 mm. Stejně tak ve srovnání s Haswellem s 32nanometrovým Sandy Bridge se počet tranzistorů zvýšil o 440 milionů (38 %) a plocha pro přechod na 22nm procesní technologii se zmenšila o 39 mm² (18 %). Termovize všech hornin byla prakticky na stejné úrovni (95 W pro SB a 84 W pro Haswell), změnila se však plocha.

To vše vedlo k tomu, že z kůže čtvereční milimetr krystalu je přiváděno více tepla. Dříve bylo z 216 mm² potřeba odebírat 95 W, poté 0,44 W / mm², nyní z plochy 177 mm² je potřeba odebírat 84 W - 0,47 W / mm², což je o 6,8 % více, nižší dříve. Pokud se má tento trend zachránit, pak bude brzy prostě fyzicky způsobilé přivádět teplo z tak malých ploch.

Vzhledem k dnešnímu dni lze teoreticky předpokládat, že v Broadwellu, který bude proveden po 14 nm technickém procesu, počet tranzistorů v růstu o 21 %, jako při přechodu z 32 na 22 nm, a oblast, na které se bude zrychlit o 26 % (o stejnou hodnotu při přechodu z 32 na 22 nm), vezmeme 1,9 miliardy tranzistorů o ploše 131 mm². Stejně jako u jiných termovizí se také sníží o 19 %, pak můžeme vypočítat 68 W, neboli 0,52 W / mm².

Tento teoretický vývoj, v praxi to bude jinak - přechod technického procesu z 32 na 22 nm je také známkou zavedení 3D tranzistorů, protože snížily průtok cívky a s nimi i termovizi. O přechodu z 22 nm na 14 nm však stále nic takového není, takže v praxi bude hodnota tepelného zobrazování větší pro všechno a 0,52 W / mm² nebude varto. Prote, takže úroveň tepelného výkonu bude 0,52 W / mm², problém místního přehřátí a skládání tepelného příkonu z malého krystalu se ještě více zahřeje.

Mimochodem, nejúčinnější způsob, jak zavést teplo pomocí tepelného zobrazování na úrovni 0,52 W / mm², může být základem pro Intel přechod na BGA nebo vzorek patice. Jelikož bude procesor připájen na základní desce, teplo se bude přenášet přímo z krystalu do chladiče bez mezikrytu. Ve světle to vypadá ještě relevantněji, vyměňte pájku na tepelné pastě pod uzávěry současné procesory. Vzhled „nahých“ procesorů s krystaly za zadkem Athlonu XP můžete znovu objevit, takže bez krytu jako mezilehlá lanka v topné vodě.

Na grafických kartách je to už dlouho, co to takhle bylo, a potřeba rozbít krystal je vyrovnána širokým rámem, takže žádné takové grafické karty neexistují. skutečné problémy“, jako termální pasta pod kryt procesoru. Tim není menší, stanou se z něj skládací povolání, ale spíše chlazení „tenkých“ procesorů není žádná věda. A přesto nás brzy zkontrolujeme, takže to samozřejmě nebude žádný zázrak ...

Slezeme na zem a otočíme se, dokud si nepromluvíme o Haswellovi. Pokud víme, Haswell po odstranění nízkého „vylepšení/změny“ jako Sandy Bridge (a samozřejmě Ivy Bridge, druh buv, po velkém rahunce, přeloženo SB do jemnějšího technického procesu):

  • vbudovaniya regulátor napětí;
  • nové režimy úspory energie;
  • zbіlshennya obsyagіv bufferіv že cherg;
  • zvýšená propustnost mezipaměti;
  • zvýšení počtu portů při spuštění;
  • přidávání nových bloků, funkcí, API do integrovaného grafického jádra;
  • zvýšení počtu kanálů pro grafické jádro.

Tímto způsobem lze pohled na novou platformu rozdělit do tří částí: grafická rychlovka, čipset.

Část procesoru

Změny v procesoru zahrnují přidání nových instrukcí a nových úsporných režimů, zavedení regulátoru napětí a také změny v jádře procesoru.

Sada pokynů

Architektura Haswell má nové sady instrukcí. V duchu je můžete rozdělit do velkých skupin: vytváření pro zvýšení produktivity vektorů a vytváření pro segment serverů. AVX a FMA3 jsou viditelné pro první, virtualizace a transakční paměť pro ostatní.

Advanced Vector Extensions 2 (AVX2)

Dialer AVX byl rozšířen na AVX 2.0. Vytočte AVX2:

  • trim 256-bitových vektorů (dříve existoval trim pouze 128-bitových vektorů);
  • následná shromažďovat-іnstruktsіy, scho znіmayut vymogu nepřerušená rozashuvannya data v paměti; nyní jsou data „vybírána“ z různých adres paměti – budete se divit, jako by to byl příspěvek k produktivitě;
  • další instrukce pro manipulaci/operace s bity.

Mezitím bude nová sada více orientací na celočíselnou aritmetiku a hlavní výhoda v AVX 2.0 bude méně vidět ve více operacích.

Fused Multiply-Add (FMA3)

FMA - tse operace součtového násobení-skládání, kdy se dvě čísla násobí a sčítají do akumulátoru. Typ Tsey operace pro přidání rozšíření a umožnění efektivnější implementace více vektorů v této matici. Podpora tohoto rozšíření může výrazně zvýšit produktivitu vektorových operací. FMA3 je již podporován v procesory AMD s jádrem Piledriver a FMA4 s buldozerem.

FMA je kombinací operace násobení a sčítání: a=b×c+d.

Pokud je vyžadován FMA3, pak existují tři instrukce operandu, takže výsledek je zaznamenán v jednom ze tří operandů, který se účastní instrukce. Výsledek vyžaduje operaci jako a=b×c+a, a=a×b+c, a=b×a+c.

FMA4 - tse chotiriooperadnі іnstruktsії іz zápis výsledku do čtvrtého operandu. Instrukce vypadá takto: a=b×c+d.

Než budeme mluvit o FMA3: cena inovace umožní zvýšit produktivitu ještě o 30 % nižší pro chytrou úpravu kódu FMA3. Warto respektuje, že pokud je Haswell daleko na obzoru, Intel plánoval propagovat FMA4, ne FMA3, ale později změnil rozhodnutí na FMA3. Lepší pro všechno, prostřednictvím samotného Bulldozeru viishov pro pomoc FMA4: když se přesunuli, nepřekonali jednotku Intel (a osa Piledriver viishov je již z FMA3). Navíc byla rotace Bulldozeru v roce 2007 plánována tak, aby zahrnovala i FMA3, ale po více veřejných plánech Intelu implementovat FMA4 v roce 2008 rotace AMD překročila její rozhodnutí uvolněním Bulldozeru z FMA4. A Intel změnil plány z FMA4 na FMA3, čipy z FMA4 jsou ve srovnání s FMA3 malé a složitost elektrických logických obvodů je značná, což také zvyšuje rozpočet na tranzistor.

Vigrash vіd AVX2 a FMA3 se objeví po přizpůsobení PZ a q sad instrukcí, takže zvýšení produktivity "tady a teď" kontroly nejsou varto. A pokud jsou úlomky softwarového inženýra inertní, pak s „dodatečnou“ produktivitou se zlepšíte.

Transakční paměť

Evoluce mikroprocesorů vedla ke zvýšení počtu vláken – současný desktopový procesor může být větší a větší. Existuje velké množství proudů při vytváření daedalů a více skládání při implementaci bohatého streamovacího přístupu k paměti. Nutná kontrola nad aktuálností změn v operační paměti: u některých streamů je nutné hodinově blokovat data pro zápis, u jiných povolit čtení nebo změnu dat. Účel úlohy je složitější a pro udržení relevantních dat v bohatých streamovacích programech byla rozbita transakční paměť. Ale až do dnešního dne byl implementován programově, což snižovalo produktivitu.

Haswell má nové rozšíření Transactional Synchronization Extensions (TSX) – transakční paměť, která je uznávána pro efektivní implementaci bohatých streamovacích programů a pokročilých funkcí. Toto rozšíření umožňuje implementaci transakční paměti „ve vzduchu“, čímž zvyšuje celkovou produktivitu.

Co je transakční paměť? Tse takovou pamětí, jak mohu v sobě mechanismus pro řízení paralelních procesů zajistit přístup k datům, které jsou plně vítězné. Rozšíření TSX se skládá ze dvou komponent: Hardware Lock Elision (HLE) a Restricted Transaction Memory (RTM).

Komponenta RTM je soubor instrukcí, s jejichž pomocí může programátor transakci spustit, dokončit a přerušit. Komponenta HLE vynucuje předpony, které jsou ignorovány procesory bez podpory TSX. Prefixy zajišťují blokování změn, umožňují ostatním procesům blokování blokovat (číst), měnit a překazit váš tečkový kód a doky se tak nestanou konfliktem se záznamem blokovacích dat.

na Narazi již se objevily programy pro rozšíření vikoristannyam tsgogo.

Virtualizace

Význam virtualizace neustále roste: stále častěji virtuální serveryšířit na jednom fyzickém, že špatné služby daedalové se rozšiřují. Zvýšení rychlosti robotizace a technologií virtualizace a virtualizace médií je proto pro segment serverů ještě aktuálnější. Haswell se pomstí za skutky polypshenie a nasměruje se ke zvýšení produktivity virtualizovaných médií. Pererakhuєmo їх:

  • vylepšení, která umožňují hodinový přechod z hostujících systémů do hostitelského systému;
  • získal přístup k rozšířené tabulce stránek (EPT);
  • změna hodiny přístupu k TLB;
  • nové instrukce pro výzvu hypervizoru bez zadání příkazu vmexit;

Díky tomu se zkrátila hodina přechodu mezi virtualizovanými médii a nepřesáhla 500 procesorových cyklů. Tse může vést k rychlému plýtvání produktivitou způsobenému virtualizací. A nový Xeon E3-12xx-v3 chytřejší pro každého bude dnes chytřejší v této třídě, nižší Xeon E3-12xx-v2.

Vbudovaniya regulátor napětí

Haswell má regulátor napětí, který se přesunul ze základní desky pod kryt procesoru. Dříve (Sandy Bridge) do procesoru je potřeba dodat různá napětí pro grafické jádro, pro systémového agenta, pro jádra procesoru atp. Nyní je do procesoru přiváděno přes patici pouze jedno napětí Vccin 1,75 V, takže je k němu připojen regulátor napětí. Regulátor napětí je 20jádrový, plášť jádra vytváří 16 fází s brnkacím výkonem 25 A. Celkem bereme 320 fází, což je mnohem více než samotné navršené základní desky. Takový pidhіd umožňuje nejen pokořit vývoj základních desek (a tedy snížit jejich rozmanitost), ale spíše regulovat napětí uprostřed procesoru, což samo o sobě vede k větším úsporám elektřiny.

Z jednoho z hlavních důvodů je přes Haswell fyzicky nemožné být stejný se starou paticí LGA1155. Takže můžete mluvit o schopnosti Intelu vydělat cent, vydat novou platformu (nový čipset) a dva různé osudy - novou zásuvku, ale v tomto případě pro výměnu zásuvky existují objektivní důvody: fyzické / elektrické šílenství .

Prote musí za všechno zaplatit. Regulátor napětí je další věc, která se v novém procesoru zahřeje. A vrakhovuyuchi, že Haswell viroblyaetsya pro normy stejného technického procesu, který je přední Ivy Bridge, bradavice, že procesor bude teplejší.

Vzagali, tse redukce více jader byla přenesena do mobilního segmentu: rychlá a přesná změna napětí umožní snížit dodávku energie a také efektivně zvýšit frekvenci procesorových jader. Podle nás cena není prázdným reklamním prohlášením, takže Intel se chystá oznámit mobilní procesory s nízkou úsporou energie.

Nové režimy úspory energie

Haswell má nové stavy spánku S0ix, které jsou podobné stavům S3/S4, ale s mnohem kratší dobou na přepnutí procesoru. pracovní tábor. K nečinnému C7 byl také přidán nový mlýn.

Režim C7 je doprovázen vypnutím hlavní části procesoru, se kterým přestává být obraz na obrazovce aktivní.

Minimální frekvence procesorů při nečinnosti by měla být nastavena na 800 MHz, což může změnit i napájení.

Architektura procesoru

Přední konec

Haswell pipeline, jako v SB, může mít 14-19 stupňů: 14 stupňů při zásahu v µop cache, 19 stupňů při chybě. Objem µop-cache se nezměnil rovnoměrně z SB – 1536 µop. Organizace keše mopů byla ponechána stejná, jako u SB - 32 sad podle největších řad, v skinu mají z jakové šest mopů. Pokud chcete získat spojení z většího počtu dochovaných přístavků, stejně jako z dalších, po mezipaměti vyrovnávacích pamětí, bylo by možné vymazat větší vyrovnávací paměť - až 1776 obchodů (proč takový obsyag - bude řečeno níže).

Dekodér

Dekodér, můžeme říci, se nezměnil - byl naplněn chotirikoliynym, jako v SB. Skládá se ze čtyř paralelních kanálů: jednoho skládacího překladače (komplexní dekodér) a tří jednoduchých (jednoduchý dekodér). Skládací překladač dokáže zpracovat/dekódovat instrukce skládání, které generují více než jeden uop. Tři další kanály jsou dekódovány jednoduché instrukce. Přinejmenším zřejmost hněvu makrooperací, instrukcí pro získání vítězství a přežití generují například jeden mop a mohou být dekódovány v „jednoduchých“ kanálech dekodéru. Instrukce SSE mohou generovat jeden uop, který lze dekódovat v kterémkoli ze tří jednoduché kanály. Vzhled 256bitového AVX, FMA3, stejně jako zvýšení počtu portů pro spouštění a funkčních doplňků, taková rychlost dekodéru prostě nemusí být k dispozici - a víno se může stát velkým problémem. Často se na malém prostoru rozšíří L0m cache, ale vše při starém, procesor s 8 porty běží, Intel by měl myslet na rozšíření dekodéru - zocrema, neobtěžoval se zvýšit počet skládacích kanálů .

Plánovač, vyrovnávací paměť, vikonavchi přístavby

Po dekodéru následujte řadu pokynů pro dekódování a osa zde je moje první změna. SB měl dvě karty po 28 záznamech - jednu kartu na virtuální vlákno Hyper-Threading (HT). U Haswellu šly dvě karty do jedné karty pro dva HT streamy pro 56 záznamů, takže čísla se nezměnila, ale změnil se koncept. Nyní je k dispozici celých 56 záznamů pro jedno vlákno pro kapacitu druhého – nárůst je také vnímán jako přírůstky s nízkým vláknem a pro vlákna s více vlákny (není důvod, proč by dvě vlákna mohla vyhrát efektivněji).

Změňte zadáním také přeskupovací vyrovnávací paměti - počet záznamů od 168 do 192 záznamů. Proto je možné zvýšit účinnost HT z důvodu větší přehlednosti přítomnosti „nezávislého“ jednoho druhu jednoho mopivu. Počet dekódovaných mikrooperací se zvýšil z 54 na 60. Zvýšily se také soubory fyzických registrů, které se objevovaly v SB - ze 160 na 168 registrů pro celočíselné operandy a ze 144 na 168 pro plovoucí operandy, které lze pozitivně rozpoznat na produktivitě vektory .

Známe všechna data o změnách v bufferech a grafech v jediné tabulce.

V zásadě se změny parametrů Haswell zdají být z pohledu celkové logiky vývoje architektury procesorů Intel zcela jasné. Vihodyachi z tsієї w logice, můžete nechat jít, scho in nastupující generace Vyrovnávací paměti pro přeuspořádání jádra by se neměly zvýšit o více než 14 % níže, takže přeskupení vyrovnávací paměti bude v oblasti 218. Ale to je již teoretický předpoklad.

Vedle řady dekódovacích operací jsou k nim připojeny funkčními přílohami port a start. V jaké fázi vytvoříme zprávu.

Pokud víme, Sandy Bridge je schopen spustit šest portů, jako je Nehalem, a tím jedním je v jeho jádru Conroe. Pokud tedy od roku 2006 Intel přidal k chotiroh chotirem další dva porty, které byly v řádu Pentia 4, počet portů se při uvedení na trh nezměnil – byly přidány pouze nové funkční přírůstky. Je pravda, řekněme, že P4 maw je vlastní architektura NetBurst, ve které dva porty mohou vyhrát dvě operace v jednom hodinovém cyklu (i když to zdaleka není mnoho operací). A bylo by nanejvýš správné zastavit vývoj počtu portů, které se mají spustit nikoli na pažbě P4, ale na pažbě PIII, takže P4 může být dlouhodobým dopravníkem a zkazit spuštění dvojnásobnou produktivitou a finančními ztrátami. , a všechny z této architektury stojí za zmínku Existuje druh zagalnopriyatnoy. A Pentium III se již blíží funkčnímu schématu portu pro spuštění Conroe a má také krátký kontejner. Obecně se tedy dá říci, že Conroe je přímým potomkem PIII. Dá se říci, že v roce 2006 byl přidán více než jeden port ke spuštění rovný PIII, což je pět portů ke spuštění.

V tomto pořadí se počet portů pro spuštění náležitě zvyšuje, a pokud jsou přidány nové, pak jeden po druhém. V Haswellu přidali další dva, celkem otrimavshi tsilih vіsіm porty - další tři, a jdou do Itanium. Je zřejmé, že Haswell vykazuje teoretickou produktivitu na dráze 8 mopů/hodin, pro které se 4 mopy používají pro aritmetické operace a 4 mopy pro operace s pamětí. Odhaduji, že Conroe/Nehalem/SB měl 6 mopů/cyklus: 3 mop aritmetických operací a 3 mop paměťových operací. Toto zlepšení může být zrušeno indikátorem IPC a tímto způsobem je v architektuře Haswell efektivně a ještě vážněji změněno jako celek, je pravda, že je to „tak“ v plánu rozvoje Intel.

Change FU ve společnosti Haswell

Počet vikonavchih hospodářských budov byl také zvýšen. Nový port (somiy za rachunkem) přidal další dvě vykonavchi přílohy - rozšíření celočíselné aritmetiky a rozšíření přenosu přechodů. Somyiy (osmý) port je otevřen pro změnu adresy.

V této hodnosti bereme spoustu vykonavchi dodatků k celočíselné aritmetice, stejně jako Sandy Bridge, který nás zasáhl pouze třemi. Otzhe, ochіkuєtsya zbіlshennya shvidkostі kolochischeї aritmetika. Kromě toho, teoreticky, můžeme nám umožnit současně viconuvat a rozrokhunki s plovoucím kómatem a tsili rozrahunki, které vlastní rukou mohou zvýšit účinnost NT. U SB bylo na stejných přístavech zřízeno množství plovoucích hrud, zdevastováno množství funkčních přístavků a za velkou rahunkou bylo provedeno blokování, takže nebylo možné, aby matka byla "jiná" navantage. Také to znamená, že přidání dodatku k přechodu v Haswell umožňuje přenos přechodu bez blokování během aritmetických výpočtů - dříve, při velkém počtu výpočtů, bylo zablokováno jediné připojení k přechodu, takže robot mohl pracovat nebo aritmetika doplněk viconic a další provistnik. Porty 0 a 1 také poznaly změnu - dostaly podporu FMA3. Šestý (osmý) port Intel představil pro zvýšení efektivity tohoto „blokování“ – pokud se pro obsazení použije druhý a třetí port, lze do obsazení zapojit šestý (osmý) port, což dříve prostě nebylo možné. Toto řešení je nezbytné pro vysokorychlostní kódování kódu AVX/FMA3.

Vzagali, takový široký Vikonavchy trakt může být vychován ke změně HT - robyvshi її chotiripotokovoy. V procesorech Intel Xeon Phi s bohatě unesenou HT cestou to poněkud streamuje a jak ukazují výsledky onoho testu, procesor se dobře škáluje. Aby bylo možné v zásadě vybudovat vegetariánský trakt, umožňuje efektivně zpracovávat z chotirmy s potoky. A dokonce i cesta od osmi portů ke spuštění jako celku může efektivně vyhrát několik streamů a navíc přítomnost čtyř streamů může rychleji zachytit všechny porty při spuštění. Pravda, pro větší efektivitu bude nutné pro větší efektivitu "nezávislých" dat navýšit buffer (použitý - reording buffer).

Haswell také zvýšil propustnost budov L1-L2, se kterými ztratili příliš mnoho nepořádku. Takový start je prostě nutný, protože 32bajtový zápis a 16bajtové čtení by prostě nefungovalo pro dostupnost osmi portů ke spuštění, stejně jako 256bitových AVX a FMA3.

Sandy BridgeHaswell
L1i32k, 8 cest32k, 8 cest
L1d32k, 8 cest32k, 8 cest
Latence4 údery4 údery
Rychlost zájmu32 bajtů/hodiny64 bajtů/hodiny
Rychlost záznamu16 bajtů/hodiny32 bajtů/hodiny
L2256k, 8 cest256k, 8 cest
Latence11 barů11 barů
Budování kapacity mezi L2 a L132 bajtů/hodiny64 bajtů/hodiny
L1i TLB4k: 128, 4cestný
2M/4M: 8/závit
4k: 128, 4cestný
2M/4M: 8/závit
L1d TLB4k: 128, 4cestný
2M/4M: 7/závit
1G: 4, 4 cesta
4k: 128, 4cestný
2M/4M: 7/závit
1G: 4, 4 cesta
L2TLB4k: 512, 4cestný4k+2M sdílené: 1024, 8-way

TLB L2 bylo navýšeno na 1024 záznamů, objevila se podpora dvoumegabajtových stran. Zvýšení TLB L2 způsobilo zvýšení asociativnosti ze čtyř na osm.

Pokud mám mezipaměť třetí úrovně, pak je situace s ní nejednoznačná: nový procesor může mít zablokování přístupu prostřednictvím výdajů během synchronizace, dokonce i nyní mezipaměť L3 pracuje na frekvenci napájení, a ne na frekvenci jader procesoru , jak se to stalo dříve. Pokud chcete přístup, jako dříve, je to 32 bajtů za hodiny. Na druhou stranu Intel hovoří o změnách v System Agent a redukci bloku Load Balancer, který lze nyní zpracovávat paralelně s požadavkem na L3 cache a rozdělit je na požadavek na data a „no-data “. To může zvýšit šířku pásma L3 cache (desetiletí testování potvrzují, že PS L3 cache ukazuje více než IB).

Princip robotické cache L3 Haswell je podobný jako u Nehalemu. Nehalem má v Uncore L3 cache a frekvence je pevná a SB L3 cache je vázána na jádra procesoru - tato frekvence se rovná frekvenci procesorových jader. Skrze to byly obviňovány problémy - například pokud procesorová jádra běžela na nižších frekvencích pro frekvenci disku (i LLC "zasinav") a GPU potřebovalo vysoké PS LLC. Takže rozhodnutí bylo zasahovat do produktivity GPU a předtím by bylo nutné přivést procesorová jádra a byl bych jednodušší než probudit LLC. Nový procesor, aby se zlepšila situace s napájením a zlepšila se účinnost práce GPU ve výše popsaných situacích, mezipaměť L3 pracuje na frekvenci napájení. Nejnebezpečnější je toto řešení pro mobilní maminky a ne pro podlahové řešení.

Varto respektovat, že obsyagi keshiv mayut nevnu zalezhnі. Mezipaměť třetí úrovně spadá dva megabajty na jádro, mezipaměť druhé úrovně - 256 KB, což je ve většině případů méně než L3 na jádro. Obsjag mezipaměť prvního rovného na mé vlastní kartě, ve většině případů je menší než L2 a stává se 32 kB. Peněžní mezipaměť zázračně zapadá do této zatuchliny: její objem je 1536 mezipaměti a je 7-9krát menší než L1 (nelze přesně určit, protože bitový objem mopu není znám a Intel pravděpodobně nebude toto téma rozvádět ). Přeuspořádávací vyrovnávací paměť 168 mopů se rovná většiněkrát menší než mezipaměť mopů 1536 mopů, i když je to mimo všudypřítomný nárůst vyrovnávacích pamětí a počtu vyrovnávacích pamětí, vedle vymazání nárůstu mezipaměti mopu. o 14 %, pak až do roku 1776. Tímto způsobem lze proporcionálně rozšířit vyrovnávací paměti a mezipaměti obsyagi. To je bezesporu další důvod, proč Intel nenavyšuje L1 / L2 cache, protože takové proporce z hlediska výkonu jsou z pohledu zvyšování produktivity a zvětšování plochy nejúčinnější. Varto respektuje, že v procesorech od špičkového grafického jádra je mezipaměťový zámek se širokou přístupovou sběrnicí, jako cache všechna data do operační paměti - jako procesor, takže videoklip. Velikost paměti bude 128 MB. U procesorových jader je pro rozšíření paměti jako L4 cache celková kapacita 64 megabajtů a s přidáním grafického jádra vypadá logicky ta 128 MB.

Pokud jde o řadič paměti, pak bez zohlednění zvýšení počtu kanálů zvýšení frekvence provozu operační paměti, tedy stejný paměťový řadič s dvoukanálovým přístupem na frekvenci 1600 MHz. Takové řešení vypadá báječně, i když se přechod z SB na IB zvýší o frekvenci provozu IKP z 1333 MHz na 1600 MHz, i když by bylo lepší přepnout architekturu na nový technický proces. Ninі No, možná nová architektura, ve své frekvenci fungování paměti ztratila kolosální rovnocennost.

Ještě překvapivěji to vypadá, že se jedná o hádání o plnosti grafického jádra – i když si pamatujeme, že mladá grafická karta HD2500 v IB používala šířku pásma o 25 GB/s více. Nyní se zvýšila produktivita CPU a produktivita grafiky a šířka pásma při budování paměti se ve velkém měřítku ztratila. Pokud se podíváte blíže, pak konkurent postupně zvýší šířku pásma paměti svých hybridních procesorů a bude to horší než u Intelu. Logické bylo upgradovat paměti Haswell o frekvenci 1866 MHz a 2133 MHz, což by zvýšilo propustnost budovy na 30 a 34 GB/s zřejmě.

Stejně jako výsledek dané rozhodnutí Intel to nechápe. V prvním kroku se závodníkovi podařilo bez zvláštních problémů provést podporu švédské paměti. U přítele Vartіst Moduliv Pam'yatі, fungující na frekvenci 1866 MHz, není parchant v modulech Poriznnyanni Z 1600-megartzavim, předtím ani zobovův Kupuvati 1866-Magahersov Pam'yati-Vibirche s výhledem na Coristuvache. Za třetí, není možné mít problémy se stejnými 1866 MHz, ale 2133 MHz: od samotného oznámení Haswellu byly nastaveny lehké rekordy pro přetaktování operační paměti, takže IKP mohl bez problémů „táhnout bi“. Za čtvrté, v řadě serverů Xeon E5-2500 V2 (Ivy Bridge-EP) je oznámeno zvýšení o 1866 MHz, přestože Intel bude na tomto trhu podporovat podporu více švýcarských paměťových standardů, existuje více než dost podlahových řešení.

V zásadě by bylo možné připustit, že bez konkurence Intelu není potřeba „jen tak“ budovat m'yazi a ještě více zvyšovat rychlost, ale přiznání je naprosto nesprávné, nárůst šířky pásma paměti, např. pravidlem, je Vyšší produktivita vestavěného grafického jádra a nemusí zvýšit produktivitu procesoru. Intel má přitom v produktivitě grafik stále samotné AMD a sám Intel dává do budoucna stále větší respekt k samotné grafice a tempo vylepšování je pro ni bohatší, nižší pro jádro procesoru. . Navíc na základě výsledků testování pokročilého grafického jádra přední generace HD4000 ukázali, že zvýšení šířky pásma paměti může vést ke zvýšení grafické produktivity až o 30 %, a také že nové grafické jádro HD4600 je chytřejší, ale izh HD4000, pak ladem PSP je stále jasnější. Nové grafické jádro bude ještě pravděpodobněji zatlačeno do „vezku“ průchodem budování paměti. Shrneme-li všechna fakta, rozhodnutí Intelu bylo absolutně nerozumné: společnost vlasnoruch „uškrtila“ své grafiky, i když zvýšení šířky pásma paměti mohlo zvýšit produktivitu.

Pokud jde o architekturu mezipaměti, myslím, že myslím naprázdno: pokud již byla přidána mezipaměť (cache cache), tak proč nepřidat mezipaměť dat v řádu 4-8 KB a s menším přístupem mezi cache L1d a vikonavchi naše přístavby, jak z P4 (což je koncept samotné mop cache převzatý z Netburstu)? Předpokládejme, že v P4 byla celá mezipaměť dat zpřístupněna ve dvou hodinových cyklech a jeden cyklus P4 dosáhl přibližně 0,75 hodinového cyklu velkého procesoru, takže by se přístup blížil druhému taktu. Vtіm, je to možné, je lepší, když je to takhle - Intel miluje dobře zapomenuté staré.

Jak si pamatujete, většina architektonických změn Intel nasměrovala ke zvýšení produktivity kódu AVX / FMA3: zvýšení propustnosti mezipaměti, zvýšení počtu portů a zvýšení rychlosti růstu / cesty ikon. V případě subbagu může být hlavní nárůst produktivity stejný u softwaru napsaného ve standardech AVX/FMA3. V zásadě se podle výsledků testů zdá, že je to tak špatně. Suchá produktivita při stejné frekvenci ve „starých“ doplňcích zaznamenala nárůst asi o 10 % ve srovnání s předním jádrem a programy napsané pomocí nových sad instrukcí vykazují nárůst o více než 30 %. Napříště budou výhody architektury Haswell rozvíjeny ve světě optimalizace doplňků podle nových sad instrukcí. Osa vítězství Haswella nad SB bude zřejmá.

Odnáší se hlavní výhra v podobě významné části inovace mobilní přílohy. Můžeme přidat nový pidhid do mezipaměti L3, regulátor napětí vbudovaniya, nové režimy spánku a nižší minimální frekvence fungování jader procesoru.

Višnovok (procesorová část)

Proč se dívat na Haswella?

V souvislosti s nárůstem počtu portů při startu je rozpoznán nárůst výkonu IPC, takže výhoda nové architektury Haswell oproti Sandy Bridge na stejné frekvenci bude již najednou, pro neoptimalizované softwarové zabezpečení. Pokyny AVX2/FMA3 - tse zadіl na budoucnost, a tse tse mohou být uloženy v prodejcích PZ: čím více smrad přizpůsobíte své programy, tím více konec coristuvach odebere zvýšení produktivity. Není však varto rozšiřovat o růst všeho a skrіz: SIMD-instrukce se udělují hlavně v robotech s multimediálními daty a ve vědeckém výzkumu, proto je růst produktivity varto sám v těchto úkolech. Hlavním přínosem z hlediska zlepšení energetické účinnosti je odstranění mobilních systémů, kde je napájení opravdu důležité. V této hodnosti dvě hlavní přímky pro yakimi nova Architektura Intel Haswell vyhrává hru – náklady na produktivitu SIMD a energetickou účinnost.

Pokud jde o stosuvannya nových procesorů Haswell, pak varto vyberte řadu různých možností pro jejich zastosuvannya: ve stolních počítačích, serverech, v mobilních řešeních, pro hráče, pro přetaktování.

plocha počítače

Úspora energie není u desktopového procesoru klíčovým aspektem, takže přes cenu jen stěží přejdeme na Haswell z předchozích generací. Tim je větší, zatímco TDP Haswell je vyšší, nižší než IB, takže úspory budou menší pro různé minimální náklady. Pro takovou produkci nemůžete krmit sumniviv buti - to není pro vás.

Z pohledu produktivity nyní přechod nevypadá tak jasně: maximální zvýšení rychlosti v úlohách procesoru najednou není větší než 10 %. Přechod na Haswell ze Sandy Bridge nebo Ivy Bridge bude v takovém případě méně pravdivý, protože plánujete porazit programy s kompetentní podporou FMA3 a AVX2: Podpora FMA3 může zvýšit tyto doplňky z 30 % na 70 %. Polypshennie, spojená s virtualizací a využitím transakční paměti, pro pracovní stůl, malý i malý.

Servery a pracovní stanice

Vrahovyuchi, scho servery a pracují bez přerušení celých 24 let v práci a mohou dosit vysoké post_yne na procesor, pokud jde o čistou energii, Haswell pravděpodobně nebude lepší než IB, pokud chcete být produktivní na watu, můžete dát opravdová výhra. Podpora AVX2/FMA3 pravděpodobně nebude dobrá na serverech a osa pracovních stanic, které se zabývají vědeckým vývojem, bude dostávat podporu stále více corisna - nebo více pro mysl, podporu nových instrukcí pro zastosovuvannym PZ. Transakční paměť - bohatá dosit korisna, ale nebojte se: můžete zvýšit bohaté streamovací programy a programy, které pracují s databázemi, ale pro efektivní vitorizaci je také nutné optimalizovat software.

A osa je celá vylepšená, vykreslená virtualizací, víc za všechno bude působit hanebně, úlomky virtuálního média jsou aktivnější najednou a na větších fyzických serverech ve virtuálním šprotu. Šíře virtualizace se navíc vysvětluje jako připomínka poklesu volatility virtuálního média z hlediska produktivity a ekonomické efektivity: pomsta za mnoho virtuálních serverů v jednom fyzickém a levnějším a umožňuje efektivnější obnovu zdrojů, procesorových zdrojů zvýšení.

Také na trhu serverů se může Haswell objevit pozitivně. Pokud změníte servery založené na Xeon E3-1200v1 a Xeon E3-1200v2 na servery založené na Xeon E3-1200v3 (Haswell), okamžitě snížíte nárůst efektivity a po optimalizaci úložného prostoru AVX2/FMA3 a transakční paměti ' ještě více zvýšit produktivitu.

Mobilní řešení

Hlavní výhoda prosazení Haswellu v mobilním segmentu samozřejmě spočívá v oblasti omezení dodávek energie. Soudě podle prezentací společnosti Intel a také podle výsledků testů, které již byly oznámeny v Merezh, je účinek pravdy chvályhodný.

Pokud jde o čistou produktivitu, přechod z Ivy Bridge na Haswell není tak prvoplánovým přístupem: čistý nárůst je způsoben, ale pozoruhodně malý, a nárůst ostatních komponent (jako je virtualizace nebo multimediální instrukce) je nepravděpodobný. Aby byly mobilní systémy dobře znějící, úlomky na laptopech a tabletech jsou jen zřídka zaměstnány skládacími middleware a skládacími vědeckými růžemi.

Obecně a obecně, s pohledem na produktivitu procesoru, je tedy potřeba zkontrolovat spoustu věcí mobilní systémy Samostatně bude potřeba zvýšit produktivitu grafického jádra. Vzhledem k tomu, že napájení pro vás není kriticky důležité, pak se vážně podívejte na upgrade napájení pro Sandy Bridge nebo Ivy Bridge není dobrý - je lepší pokračovat v provozu stávajících systémů, dokud nezůstane smrad starý. Pokud často používáte baterie, zabezpečení budovy Haswell prodlouží životnost baterie.

Hry

Napájení pro hráče v Rusku zpravidla nestojí za to - proč byste měli, když herní grafické karty jsou schopné 200 nebo více wattů? Virtualizace a transakční paměť nejsou pro hráče nutné. Není pravda, že AVX2/FMA3 bude vyžadováno samo o sobě pro hraní her, i když to může být dobrá věc pro fyziky. Čistá produktivita procesoru zůstává pozadu a zde je rozdíl mezi samotným Ivy Bridge malý. V důsledku toho se pro tuto kategorii nezdá relevantní ani přímý přechod z SB nebo IB na Haswell. Pak je chytré přejít na nové procesory od Nehalem a Lynifield a hlavně Conroe.

přetaktování

Pro overclockery může být nový procesor (ale, no, jde jen o to, že verze K je „odblokovaná“) trochu, zvláště pokud můžete pokračovat a „skalpovat“ sejmout kovovou krytku a ochladit krystal bez zádrhel. Pokud nepřetaktujete, vypadají výsledky přetaktování ještě skromněji, v Ivy Bridge níže. Navíc se integrující regulátor napětí může stát faktorem streamování. Přečtěte si o tom reportáž

Jeden z nejpopulárnějších trendů v segmentu stolních počítačů je šílené uvažovat o vydání nové rodiny procesorů Intel Core čtvrté generace s kódovým označením Haswell. V tomto článku se můžeme podívat na mikroarchitekturu Haswell a stejně tak produktivitu procesoru Intel Core i7-4770 založené na mikroarchitektuře procesoru Intel Core i7-3770 založené na mikroarchitektuře přední generace Sandy Bridge.

Hádejme, že do konce roku bude budoucnost nových generací procesorů Intel podřízena empirickému pravidlu TICK-TOCK („Tiktak“), jehož podstatou je, že technologický postup(TICK), že implementace nové mikroarchitektury procesoru (TOCK) se liší podle frekvence, přibližně dvakrát denně. Stejně jako první řeka přechází na nový výrobní proces, pak se nová mikroarchitektura procesoru zavádí do dalšího procesu ve stejném technickém procesu. Nástup osudu je převedení mikroarchitektury do nového výrobního procesu atd.

Zakrema, v roce 2012 Intel vydal 22nm verzi procesorů založených na mikroarchitektuře Sandy Bridge, která má kódové označení Ivy Bridge (cyklus TICK), a nyní nastal čas pro vydání 22nm procesorů založených na novém procesoru Microarchitecture Haswell.

Zprávu o vlastnostech nové mikroarchitektury Haswell již napsal ComputerPress č. 10'2012. Forte od té hodiny uplynula bohatá hodina, a co víc, začali zavádět nové detaily mikroarchitektury. Je přípustné to nějakým způsobem zopakovat a krátce se podívat na Haswellovu mikroarchitekturu se zaměřením na tiché detaily, které byly v našem čelním pohledu vynechány.

Numerické jádro Haswell

Haswell - to je kódové označení pro novou mikroarchitekturu procesoru, ale tradičně se všechny procesory založené na ní nazývají stejným jménem. Haswell je navíc kódové označení pro jádro procesoru Haswell, což je zcela logické, ale mikroarchitektura a mikroarchitektura jádra procesoru jsou dvě strany téže mince.

Pojďme se v rychlosti podívat na Haswellovu mikroarchitekturu (neboli počet Haswellových jader, který je v podstatě stejný).

Výpočetní jádro Haswell nerozpoznalo zásadní změny ve srovnání s výpočetním jádrem Ivy Bridge/Sandy Bridge – bylo zredukováno pouze několik bloků jádra procesoru. A té předřece řekneme mikroarchitekturu Sandy Bridge v hluboké rýži a připojíme se ke změnám provedeným před ní.

blok preprocesoru

Tradičně je popis mikroarchitektury procesorového jádra založen na bloku front-end procesoru, který je založen na volbě x86 instrukcí na instrukční cache a dekódování (obr. 1). Mikroarchitektura Haswell má blok předního procesoru, který rozpoznal minimální změny.

Mal. 1. Přední procesor v mikroarchitekturách Haswell a Sandy Bridge

Instrukce x86 jsou vybírány z instrukční mezipaměti L1I (Instruction Cache), která se v mikroarchitektuře Haswell změnila. Vіn maє rozmіr 32 KByte, є 8-kanálové a dynamicky distribuované mezi dvě vlákna instrukcí (podporováno technologií Hyper-Threading).

Z mezipaměti L1I jsou příkazy zachyceny v 16bajtových blocích do 16bajtového Fetch Bufferu.

Instrukce x86 mohou měnit délku (od 1 do 16 bajtů) a délka bloků, kterými se příkazy vymaňují z mezipaměti, je při dekódování příkazů pevná, přiřazují se mezi ostatní příkazy (informace o velikost příkazů je uložena v mezipaměti instrukcí L1I ve speciálních polích). Postup pro zobrazení příkazů z vybraného bloku se nazývá dopředné dekódování (PreDecode).

Po operaci jsou týmy organizovány ve frontě pokynů. Mikroarchitektura Sandy Bridge a Haswell mají vyrovnávací paměť příkazových řádků pro 20 příkazů ve skinu dvou streamů, navíc z vyrovnávací paměti překódování pro cyklus skinu dokáže vyrovnávací paměť příkazové řádky zachytit až šest příkazů.

Jakmile jsou vidět, příkazy (x86-instrukce) jsou předány dekodéru a jsou převedeny na strojové mikrooperace (označené jako mikro-ops nebo uOps).

Dekodér jádra procesoru Haswell mrtvý beze změny. Vіn, stejně jako předtím, є chotyricanal a může být dekódován v taktu kůže, dokud chotyroh іnstruktsіy x86. Jak bylo plánováno, maximálně jeden příkaz může dosáhnout 16 bajtů, ale průměr z maxima příkazů jsou 4 bajty. Uprostřed v 16bajtovém bloku skinu jsou zakódovány příkazy chotiri, které jsou s jiným kanálovým dekodérem dekódovány jednu hodinu v jednom hodinovém cyklu.

Vícekanálový dekodér se skládá ze tří jednoduchých dekodérů, které dokážou dekódovat jednoduché instrukce do jedné mikrooperace, a jednoho skládacího dekodéru, který lze dekódovat jednou instrukcí maximálně spodní pro každou mikrooperaci (typ dekodéru 4-1 -1-1). Pro ještě více skládacích instrukcí, které dekódují další a další mikro-ops, skládací dekodér s blokem uCode Sequenser, který lze použít k dekódování podobných instrukcí.

Při dekódování instrukcí se používají technologie Macro-Fusion a Micro-Fusion.

Macro-Fusion - sloučení dvou x86-instrukcí do jednoho skládacího mikro-ops mikro-ops, jakmile se jeden mikro-ops spojí. Je zřejmé, že takový hněv nelze dávat jako pokyny, ale spíše jako sázku pokynů (například pokyn k mentálnímu přechodu). Bez přilepení technologie Macro-Fusion na hodiny kůže procesoru lze dekódovat pouze pět instrukcí (pro čtyřkanálový dekodér) a s technologií Macro-Fusion za hodinami vzhledu lze pět instrukcí číst ve skupině na chotiri. a dekódovat.

Významné je, že díky efektivní podpoře technologie Macro-Fusion se instalují rozšířené bloky ALU (Arithmetical Logic Unit), které budují podporu pro implementaci pokročilých mikrooperací.

Micro-Fusion - sloučení dvou mikrooperací (ne x86-instrukcí, ale mikrooperace samotná) do jedné, aby se pomstily dvě základní operace. Nadal dvě takové ztížené mikrooperace jsou zpracovány jako jedna, což umožňuje snížit počet zpracovaných mikrooperací a také zvýšit celkový počet instrukcí, které procesor zpracovává, v jednom hodinovém cyklu.

V mikroarchitektuře Haswell a Sandy Bridge navíc mezipaměť dekódovaných mikrooperací (Uop Cache) stagnuje, dokud není nutné dekódování mikrooperací. Tsey hotovost pojištění za přibližně 1500 mikrooperací za průměrný den. Mezipaměť dekódovaných mikrooperací ve všech bankách (proto je mezipaměť 8kanálová), mezipaměť těchto je 32 řádků mezipaměti a skin linky mezipaměti může obsahovat až šest dekódovacích mikrooperací (uop). Zdá se, že mezipaměť lze zaplnit přibližně 1500 mikrooperacemi.

Koncept dekódovací mezipaměti mikrooperací je uložit sekvenci mikrooperací v novém dekódování. V důsledku toho je stále nutné opakovaně dekódovat x86-instrukci a druhá sekvence dekódovaných mikro-ops je stále v mezipaměti dekódovaných mikro-ops, není nutné znovu vybírat instrukci z L1 cache a znovu kódovat її - před dekódováním mikrooperace by mělo být provedeno další zpracování z mezipaměti.

Po procesu dekódování zapáchají x86-instrukce, několik kusů za hodinu, přicházejí do vyrovnávací paměti dekódovaných instrukcí (Decode Queue). Mikroarchitektura Sandy Bridge má vyrovnávací paměť pro dekódování instrukcí pro přepracování do dvou proudů příkazů, 28 mikrooperací na proud skinu. Mikroarchitektury Ivy Bridge a Haswell se nerozdělují na dva proudy příkazů a povolení pro 56 mikrooperací. Takový pidkhid se jeví jako nejlepší, když selže jednovláknový dodatek (s jedním příkazovým proudem). V tomto případě má jeden příkazový tok dostupnou vyrovnávací paměť s kapacitou 56 mikrooperací a v mikroarchitektuře Sandy Bridge pouze 28 mikrooperací.

Bylo by lepší sladit jádra procesorů Haswell a Ivy Bridge, pak nejsou žádné rozdíly v předních procesorech a přední procesory jader Haswell a Sandy Bridge se zabývají pouze strukturou vyrovnávací paměti dekódovacích instrukcí.

Forte, jak tvrdí Intel, přírůstky do předního procesoru Haswell byly ještě přineseny a dokončeny blokem Branch Predictors. Jak však byla vylepšení implementována, Intel neprozrazuje.

Dokončení popisu předního procesoru v mikroarchitektuře Haswell, další hádání o vyrovnávacích pamětech TLB.

TLB buffer (Translation Look-aside Buffers) - ce speciální cache procesor, ve kterém jsou uloženy adresy dekódovaných instrukcí a dat, což umožňuje výrazně zkrátit přístup k nim. Mezipaměť schůzek pro nejkratší dobu transformace virtuálních adres těchto nebo fyzických pokynů. Procesor bohatý na čas vyhrává virtuální adresování a přístup k datům z mezipaměti a operační paměti vyžaduje skutečné fyzické adresy. Převod virtuální adresy na fyzickou trvá asi tři cykly procesoru. TLB-cache ukládá výsledky předchozích přemapování, takže přemapování adresy lze provést v jednom hodinovém cyklu.

V procesorech s mikroarchitekturou Haswell a Sandy Bridge (jako procesory Intel založené na jiných mikroarchitekturách) je vyhrána mezipaměť TLB a dokonce i mezipaměť L2 TLB je sjednocena, pak mezipaměť L1 TLB oddílů na datové vyrovnávací paměti (DTLB) a vyrovnávací paměti іn struktur (ITLB) .

L1 TLB cache instrukcí a dat v mikroarchitektuře Haswell změnu nepoznal - smrad je stejný jako v mikroarchitektuře Sandy Bridge. L1 ITLB-cache instrukcí pojištění pro 128 záznamů, jako skinový záznam adresující paměťovou stranu o kapacitě 4 KB. Pokud jsou tedy blokovány 4 KB stran paměti L1, může mezipaměť ITLB adresovat 512 KB paměti. Různé strany mají 4 KB ITLB cache a 4 kanály a jsou staticky rozděleny mezi dva toky instrukcí. Kromě toho může L1 ITLB cache adresovat 2 MB paměťových stran. Tímto způsobem má být cache zapsána na kůži potu a více asociativní.

Blok postkurikulárních visconů příkazů

Po procesu dekódování x86-instrukce je zahájena fáze dekódování x86-instrukce (Out-of-Order).

V první fázi je nutné změnit názvy podregistrů procesoru, které nejsou architekturou přiřazeny instrukční sadě. Technika přejmenování registrů bude hloupá bez přeskupování příkazů. Z vyrovnávací paměti dekódovaného instrukčního řádku (Decode Queue) se tedy mikrooperace musí po dvou kusech za takt dostat do vyrovnávací paměti pro změnu pořadí (ReOrder Buffer), změna pořadí mikrooperací mimo pořadí (Out-of-Order) není nutné.

Mikroarchitektura Sandy Bridge má vyrovnávací paměť pro změnu pořadí 168 mikrooperací, zatímco mikroarchitektura Haswell má 192 mikrooperací.

Je důležité, že vyrovnávací paměť pro změnu pořadí a jednotka pro odchod do důchodu jsou sloučeny do jednoho bloku procesoru a pokyny se mění sekvenčně a jednotka pro odchod do důchodu je do robota zahrnuta později, pokud si pokyny potřebujete prohlédnout. daný program objednat.

Dali rozpodіl mikrooperaci pro vikonavchimi bloky. Na bloku procesoru Unified Scheduler se tvoří mikrooperace, výsledky mikrooperací využívají jeden z portů funkčních doplňků (Dispatch porty). Tento proces se nazývá dispečink (Dispatch) a sám přenáší funkci brány do funkčních přístavků.

Mikroarchitektury Sandy Bridge a Haswell mají shluky Out-of-Order Cluster souborů fyzického registru (PRF), které mají operandy mikrooperací.

Předpokládám, že pokud soubory fyzického registru nebyly uloženy v jádrech procesorů (například v mikroarchitektuře Nehalem), mikrooperace skinu je malá kopie potřebného operandu (nebo operandů). Ve skutečnosti to znamenalo, že bloky shluku post-sekundárních vykonaných příkazů jsou zodpovědné za velkou expanzi, takže matka může okamžitě pojmout mikrooperace s nezbytnými operandy.

Varianta PRF umožňuje samotným mikrooperacím ukládat pouze indikátory na operandech, ale pouze na operandech samotných. Na jedné straně takový pidhid pro jistotu snížení energetické úspory procesoru, fragmenty pohybu potrubím mikrooperací současně s jejich operandy budou vyžadovat velké úspory energie. Kromě toho vám zastosuvannya fyzický registrový soubor umožňuje uložit expanzi krystalu a prostor, po porušení, hackne, aby zvýšil expanzi vyrovnávacích pamětí shluku posmrtných příkazů.

Mal. 2. Bloky poachergovy vykonannya příkazy

mikroarchitektury Haswell a Sandy Bridge

Microarchitecture Sandy Bridge má fyzický registrační soubor pro více operandů (Integer Registers) pro 160 záznamů a pro operandy s plovoucí čárkou (AVX Registers) - pro 144 záznamů.

Mikroarchitektura Haswell má soubory fyzických registrů Integer Registers a AVX Registers pro 168 záznamů.

Navýšeny byly také vyrovnávací paměti pro čtení (Load) a záznamy (Store), které se používají pro přístup do paměti. Například zatímco v mikroarchitektuře Sandy Bridge byly buffery Load a Store chráněny pro 64 a 36 záznamů, v mikroarchitektuře Haswell byly chráněny pro 72 a 42 záznamů.

Jednotné rozšíření vyrovnávací paměti plánovače, které tvoří mikrooperace k portům funkčních přístaveb, mění také mikroarchitekturu Haswell. Stejně jako Sandy Bridge byl zodpovědný za 54 mikrooperací, Haswell - za 60.

Také, aby se zlepšila architektura Haswell a Sandy Bridge, pak v bloku post-architekturních příkazů nemusí být mikroarchitektura Haswell strukturální, ale spíše mírně mění způsob, jak zvýšit expanzi vyrovnávacích pamětí. Žádné další zásadní změny ale v bloku postsekundárních příkazů v mikroarchitektuře Haswell nejsou.

Vikonavchi bloky jádra procesoru

Pokud jde o náhradní bloky jádra procesoru, v mikroarchitektuře Haswell rozpoznal smrad zásadní změny v mikroarchitektuře Sandy Bridge. Sandy Bridge má tedy šest portů funkčních rozšíření (portů dispečinku): tři a tři pro robotickou paměť (obr. 3 ukazuje pouze počítání portů).

Mal. 3. Vikonavchi bloky v mikroarchitekturách Sandy Bridge

že Haswell (nezobrazuje se kořist pro roboty)

U mikroarchitektury Haswell byl počet portů funkčních přístaveb snížen na osm. Před tím, co bylo v mikroarchitektuře Sandy Bridge, přidali jeden port pro záznam adresy (Adresa obchodu) a výčtový port pro celočíselné operace a operace zsuvu (Integer ALU & Shift). Tímto způsobem mohou procesory Haswell porazit až osm mikrooperací v jednom hodinovém cyklu, v tu hodinu, jako u mikroarchitektury Sandy Bridge, je maximální počet taktovací mikrooperací na hodinový cyklus šest.

V mikroarchitektuře Haswell se navíc pár věcí změnilo a změnila se i samotná budova. To je způsobeno skutečností, že se v mikroarchitektuře Haswell objevily další instrukční sady: AVX2, FMA3 a BMI.

Instrukční sada AVX2 (Advanced Vector Instructions) je rozšířením instrukční sady AVX, kterou má mikroarchitektura Sandy Bridge. Na začátku po množině instrukcí AVX následuje logické pokračování množiny instrukcí SSE, SSE2, SSE3 a SSE4. Pro zpracování dat v instrukcích AVX je použito 16 vektorových registrů s kapacitou 256 bitů, takže můžete rychle urychlit spoustu operací. Například násobky několika 64místných čísel s více příkazy AVX lze provést v jednom hodinovém cyklu, a to i bez instrukcí AVX, pro které je potřeba několik cyklů.

Hlavním rysem nové sady instrukcí AVX2 ve větší verzi AVX je, že dřívější 256bitové operace s registry AVX byly dostupné pouze pro operand float a pro všechny operandy byly k dispozici méně než 128bitové operace, pak v 256bitové operace AVX2 byly dostupné pro celé operandy. Ve skutečnosti, když používáte AVX pro jeden hodinový cyklus, můžete implementovat 16 operací z čísel s jednoduchou přesností a vysoké operace z čísel s plovoucí přesností. A s proměnnou AVX2 lze v jednom cyklu zpracovat 32 operací s čísly s jednoduchou přesností a 16 operací s čísly s plovoucí přesností.

Kromě toho má AVX2 snížený subtrim susvіv a permutace vektorových operací. Nové pokyny pro výběr počtu (nebo osmi) nespojených prvků do jednoho vektorového prvku, z tohoto důvodu můžete více zavantazhuvat 256bitový registr AVX.

Nová sada instrukcí přiřazení FMA3 (Fused Multiply Add) pro operaci sečteného násobení a skládání přes tři operandy.

Vícenásobné FMA3 operace umožňují efektivnější implementaci podřádkových, odmocninových, vektorové násobení a maticové operace. Sada FMA3 obsahuje 36 instrukcí s plovoucí desetinnou čárkou pro 256bitové vektory a 60 instrukcí pro 128bitové vektory.

Sada příkazů BMI (Bit Manipulation Instructions) obsahuje 15 skalárních instrukcí pro bitové operace, které pracují s celými registry globálního rozpoznávání. Tyto instrukce jsou rozděleny do tří skupin: manipulace přes okremimi bitů, jako je vkládání, zsuv, že vyluchennya bit, pidrachunok bativ, například podrakhnok vodivé nuly v záznamu čísel, a počet číselných násobení s dostatečnou přesností. Dánské pokyny pro psaní umožňují uložit řadu specifických operací, které vítězí například při šifrování.

Paměťový subsystém pro mikroarchitekturu Haswell

Jedna z nejvýznamnějších změn v Haswellově mikroarchitektuře v Sandy Bridge byla porušena v paměťovém subsystému. A vpravo nejen v tom, že se zvětší rozšíření čtecích bufferů (Load) a záznamu (Store), které slouží pro přístup do paměti (platných je 72 a 42 záznamů). Byl přidán nový port pro ukládání adres (Store address), datová cache L1 se stala produktivnější a zvýšila se propustnost mezi cache L1 a L2. Pojďme se podívat a změnit zprávu.

Přístup k paměťovému subsystému je založen na skutečnosti, že potřebné mikrooperace se musí dostat do vyrovnávacích pamětí čtení (Load) a záznamu (Store), protože v souhrnu mohou nashromáždit více než sto mikrooperací. Mikroarchitektura Sandy Bridge má řadu funkčních přístavků, které jsou na schématech označeny jako 2, 3 a 4 a osvědčily se pro přístup do paměti (obr. 4). Porty 2 a 3 jsou připojeny k funkčním doplňkům pro generování adres (Address Generation Unit, AGU) pro zápis nebo čtení dat a port 4 je připojen k funkčnímu doplňku pro zápis dat z jádra procesoru do mezipaměti dat L1. (DL1). Procedura generování adresy trvá jeden nebo dva cykly procesoru.

Mal. 4. Paměťový subsystém v mikroarchitekturách Sandy Bridge a Haswell

Mikroarchitektura Haswell má porty 1, 2 a 3 napojené na port 7, což souvisí s funkčním doplňkem pro generování adres pro záznam dat (Store AGU). Výsledkem je, že jádro Haswell zvládne dvě operace sběru dat a jednu operaci zápisu dat na takt.

Vize funkčního doplňku pro generování adres pro záznam dat je pro vikonann jednodušší, je paralelní s funkčními doplňky pro generování adres globálního rozpoznávání (pro záznam tohoto sběru dat). Vpravo mikrooperace pro zápis dat jednoduše zapíše na adresu (i, zreshtoyu, samotná data) ve vyrovnávací paměti úložiště. A mikrooperace pro zachycení dat má být zapsána do čtecí vyrovnávací paměti a nahrazena v zapisovací vyrovnávací paměti, aby se předešlo konfliktům.

Jakmile je potřeba virtuální adresa, podívá se na mezipaměť L1 DTLB, aby se zjistilo, zda je virtuální adresa platná pro fyzickou adresu. Samotná datová mezipaměť L1 DTLB v mikroarchitektuře Haswell změnu nerozpoznala. Položky Win 64, 32 a 4 pro paměťové strany 4 KB, 2 MB a 1 GB jsou platné a 4kanálové.

V případě chybě v L1 DTLB cache je zahájena revize aktuálních záznamů v unifikované L2 TLB cache, což může být malé vylepšení mikroarchitektury Haswell. Tato mezipaměť podporuje velikost 4 KB a 2 MB, є 8 kanálů a 1024 záznamů. A v mikroarchitektuře Sandy Bridge L2 TLB je mezipaměť pro 512 záznamů (aby byla dvakrát menší), přidává pouze jednu stranu paměti o velikosti 4 KB a 4 kanály.

Samotná datová mezipaměť L1 byla naplněna 32 KB a 8 kanálů (jako v mikroarchitektuře Sandy Bridge). S tímto přístupem do mezipaměti TLB lze toto opětovné ověření značky do mezipaměti dat L1 provádět paralelně.

Datová mezipaměť mikroarchitektury Haswell L1 však může mít vyšší propustnost budovy. Provádíme současně jednu 256bitovou operaci čtení a dvě 256bitové operace zápisu, což dohromady dává agregované množství 96 bajtů na takt. Mikroarchitektura Sandy Bridge má datovou mezipaměť L1, která současně streamuje jednu 128bitovou operaci čtení a dvě 128bitové operace zápisu, takže teoretická šířka pásma může být nižší. V tomto případě je šířka pásma L1 datové mezipaměti v mikroarchitektuře Sandy Bridge více než dvojnásobek šířky pásma v mikroarchitektuře Haswell díky těm, které Sandy Bridge má pouze dva funkční bloky AGU.

Haswellova mikroarchitektura navíc zvýšila propustnost mezi L1 a L2 cache. Takže zatímco propustnost Sandy Bridge mezi mezipamětí L2 a L1 byla 32 bajtů na cyklus, Haswell ji zvýšil na 64 bajtů na cyklus. S touto L2 cache má Haswell stejnou latenci jako Sandy Bridge. Je důležité, že stejně jako v mikroarchitektuře Sandy Bridge, ani v Haswellu není mezipaměť L2 exkluzivní a nezahrnuje se ve vztahu k vyrovnávací paměti L1.

Nové režimy úspory energie pro procesory Haswell

Jednou z novinek procesoru Haswell je, že umožňuje snížit spotřebu energie procesoru. Intel Atom(Takové režimy napájení byly implementovány v procesorech Moorestown).

Předpokládejme, že tradičně může být systém buď v aktivní stanici S0 (primární provozní režim), nebo v některé z "spánkových" stanic S1-S4.

Na stanici S1 jsou všechny mezipaměti procesoru vyhozeny a procesor je připojen k instrukcím. Podporována je ale životnost procesoru a operační paměť a rozšíření, pokud nejsou rozpoznána jako notifikovaná, lze zapnout. Mill S2 - ještě více hluboký spánek mlýn, pokud je procesor zapnutý.

Mlýn S3 (jmenuje se Suspend to RAM (STR) nebo obnovovací režim Standby) je mlýn, ve kterém je nadále napájena paměť s náhodným přístupem (OZP) a je prakticky jedinou komponentou, která šetří energii.

Mill S4 vіdomy yak hіbernatsіya (Hibernace). Na této stanici je celý objem operační paměti uložen v nezávislé paměti (například na pevném disku nebo SSD).

Stanice S0ix (S0i1, S0i2, S0i3, S0i4) jsou ve smyslu rekuperace energie obdobné jako stanice S1, S2, S3 a S4, ale jsou také uvažovány za stejnou dobu, což trvá méně než hodinu, než se systém přenese do aktivní stanice S0. Například přechod ze stavu S0 do stavu S0i3 vyžaduje 450 μs a přechod otáčení trvá 3,1 ms.

Grafické jádro v mikroarchitektuře Haswell

Jednou z hlavních novinek mikroarchitektury Haswell je cena grafického jádra s podporou DirectX 11.1, OpenCL 1.2 a OpenGL 4.0.

A především je grafické jádro v mikroarchitektuře Haswell škálovatelné. Založte variantu grafického jádra s kódovými názvy GT3, GT2 a GT1 (obr. 5).

Mal. 5. Blokové schéma grafického jádra Haswell

Jádro GT1 má minimální produktivitu, zatímco jádro GT3 maximální.

Grafické jádro GT3 bude mít další výčtový blok, ke kterému přibude řada rasterizačních bloků, pixel pipeline, výčtových jader a samplerů. Uvědomte si, že GT3 bude dvakrát tak produktivní než GT2.

Jádro GT3 k pomstě 40 hack bloků, 160 počítacích jader a chotiri blok textury. Pro lepší odhad, grafické jádro Intel HD Graphics 4000 v procesorech Ivy Bridge obsahuje 16 pokročilých doplňků, 64 procesorových jader a dvě texturové jednotky. Grafické jádro Intel GT3 proto bez ohledu na přibližně stejnou taktovací frekvenci jejich práce překonává svého rivala ve stejné produktivitě. Jádro GT3 může být navíc větší vysoká produktivita integrace paměti EDRAM (v jádře GT3e) do procesorového balíčku.

Jádro GT2 má 20 paměťových bloků, 80 procesorových jader a dva texturové moduly, zatímco jádro GT1 má pouze 10 paměťových bloků, 40 procesorových jader a jeden texturový modul.

Samotné vítězné bloky lze spočítat podle počtu jader na kshtaltu tiše, což vikoristovuyutsya v architektura AMD VLIW4.

Další inovací je v tom, že při práci s pamětí jsou využívány technologie Instant Access, které umožňují výpočet jader procesoru a grafického jádra bez mezipřenosu do operační paměti. Na dřívější verze Grafické jádro jádra procesoru a grafické jádro byly zpracovány také z hlavní operační paměti, ale s tou pamětí bylo rozděleno na dva regiony s rozměry, které se dynamicky mění. Jeden z nich byl představen pro grafické jádro a druhý - pro jádra numerických procesorů. Hodinový přístup k jednomu a tomu samému paměťovému prostoru grafického jádra a počtu procesorových jader se ale zabrat nedalo. Mám vipadku, yakscho grafický procesor pokud potřebujete data, která počítalo jádro procesoru, museli jste zkopírovat hodně paměti. To vedlo k nárůstu obstrukce, navíc byl vytýkán problém zvýšení koherence dat.

Technologie InstantAccess umožňuje ovladači grafického jádra nastavit indikátor na pozici slotu v paměťové oblasti grafického jádra, kterému procesorovému jádru je potřeba udělit přístup. Při jakémkoli výpočtu pracuje jádro procesoru s oblastí paměti bez jakéhokoli středu, bez vytváření kopie a následně se potřebná oblast paměti otočí na pořadí grafického jádra.

Rodinu nových grafických jader GT1, GT2 a GT3 lze vylepšit ve schopnosti kódovat a dekódovat video data. Podporuje hardwarové dekódování formátů H.264/MPEG-4 AVC, VC-1, MPEG-2, MPEG-2 HD, Motion JPEG, DivX v samostatných budovách až do 4096×2304 pixelů. Tvrdí se, že grafické jádro budovy dokáže současně dekódovat 1080p video stream a renderovat 2160p video bez půlení a přeskakování snímků.

K dispozici je také speciální blok pro zlepšení kvality videa, který se nazývá Video Quality Engine a používá se pro redukci šumu, korekci barev, odstranění prokládání, adaptivní změnu kontrastu atd. Také nová grafická jádra budou podporovat funkce stabilizace obrazu, konverze snímkové frekvence a rozšířené.

Grafické jádro procesoru Haswell navíc poskytuje připojení až ke třem monitorům najednou. Podporuje Display Port 1.2 ve vzdálené budově až do rozlišení 3840×2160 při 60 Hz, HDMI ve vzdálené budově až do 4096×2304 při 24 Hz (při maximální povolené), stejně jako DVI port.

Modelová řada procesorů Haswell

Zatím o tom mluvte předem modelová řada Procesory Haswell Na internetu samozřejmě můžete najít různé a supersrozumitelné informace o plánech Intelu na vydání procesorů Haswell. Společnost však tuto informaci oficiálně nepotvrzuje, není jasné, že modely procesorů budou oznámeny v prvním týdnu.

Spolehlivější je, že procesory Haswell se oficiálně nazývají čtvrtá generace Intel Core a sčítají tři řady: Core i7, Core i5 a Core i3. Stejně jako předchozí generace procesorů Intel jsou i modely procesorů Haswell označeny číslem začínajícím číslicí 4 (první číslice označuje číslo generace procesoru).

Intel nedávno oznámil vydání procesorů pro stolní počítače a notebooky řady Core i7 a Core i5 a později jsou oznámeny další slabé a levné procesory řady Core i3.

Procesory pro stolní PC jsou osazeny grafickým jádrem GT2 s oficiálním názvem Intel HD Graphics 4600, procesoru je jen málo, a to natolik, že v rodině procesorů pro stolní PC je model s grafickým jádrem GT3 (oficiálně s názvem Intel HD Graphics 520) se objeví 0).

Mobilní verze procesorů Haswell jsou vybaveny buď grafickým jádrem GT3 (top modely) nebo GT2.

No, trochu znám všechny verze mobilní procesory budou některá jádra podporovaná technologií Hyper-Threading (přečtěte si o rodině mobilních procesorů Core i7). Procesory pro stolní PC rodiny Core i7 a Core i5 budou také důležitější (kvůli stejnému modelu v rodině Core i5) jako jádrový procesor, technologie Hyper-Threading bude podporovat více než top modely rodiny Core i7 a dvoujádrový model procesoru řady Core i5.

Všechny procesory rodiny Core i5 a Core i7 podporují technologii Turbo Boost.

Velikost mezipaměti L3 pro procesory rodin Core i7 a Core i5 může být 8, 6 a 4 MB a TDP těchto procesorů se pohybuje od 35 do 84 wattů.

Procesory pro stolní počítače mohou využívat patice LGA 1150 a ještě více se základními deskami založenými na nových čipových sadách Intel řady 8.

Procesor Intel Core i7-4770

Co se týče celé modelové řady procesorů Haswell, ty vlastnosti v době psaní článku nebyly malé, ale každý věděl o procesoru Intel Core i7-4770, který jsme měli na testování. Tento procesor není top v rodině Intel Core i7 čtvrté generace a je nabízen pouze k modelu Intel Core i7-4770K, protože je považován za nový tim, který lze opět odemknout, multiplikační faktor je 100 MHz vyšší než základní taktovací frekvence. Ve zbytku světa jsou procesory stejné.

Procesor Intel Core i7-4770 je také choti-core, který podporuje technologii Hyper-Threading, protože základní frekvence je 3,4 GHz. Režim Turbo Boost má maximální takt 3,9 GHz. Procesor je vybaven L3 cache o velikosti 8 MB a grafickým jádrem GT2 (oficiálně Intel HD Graphics 4600), které pracuje na taktovací frekvenci 1,2 GHz. Paměťový řadič v procesoru je stejně jako dříve dvoukanálový a oficiální maximální frekvence DDR3, která je podporována, je 1600 MHz (můžete samozřejmě použít více paměti).

No, já vím, stejně jako dříve, procesor Intel Core i7-4770 může být vybaven řadičem PCI Express 3.0 pro 16 linek. Poslední důležitou věcí je TDP procesoru na 84 wattů.

Pro lepší odhad, procesor Intel Core i7-3770 (kódové označení Ivy Bridge) přední generace může mít podobné vlastnosti. Vіn také є chotiryadernim, pіdtrimuє Hyper-Threading a maє cache L3 o velikosti 8 MB. Základní taktovací frekvence jejich procesorů jsou trochu změněny: u modelu Intel Core i7-4770 by to mělo být 3,4 GHz a u Intel Core i7-3770K - 3,5 GHz. V režimu Turbo Boost se však mění taktovací frekvence obou procesorů: pokud je povoleno jedno nebo dvě procesorová jádra, pak maximální taktovací frekvence může být 3,9 GHz (pamatujte, že maximální snížení energie a maximální stream nejsou překročena). Pokud jsou zachycena tři jádra procesoru, maximální taktovací frekvence může být 3,8 GHz a když jsou zachycena všechna čtyři jádra - 3,7 GHz.

V těchto procesorech grafického jádra je zabudována mikroarchitektura číslovacích jader a samozřejmě i samotná mikroarchitektura počítacích jader. A nyní malý detail: procesor Intel Core i7-3770 má TDP 77 W, což je méně než Intel Core i7-4770. No snad nárůst počtu bufferů a počtu registrů, další porty funkčních rozšíření a zvýšení propustnosti paměťového subsystému procesoru neprošlo jen tak pro nic za nic. To vše vedlo ke zvýšení energetické účinnosti procesoru. Z cim, prote, můžete sladit, jelikož pomocí malého zvýšení dodávky energie bylo dosaženo adekvátního zvýšení produktivity procesoru. No, ztratil jsem víru, co je pravda.

Produktivita neherních doplňků

Pro testování procesoru Intel Core i7-4770 jsme si stáhli náš nástroj ComputerPress Benchmark Script v.12.0, popis zprávy co najdete v březovém čísle časopisu. Předpokládejme, že daný testovací nástroj je založen na nadcházejících skutečných přírůstcích:

  • Xilisoft Video Converter Ultimate 7.7.2;
  • Wondershare Video Converter Ultimate 6.0.3.2;
  • Movavi Video Converter 10.2.1;
  • Adobe Premier Pro CS 6.0;
  • Photodex ProShow Gold 5.0.3276;
  • Adobe Audition CS 6.0;
  • Adobe Photoshop CS 6.0;
  • ABBYY Fine Reader 11;
  • WinRAR 4.20;
  • WinZip 17.0

Jako ukazatel produktivity vítězů se slaví hodina vítězných testovacích úloh.

Uvědomil jsem si, že samotná hodina testování testovacích úloh umožňuje vyhodnotit produktivitu procesoru. Podobné výsledky mohou být pro podobné výsledky méně rozumné, protože jsou brány jako referenční. Tento způsob uvádění výsledků nám umožňuje vyhodnotit, zda je v případě nejtěžšího úkolu mnohokrát (nebo kolikrát) testovaný procesor produktivnější (a možná méně) než referenční.

Upgradovali jsme procesor Intel Core i7-4770 procesor Intel Core i7-3770. Pro přesnost prezentace výsledků je použit globální integrální ukazatel produktivity procesoru a integrální vyhodnocení pro několik skupin testů (konverze videa, mixování video obsahu, zpracování zvuku, zpracování digitálních fotografií, rozpoznávání textu, archivace a archivace dat).

Pro analýzu integrovaného hodnocení produktivity byly výsledky testování procesoru Intel Core i7-4770 normalizovány na výsledky procesoru Intel Core i7-3770K. Výsledky normalizovaných testů byly rozděleny do šesti logických skupin (konverze videa, zpracování zvuku, porovnávání obsahu videa, zpracování digitální fotografie, rozpoznávání textu, archivace a načítání dat) a ve skupině kůže byl integrovaným výsledkem průměrný geometrický typ normalizovaných výsledků . Pro názornost prezentace výsledků byla hodnota vynásobena 1000. Poté byl vypočten geometrický průměr z hlediska odebrání integrálních výsledků a také výsledného integrálního ukazatele produktivity. U procesoru Intel Core i7-3770K dosáhl výsledek integrované produktivity a také integrované výsledky skupiny kožních testů 1000 bodů.

Pro testování procesoru Intel Core i7-3770K byla testována následující konfigurace PC:

  • základní deska - Gigabyte GA-Z77X-UD5H;
  • čipová sada systémový poplatek- Intel Z77 Express;
  • paměť - DDR3-1600;
  • grafická karta - grafické jádro procesoru Intel HD 4000;
  • Testování procesoru Intel Core i7-4770 probíhalo na stojanu:
  • základní deska - Intel DH87MC;
  • čipová sada základní desky - Intel H87 Express;
  • paměť - DDR3-1600;
  • kapacita paměti - 16 GB (dva moduly GEIL po 8 GB);
  • paměťový režim robota - dvoukanálový;
  • grafická karta - procesor grafické jádro Intel HD 4600;
  • akumulátor - Intel SSD 520 (240 GB).

Zasekl jsem se v obou vipadech operační systém Microsoft Windows 8 Enterprise (64bitový).

Je příznačné, že základní deska Intel DH87MC byla testována pro testování procesoru Intel Core i7-4770, cena technického vzorku. Společnost Intel pracovala na vývoji základních desek pod vlastní značkou a nyní se věnuje více než referenčnímu designu, aby svým partnerům fungovala jako karta. Deska Intel DH87MC se tedy v žádném případě neprodává.

Stejně jako procesor Intel Core i7-3770K byl i procesor Intel Core i7-4770 testován s vlastní BIOS pro upřesnění, že byl aktivován režim Intel Turbo Boost, ale nedocházelo k přetaktování procesorů.

Pro zajištění vysoké přesnosti výsledků byly tyto testy provedeny pětkrát.

Výsledky testu jsou uvedeny v tabulce. 1 a na Obr. 6.

Mal. 6. Integrální výsledky testování procesorů s utilitou

ComputerPress Benchmark Script v.12.0

Stejně jako u Bachite může být integrovaná produktivita procesoru Intel Core i7-4770 o 10 % vyšší než produktivita procesoru Core i7-3770K a největší nárůst produktivity je u takových doplňků, jako je Adobe Photoshop CS6 (15 % ) a Adobe Premier Pro CS 6.) a Photodex ProShow Gold 5.0.3276 (13 %).

Kdykoli je nutné věřit, že procesory Intel Core i7-4770 a Core i7-3770K pracují na stejné taktovací frekvenci a rozdíl v produktivitě, který je vidět, se vysvětluje pouze změnami v mikroarchitektuře procesoru Intel Core i7. -4770. V neherních programech vám nová mikroarchitektura procesoru Haswell umožňuje snížit nárůst produktivity v průměru o 10 %.

Produktivita hry

Utilita ComputerPress Benchmark Script v.12.0 umožňuje méně hodnotit produktivitu procesoru při práci s neherními programy, ve kterých schopnosti integrovaného grafického jádra prakticky nevítězí.

Hodnotili jsme také výkon grafického jádra procesoru Intel Core i7-4770 ve 3D hrách s různými benchmarky 3DMark Professional a 3DMark 11 Advanced Edition.

Benchmark 3DMark Professional - ce nový test, který podporuje platformy Windows i Android. Tento benchmark zahrnuje tři testy: Ice Storm, Cloud Gate a Fire Strike. První z nich je zaměřena na mobilní zařízení, jako jsou smartphony, tablety nebo netbooky, další - na notebooky / ultrabooky a univerzální počítače průměrná úroveň; a třetí - na produktivních herních počítačích s pevnou grafikou.

Stůl 2 a tabulka 3 i na Obr. 7 a 8.

Mal. 7. Výsledky testu procesoru

Mal. 8. Výsledky testu procesoru

Jak je vidět z výsledků testů 3DMark Professional a 3DMark 11 Advanced Edition, grafické jádro Intel HD 4600 (procesor Core i7-4770) dokáže efektivně o vyšší produktivita, nižší jádro Intel HD 4000 (procesor Core i7-3770K). Rozdíl v produktivitě v těchto testech však nejsou dva, jak tvrdil Intel ve svých prezentačních materiálech, ale třikrát menší. Zajistěte pokrok v produktivitě grafického subsystému.

Vidkritim, prote, zbylo ještě jedno jídlo. Produktivita grafického subsystému v procesoru Core i7-4770 tak vzrostla dvakrát více než v procesoru Core i7-3770K. Existuje dostatečná produktivita, abyste mohli běžet na počítači bez použití samostatné grafické karty? Pokud se podíváte na podrobné výsledky v testech 3DMark Professional a 3DMark 11 Advanced Edition (hodnoty FPS v grafických testech), zjistíte, že jádro Intel HD 4600 není vhodné pro grafické hraní. Nicméně benchmarky 3DMark Professional a 3DMark 11 Advanced Edition jsou stále specifické programy. A abychom dali objektivní zpětnou vazbu k napájecímu obvodu, můžeme se dostat k výsledkům testování procesoru Core i7-4770 a dalších herních benchmarků. Z tohoto důvodu není potřeba porovnávat výsledky testování grafických jader procesorů Core i7-4770 a Core i7-3770K, ale porovnat můžeme pouze absolutní výsledek procesoru Core i7-4770 ve FPS.

  • Pro tento test jsme testovali následující benchmarky:
  • Unigine Heaven Benchmark 4.0;
  • Unigine Valley 1.0;
  • Bioshock Infinite (v budoucím benchmarku);
  • Metro 2033 (probíhá benchmark).

Testování probíhalo s velikostí obrazovky 1920×1080 (menší velikost je prostě nepodstatná) a ve dvou režimech: maximální produktivita a maximální jas. Tsі extreme nalashtuvannya znamenají vlastní vidličku, za jejíž hranicemi se FPS nedostanete za žádný nalashtuvan gri.

Zlepšení kožního benchmarku v režimech maximální produktivity a intenzity jsou uvedeny v tabulce. 4, tab. 5, tab. 6 a tab. 7 a výsledky testu jsou uvedeny na Obr. 9.

Obrázek 9. Výsledky testování procesoru Intel Core i7-4770 ve hrách

a herní benchmarky

Z výsledků testu je zřejmé, co je třeba udělat pro zlepšení minimálního jasu ( maximální produktivita), kdy grafické jádro nesmí hrát v aktuální 3D hře v procesoru Intel Core i7-4770. Průměrná hodnota FPS, kterou jsme zvolili pro naše benchmarky, nepřesáhne 30 FPS, což samozřejmě nelze považovat za uspokojivý výsledek. A k tomu je visnovok takový: chytře je nové grafické jádro Intel HD 4600 produktivnější jádro Intel HD 4000, ale to neznamená, že grafika je navržena tak, aby vám umožnila obejít se bez samostatné grafické karty. Pro počítač, na kterém běží hry, grafika evidentně nevyhovuje.

Višňovok

Na konci naší recenze procesoru Intel Core i7-4770 byla krátká taška.

V porovnání s procesorem Intel Core i7-3770K vzrostl výkon procesoru Intel Core i7-4770 v neherních programech přibližně o 10 %. Pokud však mluvíme o rostoucí produktivitě procesorů Haswell, je nutné, aby matka měla důležité prostředí.

Jeden z hlavních úspěchů procesorů Intel Jádro jiného(Sandy Bridge) a třetí (Ivy Bridge) generace se věřilo, že zápach byl laskavě rozptýlen a pochopení základní frekvence hodin booleovským virtuálním světem. Procesory Qi byly rozděleny na částečně odemčené (procesory řady K) a částečně odemčené (všechny ostatní procesory). Procesory řady K lze oddělit způsobem změny multiplikačního faktoru (maximální hodnota multiplikačního faktoru je dobrá a nutná, ale aby byla vysoká).

U procesorů, které se často rozpadávají, můžete v režimu Turbo Boost nastavit násobitel na vyšší, nižší maximální hodnotu. Například procesor Intel Core i7-3770 se základní taktovací frekvencí 3,4 GHz může být taktován až na 4,3 GHz (násobič 43), ale maximální taktovací frekvence tohoto procesoru v režimu Turbo Boost je 3,9 GHz (násobič 3 ).

V procesorech Haswell, které nepatří do řady K, však dochází k tak častému blokování, a proto je nelze prolomit.

Dříve bylo možné krim manipulace s multiplikačním koeficientem procesoru rozptýlit zvýšením frekvence systémové sběrnice. Formálně můžete. Jak ale ukazuje praxe, procesory Intel Core další, třetí a čtvrté generace prakticky nelze řídit na vyšší frekvenci systémové sběrnice. Naše experimenty s procesorem Intel Core i7-4770 ukázaly, že pokud se frekvence systémové sběrnice zvýší o více než 3 MHz, systém již nebude využíván.

Nový Intel zablokoval možnost soukromého přetaktování – naprosto nerozumné. Více než cokoli jiného lze tuto nepřátelskou polovinu společnosti z hlediska propagace koristuvachіv a partnerům, protože se zabývají výrobou základních desek, považovat za sakra marketingovou pardon společnosti.

Nemožnost přetaktování procesorů Haswell, pokud neleží na řadě K, vést k urážlivému součtu. Z pohledu variability a produktivity si můžete pořídit často odemčený procesor Intel Core i7-3770 a zcela odemčený procesor Intel Core i7-4770. S jeho provozem na frekvenci 4,3 GHz (do takové frekvence jej lze provozovat bez problémů) dosáhnete vyšší produktivity srovnatelné s procesorem Intel Core i7-4770.