Avx jaké procesory. Instrukční sady AVX. Mikroprocesory s AVX

Vylepšení

  • Nové schéma kódování instrukcí VEX
  • Velikost vektorových registrů SIMD se zvyšuje ze 128 (XMM) na 256 bitů (registry YMM0 - YMM15). Stávající 128bitové instrukce SSE budou používat dolní polovinu nových registrů YMM, aniž by změnily horní polovinu. Byly přidány nové 256bitové instrukce AVX pro práci s registry YMM. V budoucnu je možné rozšířit vektorové registry SIMD na 512 nebo 1024 bitů.

Nové schéma kódování

Nové schéma kódování instrukcí VEX používá prefix VEX. V přítomný okamžik Existují dvě předpony VEX, dlouhé 2 a 3 bajty. U 2bajtové předpony VEX je první bajt 0xC5, u 3bajtové předpony VEX 0xC4. V 64bitovém režimu je první bajt předpony VEX jedinečný. V 32bitovém režimu dochází ke konfliktu s instrukcemi LES a LDS, který je řešen nejvýznamnějším bitem druhého bajtu, má smysl pouze v 64bitovém režimu prostřednictvím nepodporovaných forem instrukcí LES a LDS. Délka existujících instrukcí AVX, včetně prefixu VEX, nepřesahuje 11 bajtů. V budoucích verzích se očekávají delší pokyny.

Nové pokyny

Instrukce Popis
VBROADCASTSS, VBROADCASTSD, VBROADCASTF128 Zkopíruje 32, 64 nebo 128bitový operand z paměti do všech prvků vektorového registru XMM nebo YMM.
VINSERTF128 Nahradí dolní nebo horní polovinu 256bitového registru YMM hodnotou 128bitového operandu. Druhá část cílového registru se nezmění.
VEXTRACTF128 Načte dolní nebo horní polovinu 256bitového registru YMM a zkopíruje jej do 128bitového cílového operandu.
VMASKMOVPS, VMASKMOVPD Podmíněně přečte libovolný počet prvků z vektorového operandu z paměti do cílového registru, zbývající prvky ponechá nepřečtené a vymaže odpovídající prvky cílového registru na nulu. Může také podmíněně zapsat libovolný počet prvků z vektorového registru do vektorového operandu v paměti, přičemž zbývající prvky paměťového operandu zůstanou nezměněny.
VPERMILPS, VPERMILPD Přeuspořádá 32 nebo 64bitové vektorové prvky podle operandu selektoru (z paměti nebo z registru).
VPERM2F128 Přeskupí 4 128bitové prvky dvou 256bitových registrů do 256bitového cílového operandu pomocí okamžité konstanty (imm) jako selektoru.
VZEROALL Vymaže všechny registry YMM a označí je jako nepoužité. Používá se při přepínání mezi 128bitovým režimem a 256bitovým režimem.
VZEROUPPER Resetuje horní poloviny všech registrů YMM na nulu. Používá se při přepínání mezi 128bitovým režimem a 256bitovým režimem.

Specifikace AVX také popisuje instrukční skupinu PCLMUL (Parallel Carry-Less Multiplication, Parallel CLMUL).

  • PCLMULLQLQDQ xmmreg, xmmrm
  • PCLMULHQLQDQ xmmreg, xmmrm
  • PCLMULLQHQDQ xmmreg, xmmrm
  • PCLMULHQHQDQ xmmreg, xmmrm
  • PCLMULQDQ xmmreg,xmmrm,imm

Aplikace

Vhodné pro intenzivní výpočty s pohyblivou řádovou čárkou v multimediálních programech a vědeckých úlohách. Kde je možný vyšší stupeň paralelismu, zvyšuje se výkon s reálnými čísly.

Podpora operačního systému

Použití registrů YMM vyžaduje podporu operačního systému. Registry YMM podporují následující systémy:

Mikroprocesory s AVX

Kompatibilita mezi implementacemi Intel a AMD je popsána v instrukční sadě XOP.

Budoucí rozšíření

Schéma kódování instrukcí VEX snadno umožňuje další rozšíření sady instrukcí AVX. V další verze, AVX2 se plánuje přidání instrukcí pro práci s celými čísly, FMA3 (zdvojnásobí výkon při zpracování čísel s pohyblivou řádovou čárkou), načtení vektoru distribuovaného v paměti (shromáždění) a tak dále.

Různá plánovaná rozšíření instrukční sady x86:

  • CLMUL
  • AMD FMA4
  • AMD XOP
  • AMD CVT16

Poznámky


Základní instrukční rozšiřující sady pro procesory rodiny x86
MMX | MMXEXT | SSE | SSE2 | SSE3 | SSSE3 | SSE4 | ATA | 3DNy! | 3DNowExt | SSE5 | AVX| AES

Nadace Wikimedia.

  • 2010.

Úřad státní bezpečnosti (Maďarsko)

    Podívejte se, co je "AVX" v jiných slovnících: Prům

    AVX- ((image))) Sigles d une seule letter Sigles deux letters > Sigles de trois letter AAA à DZZ EAA à HZZ IAA à LZZ MAA à PZZ QAA à TZZ UAA à XZZ … Wikipédia en Français

- Sigles d’une seule letter Sigles deux Lettres > Sigles de trois letters Sigles de quatre liters Sigles de cinq letters Sigles de cinq letters Sigles de sept… … Wikipédia en Français

Dnes chci začít konverzaci o tom, jaké avx instrukce jsou v procesoru, kde a k čemu se používají.
Co se týče procesorů, na policích jsou vzteklé pahýly výkonově rovné i-3s. Je i3 marketingové spiknutí? Je Pentium skutečně „stejný druh 3 jen levnější“? ano i ne. Tady je ta věc.

K napsání eseje ve Wordu bude stačit nejlevnější Celeron (a „zástrčkový procesor“ seženete ještě levněji, když ho koupíte na bleším trhu s účtenkou a zbytkem záruky).
Pro hraní všech her po abstraktu je vhodné Pentium s provedením i-3 (2 jádra 4 vlákna). U her nejsou instrukce AVX vyžadovány (pokud jsou k dispozici potřebné SSE).

Ale pro profesionální úkoly bude užitečná hardwarová virtualizace a podpora instrukcí AVX, takže je lepší vzít alespoň i-3.

Proč potřebujeme instrukce AVX?

Co je součástí řady odborných úkolů? Kameny postrádající AVX zpravidla také postrádají hardwarovou virtualizační akceleraci.
Vývoj pro Android, který bude vyžadovat virtuální stroj stejného kýblu (některé emulátory se ani nespustí, některé budou bohužel fungovat a silně zatěžují jádra).
Žvýkání multimediálních dat (od zpracování fotek až po kódování videa a stříhání 3D grafiky, takže hráči let's play by měli vyndat víc za dražší procesor).

Pokud bez AVX

Procesor má registry pro instrukce.
Registr SSE je 128bitový a registr AVX je 256bitový.
Abychom tedy nikoho nenafoukli anatomií kamene, řekněme - 256 se do 128 nevejde.

Bez AVX můžete také zpracovávat fotografie, žvýkat videa a stříhat tři de. Ale jsou tu nuance...
Zjednodušeně řečeno, starý 8jádrový Xeon (neschopný AXV) bude stříhat videa stejnou rychlostí jako moderní i3 (schopný AVX).

Procesor má pipeline: zjistil, kde to vzít z paměti, vzal to z paměti, vypočítal to a poslal výsledky do paměti.
Zjednodušené potrubí s a bez AVX lze znázornit následovně.

Jak vidíte, v druhém případě je operací méně. Z čehož je logické předpokládat, že AVX-counter pracuje rychleji (v každém výpočetním cyklu). A protože je rychlejší v každém hodinovém cyklu, pak s méně gigahertzy můžete počítat rychleji.

Další dobrá věc na AVX je dodatečný operand. Nejsou použity 2 operandy, ale 3, což také zkracuje potrubí. Řekněme, že chceme přidat X a Y.
Kód: Normální provoz, kde 2 operandy (X=X+Y) způsobí přepsání jednoho z operandů.
Operace AVX, kde 3 operandy (Z=X+Y) umožňují zapsat výsledek do třetího operandu.
Obtížný? Dobře, pojďme to zjednodušit.

Natáčení videí pomocí AVX bude rychlejší. Protože k výše uvedenému se přidává bonus optimálního členění rámu.
Počítač nepřepočítává každý snímek. Rám rozbije na obdélníky a porovná je, a pokud se najde vhodný, použije hotový kus.
Zde se AVX naučil optimálněji pracovat s videi (pro zájemce čtěte od profesionálů a já se omezím na krásný obrázek).

Dříve bylo členění znázorněno vlevo. Rozdělení AVX může dělat chytřejší věci - jak je znázorněno vpravo.

Abych to shrnul

Chcete-li napsat abstrakt ve Wordu, udělá to každý procesor.
Aby bylo možné hrát hru místo eseje, bude stačit pahýl o velikosti I-třetiny.
Chcete-li omezit obsah, je lepší rozdělit se na i-třetinu.

Nejnovější rozšíření funkcí AVX512 (Advanced Vector Extension 512-bit), také známý jako AVX3, sestává z devíti technologií, z nichž každá může nebo nemusí být volitelně podporována konkrétním procesorem. Řada implementací uvažované rodiny, spojených s operacemi se zvýšenou bitovou kapacitou, se již používá v procesory Intel Xeon Phi a volitelně dostupné v procesory Xeon s mikroarchitekturou Skylake. Připomeňme, že koprocesory Xeon Phi jsou určeny pro instalaci do PCI Express slot

Základní funkce AVX512

Přijatá zkratka: AVX512 F (Nadace) . Toto je základní nebo minimální sada spustitelných příkazů a dostupných softwarových prostředků potřebných ke zpracování 512bitových vektorů. Podpora AVX512F implikuje rozšíření šířky vektorových registrů na 512 bitů a zvýšení počtu těchto registrů na 32. Pro srovnání funkční rozšíření předchozí generace (AVX2), implementované v r. procesory Haswell, znamená použití 16 registrů o šířce 256 bitů. Tradičně jsou „staré“ registry součástí „nových“. V tomto případě to znamená, že 16 256bitových registrů YMM je mapováno na spodní 256bitové „poloviny“ 512bitových registrů ZMM.

Jak vyplývá z jednoduchých výpočtů, nový 512-bit provozní zařízení schopný zpracovat 8 64bitových čísel s dvojitou přesností nebo 16 32bitových čísel s jednoduchou přesností v jedné vektorové instrukci.

Základní sada AVX512F obsahuje také provedení predikátu vektorové operace. To znamená, že při zpracování čísel zabalených v 512bitovém registru lze operaci provést nebo zrušit na základě jednotlivých čísel. Například při zpracování 16 32bitových čísel s jednoduchou přesností 16bitový predikát obsahující všechny „jedničky“ zajistí provedení operace se všemi čísly. Pokud jsou všechny bity predikátu nulové, operace se nezdaří. A nastavením například dvou nejméně významných bitů predikátu můžete provést operaci s prvními dvěma čísly, přičemž zbývající čísla zůstanou nedotčena. Pro uložení predikátů je zavedeno 8 dalších 64bitových registrů K0–K7.

Obr. 1

Detekce konfliktů hardwaru

Přijatá zkratka: AVX512CD (detekce konfliktů). Používá se k efektivní detekci situací, ve kterých je specifikováno softwarové procedury nelze spustit paralelně kvůli závislosti na datech. Připomeňme, že při optimalizaci programových smyček se používá metoda, která implikuje přechod od sekvenčního k paralelnímu provádění iterací smyček. Smyčka se „rozvine“ do lineárního sledu operací, následně se tyto operace provádějí paralelně pomocí vektorových registrů. Tato technika je povolena pouze v případě, že mezi iteracemi smyčky nejsou žádné datové „konflikty“. V opačném případě, pokud některá iterace používá data, která by měla připravit předchozí iterace paralelní provedení bude mít za následek chybu.

Dopředné načítání dat

Přijatá zkratka: AVX512 PF (Přednačtení) . Mechanismus předběžného načítání byl vylepšen, aby vyhovoval náhodně fragmentovanému načítání dat. Dopředné načítání ve své nejjednodušší podobě se v procesorech Intel používá již od Pentia III. Skládá se ze čtení operandů z BERAN k použití mezipaměti speciální týmy(nápovědy k předběžnému načtení). To minimalizuje neproduktivní pauzy v procesoru, protože když jsou data požadována, jsou již načtena z paměti. Nyní lze tuto operaci provést nejen pro jednu paměťovou buňku, ale také pro seznam buněk, jejichž adresy jsou ve vektorovém registru.


Obr. 2

Výpočet exponentů a reciprokých hodnot

Přijatá zkratka: AVX512ER (exponenciální a reciproční). Tato skupina příkazů vytváří přibližné výsledky pro exponent, převrácenou a převrácenou hodnotu odmocniny. Relativní chyba v závislosti na typu příkazu je až 2 až mocniny mínus 23 nebo 2 až mínus 28. Příkazy v této skupině se používají k efektivní podpoře situací, ve kterých je přijatelné obětovat přesnost kvůli výkonu. Udělejme hned výhradu, že exponent zde znamená zvýšení dvojky (a ne čísla e) na danou mocninu. Tuto kontroverzní terminologickou vlastnost mají inženýři Intelu na svědomí.

Operace s proměnnými bity

Přijatá zkratka: AVX512 VL (Vektor Délka) . Tato funkce umožňuje použití funkcí AVX512, zejména výše popsaných predikátů a 32 vektorových registrů) pro operandy o velikosti 128 a 256 bitů.

Manipulace s bajty a 16bitovými operandy

Přijatá zkratka: AVX512 B.W. (Byte a Slovo) . Umožňuje použití funkcí AVX512 pro 8bitové a 16bitové celočíselné operace.

Zpracování 32 a 64bitových operandů

Přijatá zkratka: AVX512 DQ (Dvojnásobek slovo a Quad Slovo) . Umožňuje použití funkcí AVX512 pro 32bitové a 64bitové operace.

Kombinované vícenásobné sčítání pro 52bitové operandy

Přijatá zkratka: AVX512IFMA (Integer Fused Multiply and Add). Násobení celých čísel bez znaménka 52 bity. V otevřené dokumenty Nebylo možné najít vysvětlení pro použití takto atypického číselného formátu. Vzhledem k tomu, že šířka mantisy pro číslo s dvojnásobnou přesností je 52 bitů, předpokládejme, že cílem bylo umět zpracovat mantisu jako nezávislou hodnotu celočíselným (a tedy rychlým) způsobem.

Operace s byty jako součást vektorových registrů

Přijatá zkratka: AVX512VBM (Manipulace s vektorovými byty). To zahrnuje instrukce pro přeskupení a selektivní předávání bajtových operandů umístěných ve vektorových registrech.

Resumé

Jak je patrné z výše uvedeného, ​​rozšíření AVX512 znamená zavedení nových instrukcí procesoru a architektonických prostředků. Proto pouze software, který je napsán a optimalizován s ohledem na novou technologii, získá zvýšení produktivity.

Aby taková technologie fungovala, je samozřejmě také nutná podpora operačního systému, protože zvýšení počtu a bitové hloubky registrů vede ke zvýšení množství informací, které je třeba uložit a obnovit při přepínání kontextu procesoru v multitaskingové prostředí. Všimněte si, že Intel se maximálně sjednotil

Zpracování řetězců

Instrukční sady SSE4.2

Čtení paměti WC

Operace čtení, která umožňuje zrychlit (až 7,5krát) práci s paměťovými oblastmi kombinujícími zápis.

Tyto instrukce provádějí aritmetická srovnání mezi všemi možnými dvojicemi polí (64 nebo 256 porovnání!) z obou řetězců daných obsahem xmm1 a xmm2/m128. Booleovské výsledky srovnání jsou pak zpracovány tak, aby byly získány požadované výsledky. Okamžitý argument imm8 řídí velikost (řetězce bajtů nebo unicode, každý až 16/8 prvků), signaturu polí (prvky řetězce), typ porovnání a interpretaci výsledků.

Mohou vyhledávat v řetězci (oblasti paměti) znaky z dané sady nebo v určených rozsazích. Můžete porovnávat řetězce (oblasti paměti) nebo hledat podřetězce.

Všechny ovlivňují příznaky procesoru: SF je nastaveno, pokud xmm1 není úplný řetězec, ZF je nastaveno, pokud xmm2/m128 není úplný řetězec, CF je nastaveno, pokud výsledek není nula, OF je, pokud je nejméně významný bit výsledek není nula. Příznaky AF a PF jsou resetovány.

Pokročilé vektorové rozšíření(AVX) - rozšíření instrukční sady x86 pro mikroprocesory Intel a AMD, navržený společností Intel v březnu 2008.

AVX poskytuje různá vylepšení, nové pokyny a nové schéma kódování strojových kódů.

Vylepšení:

Velikost vektorových registrů SIMD se zvyšuje ze 128 (XMM) na 256 bitů (registry YMM0 - YMM15). Stávající 128bitové instrukce budou používat spodní polovinu nových registrů YMM. V budoucnu je možné rozšíření na 512 nebo 1024 bitů.

Nedestruktivní operace. Instrukční sada AVX umožňuje použití libovolné instrukce XMM se dvěma operandy ve formě tří operandů bez úpravy dvou zdrojových registrů, se samostatným registrem pro výsledek. Například místo a = a + b můžete použít c = a + b, zatímco registr a zůstane nezměněn. AVX nepodporuje nedestruktivní formy operací na běžných obecných registrech, jako je EAX, ale taková podpora může být přidána v budoucích rozšířeních.

Požadavky na zarovnání dat pro operandy SIMD v paměti jsou uvolněny.

Nový systém kódování strojového kódu VEX poskytuje nová sada předpony kódu, které rozšiřují prostor možných strojových kódů. Přidány instrukce s více než třemi operandy. Vektorové registry SIMD mohou být větší než 128 bitů.

Nové pokyny:

Specifikace AVX také popisuje instrukční skupinu PCLMUL (Parallel Carry-Less Multiplication, Parallel CLMUL).

Aplikace:

Vhodné pro multimediální, vědecké a finanční aplikace náročné na plovoucí desetinnou čárku. Zvyšuje paralelismus a propustnost v reálném počítání SIMD. Snižuje tlak (zatížení) registrů díky nedestruktivním tříoperandovým operacím.

Popis testovacích systémů a testovacích metod

Hlavním účelem testování je identifikovat výkonnostní zisky, kterých lze dosáhnout přetaktováním nepřetaktovaných procesorů. Proto juniorští zástupci v řadách Core i5 a i3, které jsme vzali k testování, Jádrové procesory Modely i5-6400 a i3-6100 byly testovány dvakrát: v nominálním provozním režimu a na frekvenci 4,7 GHz, což lze na základě získaných zkušeností považovat za docela typický režim přetaktování CPU generace Skylake. Kromě toho se testů zúčastnil i plnohodnotný přetaktovací procesor řady K, Core i5-6600K. Jeho přítomnost v testech je nezbytná pro posouzení, zda se liší výkon přetaktování u procesorů určených a neurčených pro provoz v nouzových režimech, a pokud ano, o kolik. Core i5-6600K jsme testovali dvakrát: jak v nominálním režimu, tak při přetaktování na 4,6 GHz (to je maximální dosažitelná frekvence pro náš vzorek s napájecím napětím zvýšeným na 1,425 V).

Kompletní seznam komponent zapojených do testovacích systémů je následující:

  • Procesory:
    • Intel Core i5-6600K (Skylake, 4 jádra, 3,5-3,9 GHz, 6 MB L3);
    • Intel Core i5-6400 (Skylake, 4 jádra, 2,7-3,3 GHz, 6 MB L3);
    • Intel Core i3-6100 (Skylake, 2 jádra + HT, 3,7 GHz, 3 MB L3).
    • Chladič CPU: Noctua NH-U14S.
    • základní deska: ASUS Maximus VIII Ranger (LGA1151, Intel Z170).
    • Paměť: 2 × 8 GB DDR4-3200 SDRAM, 16-18-18-36 (Corsair Vengeance LPX CMK16GX4M2B3200C16R).
    • Grafická karta: NVIDIA GeForce GTX 980 Ti (6 GB/384bitová GDDR5, 1000-1076/7010 MHz).
    • Diskový subsystém: Kingston HyperXÚsporných 480 GB (SHSS37A/480G).
    • Napájení: Corsair RM850i ​​​​(80 Plus Gold, 850 W).

Testování bylo provedeno na operačním systému Microsoft Windows 10 Enterprise Build 10586 s použitím následující sady ovladačů:

  • Ovladač čipové sady Intel 10.1.1.8;
  • Ovladač rozhraní Intel Management Engine 11.0.0.1157;
  • Ovladač NVIDIA GeForce 361.43.

Popis nástrojů používaných k měření výpočetního výkonu:

Srovnávací hodnoty:

  • BAPCo SYSmark 2014 ver 1.5 – testování ve scénářích produktivity Office ( kancelářská práce: příprava textu, zpracování tabulek, práce s e-mailem a navštěvování internetových stránek), Tvorba médií (práce na multimediálním obsahu – tvorba reklamy pomocí předfilmovaného digitální obrázky a video) a Data/Finanční analýza (statistická analýza a prognóza investic na základě určitého finančního modelu).
  • Futuremark 3DMark Professional Edition 1.5.915 – testování ve scénách Sky Diver, Cloud Gate a Fire Strike.

Aplikace:

  • Adobe After Effects CC 2015 - testování rychlosti vykreslování pomocí ray tracingu. Měří se čas, který systém stráví vykreslením předem připraveného videa v rozlišení 1920 × 1080@30fps.
  • Adobe Photoshop CC 2015 - testování výkonu při zpracování grafických obrázků. Měří průměrnou dobu provádění testovacího skriptu, který je kreativním přepracováním Retouch Artists Photoshop Speed ​​​​Test, který zahrnuje typické zpracování čtyř pořízených 24megapixelových snímků. digitální fotoaparát.
  • Adobe Photoshop Lightroom 6.1 – testování výkonu při dávkovém zpracování série snímků ve formátu RAW. Testovací scénář zahrnuje následné zpracování a export do JPEG v rozlišení 1920 × 1080 a maximální kvalitě dvou set 12megapixelových RAW snímků pořízených digitálním fotoaparátem Nikon D300.
  • Adobe Premiere Pro CC 2015 - testování výkonu pro nelineární střih videa. Měří se čas vykreslení Blu-Ray projektu obsahujícího HDV 1080p25 video s různými použitými efekty.
  • Autodesk 3ds max 2016 - testování rychlosti finální ztvárnění. Měří čas potřebný k vykreslení v rozlišení 1920 x 1080 pomocí vykreslovače mental ray standardní scény Hummer.
  • Blender 2.76 - testování konečné rychlosti vykreslování v jednom z populárních balíčky zdarma k vytvoření trojrozměrné grafiky. Měří se doba výstavby finálního modelu z Blender Cycles Benchmark rev4.
  • Microsoft Edge 20.10240.16384.0 - testování výkonu internetových aplikací vytvořených pomocí moderních technologií. Je použit specializovaný test WebXPRT 2015, který implementuje algoritmy skutečně používané v internetových aplikacích v HTML5 a JavaScriptu.
  • TrueCrypt 7.2 - testování kryptografického výkonu. Používá se benchmark zabudovaný do programu, který používá trojité šifrování AES-Twofish-Serpent.
  • WinRAR 5.30 - testování rychlosti archivace. Čas strávený archivátorem komprimací adresáře různé soubory celkový objem 1,7 GB. Používá se maximální stupeň komprese.
  • x264 r2638 - testování rychlosti překódování videa do formátu H.264/AVC. Pro hodnocení výkonu používáme originální video soubor 1080p@50FPS AVC s datovým tokem asi 30 Mbps.
  • x265 1.8+188 8bpp - testování rychlosti překódování videa do slibného formátu H.265/HEVC. K vyhodnocení výkonu se používá stejný soubor videa jako v testu rychlosti překódování kodéru x264.

Hry:

  • Company of Heroes 2. Nastavení pro rozlišení 1280×800: Maximální kvalita obrazu, Anti-Aliasing = Vypnuto, Vyšší detail textury, Vysoký detail sněhu, Fyzika = Vypnuto. Nastavení pro rozlišení 1920×1080: Maximální kvalita obrazu, Vysoká anti-aliasing, Vyšší detail textury, Vysoký detail sněhu, Fyzika = Vysoká.
  • Grand Theft Auto V. Nastavení pro rozlišení 1280 × 800: Verze DirectX = DirectX 11, FXAA = Vypnuto, MSAA = Vypnuto, NVIDIA TXAA = Vypnuto, Hustota osídlení = Maximum, Varieta populace = Maximum, Měřítko vzdálenosti = Maximum, Kvalita textury = Velmi vysoká, Kvalita stínování = Velmi vysoká, kvalita stínu = velmi vysoká, kvalita odrazu = ultra, odraz MSAA = vypnutý, kvalita vody = velmi vysoká, kvalita částic = velmi vysoká, kvalita trávy = ultra, jemný stín = nejjemnější, post FX = ultra, hloubka ve hře Of Field Effects = zapnuto, anizotropní filtrování = x16, Okolní okluze= Vysoká, Teselace = Velmi vysoká, Dlouhé stíny = Zapnuto, Stíny s vysokým rozlišením = Zapnuto, Streamování s vysokými detaily za letu = Zapnuto, Škálování rozšířené vzdálenosti = Maximální, Vzdálenost rozšířených stínů = Maximální. Nastavení pro rozlišení 1920 × 1080: Verze DirectX = DirectX 11, FXAA = Vypnuto, MSAA = x4, NVIDIA TXAA = Vypnuto, Hustota osídlení = Maximum, Varieta populace = Maximum, Měřítko vzdálenosti = Maximum, Kvalita textury = Velmi vysoká, Kvalita stínování = Velmi vysoká, kvalita stínu = velmi vysoká, kvalita odrazu = ultra, odraz MSAA = x4, kvalita vody = velmi vysoká, kvalita částic = velmi vysoká, kvalita trávy = ultra, jemný stín = nejjemnější, post FX = ultra, hloubka ve hře Efektů pole = Zapnuto, Anizotropní filtrování = x16, Okolní okluze = Vysoká, Teselace = Velmi vysoká, Dlouhé stíny = Zapnuto, Stíny s vysokým rozlišením = Zapnuto, Streamování s vysokým rozlišením za letu = Zapnuto, Rozšířené měřítko vzdálenosti = Maximální, Vzdálenost rozšířených stínů = Maximum.
  • F1 2015. Nastavení pro rozlišení 1280×800: Ultra High Quality, 0xAA, 16xAF. Nastavení pro rozlišení 1920×1080: Ultra High Quality, SMAA + TAA, 16xAF. Testování využívá trať v Melbourne.
  • Hitman: Absolution. Nastavení pro rozlišení 1280×800: Ultra kvalita, MSAA = vypnuto, vysoká kvalita textury, 16x textura Aniso, ultra stíny, vysoké SSAO, globální osvětlení = zapnuto, vysoké odrazy, FXAA = zapnuto, ultra úroveň detailů, vysoká hloubka ostrosti, Teselace = zapnuto, normální květ. Nastavení pro rozlišení 1920×1080: Ultra kvalita, 8x MSAA, vysoká kvalita textury, 16x textura Aniso, ultra stíny, vysoké SSAO, globální osvětlení = zapnuto, vysoké odrazy, FXAA = zapnuto, ultra úroveň detailů, vysoká hloubka ostrosti, teselace = Zapnuto, normální kvetení.
  • Metro: Poslední světlo Redux. Nastavení pro rozlišení 1280×800: DirectX 11, Vysoká kvalita, Filtrování textur = AF 16X, Rozostření pohybu = Normální, SSAA = Vypnuto, Teselace = Normální, Pokročilá PhysX = Vypnuto. Nastavení pro rozlišení 1920×1080: DirectX 11, Velmi vysoká kvalita, Filtrování textur = AF 16X, Rozostření pohybu = Normální, SSAA = Zapnuto, Teselace = Normální, Pokročilá PhysX = Vypnuto. Pro testování se používá scéna 1.
  • Tom Clancy's Rainbow Six Siege. Nastavení pro rozlišení 1280×800: Kvalita textur = Ultra, Filtrování textur = Anizotropní 16x, Kvalita LOD = Ultra, Kvalita stínování = Vysoká, Kvalita stínů = Velmi vysoká, Kvalita odrazu = Vysoká, Okolní okluze = SSBC, Efekty čočky = Bloom + Lens Odlesk, hloubka ostrosti přiblížení = zapnuto, vyhlazení po procesu = vypnuto, vyhlazení více vzorků = vypnuto. Nastavení pro rozlišení 1920×1080: Kvalita textur = Ultra, Filtrování textur = Anizotropní 16x, Kvalita LOD = Ultra, Kvalita stínování = Vysoká, Kvalita stínů = Velmi vysoká, Kvalita odrazu = Vysoká, Okolní okluze = SSBC, Efekty čočky = Bloom + Lens Odlesk, hloubka ostrosti přiblížení = zapnuto, vyhlazení po procesu = vypnuto, vyhlazení více vzorků = MSAA 4x.
  • Zloděj. Nastavení pro rozlišení 1280×800: Kvalita textury = Velmi vysoká, Kvalita stínů = Velmi vysoká, Kvalita hloubky ostrosti = Vysoká, Kvalita filtrování textur = 8x anizotropní, SSAA = Vypnuto, Odrazy prostoru obrazovky = Zapnuto, Mapování paralaxní okluze = Zapnuto, FXAA = Off, Contact Hardening Shadows = On, Tessellation = On, Image-based Reflection = On. Nastavení pro rozlišení 1920×1080: Kvalita textury = velmi vysoká, kvalita stínů = velmi vysoká, kvalita hloubky ostrosti = vysoká, kvalita filtrování textur = 8x anizotropní, SSAA = vysoká, odrazy prostoru obrazovky = zapnuto, mapování paralaxní okluze = zapnuto, FXAA = On, Contact Hardening Shadows = On, Tessellation = On, Image-based Reflection = On.
  • Total War: Attila. Nastavení pro rozlišení 1280×800: Anti-Aliasing = Vypnuto, Rozlišení textury = Ultra; Filtrování textur = anizotropní 4x, stíny = Max. Kvalita, Voda = Max. Kvalita, Sky = Max. Kvalita, Hloubka ostrosti = Vypnuto, Účinky částic = Max. Kvalita, Odrazy prostoru na obrazovce = Max. Kvalita, Tráva = Max. Kvalita, Stromy = Max. Kvalita, terén = Max. Kvalita, detaily jednotky = Max. Kvalita, Stavební detaily = Max. Kvalita, Velikost jednotky = Ultra, Kvalita okénka = 3D, Neomezená videopaměť = Vypnuto, V-Sync = Vypnuto, SSAO = Zapnuto, Efekty zkreslení = Zapnuto, Viněta = Vypnuto, Vyblednutí blízkosti = Zapnuto, Blood = Zapnuto. Nastavení pro rozlišení 1920 × 1080: Maximální kvalita.

Takže přetaktování, jak jsme ho znali před pár lety – než Intel začal uvolňovat specializované přetaktovací procesory a blokovat možnost zvyšovat provozní frekvence u jiných CPU, se konečně vrací. Těžko říct, kde se vlastně vzalo řešení otázky odstranění blokování základní frekvence. generátor hodin všechno modelová řada Skylake. Možná se ukázalo, že ochrana BCLK Governor od Intelu není tak silná a spadla pod tlak vývojářů BIOSu základní desky. Je ale také možné, že je do toho strčila pravá strana Intel sám, protože nakonec vyhráli všichni: gigant mikroprocesorů, výrobci desek i uživatelé.

Díky nově otevřeným možnostem přetaktování mají nyní kupující nové argumenty ve prospěch přechodu na platformu LGA1151. O tom není pochyb to bude do určité míry stimulovat prodej nových procesorů. Výrobci desek na cestě získají také nové zákazníky, kterým se jistě podaří zvýšit prodeje modelů založených na Intel Z170. Stranou nezůstanou ani nadšení uživatelé. Čelí nejen dalšímu prostoru pro experimentování, ale také možnosti získat zcela zřejmé finanční výhody. Přetaktovací systémy lze totiž nyní sestavit z levnějších komponent než dříve.

Co je ale na celé této situaci obzvlášť pikantní, je to, jak dobře vše pro Intel dopadlo. Ostatně objevení možnosti přetaktování jakýchkoli, včetně nepřetaktovacích, procesorů LGA1151 by snadno mohlo způsobit pokles poptávky po vlajkových modelech Skylake. Prodeje starších Skylake s oficiálně schváleným přetaktováním jsou ale bezpečné. Faktem je, že při přetaktování ne-K procesorů najednou vzniká celá hromada problémů, z nichž nejhorší je pokles rychlosti provádění instrukcí AVX/AVX2. Díky tomu výkon při práci s řadou programů při přetaktování nejen neroste, ale naopak klesá. To znamená, že skutečný přínos z takového přetaktování lze získat pouze v případech, kdy mluvíme výhradně o práci v aplikacích, které nezahrnují moderní schopnosti FPU procesoru.

To vše znamená, že pokud se bavíme o profesionálních činnostech, na které výkon CPU pracujících v nominálním režimu nestačí, můžete si stejně jako dříve vybrat pouze z Core i5-6600K nebo Core i7-6700K. Přetaktování non-K procesorů je vlastně vhodné jen na hraní – v obou smyslech toho slova. Na jednu stranu je experimentování s přetaktováním takových procesorů neuvěřitelně zajímavé, protože to je opravdu něco nového a poněkud zakázaného. Na druhou stranu hry patří mezi ty aplikace, které instrukce AVX/AVX2 (zatím?) nepoužívají.

I když se však zajímáte pouze o hry a programy, kde se nepoužívají a rozhodně nebudou používat rozšíření AVX/AVX2, schopnost přetaktování, která se objevila u neo-overclockingových procesorů Skylake, vůbec neznamená, že byste, obrazně řečeno, bude moci přetočit čas a vrátit se do zlatého věku Celeronu 300A. V dnešní realitě je nemožné za žádných okolností zvýšit výkon levného procesoru na úroveň vlajkové lodi. Poté, co Intel v polovině roku 2000 rozdělil řadu spotřebitelských procesorů do tříd podle počtu jader a seznamu podporovaných technologií, byl jakýkoli „mezitřídní boj“ nenávratně minulostí. A to jasně ukázaly testy. Junior Core i3-6100 může pouze předstírat, že se při přetaktování snaží dosáhnout výkonu výchozích modelů Core i5. A Junior Core i5-6400 se může pokusit konkurovat Core i5-6600K, ale přirozeně nemůže konkurovat Core i7-6700K.




Nahoru