Arm Cortex-A77 - všetko, čo potrebujete vedieť

Autor: Randy Alexander
Dátum Stvorenia: 2 Apríl 2021
Dátum Aktualizácie: 1 V Júli 2024
Anonim
Ядра Cortex-A77: Увеличенная Производительность на такт MOP-кэш
Video: Ядра Cortex-A77: Увеличенная Производительность на такт MOP-кэш

Obsah


Spolu s novým grafickým procesorom Mali-G77 a zobrazovacím procesorom Mali-D77, Arm predstavil svoj najnovší vysoko výkonný návrh CPU - Cortex-A77. Rovnako ako v minulom roku Cortex-A76, aj Cortex-A77 je navrhnutý pre aplikácie najvyššej úrovne vyžadujúce nízku spotrebu energie značky Arm. Všetko od smartphonov až po laptopy a pravdepodobne aj ďalej.

S prístrojom Cortex-A77 sa Arm zameral na maximálne zvýšenie výkonu inštrukcie na cyklus / hodiny (IPC), ktoré by mohol zvládnuť v porovnaní s procesorom Cortex-A76. Frekvencie hodín, spotreba energie a oblasť sú navrhnuté tak, aby zostali zhruba v rovnakom parku, ale nové jadro môže naraziť na viac inštrukcií naraz. Za týmto účelom spoločnosť Arm navrhla ešte širšie jadro ako minulý rok a urobila niekoľko vylepšení, aby jadro procesora bolo čo najlepšie doplnené. Ale skôr, ako sa dostaneme k tomu, poďme sa pustiť do prehľadu na vysokej úrovni a čísel výkonnosti.


Dosiahnutie cieľov výkonnosti

Už v auguste 2018 Arm necharakteristicky zdieľal cestovnú mapu CPU do roku 2020. Od dizajnu Cortex-A73 až do roku 2020 „Hercules“ spoločnosť sľubuje 2,5-násobné zvýšenie výpočtového výkonu. Spravodlivý kúsok tejto obrovskej projekcie sa dosiahol pomocou hlavného posunu mikroarchitektúry s Cortex-A76, vyššími modernými hodinovými rýchlosťami a posunom zo 16 na 10 a teraz 7 nm výroby s následnou 5 nm. Približne 1,8-násobok ziskov z mapy sa dosiahol už minulý rok a Cortex-A77 poskytuje ďalšie zvýšenie IPC približne o 20 percent. Tým sa dostávame na dobrú cestu k cieľu spoločnosti Arm 2,5 x, hoci mobilné zariadenia s obmedzeným rozpočtom na energiu a teplo sa neočakávajú, že uvidia všetky tieto zisky.

Na porovnanie, minuloročný Cortex-A76 poskytol približne 30-35 percentný nárast oproti Cortex-A75. Tento rok sa pozeráme na utlmený, ale stále výrazný, 20-percentný zisk IPC medzi A77 a A76. Toto je dobrá správa, pretože to znamená vyšší výkon pri dodržaní podobných obmedzení týkajúcich sa tepla a energie ako predtým. Kompromis je, že A77 je asi o 17 percent väčší ako A76, takže z hľadiska kremíka bude stáť o niečo viac. Ak chcete porovnanie s vedúcimi pracovníkmi v oblasti stolných počítačov, spoločnosť AMD zvládla 15% zvýšenie IPC medzi Zen2 a Zen +, zatiaľ čo IPC spoločnosti Intel zostali roky staticky statické.Hovoríme tu samozrejme o rôznych segmentoch trhu, ale to dokazuje, ako tím dizajnérskeho tímu spoločnosti Arm v oblasti CPU dosiahol v posledných generáciách pôsobivé zisky.


20% zvýšenie výkonu je k dispozícii pre budúce generácie SoC založených na Cortex-A77

Jedným z predpokladov je, že A76 označil hlavný mikroarchitektúrny posun s obrovským zvýšením výkonu, zatiaľ čo u A77 sa vraciame k zlepšeniu úrovne optimalizácie. Ak sa vám to podarí, poďme sa pustiť do noviniek v prístroji Arm Cortex-A77.

Cortex-A77 stavia na mikroarchitektúre A76

Kľúčom k pochopeniu rozdielu medzi modelmi Cortex-A77 a A76 je pochopiť, čo sa myslí „širším“ jadrom. V podstate hovoríme o schopnosti vykonať viac pokynov pre každý cyklus hodín, čo zvyšuje priechodnosť jadra. Toto právo má dve dôležité časti - zvýšenie počtu vykonávacích jednotiek na spracovanie a zabezpečenie toho, aby boli tieto jednotky dobre zásobené údajmi. Začnime touto poslednou časťou a zameriame sa na časť odoslania, vyrovnávacej pamäte a predikčnej vetvy časti SoC.

Cortex-A77 vidí 50-percentné zvýšenie dispečerskej šírky, až šesť pokynov na cyklus od štyroch s A76. To znamená, že viac pokynov smeruje do jadra vykonávania pre každý taktovací cyklus, aby sa dosiahol vyšší výkonový potenciál. Výsledkom je aj väčšie okno na vykonanie objednávky mimo prevádzky, ktoré sa zvýši na 160 záznamov, aby sa odhalila väčšia paralelita. K dispozícii je známa vyrovnávacia pamäť 64 kB, zatiaľ čo Branch Target Buffer (BTB), ktorý drží adresy prediktora vetvy, je o 33 percent väčší ako predtým, aby zvládol rast paralelných pokynov. Nie je tu nič neobvyklé, ide v podstate o širšiu verziu minuloročného dizajnu.

Zaujímavejším doplnením front-end je úplne nová vyrovnávacia pamäť 1,5 M MOP, ktorá ukladá makropopy (MOP), ktoré sa privádzajú späť z dekódovacej jednotky. Architektúra procesorov Arm spoločnosti Arm dekóduje pokyny z užívateľskej aplikácie na menšie makro-operácie a potom ďalej na mikro-operácie, ktorým jadro vykonávania rozumie. Môžete to vidieť na obrázku vyššie v sekcii dekódovania. Vyrovnávacia pamäť MOP sa používa na zníženie penalizácie nákladov za zmeškané vetvy a návaly, pretože makro-operátory držíte skôr, ako ich znova dekódujete, a zvyšuje celkovú priepustnosť jadra. Načítanie z MOP namiesto i-cache obchádza dekódovaciu fázu, čím sa ušetrí jeden cyklus. Arm uvádza, že vyrovnávacia pamäť MOP môže dosiahnuť 85% alebo viac úspešnosti v celom rozsahu pracovných zaťažení, čo z nej robí veľmi užitočný doplnok k štandardnej i-cache.

Pri prechode nadol na časť jadra vykonávania CPU si všimnite pridanie štvrtej jednotky ALU a druhej vetvovej jednotky. Táto štvrtá ALU zvyšuje všeobecnú šírku pásma procesora o 50 percent. Táto dodatočná ALU je schopná vykonávať základné jednokruhové inštrukcie (ako ADD a SUB) plus dvojčíselné celočíselné operácie, ako je násobenie. Dve z ďalších ALU zvládajú iba základné jednokruhové inštrukcie, zatiaľ čo konečná jednotka je nabitá pokročilejšími matematickými operáciami, ako je delenie, násobenie a akumulácia atď. Druhá vetviaca jednotka vo vnútri vykonávacieho jadra zdvojnásobuje počet súčasných vetvových skokov. jadro zvládne, čo je užitočné v prípadoch, keď dva zo šiestich odoslaných inštrukcií sú skoky na vetve. Znie to trochu čudne, ale interné testovanie v službe Arm odhalilo výhody z prijatia tejto druhej jednotky.

Cortex-A77 ponúka vylepšený paralelizmus a nové prevzatie medzipamäte predbežného vyzdvihnutia

Medzi ďalšie vylepšenia jadra CPU patrí pridanie druhého šifrovacieho reťazca AES. Potrubia na ukladanie údajov sú teraz vybavené vyhradenými portami na vydávanie, aby zdvojnásobili šírku pásma vydania. Tieto porty boli predtým zdieľané s ALU, ktoré by sa niekedy mohli stať prekážkou. K dispozícii je tiež zdokonalenie údajov novej generácie na zlepšenie energetickej účinnosti a zvýšenie šírky pásma na systém DRAM.

Súčasťou tohto systému v Cortex-A77 je tiež úplne nový systémový systém predbežného načítania. Vylepšuje sa tým výkon pamäte na základe širokého spektra počtov jadier CPU, kapacít a latencií vyrovnávacej pamäte a konfigurácií subsystémov pamäte vo finálnych zariadeniach. Vyhradený hardvér na rozhovory s jednotkou Dynamic Scheduling Unit (DSU) ako súčasť klastra CPU DynamIQ, ktorý monitoruje využitie zdieľanej vyrovnávacej pamäte L3. Jadro obsahuje dynamickú vzdialenosť a úrovne agresivity, aby sa znížilo využitie vyrovnávacej pamäte v situáciách, keď je šírka pásma L3 obmedzená inými jadrami CPU. Jadrá s vyšším výkonom, ako je Cortex-A77, s väčšou pravdepodobnosťou nasýtia prístup DSU k pamäti, zatiaľ čo jadrá s nižšou energiou, ako je A55, sa pravdepodobne nebudú.

Zloženie to všetko dohromady

Cortex-A77 má veľa malých zmien, ktoré v porovnaní s jeho predchodcom prispeli k podstatným rozdielom. Stručne povedané, nová vyrovnávacia pamäť MOP A77s v kombinácii so širším a dlhším oknom inštrukcií pomáha udržiavať posilnené jednotky ALU, pobočky a pamäťové jednotky zaneprázdnené činnosťou. Konštrukcia Powerhouse Cortex-A76 bola rozšírená, aby ešte viac zlepšila svoju priepustnosť s A77 bez spoliehania sa na vyššie rýchlosti hodín.

Najväčší výkon zvyšuje, aby Cortex-A77 dorazil vo forme matematiky s celými číslami a s pohyblivou rádovou čiarkou. Potvrdzujú to interné referenčné hodnoty spoločnosti Arm, ktoré preukazujú zvýšenie výkonnosti o 20 až 35 percent v referenčných hodnotách INTE integer a s pohyblivou rádovou čiarkou. Vylepšenia šírky pásma pamäte ležia niekde medzi 15 a 20 percentami, opäť zdôrazňuje, že najväčšie zisky majú podobu drvenia čísel. Celkovo možno povedať, že tieto zlepšenia dávajú A77 v priemere o 20 percent viac v porovnaní s predchádzajúcou generáciou. Môžeme tiež vidieť niektoré ďalšie, marginálne zisky v dôsledku vyspelejších 7nm výrobných procesov koncom tohto roka alebo začiatkom roku 2020.

Pokiaľ ide o smartphony, sú SoC s napájaním Cortex-A77 určené pre vysoko výkonné, vlajkové produkty. Arm plne očakáva, že projektovanie powerhouse využíva 4 + 4 bit.LITTLE usporiadanie jadier. Vzhľadom na zvýšenú priepustnosť a mierny náraz do veľkosti oblasti A77 budeme pravdepodobne svedkami toho, že návrhári SoC pokračujú v trende 1 + 3 + 4 alebo 2 + 2 + 4. S jedným alebo dvoma výkonnými veľkými jadrami s väčšími medzipamäťami a vyššími hodinami, zálohovanými 2 alebo 3 jadrami A77 s menšími veľkosťami medzipamäte a nižšími hodinami, čím šetríte energiu a plochu. Nakoniec Cortex-A77 hláskuje dobré veci pre smartfóny a rastúci trh pre vždy pripojené notebooky Arm. Neskôr v tomto roku sledujte kremíkové oznámenia.

tarý telefón CoolpadKábel UB-C na UB-A18 W rýchlonabíjačkaNano IM kartaKľúč na kartu IM...

Nedávno poločnoť Boot Mobile uviedla na trh Coolapd Illumina, 5-palcový martfón Android 8.0 Oreo (Android Go), ktorý je v účanoti za cenu iba 29,99 dolárov. Taktiež vydal...

Zaujímavé Dnes