Referenčné hodnoty: čo to je? Na čo to je história, typy a tipy
![Referenčné hodnoty: čo to je? Na čo to je história, typy a tipy](https://img.comprating.com/img/software/259/benchmarks-qu-es-para-qu-sirve.jpg)
Obsah:
Referenčné hodnoty sú podstatnou súčasťou našej každodennej analýzy hardvéru a umožňujú nám vám poskytnúť vedecky porovnateľné meranie medzi rôznymi komponentmi, ako sú CPU, grafické karty, pamäťové jednotky atď. Dnes sa budeme venovať niekoľkým smerom k jeho histórii, jej typom, ako fungujú, čo merajú, aké sú najbežnejšie opatrenia, a tiež vám poskytneme niekoľko tipov, ako ich vykonávať a ktorým by sme mali dôverovať.
To, čo dnes v PC alebo mobilnom svete poznáme ako referenčné hodnoty, sú techniky zdedené z priemyselného prostredia, ktoré od začiatku tejto revolúcie umožnilo rozhodovanie založené na porovnateľných údajoch v kontrolovanom prostredí.
Svet moderných výpočtov uplatňuje tieto techniky takmer vo všetkých svojich mnohých rôznych doménach a domáci používatelia ich tiež prijali ako spoľahlivý spôsob, ako sa učiť o výkone a schopnostiach našich systémov, ako aj dôležitý informačný bod, keď robiť dôležité rozhodnutia, ako napríklad nákup nového počítača, mobilného telefónu, grafickej karty atď.
Dnes budeme hovoriť o histórii PC benchmarkov, o typoch benchmarkov, ktoré existujú, a o tom, ktoré komponenty nášho systému sú vhodnejšie pre tento typ testov, ktoré nie sú iba výkonom.
Index obsahu
histórie
Referenčný alebo merací systém uplatňuje kontrolované prostredie a rozpoznateľné opatrenia, ktoré sú vedecky porovnateľné a overiteľné a koexistujú so svetom počítača od jeho existencie. Referenčná hodnota ako taká bola demokratizovaná do tej miery, že časť jej základnej podstaty bola stratená, čo znamená, že ju môžu auditovať a overiť tretie strany. Teraz ich používame skôr ako rýchle porovnanie výkonnosti, ale sledovateľnosť jeho pravdivosti tretími stranami sa určite do značnej miery stratila.
Najtradičnejšie porovnávacie metódy sa vždy odvolávali na výpočtovú kapacitu CPU systému, hoci v poslednom čase sa medzi rôznymi komponentmi líšili, pretože v počítači získali prevahu a dôležitosť.
Dva najtradičnejšie meracie jednotky, ktoré sa stále používajú, sú Dhrystones a Whetstones. Obidve sa určitým spôsobom stali základom všetkých syntetických kritérií, ktoré dnes poznáme.
Najstarší je Whetstones (lokalita v Spojenom kráľovstve, kde sa nachádzala divízia atómovej energie v Spojenom kráľovstve, štátna energetická spoločnosť) a Dhrystone prišiel neskôr hrať s menom prvý (mokrý a suchý).
Prvý z nich bol navrhnutý v 70. rokoch a druhý z 80. rokov a oba sú základom porovnávacieho výkonu, ktorý sme mali v nasledujúcich rokoch. Zjednodušenie whetstones ponúklo nahliadnutie do výpočtového výkonu procesora pri operáciách s pohyblivou rádovou čiarkou, pri operáciách s veľkým počtom desatinných miest.
Dhrystone je jeho náprotivkom, pretože je venovaný základným inštrukciám bez desatinných miest, čo dáva jasný obraz o výkonnosti procesora z dvoch úplne odlišných, ale vzájomne sa doplňujúcich prístupov. Whetstones a Dhrystone odvodené do dvoch konceptov, ktoré dnes používame omnoho častejšie, MIPS a FLOP.
Po týchto meraniach prišli aj ďalšie, ako napríklad alopetická aritmetika s pohyblivou rádovou čiarkou - aritmetika s pohyblivou rádovou čiarkou), ktorá je dnes v počítači do veľkej miery dôležitejšia ako doteraz, pretože je základom pokročilého výpočtu v mnohých moderných technikách. ako sú algoritmy umelej inteligencie, lekárske algoritmy, predpovede počasia, fuzzy logika, šifrovanie atď.
LINPACK bol vyvinutý inžinierom Jackom Dongarrom v 80. rokoch 20. storočia a naďalej sa používa na meranie výpočtovej kapacity s plávajúcou desatinnou čiarkou všetkých typov systémov. V súčasnosti existujú verzie optimalizované podľa architektúry, výrobcu CPU atď.
FLOPS zapĺňajú naše články o grafických kartách (určite sú známe jednoduché alebo dvojité presné zvuky), procesory a sú základom pre výpočet požiadaviek na energiu a vývoj hardvéru pre akýkoľvek superpočítač, ktorý je v prevádzke alebo sa vyvíja.
FLOP je dnes najžiadanejšou jednotkou merania výkonu v priemysle, ale vždy bola kombinovaná s MIPS (milióny inštrukcií za sekundu), čo je zaujímavé opatrenie na meranie, pretože nám poskytuje množstvo pokynov. Základná aritmetika, ktorú procesor dokáže vykonávať za sekundu, ale ktorá závisí viac od architektúry procesora (ARM, RISC, x86 atď.) A programovacieho jazyka, ako od iných meracích jednotiek.
Ako výkon vystúpil, multiplikátory sa stali. Teraz meriame výkon domácich procesorov v GIPS a GFLOPS. Základňa zostáva rovnaká, klasické aritmetické operácie. Sisoft Sandra nám naďalej ponúka tento typ merania v niektorých svojich syntetických referenčných hodnotách.
MIPS bol tiež viac zaradený do CPU ako klasický prvok a FLOP sa rozšíril do ďalších prosperujúcich oblastí, ako je kapacita procesu alebo všeobecný výpočet bývalých procesorov veľmi zameraných na konkrétne úlohy, ako sú napríklad GPU, ktoré všetci pripájame k našim procesorom alebo na naše špecializované rozširujúce karty.
K týmto základným koncepciám čas v modernom počítači alebo v superpočítači pridával také dôležité alebo dôležitejšie nové meracie jednotky, ako sú tieto. Tranzit údajov je jedným z týchto opatrení, ktoré sa stalo veľmi dôležitým av súčasnosti sa meria v IOP (operácie vstupu a výstupu za sekundu) a tiež v iných formách, ako sú napríklad opatrenia na ukladanie MB / GB / TB v porovnaní s časom potrebným na tranzit z jedného bodu do druhého (MB / s - megabajty za sekundu).
AS-SSD môže merať výkon pevného disku v MBps alebo IOP.
V súčasnosti tiež používame prenosové opatrenie vo svojich rôznych multiplikátoroch ako spôsob interpretácie rýchlosti prenosu informácií medzi dvoma bodmi, kedy je potrebné emitovať určité informácie, ktoré sme skutočne museli získať o trochu viac informácií. Závisí to od protokolu použitého na prenos informácií.
Jasný príklad, ktorý používame veľa, je v rozhraní PCI Express. Podľa tohto protokolu musíme pre každých 8 bitov informácií, ktoré chceme presunúť (0 alebo 1 s), vygenerovať 10 bitov informácií, pretože tieto ďalšie informácie slúžia na riadenie komunikácie, ktorá sa odosiela na opravu chýb, integritu údajov atď.
Ďalšími dobre známymi protokolmi, ktoré tiež zavádzajú túto „stratu“ reálnych informácií, je IP, protokol, ktorý používate na čítanie tohto článku, a vďaka ktorému vaše pripojenie 300MT / s skutočne ponúka o niečo menej ako rýchlosť 300 Mb / s.
Preto používame gigatransfer alebo prenos, keď hovoríme o nespracovaných informáciách odoslaných rozhraním, a nie o informáciách, ktoré sú skutočne spracované v prijímači. Dátová zbernica PCI Express 3.0 GG / s skutočne odosiela 6, 4 GB / s informácií pre každú linku spojenú medzi bodmi. Prenos sa stal veľmi dôležitým vďaka integrácii protokolu PCI Express do všetkých hlavných autobusov domáceho a profesionálneho počítača.
V nedávnej dobe sme tiež začali kombinovať opatrenia ako spôsob prepojenia výpočtového výkonu s inými veľmi dôležitými faktormi v moderných výpočtoch, pričom spotreba bola jedným z týchto opatrení, ktoré sa zavádza ako porovnávacia škála medzi výkonom dvoch systémov. Energetická účinnosť je dnes rovnako dôležitá ako výkonnosť procesu, a preto je ľahké vidieť referenčné hodnoty, ktoré porovnávajú výkonnosť procesu podľa wattov spotreby prvku pri meraní.
Jeden z veľkých zoznamov superpočítačov sa v skutočnosti netýka hrubého výkonu počítača medzi všetkými jeho výpočtovými uzlami, ale vývoja tohto výkonu založeného na wattoch alebo energii spotrebovanej celým systémom. Zoznam Green500 (FLOPS na watt - FLOPS na watt) je jasným príkladom toho, ako je spotreba v súčasnosti základom každého sebaprehľadávacieho štandardu, hoci všetci sme bezpochyby naďalej podrobne sledovaní zoznam TOP500, ktorý tento faktor nemá ako kondicionujúci faktor.
Typy referenčných hodnôt
Aj keď môžeme hovoriť o mnohých ďalších rodinách alebo typoch referenčných kritérií, zoznam zjednoduším v dvoch najbežnejších triedach tých, ktoré sú nám najbližšie ako viac či menej pokročilí používatelia.
Na jednej strane máme syntetické kritériá, ktoré sú zväčša tie, ktoré nám ponúkajú opatrenia, o ktorých sme už hovorili. Syntetické referenčné hodnoty sú programy, ktoré vykonávajú kontrolované testy s viac-menej stabilným programovým kódom orientovaným na konkrétnu platformu a architektúru. Sú to programy, ktoré vykonávajú veľmi špecifické testy, ktoré môžu integrovať jeden alebo viac našich komponentov, ale v ktorých sa vždy vykonávajú rovnaké testy alebo testy, bezo zmeny.
Vizualizácia obrazu bola vždy dobrou metódou poznania výkonu CPU v modernom systéme, pretože je to náročná úloha. Cinebench R15 má tiež niekoľko testov, jeden pre GPU a dva pre CPU, kde môžeme poznať výkon systémov s viacerými jadrami a procesnými vláknami.
Ponúkajú kontrolované testovacie prostredie, kde nie sú žiadne zmeny okrem verzií a kde sú tieto zmeny správne zdokumentované, takže užívateľ vie, ktoré verzie je možné navzájom porovnávať. Tieto typy programov môžu testovať rôzne podsystémy nášho počítača samostatne, s inými časťami kódu alebo konkrétnymi referenčnými hodnotami na vykonanie určitého typu testu, alebo kombinované, ktoré môžu byť ovplyvnené výkonom jedného, dvoch alebo viacerých systémových komponentov. Benchmark integrovaný do hry alebo programy ako Cinebench, Sisoft Sandra, SuperPI, 3DMark,… sú jasnými príkladmi syntetických benchmarkov.
Ďalšími syntetickými referenčnými hodnotami, ktoré by sme si nemali zamieňať s reálnymi referenčnými hodnotami, sú tie, ktoré simulujú vykonávanie reálnych programov alebo ktoré vykonávajú akčné skripty v reálnych programoch, sú tiež syntetické, pretože v teste nie je náhodnosť. PC Mark je jasným príkladom syntetický benchmarkový program, ktorý si môžeme zamieňať so skutočným benchmarkom.
Skutočná referenčná hodnota je veľmi odlišná testovacia metóda, pretože akceptuje náhodnosť použitia programu na meranie jeho výkonnosti. Hráči sú zvyknutí vykonávať tento typ testov alebo test výkonnosti, keď prispôsobujeme parametre kvality hry možnostiam nášho hardvéru.
Meranie výkonu hry počas hry je skutočným meradlom.
Keď otvoríte FPS, ktorý hra dáva, a pokúsite sa dosiahnuť požadovaných 60 FPS nepretržite, potom vykonávajú skutočnú referenčnú hodnotu. To isté možno extrapolovať na akýkoľvek iný typ programu a ak ste vývojár, keď optimalizujete kód svojho programu, potom robíte aj skutočné testovacie testy, kde sa mení váš kód alebo spôsob jeho vykonania na platforme stabilný alebo variabilný hardvér.
Obidva typy referenčných kritérií sú dôležité, prvé umožňujú porovnávať náš systém s ostatnými v kontrolovanom prostredí a druhé sú spôsobom optimalizácie našej činnosti, keď sú pridané dva dôležité faktory, náhodnosť pri vykonávaní a ľudský faktor. Oba faktory ponúkajú ďalší pohľad na výkon komponentu alebo komponentov, ktoré chceme testovať.
Úvahy pri porovnávaní
Aby bola referenčná hodnota užitočná a efektívna, musíme zohľadniť určité faktory, ktoré sú skutočne dôležité. Porovnanie rôznych platforiem a architektúr predstavuje dôležitý faktor neistoty, a preto tento typ kritérií, ktoré vám umožňujú porovnávať mobilné telefóny so systémom iOS s počítačmi so systémom Windows x86, je napríklad potrebné vziať ich pomocou pinzety, pretože sa nielen zmení. jadro operačného systému, ale architektúry procesorov sú veľmi odlišné. Vývojári tohto typu meradiel (napríklad Geekbench) zavádzajú korekčné faktory medzi svojimi rôznymi verziami, ktoré je ťažko kontrolovateľné.
Preto prvým kľúčom k porovnateľnosti porovnávacích kritérií medzi rôznymi hardvérom je to, že testovací ekosystém je čo najviac podobný porovnávacej platforme, operačnému systému, ovládačom a verzii softvéru. Určite tu budú prvky, ktoré nemôžeme kontrolovať homogenizáciu, podobne ako grafický ovládač, ak testujeme grafiku AMD proti grafike Nvidia, ale zvyšok sa musíme snažiť urobiť ju čo najstabilnejšou. V tomto prípade by sme zahrnuli aj hardvér, pretože pri porovnávaní grafických kariet je vašou úlohou používať ten istý operačný systém, ten istý procesor, rovnaké pamäte a všetky operačné parametre a udržiavať ich rovnaké, vrátane parametrov kvality, rozlíšenia a testu v teste. Čím stabilnejší je náš testovací ekosystém, tým spoľahlivejšie a porovnateľnejšie budú naše výsledky.
Odporúčame prečítať Ako zistiť, či má môj procesor problémové miesto?
Ďalšou vecou, ktorú musíme vziať do úvahy, je to, že porovnávacie testy majú zvyčajne stresový faktor na hardvér, ktorý sa chystáme testovať, a tento hardvér zvyčajne vystavujú situáciám, ktoré sa normálne nevyskytujú pri bežnom používaní systému. Každá referenčná hodnota, ktorú berieme z nášho pevného disku, grafickej karty alebo procesora, ich podrobuje situáciám, ktoré môžu byť pre hardvér nebezpečné, takže musíme stanoviť príslušné opatrenia, aby sa bod napätia nestal bodom lomu ani v prvok znižovania výkonu, pretože mnoho komponentov má ochranné systémy, pomocou ktorých znižujú svoj výkon napríklad v prípade teplôt mimo ich rozsah použitia. Primerané chladenie, doby odpočinku medzi testami, správne napájanie testovaných komponentov… všetko by malo byť v ideálnej situácii, aby test prebiehal hladko.
Na druhú stranu, tiež používame presne tento typ benchmarkov, aby sme systém vystavili stresu, aby sme videli jeho stabilitu v tomto type situácie, je to iný spôsob uplatňovania benchmarku, pretože to nielenže nepozná výkon, ale tiež to, či systém je stabilný a ešte viac, ak systém funguje v týchto stresových situáciách tak, ako by mal.
záver
Pre tých z nás, ktorí sa venujú profesionálnemu testovaniu počítačového hardvéru, je referenčný štandard pracovným nástrojom a vďaka nemu majú používatelia vedecký a overiteľný spôsob porovnávania alebo poznania výkonu nášho ďalšieho počítača v každom z jeho subsystémov s presnosťou. porovnateľné s nástrojmi používanými na priemyselnej úrovni.
Testovacia tabuľka, rovnako ako tabuľka, ktorú vidíte na obrázku, sa snaží presne štandardizovať testovaciu metódu tak, aby porovnávacia referenčná hodnota bola čo najspoľahlivejšia a testovateľná pri zavádzaní variácií, ktoré modifikujú výsledky.
Ale ako každá „laboratórna“ skúška, aby bola spoľahlivá, musia byť stanovené správne podmienky na jej vykonanie, a ešte viac porovnateľnosť medzi rôznymi systémami.
Dnes sme vám niečo povedali o histórii tohto typu programu, o jeho rôznych druhoch, o tom, ako fungujú a ako od nich získať spoľahlivé informácie. Sú užitočné, ale pre mňa sú len jednou ďalšou informáciou, ktorú treba mať na pamäti, a vždy by som ju umiestnil za osobné skúsenosti a aktívne testovanie so skutočnými programami, ktoré budeme používať každý deň.
Referenčné hodnoty sú v poriadku, keď sa do nášho rozhodovacieho procesu vkladajú minimálne údaje o výkonnosti, nemali by však definovať tieto rozhodnutia a ako posledný tip by sa nemali vyhýbať syntetickým referenčným hodnotám, ktoré tvrdia, že sú schopné porovnávať výkon medzi architektúrami, operačnými systémami atď.
Nové referenčné hodnoty z unigine, údolia 1,0 a neba 4.0
![Nové referenčné hodnoty z unigine, údolia 1,0 a neba 4.0 Nové referenčné hodnoty z unigine, údolia 1,0 a neba 4.0](https://img.comprating.com/img/http://www.profesionalreview.com/wp-content/uploads/2013/02/val1-300x168.jpg)
Z ruky tvorcu prvého benchmarku pre Dx11 dostávame dva nové programy na testovanie grafického výkonu našich tímov. Údolie
Prvé referenčné hodnoty apu carrizo a
![Prvé referenčné hodnoty apu carrizo a Prvé referenčné hodnoty apu carrizo a](https://img.comprating.com/img/http://www.profesionalreview.com/wp-content/uploads/2014/10/amd_carrizo_soc_ddr4_20151.jpg)
Prvé testy SoD série A-8000 „Carrizo-L“ AMD ukazujú sľubné výsledky tým, že prekonali Kaveri s nižšími prevádzkovými frekvenciami
Zobrazia sa referenčné hodnoty jadra i7 6700k (skylake
![Zobrazia sa referenčné hodnoty jadra i7 6700k (skylake Zobrazia sa referenčné hodnoty jadra i7 6700k (skylake](https://img.comprating.com/img/noticias/196/aparecen-benchmarks-del-core-i7-6700k.jpg)
Zdá sa, že niekoľko budúcich kritérií čelí budúcemu Core i7 6700k oproti súčasnému Core i7 4790k, čo ukazuje rozdiel vo výkonnosti 9%