Posljednji članci

Intel Core i7 arhitektura

Dugo očekivan Intelov procesor kodnog imena Nehalem poslednjih nekoliko meseci jedna je od glavnih atrakcija na IT forumima. Svakodnevne diskusije na temu nove Intel procesorske arhitekture dovele su do raznoraznih nagađanja, koja su dodatno podizala već napregnutu tenziju među fanovima pomenutog nam giganta. Međutim, ćutanju došao je kraj i vreme je da pogledamo ispod haube pomenute nam „zveri“ koju smo toliko dugo čekali. Neka Nehalem žurka počne!

 

Svima je već jasno da je Intel u poslednjih dve godine načinio veliki pomak kada je industrija procesora u pitanju. Njegova pozicija na tržištu, tj. pozicija lidera jasno govori sa koliko kvalitetnim, a pre svega konkurentnim proizvodima Intel raspolaže. Razjarena masa entuzijasta i pored toga što je svesna da Core 2 arhitektura pruža i više nego dosta u vidu performansi, već od prve najave superiornije procesorske arhitekture ne prestaje da se bavi diskusijama koje su znale u nekim situacijama da prevazilaze granice nemogućeg.

 

Ono što je trebalo, tj. ono što je nedostajalo Intel Core 2 procesorima, svakako je integrisan memorijski kontroler koji AMD toliko dugo poseduje, te je i to bio jedan od razloga zašto se sa toliko nestrpljenja čekala ova nova Intel tehnologija. Zatim prisustvo Hyper Threading tehnologije koja je nagoveštavala osam uposlenih taskova posredstvom samo četiri jezgra, dodatno je obećavala, a opet ostavljala je veliki broj nestrpljivih korisnika da svakodnevno listaju raznorazne forume, ne bi li pre isteka famoznog „ćutanja“ procurela neka od informacija, koja bi potvrdila koliko je dobar i da li je Nehalem ono što su svi očekivali.

 

No dobro da se prisetimo kako se odvijala situacija na tržištu mikroprocesora u poslednjih tri godine. Ako bismo morali da se vratimo u vreme pre tačno tri godine, jasno je da je u tom periodu i pored dobrog poslovanja Intel korporacije, jednostavno AMD imao bolju procesorsku logiku koja se u kroz performanse bolje pokazala od konkurencije. Famozni AMD s939 bazirani procesori sa prvim integrisanim memorijskim kontrolerom uz DDR1 memorijsku logiku, bili su jasan pokazatelj i demonstrator sile u tom trenutku. Intel Pentium 4 u to vreme i pored spuštanja proizvodnog procesa nije odolevao konkurenciji, pa shodno tome moralo se poraditi na strategiji u vidu izbacivanja novog proizvoda. Kako je DDR2 memorijski standard postao svakodnevnica kod novih Intel platformi, tako su se i pojavili prvi procesori kodnog imena Intel Pentium D. Izrađeni u 65nm i sa dobrom overklok marginom pomenuti Intel Pentium D procesori približili su se performansama još uvek aktuelne AMD s939 procesorske logike. Međutim, to nije bilo dovoljno i moralo se poraditi na radikalnim promenama, sa kojim bi se Intel vratio na tron proizvođača najboljih, tj. najbržih mikroprocesora. Pre okvirno dve godine i dva meseca, promene su i počele te od tog trenutka pa do dana današnjeg Intel nije imao konkurenciju u smislu brzine, tj. performansi, te je još uvek lider na tom polju. Šta se tačno dogodilo? Kako smo rekli pre okvirno dve godine i dva meseca Intel je izbacio dugo najavljivanu Core 2 armiju mikroprocesora gde su prvi ugledali svetlost dana oni sa kodnim imenom Conroe. Odmah posle izlaska mikroprocesora sa jezgrom kodnog imena Conroe, svetlost dana ugledali su i “mališani” sa duplo manje keš memorije, kodnog imena Allendale.

 

Prisećanja radi procesori sa Allendale jezgrom poseduju 2 MB L2 keš memorije, i u to vreme zadovoljavali su potrebe tržišta u low end segmentu. Nezadovoljan potpunom dominacijom u „teškoj kategoriji“ Intel je ubrzo posle objavljivanja jeftinijih derivata u Allendale izdanju na tržište izbacio prve procesore sa četiri jezgra kodnog imena Kentsfield. Sa pojavom pomenutih procesora kupci koji su se bavili video obradom ili pak drugim vidovima kompresije, našli su adekvatnu zamenu za pređašnja Dual Core rešenja, i bez obzira na tada previsoku cenu, prilivi Quad Core procesora u našu zemlju jednostavno nisu mogli da zadovolje potražnju tržišta. Međutim, kako je vreme prolazilo AMD je bio primoran da uz sniženje cena pokuša da uzme deo kolača koju mu je Intel u startu sa izbacivanjem Core 2 arhitekture, bukvalno istrgnuo iz šaka. Isto tako, odmah posle pomenutog poteza koji je načinio AMD sa sniženjem cena u srednjem i nižem tržišnom segmentu Intel izbacuje nove serije low segment procesora kodnog imena Pentium E. Novi Pentium E21XX i E22XX procesori zasnovani su na Core 2 arhitekturi, međutim sniženje L2 keš memorije na 1 MB, zahtevalo je i promenu kodnog imena. Da se priča ne završava na tome, Intel nastavlja sa spuštanjem veličine L2 keš memorije, takao da se danas mogu naći i procesori sa 512 MB L2 keš memorije u Celeron izvedbi, ali i u ovom slučaju sa dva jezgra, što je naravno veoma povoljno za krajnjeg korisnika sa ne toliko dubokim džepom. Svakako, tim potezom Intel je popunio sve rupe, od Low do High segmenta, što mu je omogućilo da nastavi sa dominacijom na tržištu mikroprocesora.

 

Da bi smanjio troškove proizvodne i da bi izašao sa novom arhitekturom, Intel je počeo sa proizvodnjom procesora u 45nm proizvodnom procesu. Novonastala armija procesora dobila je kodno ime Penryn i deli se na dve grupe koje krase Wolfdale bazirani modeli (Dual Core izvedba) i Yorkfield bazirani modeli (Quad Core izvedba). Generalno gledano neke preterano velike razlike između 65nm i 45nm, tj. procesora izrađenih u tim proizvodnim procesima i nema, međutim sitniji proizvodni proces omogućio je Wolfdale i Yorkfield procesorima implementaciju manjih, tj. sitnijih tranzistora, što je ostavilo dosta prostora za dodatno povećanje keš memorije. Dual Core procesori bazirani na Conroe jezgru zauzimaju površinu od 143 mm², dok je slučaj sa sadašnjim Wolfdale procesorima još povoljni, te ona zauzimaju jedva 107 mm², što je dovelo do proširenje sa 4 MB na 6 MB L2 keš memorije. Isto tako, kod Quad Core procesora priča je veoma slična, tj. Yorkfield bazirani procesori poseduju neverovatnih 12 MB L2 keš memorije. Međutim, priča se ne završava samo na povećanju keš memorije, a tome može da posvedoči broj tranzistora kod Woldale procesora koji iznosi čitavih 410 miliona, što je za 41% više nego u poređenju na 65nm proizvodni proces.

 

Ovim potezom Intel je napravio manje troškove, naime sa 41% više tranzistora, sa 50% više keš memorije u 25% manjem pakovanju dobijen je brži mikro procesor, a sve to gledano kroz „klok za klok“ u poređenju na prethodnu arhitekturu. Bitno je napomenuti da je promena prisutna i kod arhitekture L2 keš memorije, gde je recimo Conroe jezgro posedovao 4MB 16-way set-associative L2 keš memorije, dok je kod Wolfdale procesora prisutno 6MB keš memorije, ali sa 24-way set-associative strategijom. Novi Penryn procesori takođe su dobili nekoliko veoma bitnih, tj. novih instrukcija od kojih je svakako najupečatljivija SSE4. Pomenuta instrukcija veoma je bitna za video kompresiju, odnosno za sve vidove enkodinga (ovu instrukciju zvanično je prvi podržao Divx 6.8 codec ) gde se poboljšanje u vidu „klok za klok“ u nekim slučajevima osećalo i preko 15%, naravno sve to u poređenju na predhodnu arhitekturu. Kako je napredak u vidu performansi neminovna stvar oko ove priče vezane za 45nm Penryn procesore, tako je i neizbežno napomenuti da se smanjenjem proizvodnog procesa povećao i krajnji overklok, te se danas skoro svi procesori sa većim množiocem od 8.5 bez problema overklokuju preko 3.8 GHz. Svakako, došlo je vreme novih procesora i Intelov Nehalem procesor stigao nam je na test, naše je da vam prenesemo iskustva, a vaše je da pređete na sledeću stranu u koliko želite da saznate šta to donosi novi procesor ponikao u Intelu.

 

{jospagebreak_scroll title= Intel Core i7 arhitektura na prvi pogled}

Porediti Conroe, tj. Intel Core 2 arhitekturu sa Pentium 4 procesorima je kako kad bi poredili babe i žabe. Conroe nova arhitektura je radikalno odstupila od NetBurst mikro-arhitekture i naizgled sve je odrađeno drugačije. Pentium 4 je zahtevao ogromnu količinu softverske optimizacije kako bi ispoljio svoje performanse i to je bio jedan od tadašnjih problema. Od tada, Intel je bio primoran da sagledava stvari drugačije i da više ne očekuje od softverske zajednice, tj. kompanija da naknadno kompajliraju softver, a samim tim i da ga optimizuju za svaku novu arhitekturu. Shodno tome Nehalem treba da bude brz i spreman na svaka iznenađenja, pa je samim tim i dizajniran na taj način. Conroe procesor može da dekodira, pa i da preimenuje i odloži do četiri mikro operacije u isto vreme. Iskorišćenje Conroe-a je zapravo bilo nepotpuno u većini slučajeva, međutim ovo je takođe u potpunosti ispravljeno, te Nehalem sve to ispravlja sa svojom novom arhitekturom. Intel je predstavio macro-ops fuziju kod Conroe-a, tj. odlika procesora da dve vezane x86 instrukcije spoji i tretira kao jednu. Svakako one će se dekodirati i izvršiti kao jedna instrukcija umesto dve, samim tim povećavajući mogućnosti hardvera. Nehalem je dobio dodatne instrukcije (jedna od najvažnijih je svakako i SSE 4.2) koje mogu da budu spojene, sa svim onim prisutnim što smo imali da vidimo kod Core 2 čipova. Šta to znači konkretno? To znači da su ostala macro-ops spajanja dodatno unapređena, pa tako i 64-bitne instrukcije mogu biti spojene, dok su prethodno samo 32-bitne imale tu mogućnost. Na taj način unapređenje je neznatno prisutno u vidu performansi, te će se najveći boljitak osetiti upravo kod 64bit-nog operativnog sistema, naravno uz korišćenje adekvatnog 64bit-nog softvera.

 

Ono što odlikuje Core 2 arhitekturu je Loop Stream Detector (LSD). Poenta je bila da procesor detektuje tzv. petlju u softveru, zatim da prekine sa predviđanjem delova (i potencijalnih netačnih predviđanja poslednjeg dela petlje) i jednostavno da izbaci instrukcije iz LSD-a. Predviđanje petlji i pozivanje hardvera može biti sprečeno i kod sadašnjih Core 2 procesora, tj. moguće je držati do 18 instrukcija u LSD-u i jednostavno ih izvršavati iznova sve dok petlja nije završena ili dok ne ponestane instrukcija u LSD-u. Isto tako bitno je napomenuti da Nehalem može da kešira 28 mikro operacija u svom LSD-u, što je u stvari drastično više nego što Core 2 procesori mogu. Ako bismo morali da preciziramo, Nehalem nije toliko unapređen procesor, ali konačan ishod u vidu performansi pokazao se i više nego dobro. Intel Core i7 procesor sada ima drugi nivo predviđanja i grananja koji je sporiji, ali na njih gleda sveobuhvatnije. Priključenje L2 predviđanja i grananja omogućuje obimnim aplikacijama, da koriste unapređenju preciznost što dodatno utiče na performanse. Isto tako orijentisane aplikacije su važne. Osnovna razlika koja će, nadamo se, sprečiti Nehalem-ove naslednike da se pretvore u Pentium 4 je upravo Intelovo zlatno pravilo odnos performansi i potrošnje. Nehalem i Atom su dizajnirani, po prvi put u Intelovoj istoriji, sa jednim važnim ciljem,a to je smanjenje potrošnje uz veoma dobar odnos performansi. Za svaku predloženu karakteristiku za Nehalem, a tako i za Atom, svako povećanje od jednog procenta u potrošnji treba da odgovara minimalno dva procenta povećanja u performansama.

 

Power management

Na ovogodišnjem IDF-u najveće nazovi otkriće vezano za Nehalem imalo je veze supravo sa power managementom. Nehalemov dizajn se poprilično promenio u odnosu na prethodne procesore. Dynamic domino logic je u mnogome korišten kako bi se povisila frekvencija procesora kod modela kao što su Pentium 4 i IBM-ov Cell. Sa Nehalemom Intel je uklonio Dynamic domino logic tehnologiju i vratio se na statičan CMOS dizajn. Nehalemovi inženjeri su iskoristili preko milion tranzistora za integrisani mikrokontroler sa nazivom Power Control Unit (PCU). Primera radi, toliko je tranzistora imao celokupan 486 procesor, a sada je upravo toliko potrošeno na power management.

 

PCU ima sopstveni firmware i ima uvid u temperature, napone, snagu i zahteve operativnih sistema. Svaki Nehalem poseduje PLL, pa tako svako jezgro može imati različitu frekvenciju, kao kod AMD-ovog Phenom procesora. Kao i kod Phenoma, svako jezgro radi na istom naponu – jedina razlika je što Intel koristi integrisane naponske portove. Uz blisku saradnju Nehalemovih tvoraca i Intelovih inženjera zaduženih za proizvodnju, Intel je uspeo da napravi poseban materijal koji može da se ponaša kao naponski port između naponskog izvora koji napaja jezgro, i samog jezgra. Benefit se vidi i u tome što određena jezgra mogu da se isključe kada su u “dubokom snu”.

 

Za sada, multi-core procesori (bilo AMD, bilo da je Intel) moraju da rade na istom naponu, što znači da je utrošak energije još uvek visok pošto su jedno ili vise jezgara aktivni. Ostali benefiti se ogledaju u tome što je integrisani power management daleko efikasniji od eksternog rešenja na matičnoj ploči. Brža promena napona omogućuje daleko bolju efikasnost itd. Ranije smo napomenuli da PCU nadgleda operativni sistem i tako može da napravi inteligentne poteze vezane za power/performance stanje. Postoje određene situacije gde Vista (ili drugi OS) pokreće aplikaciju sa visokim nivoom prekidanja i samim tim procesor ide iz stanja mirovanja u stanje određene opterećenosti. Nehalemov PCU će nadgledati ove situacije i pametnije zaključivati kako bi trebao procesor da se ponaša u tim situacijama bez obzira šta operativni sistem nalaze.

 

{jospagebreak_scroll title= Novi TLB i brži keš pristup}

Generalno gledano aplikacije koje pokreću mikro procesore na osnovu TLB veličine i performansi svakako su serverske aplikacije, koje ujedno mogu da iskoriste potencijal svakog jezgra procesora u potpunosti. Nehalem ne da je samo povećao veličinu svog TLB-a, nego mu je dodat i drugi nazovi nivo TLB-a za oba koda i podatke. Još jedna od bitnih stavki je i brži keš pristup. Najveća veličina SSE memorijskih operacija je 16-bytes (128-bits). Za svaku od ovih load/store operacija postoje dve verzije osnovnih operacija, a to su : operacija koja je povezana sa 16-byte nazovi granicom, i jedna koja nije. Programeri će zasigurno koristiti nepovezane operacije, u slučaju ne mogu da garantuju da će pad memorijskog pristupa pasti na 16-byte granicu.

 

Kod svih Core 2 procesora, nepovezane operacije bile su sporije nego povezane, čak i kod povezanih podataka. Isto tako problem je taj što većina programera ne može da garantuje da će podaci biti povezani kako treba, pa shodno tome koriste nepovezane operacije, i pored toga što se ponekad želi pristupiti preko povezanih podataka. Kod Nehalema Intel nije samo popravio performanse nepovezanih operacija, nego je u slučaju da koristite nepovezane operacije na povezanim podatcima, jednostavno je došlo do apsolutnog održanja performansi, tj. pad performansi nije prisutan. U tom slučaju programeri mogu da koriste nepovezane operacije bez ikakvog straha da će pad performansi biti prisutan, krajnje impresivno. Takođe bitno je napomenuti da je i sinhronizacija performansi poboljšana što nas vodi do sledeće strane ovog testa.

 

{jospagebreak_scroll title= Hyper Threading i raspored keša}

Još za vreme Intel Pentium 4 procesora koji su podržavali Hyper Threading tehnologiju nismo imali priliku da vidimo pomenutu tehnologiju kod Core 2 procesora tokom ovih poslednjih dve godine i nekoliko meseci. No sa Nehalemom došlo je do radikalnih promena i Hyper Threading je jedan od najnaprednijih inovacija pored integrisanog memorijskog kontrolera koji u ovom trenutku Intel nudi. Naime, Hyper Threading je zasnovan na SMT (simultaneous multi-threading) tehnologiji uz čiju pomoć jedno jezgro je u mogućnosti da obrađuje dva zadatka. Operativni sistem u tom slučaju i pored toga što imamo jedno fizičko jezgro, jednostavno vidi dva jezgra. Isti slučaj imali smo i kod Pentium 4 procesora, međutim kod Nehalema je cela priča veoma bolja, tj. veoma povoljnija iz nekoliko razloga. Recimo Nehalem ima bolji memorijski protok i dosta veću keš memoriju, što mu omogućuje brže i preciznije prenošenje podataka do jezgra.

 

U realnom radu to bi značilo da u koliko koristite aplikacije koje zavise od više jezgara, jednostavno Nehalem je najbolji, najekonomičniji izbor za tako nešto. Naime, svaka multy-core aplikacija koja nema vidna ograničenja, tj. koja je u stanju da sarađuje sa koliko god jezgara imate, ista ta aplikacija jednostavno će uposliti osam „virtuelnih“ jezgara i pored toga što imate procesor sa 4 jezgra. Naravno i performanse će biti drastično veće, što dodatno dovodi do činjeničnog stanja koje nas navodi da kažemo „Svaka čast Intel“. U suštini da ne koristite softver koji može da iskoristi potencijal Hyper Threading tehnologije, istu opciju možete isključiti posredstvom BIOS-a matične ploče, te na taj način ujedno smanjiti ćete ujedno i zagrevanje.

 

Raspored keša

Nehalem, kao AMD-ov procesor Phenom, poseduje 3 stepena raspodele keša. Tu su 64KB L1 keš (32KB I + 32KB D), 256KB L2 keš (po jezgru, nedeljivi) i sve do 8MB L3 keša (deli se između jezgara). L1 keš je iste veličine kao što je bilo kod Penryn-a, ali je u stvari sporiji (4 kruga naspram 3 kruga). Intel je usporio L1 keš kako bi povećavao brzine, posebno kako su čipovi rasli i gledano kroz veličinu, tj. kako su postajali sve kompleksniji. A ono što je bitno za Nehalam je to što je Intel je povećao performanse za 2 – 3% zahvaljujući višim latencijama L1 keša. L2 keš je takođe pretrpeo izmene – kako smo kod Penryn-a imali 6 MB L2 keš deljene memorije izmešu dva jezgra, kod Nehalem-a L2 keš je podeljen za svako jezgro ponaosob i iznosi mizernih 256KB. Do sad nismo imali Intel-ov CPU visokih performansi sa tako malom količinom L2 keša, tj. još od Pentium-a 4. Isto tako L2 keš se ponaša kao buffer L3 kešu tako da nisu sva jezgra zauzeta sa L3 kešom , zahtevajući tonama bandwidth-a. L3 keš se deli između svih jezgara i u inicijalnim Core i7 procesorima i njegova veličina će biti 8MB, a opet njegova veličina će varirati zavisno od broja jezgara. Multi-thread aplikacije koje će raditi sa svim jezgrima moći će da koriste deljeni L3 keš.

 

Jedna nova stvar koju smo mogli da čujemo od Intel zvaničnika jeste ta da se Intel zapravo okrenuo 8T (8 tranzistora) SRAM ćelijskom dizajnu za sva jezgra, tj. kešu memorije (L1 i L2 keš, ali ne L3 keš). Okrenuvši se 8T dizajnu Intel je bio u mogućnosti da zapravo smanji operativni napon Nehalem-a, što automatski smanjuje potrošnju. Ako se sećate Intel-ov Atom tim je uradio nešto slično sa njegovim L1 kešom. Umesto pumpanja napona i zadržavanja na malom signalnom nizu, Intel se prebacio na register file (1 čitanje/1 upis po portu). Keš sada ima veću ćeliju (8 tranzistora po ćeliji) što povećava površinu otiska L1 instrukcije i data keša. Pitali smo se zašto Atom ima asimetričan L1 data i instrukcijski keš (24KB i 32KB respektivno, umesto 32KB/32KB) i ispostavilo se da je uzrok tome – napon . Dizajn malog signalnog niza baziranog na 6T ćeliji koristi minimum operativnog napona, drugim rečima može da se održi u stanju do određene Vmin. U L2 kešu, Intel je bio u mogućnosti da koristi 6T dizajn signalnog niza tako da je imao linijski ECC.

 

{jospagebreak_scroll title= Integrisani memorijski kontroler}

Nehalem poseduje integrisan DDR3 memorijski kontroler, koji se konačno, tj, koji se više ne nalazi na matičnoj ploči kao što je to bio slučaj do sada. Prva inkarnacija Nehalema će imati triple-channel DDR3 kontroler što znači da bi DDR3 moduli, tj. memorijski kitovi trebali da budu u paketu od 3 modula kako bi se dobio maksimalni protok. Samim tim, proizvođači memorija će početi sa prodajom pomenutih kitova (3 modula po kitu) namenjenih za Nehalem. Sadašnji, a i budući Nehalemi će imati samo dva aktivna kontrolera, dok će high-end i server segment imati tri. Sa tri DDR3 memorijska kanala, Nehalem će očigledno imati jako visok memorijski protok što će mu pomoći da dovoljno “nahrani” sva jezgra.

 

Posledica povišenja memorijskog protoka će se ogledati u tome što će Nehalemove instrukcije raditi agresivnije. Isto tako sa Nehalemom agresivnost instrukcija može biti oslabljena ako nema dovoljno memorijskog protoka. Bilo kako bilo jedna od osnovnih prednosti integrisanog memorijskog kontrolera svakako je memorijski protok. U najboljem slučaju memorijski protok trebalo bi da je i za 100% veći poređenju na Intel Core 2 arhitekturu, ali o tome više u delu koji se bavi testiranjem.

 

QPI

Kada je Intel napravio korak i integrisao memorijski kontroler, potrebno je bilo napraviti konekciju između čipova i s toga QPI je rođen. Nismo sigurni siguran da li je QPI ili Hyper Transport bolje ime za ovo. Svaki QPI link je bi-direktan sa teoretskom propusnošću od 6.4 GigaTexela po linku. Svaki je širok 2 bajta i samim tim dobijate 12.8GT/s protoka po linku u svakom pravcu, tj. ukupno 25.6 GT/s protoka po jednom QPI linku.

 

High-end Nehalem procesori ce imati dva QPI linka dok će mainstream čipovi imati samo jedan. U multi-socket Nehalem sistemima, svaki soket će imati svoju lokalnu memoriju i svoje aplikacije kako bi se osiguralo da procesor ima svoje podatke u memoriji umesto podatke u memoriji susednog soketa.

 

{jospagebreak_scroll title= Nešto sasvim novo – Turbo mod}

 

Turbo Mode je prvi put predstavljen kod mobilnih Penryn procesora. A ideja je bila da ukoliko imate Dual Core procesor i pokrenutu single-thread aplikaciju, jedno jezgro će biti u IDLE stanju, i ukupna disipacija toplote (TDP) će biti niža. Intel je iskoristio ovu tehnologiju da podigne frekvenciju aktivnog jezgra. Na žalost, na mobilnim Penryn procesorima benefit Turbo Moda nije iskorišćen, jer Vista uvek podeli single-thread aplikaciju po jezgrima, pa tako svako jezgro biva zaposleno. Ostaje problem da je redak slučaj kad imate pokrenutu samo single-thread aplikaciju, pa će Vista uvek kreirati dodatne thread-ove i samim tim bi onemogućili procesor da uđe u Turbo mod. Nehalem je nešto uspešniji po ovom pitanju. Ne samo da može da omogući Turbo mod ako sva jezgra miruju, već može iako su samo neka od jezgara u mirovanju ili su sva jezgra aktivna, ali ne i iskorišćena do kraja. Svi Nehalem procesori će biti najmanje u stanju da idu do 133 MHz u Turbo modu, iako su sva jezgra aktivna, sve dok PCU detektuje da TDP specifikacija nije prekoračena. Ako je TDP nivo dovoljno nizak, ili jezgra dovoljno miruju, Nehalem može da podigne frekvenciju za jedan korak više. Za sada, izgleda kao da je jedini sledeći korak 266 MHz, što je još u ovom trenutku neizvodljivo, ali izgleda da Intel ima jako visoke ciljeve sa Turbo modom kod Nehalema, pa ostaje da vidimo šta će vreme pokazati.

 

Buduće verzije bi mogle da dobiju veću “količinu turba” iz Nehalema, koju možete da zamislite u situacijama gde bi frekvencija bila podignuta više od 266 MHz. Ideja je da Intel može da “kapitalizuje” koliko su njegovi procesori raspoloženi za overklok i bezbedno podigne performanse za one koji nisu toliko željni overkloka. U svakom slučaju ne morate da brinete jer Turbo mod može da se isključi ukoliko vam se ta opcija ne dopada.

 

{jospagebreak_scroll title=Intel Core i7 940 – Prvi utisci}

 

Intel Core i7 940 model procesora (kodnog imena Bloomfield) pripada srednjem-visokom tržišnom segmentu . Model koji je nama stigao nije došao u retail pakovanju, tj. nije došao u kutiji u kojoj se nalazi vazdušni hladnjak sa procesorom, što nam otežava posao jer smo ujedno hteli da pretestiramo i performanse novog rashladnog sistema ovog modela. Međutim, ako je verovati Intel podatku koji koje kaže da je ukupna potrošnja ovog modela 130 W, onda je jasno da se i vazdušni hladnjak u mnogome neće razlikovati od onih koje smo imali priliku da vidimo ranije, tj. kao kod recimo Intel Core 2 Extreme QX9XXX modela izrađenih u 45nm. Ipak raster, ili pak razmak između rupa se razlikuje, pa recimo stari hladnjaci neće moći da se montiraju na nove Nehalem bazirane ploče (raster je veći), te ćete u slučaju kupovine novog kulera za Nehalem, obavezno morati da proverite da li podržava novo podnožje (Socket 1366 LGA). Bilo kako bilo glavni adut i7 940 procesora jeste njegova arhitektura. Naime, Intel Core i7 940 mikro procesor izrađen je u 45nm proizvodnom procesu i sa svoja četiri jezgra uz napredniju Hyper Threading tehnologiju, sa integrisanim memorijskim kontrolerom, a opet u poređenju na Core 2 arhitekturu, jednostavno u ovom trenutku predstavlja proizvod bez premca.

 

Fabrički klok ovog procesora iznosi 2.93 GHz, što ruku na srce nije neki napredak ako znamo da smo imali identičan klok i kod Core 2 procesora (kao što je recimo Intel Core 2 Extreme QX6850). Međutim i7 940 kao i svi Nehalem procesori raspolažu sa dosta većom površinom, te se jednim delom više i greju, pa je shodno tome i očekivati neke slične vrednosti kloka. Opet, samim tim vrednost od 2.93 GHz kada se uvrste svi pomenuti podaci oko zagrevanja i površine, ipak deluje kao odlična vrednost kloka. Bus speed ili interni klok procesora sveden je 133 MHz što uz množilac koji iznosi 22 dovodi do Default kloka koji smo već spomenuli, tj. do 2.93 GHz. Veoma bitno je napomenuti i to da se množilac i pored toga što je fabrički podešen na 22, može spustiti na niže vrednosti, pa ako posredstvom podizanja Bus-a želite da povećate mem klok, a opet ne želite da povećate klok procesora, jednostavno spustite množilac procesora i podižite pomenuti interni klok na željenu vrednost. Ovakvo činjenično stanje jasno nam govori da se naš Intel Core i7 940, kao i svi ostali procesori mogu klokovati preko nazovi interne (Bus Speed) magistrale, te da se u većini slučajeva čak i klok generator na matičnim pločama moći da se izmanipuliše unutar Windows operativnog sistema. Što će reći, imaćete mogućnost overkloka i iz Windows operativnog sistema, a da u opšte ne ulazite u BIOS. Neizbežno je napomenuti i to da Intel Core i7 940 poseduje L1, L2 i L3 keš memoriju, koja je raspoređena u ovom odnodu: L1 Data=4x32Kbytes, L1 instrukcije=4x32Kbytes i L3=8Mbytes.

 

Napredni korisnici među kojima su oni koji se prevashodno bave video montažom, ili raznim vidovima kompresije itd, biće veoma zahvalni na ovom proizvodu. Prisustvo unapređenih instrukcija nije izostalo pa se pored standardnih kao što su MMX, SSE, SSE2, SSE3 i SSSE3, EM64T našla i jedna veoma povoljna po korisnike koje smo pomenuli. Naime, SEE4.2 instrukcija (naslednik SSE 4.1 instrukcije koju smo imali priliku da vidimo kod Core 2 procesora izrađenih u 45nm) donela je unapređenje u vidu boljeg funkcionisanja ovog modela procesora u okruženju pomenute video kompresije ili nekog drugog multi-cpu podržanog softvera. Korisnici koji se ne bave toliko ozbiljnom nazovi video montažom, tj. zaljubljenici Divx filmova, imaće umnogome lakši, tj. brže obavljen posao kada budu kompresovali svoje najomiljenije DVD naslove u pomenuti Divx format. U nekim slučajevima performanse u poređenju na Core 2 45nm arhitekturu mogu prelaziti čak i preko 30%, u korist našeg test modela, jer je baš Divx codec jedan od prvih koji je omogućio iskorišćenje nove SSE4 instrukcije ( razlika u korist Nehalema tek će da se oseti jer još uvek nije optimizovan Divx codec za SSE 4.2 instrukcije). Krajnje impresivno zar ne? Isto tako, boljitak u poređenju na stariji proizvodni proces osetio se i kod najnovijim igračkim naslova, što smo mogli i da očekujemo s obzirom na to da memorijski protok zna da pređe vrednosti učitavanja i upisivanja u granicama koje mogu prevazilaze vrednost veću od 18000 MB/s. Svakako najveći benefit će osetiti kod onih „totalnih“ game-entuzijasta koji ne žale novac za recimo dve uparene ATI-AMD 4870X2 kartice u multi GPU režim rada, jer u tom slučaju usko grlo procesor sigurno neće biti.

 

Maksimalni napon koji Intel preporučuje za ovaj model ne bi smeo da pređe više od 1.35 V, međutim naši testovi su pokazali su da ovaj model i pored toga što poseduje četiri jezgra neverovatno dobro podnosi visoke napone. Podigavši napon na vrednost od čitavih 1.5 V na fabričkoj vrednosti kloka, ovaj procesor nalazio sa na temperaturi od 42ºC 43ºC 43ºC 42ºC, a sve to na sobnoj temperaturi od 20ºC – 21ºC, dok je pri punom opterećenju temperatura dostizala svoj maksimum koji je iznosio oko 61ºC 63ºC 62ºC 60ºC, gde nam ništa drugo nije preostalo nego da se bacimo na testove kako bi utvrdili maksimalne dometne ove četvoro-glave „aždaje sa osam otvorenih čeljusti“.

 

{jospagebreak_scroll title=Test sistem}

 

Kako bi počeli sa ispitivanjem Intel Core i7 940 procesora, bilo je neophodno naći i odgovarajuće komponente koje ruku na srce u ovom trenutku nije bilo lako „iskopati“. ASUS P6T Deluxe matična ploča poslužila nam je kao test hardver i možemo vam reći da smo i više nego zadovoljni sa ovim vidom proizvod koji je među prvima izašao na tržište. Što se tiče memorije obezbedili smo dva Super Talent DDR3 memorijski kit-a, kako bi iskoristili tri memorijska modula, potrebna za nesmetan rad triple-chanel tehnologije. Svakako da bi test načinili interesantnijim, obezbedili smo i Intel Core 2 Extreme QX9650 PROCESOR kome sa 3 GHz, namerno smanjili klok na 2.93 GHz ( u kombinaciji sa GIGABYTE GA-EP45T Extreme matičnom pločom koju je obezbedila GIGABYTE kancelarija) kako bi prvu bateriju testova izvrteli na istom kloku oba procesora. Bitno je napomenuti da je memorija kod Nehalem procesora pri Default testiranju bila na kloku od 1066 MHz, dok je slučaj kod Intel Core 2 Extreme QX9650 procesora malo drugačiji te je klok memorije iznosio 1301 MHz. Druge dve baterije testova su rađene uz pomoć dva overklok podešavanja. Prvo overklok podešavanje svodilo se na testiranje, tj. traženje maksimalnog kloka uz pomoć OCZ Vendetta 2 vazdušnog kulera (koji smo morali dodatno da modujemo kako bi useli da ga montiramo na ASUS matičnu ploču) i drugi vid overklok test odigran je na vodenom hlađenju kompanije Cooler Master, oznake AquaGate Max. Testirali smo tako što smo poredili rezultate kako na fabričkim vrednostima, tako i na vrednostima maksimalno postignutog kloka, kako na vazdušnom tako i na vodenom hlađenju. Bitno je napomenuti i to da smo pri testiranju, tj. utvrđivanju maksimalnog kloka oba procesora koristi Quad Prime program, sa kojim smo opteretili svih četiri jezgra (ili osam virtuelnih u slučaju uključenja Hyper Threading tehnologije), a sve to u trajanju nešto više od jednog sata, kao i CPU TEST 3D Mark 06 programa u trajanju od četiri ponavljanja za celu torturu pomenute Prime aplikacije.

 

{jospagebreak_scroll title=Sintetički testovi – Default}

 

{jospagebreak_scroll title=Testovi realnih aplikacija – Default}

 

{jospagebreak_scroll title=3D Testovi – Default}

 

{jospagebreak_scroll title=Maksimalni overklok na vazdušnom hlađenju}

 

Da bi zadovoljili potrebe overklokera kako na vazdušnom, tako i na vodenom hlađenju, pribegli smo testiranju upravo na pomenutim hlađenjima. Testiranje se svodilo na traženje maksimalnog stabilnog kloka kod Intel Core 2 Extreme QX9650, ali i maksimalnog stabilnog kloka kod Intel Core i7 940 procesora. Kako je Intel Core i7 940 napredniji procesor, te je imamo i prisutnu Hyper Threading tehnologiju, kod ovog procesora tražili smo dva masimalna kloka, tj. jedan sa uključenom, a jedan sa isključenom Hyper Threading tehnologijom, posredstvom BIOS-a. Zašto smo to radili? Naime, uključenjem Hyper Threadinh tehnologije Windows operativni vidi 8 jezgara, i samim tim aplikacije koje mogu da iskoriste potencijal svih osam jezgra, pri svom pokretanju zagrevale bi dodatno procesor. Isti slučaj je bio i kod testiranja, gde je Prime 95 aplikacija videla ukupno 8 thread-ova, a opet ponovićemo procesor se i grejao dodatno, što je povlačilo i manju overklok marginu.

 

Intel Core 2 Extreme [email protected] MHz

 

Intel Core i7 940 – 4 thread @ 4045,2 MHz

 

Intel Core i7 940 – 8 thread @ 3955 MHz

 

Maksimalan klok Intel Core 2 Extreme QX9650 procesora zaustavio na 4016,8 MHz uz pomoć 1.360 V napona, što ruku na srce predstavlja jedan od boljih rezultata, ako znamo da je hlađen jednim prosečno-dobrim vazdušnim hladnjakom. Sa druge strane Intel Core i7 940 nas je potpuno iznenadio te smo izvukli 4045,2 MHz što je za 28,4 MHz veći klok u poređenju na pandan model. Međutim uključenjem Hyper Threading tehnologije, tj. upošljavanjem 8 thread-ova klok se smanjio na 3955 MHz. Bilo kako bilo pogledajmo naredne tri strane, tj. rezultate testova na ovim postignutim vrednostima overkloka.

 

{jospagebreak_scroll title=Sintetički testovi – Vazdušno hlađenje}

 

{jospagebreak_scroll title=Testovi realnih aplikacija – Vazdušno hlađenje}

 

{jospagebreak_scroll title=3D Testovi – Vazdušno hlađenje}

 

{jospagebreak_scroll title=Maksimalni overklok na vodenom hlađenju}

 

Ovom prilikom zahvaljujemo se kompaniji Cooler Master koja je za potrebe ovog testa obezbedila svoje vodeno hlađenje oznake AquaGate Max. Sličan problem koji smo imali kod OCZ Vendetta 2 vazdušnog hladnjaka manifestovao se i kod ovog hlađenja. Naime kako bi uspeli da povežemo matičnu ploču sa vodenim blokom, bilo je neophodno napraviti, novi back plate i samim tim da postavimo šrafove pod uglom kako bi ovaj deo testiranja mogli da privedemo kraju. Overklok margina Nehalem procesora, bar na prvi pogled deluje sasvim korektno, šta više na našem testu se pokazala bolje nego predhodna arhitektura. Međutim na testu nismo imali Core 2 procesor sa E0 stepingom, ali i pored toga ne verujemo da izvukli nešto veći klok pomenutog procesora. Bilo kako bilo, došli smo do zaključka da je za vrhunski overklok na vodi ipak potrebno više od jednog dual radijatora, te u slučaju recimo jednog ili možda dva vezana triple radijatora, situacija bi sigurno bila još bolja. No dobro da vidimo kako se pokazao i7 940 na vodenom hlađenju.

 

Intel Core 2 Extreme [email protected],5 MHz

 

Intel Core i7 940 – 4 thread @ 4200 MHz

 

Intel Core i7 940 – 8 thread @ 4036,7 MHz

 

Intel Core 2 Extrime QX9650 zaustavio se na kloku od 4136,5 MHz. Međutim, maksimalni overklok sa isključenom Hyper Thrading tehnologijom, tj. sa četiri fizička jezgra kod našeg i7 940 procesora iznosio je neverovatnih 4200 MHz, na naponu od samo 1.424 V, dok se maksimalni overklok ovog procesora sa uključenom HT tehnologijom zaustavio na 4036,7 MHz. Moramo priznati da smo ostali veoma pozitivno iznenađeni i da nismo očekivali ovakav ishod. Isto tako, ako se osvrnemo na rezultate koje smo imali priliku da viđamo na našem forumu, kod korisnika koji poseduju procesore sa E0 stepingom, jasno je da je na vodenom hlađenju viđano i preko 4200 MHz. Isto tako, Nehalem procesor koji smo dobili na test, spada u primerke sa prvim stepingom, te u skorije vreme možemo da viđamo i modele sa novim stepingom, koji će nadamo se još više povećati overklok marginu ovih procesora.

 

{jospagebreak_scroll title=Sintetički testovi – Vodeno hlađenje}

 

{jospagebreak_scroll title=Testovi realnih aplikacija – Vodeno hlađenje}

 

{jospagebreak_scroll title=3D Testovi – Vodeno hlađenje}

 

{jospagebreak_scroll title=Krajnji utisci}

 

Sva naša očekivanja su u potpunosti, naravno gledano kroz performanse (bilo da je to overklok ili konačan ishod rezultata test aplikacija) jednostavno ispunjena. Budući sistemi bazirani na Nehalem-u posmatrano od ovog trenutka svakako da neće imati premca. Na našem ne toliko kratkom testu (šala) mogli ste da vidite i overklok margine, kako na vazdušnom, tako i na vodenom hlađenju, i moramo priznati da su nas pomenute „cifre“ koje smo ostvarili veoma pozitivno iznenadile. Sa druge strane, rezultati testova jasno govore, da Hyper Threading tehnologija zajedno sa odličnim memorijskim protokom dosta utiče na realne aplikacije. Primera radi Cinebench R10 benchmark program (realna aplikacija), u stanju je da 100% optereti svih 8 thread-ova kod Nehalem procesora i boljitak kako klok za klok, tako i u overklok rezultatima znao je da iznosi čak i preko 20% u korist Nehalem procesora. Zatim i pored toga što recimo Divx codek još uvek ne podržava SEE 4.2 instrukcije koje su prisutne kod Core i7 procesora, jednostavno boljitak u poređenju klok za klok na defaultu prelazi 26% u korist Intel Core i7 940 modela. Možda je najbolji pokazatelj Nehalem sile ipak u overkloku, jer upravo u uslovima overkloka se pokazalo pravo lice ovog fenomenalnog parčeta hardvera.

 

Naime na vodenom hlađenju sa uključenom Hyper Thrading tehnologijom i7 940 procesor ostvario je klok od 4036,7 MHz (38% overkloka), isto tako Intel Core 2 Extreme QX9650 uspeo je da ostvari 4136,5 MHz. E sad zašto smo ovo spomenuli? Intel Core i7 940 uspeo je da ostvari više od 25% bolje rezultate u Divx kompresiji sa klokom koji je za čitavih 100 MHz manji u poređenju na Intel Core 2 Extreme QX9650 procesor. Što nas dovodi do zaključka i da performanse rastu proporcionalnim povećanjem overkloka, ali na bolje u poređenju na stariju Core 2 arhitekturu. Da se priča ne završava samo na „render“ aplikacijama, mogu da posvedoče i 3D testovi, gde smo recimo u slučaju FutureMark 3D Mar 06 benchmark testa imali razliku od 1791 poena u korist Nehalem procesora, a sve to na identičnom kloku sa Intel Core 2 Extreme QX9650 procesorom. Bolji rezultati su primetni i kod memorijskog protoka, gde je recimo u Everest benchmark programu pri overkloku na vodenom hlađenju ostvaren boljitak od neverovatnih 83% u korist Nehalem procesora, što nam još jednom govori koliko je superioran Nehalemov integirisani memoriski kontroler. Bilo kako bilo zapažanja ima na pretek, i sva su moramo priznati veoma pozitivna, te vas molimo u koliko niste pročitali ceo test da to učinite. A ovom prilikom ujedno želimo da čestitamo kako Intel kancelariji u Srbiji, tako i Intelu u globalu na ovom fenomenalnom proizvodu koji je SXT prosto oduševio.

WP-Backgrounds Lite by InoPlugs Web Design and Juwelier Schönmann 1010 Wien