Çfarë na jep FPU? Çfarë do të thotë FPU për kompjuterët? Çfarë është njësia me pikë lundruese fpu?

Procesori i shpejtë është i mahnitshëm! Ka shumë për të mbrojtur zyrtarët që përdorin kodin e shpejtësisë së procesorit. Njerëzit janë duke u ngacmuar sepse matin rrjedhshmërinë në gigahertz - sa më shumë, aq më mirë. Ata që janë të përditësuar duhet të vlerësojnë produktivitetin e procesorit ose përmes testeve speciale, ose sesi ai përballet me përpunimin e informacionit në të dhëna reale, gjë që kërkon përpjekje të mëdha llogaritëse (grafika 3D, edhe filma video). Bazuar në faktin se shumica e shtesave dhe igoreve ditore gjenerojnë një sasi të madhe llogaritjesh mbi vetë numrat e të folurit (numrat me pikë lundruese), produktiviteti i fshehur i procesorit varet nga shpejtësia që prodhojnë є. Për këto qëllime, procesori ka një modul të veçantë të quajtur Floating-Point Unit (FPU) - një modul që llogarit pikën që noton. Në të njëjtën kohë, produktiviteti i këtij moduli varet vetëm nga frekuenca e funksionimit të procesorit dhe karakteristikat e tij të projektimit.

Në fillim të evolucionit të kompjuterëve të çmendur IBM, llogaritja mbi numrat e të folurit, duke përdorur një procesor kompjuterik matematikor, lidhej strukturisht me llojin e procesorit qendror. Tashmë në procesorin 486, Intel prezantoi një modul për llogaritjen e pikës lundruese, i cili rriti ndjeshëm shpejtësinë e procesorit me numrat e të folurit. Gjatë vitit të kaluar, prodhues të tjerë të procesorëve për kompjuterë personalë kanë kaluar në përdorimin e FPU-ve.

Shtë domethënëse që kur punoni me numrat e të folurit, ekziston e njëjta nuancë si në operacionet e tëra - komanda nuk mund të ekzekutohet në një cikël orësh të bërthamës së procesorit (shih artikullin "Këshillimi i transportuesit të procesorit", "KV" Nr. / 2003). Dhe meqenëse në 486 procesorë, një transportues me pesë faza tashmë ka filluar të përdoret për përpunimin e komandave të tëra, FPU, si më parë, nuk është i tipit transportues, atëherë. Skuadra me pikën lundruese po përparonte dhe ishte e detyruar të kontrollonte vikonin përpara. Kjo ndikoi në punën e procesorit me programet multimediale. Dhe pjesa tjetër në atë orë tashmë kishte filluar të mbulohej me shpejtësi nga "kërkesat" e tyre. Është krejtësisht e natyrshme që Intel, duke filluar me procesorët Pentium, filloi të ngecë në tubacion jo vetëm në përgjithësi, por edhe në operacionet e të folurit. Korporata AMD, nga ana e saj, mori një rrugë tjetër - në vend që të përçonte FPU, ajo filloi të prezantojë teknologjinë 3DNow në produktet e saj, e cila synonte gjithashtu rritjen e produktivitetit në operacionet me numrat e të folurit. Kjo teknologji është shfaqur pa asnjë problem në zbatimin e saj. Unë mendoj se shumë njerëz kujtojnë se AMD K6-2 konkurroi me Pentium II në të gjitha operacionet, duke qenë tridhjetë për qind më i lartë se ai i ri në mostrën e numrave operacionalë.

Epo, siç duket, për të filluar, në Athlon dhe procesorët e rinj, korporata AMD kaloi në një FPU të tipit transportues. - në një procesor Tre module FPU filluan të zgjerohen, me sa duket nga të cilat ata marrin pjesë në llogaritjet me pikë lundruese, me fjalë të tjera, me lëshimin e procesorëve Athlon.

FPU(Floating Point Unit) - një bllok që kryen operacione me një pikë lundruese (shpesh quhet koma) ose një procesor llogaritës matematikor.

FPU ndihmon procesorin kryesor të kryejë operacione matematikore në numrat e të folurit.

Fillimisht, ai u instalua opsionalisht, si një procesor shtesë.

Kristali i procesorit FPU ka integrim superior në procesorin e vitit 1989 (procesori Intel 80486).

AMD Radeon Software Adrenalin Edition 19.9.2 Shofer opsional

Versioni i ri i AMD Radeon Software Adrenalin Edition 19.9.2 Opsional driver përmirëson performancën e Borderlands 3 dhe shton mbështetjen për teknologjinë Radeon Image Sharpening.

Përditësimi kumulativ i Windows 10 1903 KB4515384 (shtuar)

10 qershor 2019 Microsoft ka lëshuar një përditësim kumulativ për Windows 10 versioni 1903 - KB4515384 me përmirësime dhe përmirësime të ulëta të sigurisë që prishën kërkimin e Windows dhe rritën përdorimin e CPU.

Lojë shoferi gati GeForce 436.30 WHQL

NVIDIA ka lëshuar një paketë shoferi Game Ready GeForce 436.30 WHQL, e cila përdoret për optimizim në lojërat: "Gears 5", "Borderlands 3" dhe "Call of Duty: Modern Warfare", "FIFA 20", "The Surge 2" dhe "Code" Vein" korrigjon një numër korrigjimesh të vërejtura në versionet e mëparshme dhe zgjeron gamën e ekraneve në kategorinë G-Sync Compatible.

Shofer AMD Radeon Software Adrenalin 19.9.1 Edition

Lëshimi i parë pranveror i drejtuesve të grafikës AMD Radeon Software Adrenalin 19.9.1 Edition është optimizuar për Gears 5.

Apo më mirë akoma, edhe para se të shfaqen problemet e para, kontrolloni menjëherë stabilitetin e kompjuterit dhe zbuloni nëse diçka po vdes nga rrjedhjet?

Ne nisim dhe zgjedhim nga dritarja programin "Shërbimi" - " Testi i stabilitetit të sistemit".

Para teje, vlasne, bachimo merr:

Grafiku i sipërm tregon temperaturën e komponentëve të kompjuterit. Pasi të keni kontrolluar ose pastruar kutinë e zgjedhjes, mund të zgjidhni dhe të shfaqni imazhin në grafikun e temperaturës së çdo njësie ruajtëse. Natyrisht, nëse e dini se puna juaj nuk nxehet në asnjë moment, atëherë thjesht zgjidhni kutinë në mënyrë që të mos rrëmbeni grafikun me informacione të panevojshme. Atje, mbi grafikun e parë, mund të lundroni nëpër skedat që shfaqin informacione të tjera (fluiditeti i mbështjelljes së ftohësit, voltazhi, etj.). Skeda më e vlefshme mbetet atje, sepse në të, në tabelën fillestare (ku regjistrohet minimumi dhe maksimumi i çdo parametri), regjistrohen të gjitha statistikat (temperaturat, tensionet, etj.) që mblidhen gjatë testimit.

Meqenëse ky është ushqim, atëherë unë, si gjithmonë, do t'ju informoj për to në komente ose për ndihmë.

AIDA64 është një program mjaft funksional për matjen e karakteristikave të një kompjuteri, duke kryer teste të ndryshme që mund të tregojnë se sa i qëndrueshëm është sistemi dhe nëse procesori mund të rindizet. Є zgjidhje të rëndësishme për të testuar qëndrueshmërinë e sistemeve me produktivitet të ulët.

Testi për stabilitetin e sistemit transferon presionin tek elementët e tij (CPU, RAM, disqe, etj.). Me këtë ndihmë, është e mundur të zbulohet mosfunksionimi i një ose një komponenti tjetër dhe menjëherë të filloni.

Nëse keni një kompjuter të dobët, atëherë përpara se të kryeni testin, duhet të kontrolloni që procesori të mos nxehet nën presion ekstrem. Temperatura normale për bërthamat e procesorit është fillimisht 40-45 gradë. Nëse temperatura e trupit tuaj është e lartë, rekomandohet ose të prisni testin ose ta bëni atë me kujdes.

Kjo për faktin se gjatë testit, procesori njeh presionin, përmes të cilit (për shkak të faktit se CPU mbinxehet në modalitetin e emergjencës) temperaturat mund të arrijnë vlera kritike prej 90 ose më shumë gradë, gjë që nuk është më e sigurt. për integritetin e vetë procesorit, motherboard dhe komponentët, udhëzimet e përziera.

Testimi i sistemit

Për të printuar një test stabiliteti nga AIDA64, gjeni artikullin në menynë e sipërme "Shërbimi"(Ndodhet në anën e majtë). Klikoni në new dhe gjeni në meny "Testi i stabilitetit të sistemit".

Do të hapet një dritare ku do të ketë dy grafikë, një numër zgjedhjesh dhe butona në panelin e poshtëm. Kthejeni respektin te bisha. Le të hedhim një vështrim në secilën prej tyre në raport:


Ju mund të kuptoni mustaqet e tyre, por në këtë rast ekziston rreziku i fryrjes së tepërt të sistemit, pasi ai është edhe më i dobët. Riinstalimi mund të shkaktojë një riinstalim urgjent të PC-së, dhe vetëm me pak fjalë. Kur zgjidhni disa pika në grafikë, shfaqen një numër parametrash për të punuar me to derisa grafikët e mbetur të përmbajnë informacion.

Së pari duhet të zgjidhni tre pikat e para dhe t'i testoni ato, dhe më pas dy të tjerat. Në këtë rast, do të ketë më pak presion mbi sistem dhe grafika do të jetë më e arsyeshme. Sidoqoftë, nëse kërkohet një test në shkallë të plotë të sistemit, atëherë duhet të merren parasysh të gjitha pikat.

Më poshtë janë dy grafikë. E para tregon temperaturën e procesorit. Përveç artikujve të veçantë, mund të shikoni temperaturën mesatare për çdo procesor ose bërthamë, dhe gjithashtu mund të shfaqni të gjitha të dhënat në një grafik. Një grafik tjetër tregon numrin e ngarkesave për procesor - Përdorimi i CPU-së. Ekziston edhe një pikë e tillë si Mbyllja e CPU-së. Në funksionimin normal të sistemit, treguesit e kësaj pike nuk janë fajtorë për tejkalimin e 0%. Nëse ka një zhvendosje, atëherë është e nevojshme të kryhet testimi dhe të identifikohet problemi me procesorin. Nëse vlera arrin 100%, atëherë vetë programi do të përfundojë punën dhe, pasi të ketë përfunduar gjithçka, kompjuteri do të riaktivizohet deri në atë kohë.

Mbi grafikët ka një meny të veçantë ku mund të shikoni grafikët e tjerë, për shembull, tensionin dhe frekuencën e procesorit. Në mënyrë të veçantë Statistikat Ju mund të bëni një përmbledhje të shkurtër të përbërësve të lëkurës.

Për brumin, ka elementë që duhet të testohen në krye të ekranit. Pas asaj klikoni "Fillimi" në pjesën e poshtme të majtë të dritares. Gjatë testimit, mund të shihni afër 30 hvilin.

Pas një ore testimi në dritare, që doli përballë pikave për zgjedhjen e opsioneve, mund të filloni të zbuloni problemet dhe zbulimin e tyre. Ndërsa jeni duke marrë testin, shikoni grafikët. Në temperatura të larta dhe/ose në temperatura në rritje Mbyllja e CPU-së Aplikoni pa dyshim testin.

Shtypni butonin për të përfunduar "Stop". Ju mund t'i ruani rezultatet tuaja me ndihmë "Ruaj". Nëse zbulohen më shumë se 5 gabime, atëherë jo të gjitha problemet me kompjuterin duhet të korrigjohen. Përpara se lëkura të zbulohet, i jepet testit në të cilin moment është zbuluar, p.sh. CPU stresi.

08.08.2012

Edhe para ardhjes së procesorëve Intel Core, askush nuk kujdesej për konceptin e "efikasitetit të kernelit", por rëndësia e tij dukej shumë më e madhe, edhe pse frekuencat dhe kapaciteti i cache ishin më të ulëta. Si të tregoni efektivitetin e kernelit në numra. Ne ju paraqesim një nga opsionet që mund të përdorni për të vlerësuar produktivitetin në një mënyrë tjetër.

Dua të theksoj se rezultatet e testit të sotëm nuk janë të vërteta në asnjë rast tjetër. Unë nuk pretendoj saktësi njëqind e njëqind e njëqind metra. Me zgjedhjen e parimeve të tjera të testimit, mund të merren rezultate të tjera, përndryshe, vetë kjo metodë jep mundësinë për të gjeneruar rezultate adekuate që vërtetohen nga historia.

Pse i njëjti procesor tregon produktivitet superior? Ky ushqim ka munduar shumë amatorë dhe profesionistë në mbarë botën. Për një kohë të gjatë, shpejtësia e orës ka qenë matësi kryesor i produktivitetit. Disa kohë më vonë kaloi në frekuencën e autobusit të përparmë, pastaj në cache, dhe më pas në numrin e bërthamave. Por në fillim u anashkalua se me të vërtetë kishte një ndikim të madh në efikasitetin e llogaritjes.

Ajo që është e rëndësishme, natyrisht, është produktiviteti i plotë i dy blloqeve më të rëndësishme të procesorëve modernë x86: Njësia Logjike Aritmetike (ALU) dhe Njësia me Pika Floating (FPU). Vetë kompleksiteti i karakteristikave të tyre nënkupton gjithashtu konceptin e arkitekturës - dhe për frekuencën e cache, ky koncept ka shumë rëndësi, kështu që produktiviteti themelor i procesorit reflektohet drejtpërdrejt.

Pra, para kësaj, pasi ka padyshim shumë hetime, le të kuptojmë se cilat janë këto blloqe, çfarë bëjnë dhe si kontrollohen. Siç e kam thënë tashmë, në këtë material nuk do të flasim për punën me memorien, cache dhe të tjera shtesë, do të flasim vetëm për ALU dhe FPU, dhe, natyrisht, për dy depot e tyre të rëndësishme - transportuesit dhe një njësi të parashikimit të prishjes . Epo, le të flasim pak për teknologjinë Hyper-Threading të Intel, sepse ajo ka një ndikim të madh në produktivitetin bazë gjatë operacioneve më të thjeshta.

Blloku i të gjitha operacioneve

E para është njësia kryesore e procesorit. Do të doja të thoja se do të ishte më e saktë të thuash jo një bllok, por blloqe, sepse ka vetëm kaq shumë prej tyre në procesorë. Përafërsisht, në agimin e zhvillimit, praktikisht nuk kishte asgjë në këtë bllok në procesor. Dizajni bazë i ALU, nga modelet e para deri te përbindëshat aktualë, nuk ka ndryshuar. Vin gjithashtu punon me numra të thjeshtë (të plotë), veprime vibruese të mbledhjes, zbritjes, rreshtimit dhe transformimit të numrave; Përfundon operacionet më të thjeshta logjike dhe çon në shkatërrim biologjik.

Ju lutemi vini re se ALU nuk ka të njëjtin shumëzim dhe nën-seksion, por të gjitha këto lloje llogaritjesh kryhen rrallë, dhe si rezultat ata panë një bllok fuqie - "shumësues i plotë", i cili ishte në gjendje të rriste produktivitetin ALU, duke pasur kurseu shumë porosi jo standarde. . Operacionet në nënseksion gjithashtu shumëzohen dhe shtohen në një tabelë të veçantë konstantesh. Ky është një bllok kaq i thjeshtë, produktiviteti i të cilit ndikon drejtpërdrejt në produktivitetin e procesorit në shumë aplikacione, për shembull, aplikacionet e zyrës, programe të shumta specifike për zhvillim, etj.

Numëroni bllokun me një koma lundruese

Ky bllok u shfaq në procesorë shumë më vonë, më i ulët se ALU, dhe fillimisht u pa si një procesor hibrid. Sidoqoftë, më vonë ai ende migroi në thelbin e procesorit kryesor dhe që atëherë u bë një pjesë e padukshme dhe megjithatë e rëndësishme (siç është rasti me ALU, ka më shumë se një nga këto blloqe në procesor). Siç nënkupton edhe emri, detyrat kryesore të FPU-së janë operacionet mbi numrat lundrues.

Që nga momenti që ky bllok u shfaq në magazinën e CPU-së, kërkesa për të u rrit gjatë gjithë orës, gjë që përfundimisht bëri që kërkesa për FPU më së shpeshti të tejkalonte kërkesën për ALU. Përveç kësaj, për të siguruar shkathtësinë e lartë të këtij blloku, kësaj njësie i janë shtuar funksione shtesë, ndërsa në të njëjtën kohë funksionon me rezolucione të transmetimit dhe është i angazhuar në përpunimin e të dhënave vektoriale, të cilat tashmë gjenden në mënyrë të pasur në procesorët aktualë . Produktiviteti i këtij blloku përfshin produktivitetin e procesorit në shumicën dërrmuese të programeve, veçanërisht në multimedia, lojëra, punë 3D me fotografi, etj.

Transportues

Është e qartë se funksionimi i lëkurës në procesor kërkon një kohë të madhe përpunimi dhe këto të dhëna, pa ekzagjerim, janë të një kompleksiteti të madh. Për të optimizuar punën me ta dhe për të organizuar porositjen e tyre, për të rritur shpejtësinë e punës, u shpik transportuesi.

Parimi i tij është i ngjashëm me punën e një transportuesi emergjent në një fabrikë: pjesa kalon hap pas hapi përmes një numri postesh të palëvizshme të punëtorëve që janë të angazhuar në përpunimin e tij, dhe ata kryejnë vetëm një operacion në të. Në vend të pjesëve, procesori merr të dhëna, të cilat gjithashtu kalojnë nëpër një sërë hapash. Sigurisht, kjo qasje ju lejon të ndryshoni ndjeshëm kohën e papunë të procesorit të bllokut të lëkurës, duke rritur ndjeshëm produktivitetin e tij për shkak të përpunimit ekskluziv të të dhënave.

Megjithatë, transportuesi ka mangësi, e cila është ende superiore. Golovny - nuk ka nevojë të rivendosni të gjithë transportuesin e trashëgimisë së ndryshimeve të pakontrolluara në përparimin e programit. Më shpesh, kjo ndodh kur ka një shkelje të kodit të operatorëve mendorë, e cila është për shkak të rëndësisë së ndryshimit të të dhënave dhe drejtimeve të mëtejshme.

Një pikë tjetër e rëndësishme: transportuesit e procesorëve të ndryshëm kanë një numër të ndryshëm fazash. Avantazhi i transportuesve të shkurtër është se ato ju lejojnë të arrini produktivitet më të madh në të njëjtën frekuencë, ndërsa një transportues i gjatë mund të arrijë frekuenca më të mëdha të orës. Një shembull i thjeshtë nga jeta: procesorët AMD Athlon XP dhe Athlon 64 me arkitekturë K7 dhe K8, të cilët konkurruan me procesorët Intel Pentium 4 me arkitekturë NetBurst. Siç e mbani mend, shumë përpunues në këto linja ishin shumë afër njëri-tjetrit për sa i përket produktivitetit, por ishin kategorikisht të ndryshëm për nga karakteristikat. Zokrema, Athlon 64 3200+ me një frekuencë të orës 2200 megahertz, më së shpeshti duke tejkaluar Pentium 4 me një frekuencë prej 3200 megahertz. Arsyeja për këtë fakt është në zhvillimin e fundit të transportuesit: ndërsa AMD, tradicionalisht, përdorte një 12-fazë të shkurtër, Intel Pentium 4 përdori një 20-fazë të gjatë, dhe tre më vonë, një 31-fazë! Ka një ndryshim domethënës në produktivitet.

Blloku për transferimin e kalimeve inteligjente (bllok për transferimin e kalimeve inteligjente)

Shfaqja e këtij blloku ishte e pashmangshme pas shfaqjes së transportuesit. Problemi i operatorëve inteligjentë tashmë është shprehur dhe në mënyrë të pashmangshme transportuesi rivendoset në zero, gjë që ndikoi ndjeshëm në produktivitetin, duke lënë qindra burime shtesë në përpunimin e të dhënave thjesht duke kaluar nga çatia.

Pra, çfarë po bën ky bllok? Është e thjeshtë - funksionon si një shikues i rregullt i procesorit, në mënyrë që, duke i kthyer hapat (lexoni ndarjen e pluhurit të qumështit të të dhënave), do të thotë se do të përcaktohet kalimi mendor. Sigurisht, nuk ka asnjë magjistar në thellësi të tij. Për momentin, kryesore dhe prioritare është metoda dinamike e transferimit të tranzicioneve, në të cilën njësia transferuese jo vetëm që analizon udhëzimet e dhëna që përgatiten para përpunimit nga procesori, por gjithashtu analizon historinë e tranzicioneve të ngjashme dhe ai e grumbullon atë vetë. Për shkak të faktit se ai ndjek vazhdimisht rezultatin e nën-çantës (pasi e ka marrë me mend) dhe është i barabartë me prognozën e tij, përveç statistikave të qeverisë, efektiviteti i transferimit në situata të ngjashme në Maybu Kjo do të rritet patjetër. Nëpërmjet kësaj taktike, ka shumë më tepër transferime të sakta për këtë bllok, dhe më pak të pasakta - procesorët aktualë nga Intel dhe AMD në 95-97 raste tregojnë patjetër një tranzicion të drejtpërdrejtë mendor. Natyrisht, rivendosja e transportuesit është shumë e rrallë.

Epo, ne kemi hedhur një vështrim të vogël të procesorëve dhe tani mund të shohim se si funksionon gjithçka në realitet, sa efektive është kjo arkitekturë tjetër dhe sa efektive janë njësitë ALU dhe FPU (dhe, natyrisht, shtesat dhe blloqet e tyre). Për të qenë në gjendje të kërkojmë një gamë më të gjerë të bërthamave të procesorit dhe në të njëjtën kohë të minimizojmë ndikimin në rezultatet e testimit, pjesë të tilla të rëndësishme të CPU-së aktuale si cache, autobusi i procesorit dhe gjerësia e brezit të nënsistemit të memories, ne kaluam në AIDA 64 paketë testimi pse ka më shumë se dy vibrano në paketim sintetik - CPU Queen dhe FPU SinJulia. Pse bie erë e keqe? Ka konfirmim në vetë parimin e funksionimit të tyre dhe përputhshmërinë e plotë të tyre me aftësitë e këtij testi. Për të kuptuar se si këto dhe karakteristika të tjera arkitekturore të testit të lëkurës përcaktohen nga rezultatet e testit, le të hedhim një vështrim në përshkrimin zyrtar:

Mbretëresha e CPU-së

Një test i thjeshtë. Rezultati ruhet, para së gjithash, në produktivitetin e Bllokut të Operacioneve të Numrit të plotë, dhe gjithashtu i ndjeshëm ndaj efikasitetit të Bllokut të Transmetimit Rozgaluzhen, si rezultat i të cilit kodi zhvillohet pa asnjë tranzicion mendor.

Në frekuenca të barabarta të përpunuesve, një model me një transportues më të shkurtër dhe një numër më të vogël procesorësh po fiton përparësi. Megjithatë, me HyperThreading të aktivizuar, procesori Pentium 4 në bërthamën Northwood prodhon rezultate më të larta se modeli më i ulët me bërthamën Prescott, për faktin se në edicionin e parë përdoret tubacioni i shkurtër me 20 faza, kundrejt tubacionit me 31 faza. në tjetrin.

Kur aktivizohet, HyperThreading mund të ndryshojë shpërndarjen e forcave dhe të lejojë Prescott të kapërcejë. Për më tepër, produktiviteti i procesorëve AMD të familjes K8 është për shkak të faktit se modelet e familjes K7 janë inferiore ndaj pranisë së një blloku të transmisionit të pikturuar Rozgaluzhen në to.

CPU Queen teston shtesat e transmetimit MMX dhe SSE, deri në versionin SSSE3. Merr më pak se 1 megabajt RAM. Mbështet HyperThreading, sistemet me shumë procesorë (SMP) dhe procesorë me shumë bërthama.

Përzgjedhja e këtij testi diktimi përpara se të mund të zgjidhni rezultatet e nënsistemit të kujtesës dhe të përdorni cache-et e serverëve tuaj të memories. Për të marrë rezultatin e funksionimit të vetë ALU, i cili mbështet njësinë e transferimit dhe degazimin. Testet e tjera me paketën ALU, megjithëse në mënyrë të parëndësishme, ende tregojnë një rritje në frekuencën dhe vëllimin e cache-it, si dhe në xhiron e autobusit të procesorit dhe autobusit të memories. Dhe në rastin tonë, nëse ndryshojnë dhjetëra përpunues të gjeneratave të ndryshme, diferenca në produktivitetin e këtyre nënsistemeve mund të arrijë shumë shkallë. Për shembull, konsumohet një tabelë: një procesor Pentium III përdor memorie SDR-133 me një gjerësi autobusi memorie 64-bit dhe një Core i7 ka një autobus memorie 192-bit me DDR3-1333.

Dhe boshti i mbështetjes HT nuk mund të shtypet në këtë situatë, sepse ka shumë procesorë në listë që nuk e mbështesin atë, si dhe shumë programe reale. Sidoqoftë, ky fakt mund të konsiderohet thjesht në mendje me barazimin e drejtpërdrejtë të dy procesorëve me dhe pa mbështetje HT.

FPU SinJulia

Test për llogaritjen me koma lundruese dhe me saktësi të shtuar (80 bit). Testi bazohet në analizën e një kornize të një fraktali të modifikuar Julia. Kodi i këtij testi është shkruar në gjuhën e asamblesë, dhe gjithashtu është i optimizuar për procesorët Intel dhe AMD. Sidomos ato kernele që mund të përdorin udhëzime trigonometrike dhe eksponenciale x87.
Testi FPU SinJulia merr më pak se 1 megabajt RAM. Mbështet HyperThreading, sistemet me shumë procesorë (SMP) dhe procesorë me shumë bërthama.

Siç mund ta shihni, testi SinJulia FPU, ashtu si CPU Queen, është plotësisht i pavarur nga produktiviteti i nënsistemit të kujtesës, si dhe nga frekuenca dhe vëllimi i cache-ve të procesorit. Për më tepër, rezultati i SinJulia do të jetë objektiv kur krahasohet K6-III i vjetër dhe Phenom II aktual për faktin se testi nuk përdor shtesa të transmetimit si MMX dhe SSE. Epo, saktësia e lartë e llogaritjes ju lejon të krijoni vlerësime të përshtatshme për detyrat e përditshme që mbështeten në CPU.

Një përzgjedhje e testeve ka përfunduar, por tashmë dëgjoj zëra që protestojnë kundër përshtatshmërisë së rezultateve të përmirësimit të përpunuesve të vjetër dhe të rinj. Një nga argumentet ka të bëjë me barazimin e procesorëve me një numër të ndryshëm bërthamash dhe frekuenca të ndryshme. Pra, veçanërisht për hir të objektivitetit, kemi nxjerrë një koeficient produktiviteti për testin e lëkurës, i cili është llogaritur duke përdorur një formulë të thjeshtë:

rezultati i testit/numri i bërthamave/frekuenca

Pasi i kemi ndarë të dhënat në vlerat për procesorin e lëkurës, morëm rezultatin e një bërthame për cikël orësh. Kur përshkruani testet, është e nevojshme të bëhen një sërë korrigjimesh. Persha: për shkak të pranisë së mbështetjes HyperThreading, procesori do të prodhojë gjithmonë rezultate më të mëdha. Një tjetër: procesorët që nuk mbështesin SSE tregojnë rezultate më të ulëta në testin ALU, si CPU Queen. Për fat të mirë, lista e procesorëve të tillë nuk është e madhe në fakt, vetëm AMD K6-III.

Është gjithashtu e rëndësishme të mbani mend se në fakt procesori i testuar kishte motherboard-in e tij. Dhe bordi i lëkurës, me sa duket, ka gjeneratorin e vet të orës, i cili mund të përdoret për të zvogëluar frekuencën e referencës së procesorit. Ky fakt do të thotë se rezultatet e të njëjtit procesor në motherboard të ndryshëm ndryshojnë. Mjekët, të cilët mund ta zhdukin këtë moment, kishin gjasa t'i privonin rezultatet nga humbja e madhe që rezultatet e justifikuan veten duke lejuar përpunuesit e grupit të drejtonin.

Dhe ky informacion ishte i nevojshëm për një demonstrim adekuat të efektivitetit të kësaj dhe arkitekturave të tjera, dhe në disa raste të kernelit. Duke kërcyer pak përpara, do të them se kjo metodë e destrukturimit u tregua e vërtetë, duke demonstruar një linearitet të lartë dhe ngecje të rezultateve.

Tani le të flasim për ata që protestuam të gjithë. Nëse tashmë jeni mrekulluar nga tavolina, do të vini re se ajo përmban 61 procesorë të gjeneratave të ndryshme. Natyrisht, jo të gjithë u testuan në laboratorin tonë vetëm rreth një e treta e tyre. Një pjesë e konsiderueshme e rezultateve është marrë nga databaza e programeve AIDA 64 2.50, e cila ishte një paketë e vetme testimi në këtë version. Natyrisht, ne nuk u mbështetëm verbërisht në rezultatet. Dhe ne kontrolluam edhe një herë rezultatet e bazës së të dhënave të tyre, pasi kemi kryer teste të jashtme, për disa procesorë të ngjashëm. Rezultatet, të cilat përfshijnë humbjen e frekuencës së referencës dhe ndryshimin në frekuenca të tilla, ishin inkurajuese, duke demonstruar edhe më shumë ngjashmëri. Dhe pastaj, pa asnjë dyshim, ne përpiluam rezultatet nga programet bazë me rezultatet kryesore në një tabelë.

Është gjithashtu e rëndësishme të theksohet këtu se në versione të ndryshme të AIDA-s rezultatet mund të mos jenë të njëjta, dhe për këtë arsye rezultatet nuk janë të qëndrueshme. Në versionin tonë, të gjitha rezultatet u hoqën nga versioni 2.50.

Epo, tani është koha për të vazhduar për të ndjekur rezultatet e testit, të cilat u gjetën të plota dhe madje të dobishme. Tani është koha për t'i hedhur një sy tabelës sonë kryesore, ku do të gjeni karakteristikat më të rëndësishme të procesorëve në këtë test, dhe më e rëndësishmja rezultatet e të dy testeve me të dhënat tashmë të publikuara për produktivitetin bazë për orë.

Vëmë re se efikasiteti i njësive FPU dhe ALU mund të ndryshojë shumë, ju nuk keni faj për dy momente në të cilat i njëjti procesor ka produktivitet të mahnitshëm kur punon me të dhëna të plota, por në të cilin punon shumë më shumë me të dhëna lundruese. Unë dua ta bëj atë në fluturim. Përpara publikimit të raportit, dëshiroj të theksoj se përshkrimi im bazohet në një vijë kohore, ashtu si tabela e rezultateve është renditur nga rezultati absolut i testit ALU.

Procesorët e parë dhe më të vjetër në këtë listë do të jenë modelet AMD K6-III në bërthamën Sharptooth dhe Pentium III në bërthamën Katmai. Këta procesorë mund të përfundojnë një transportues të shkurtër në vetëm disa orë - vetëm 12 faza të Intel dhe një minimum prej 6 fazash të AMD. Sidoqoftë, kjo e fundit praktikisht nuk kërkon një njësi transferimi, pasi problemet që lidhen me zgjedhjen e gabuar të mënyrës nuk do të ndikojnë në rezultatin aq shumë sa në procesorin Pentium. Nuk kishte një gjë të tillë në këtë procesor, por në procesorin Intel kishte, megjithëse sipas standardeve aktuale efikasiteti i tij është i ulët, por mekanizmat e analizës janë të njëjta si në procesorët aktualë. Si rezultat, testi ALU ka rezultatin më të lartë për rrjedhën e shkurtër të tubacionit të AMD K6-III. Rezultati i Yogos është 2.03 rrahje/cikël kundrejt 1.93 për konkurrentin. Dhe nuk ka rëndësi për ata që procesorët AMD të kësaj gjenerate nuk mbështesin zgjerimin e transmetimit të SSE! Në të njëjtën kohë, në testin e FPU-së përpara, ka shumë dëmtime në njësinë e transmisionit, Pentium III me rezultat 0.164 njësi/cikël kundrejt 0.128 për përfaqësuesin e arkitekturës K6.


Pentium III është rritur në efikasitet. Athlon vështirë se mund ta konkurrojë këtë parametër me suksesin e tij të madh

Me kalimin e viteve, bërthamat Coppermine dhe Tualatin të procesorëve Pentium III kanë ruajtur arkitekturën Katmai pa ndryshime, dhe për këtë arsye rezultatet e dy procesorëve: Celeron 700 dhe Pentium III 1333 janë të ngjashme me ato që kemi testuar tashmë. Dhe boshti AMD, për një orë, prodhimi i këtyre procesorëve filloi të dukej si arkitektura K6, pasi përmes një transportuesi shumë të shkurtër nuk ishte e mundur të arrinte frekuenca më të larta se 550 megaherz. Si rezultat, arkitektura e re K7 eliminoi tubacionin ekzistues me 10 faza dhe shtoi shumë funksione dhe ndryshime shtesë që sollën përmirësime të rëndësishme në produktivitet. Risia kryesore dhe më e rëndësishmja në kuadrin e këtij materiali ishte shfaqja e një njësie degazimi. Sidoqoftë, përpunuesit Pentium III dhe produktet e reja, që morën përsipër Athlon, nuk ishin në gjendje të tejkalonin produktivitetin e njësive ALU. Efikasiteti i performancës së FPU është rritur ndjeshëm: në këtë parametër, AMD K7 Athlon tejkaloi ndjeshëm K6 dhe ishte në të njëjtin nivel me konkurrentët e tij, duke demonstruar një rezultat prej 0.163 od./cikël. Dhe boshti i transportuesit ka ulur ndjeshëm efikasitetin e bllokut ALU - në 1,58 njësi/cikël, që është të paktën 25 vat më i lartë se K6. Mirëpo, kjo ishte e justifikuar, pasi që FPU në shumicën e shtesave në atë kohë ishte e rëndësishme, dhe frekuenca më e lartë që u arrit si rezultat i mbulonte shpenzimet e tepërta.

Kalimi i AMD Athlon në bërthamën Thunderbird nuk ndryshon rritjen e fuqisë dhe efikasitetit për orë, megjithëse bërthama bazohet në të njëjtën arkitekturë. Në fakt, menjëherë pas tyre, në treg u shfaqën procesorët e parë Pentium 4, bazuar në arkitekturën krejtësisht të re NetBurst. Ndoshta për sa i përket marketingut dhe shitjeve, këta përpunues ishin një sukses i çmendur, por për sa i përket inxhinierisë dhe efikasitetit, arkitektura më e madhe në histori nuk ekzistonte.


Pentium 4 në bërthamën Willamette. Një nga përpunuesit e parë të bazuar në arkitekturën jetëshkurtër, ose ndoshta të qëndrueshme, Netburst.

Arsyeja është kjo: në ndjekje të megahercit të madh që blerësit kërkuan aq shumë, inxhinierët e Intel ndërmorën një lëvizje të pazakontë për të arritur më shumë frekuenca të larta, ata e zgjeruan ndjeshëm transportuesin në 20 faza. Natyrisht, në garën për megahertz ata u bënë menjëherë liderë, dhe produktiviteti hyri në takt edhe dukshëm. Rezultati mesatar i procesorëve Pentium 4 në bërthamat Willamette dhe Northwood në testin ALU është ende 1.02, dhe në testin FPU është 0.108. Krahasoni rezultatet e Pentium III, ndryshimi është kolosal! Në mënyrë që të tejkalojë procesorët e gjeneratës së mëparshme për sa i përket produktivitetit, Pentium 4 kërkonte një frekuencë dukshëm më të lartë. Në fakt, për të arritur efikasitet të barabartë të blloqeve ALU me procesorin më të lartë të familjes Pentium III, i cili funksionon në një frekuencë prej 1400 megahertz, bërthama Pentium 4 mund të funksionojë në një frekuencë prej 2536 megahertz! Dhe për të arritur të njëjtin rezultat në testin FPU, ju nevojiten 2111 megahertz, që është pak më pak, por ende jo e mjaftueshme. Pra, nëse mesatarizojmë rezultatet, atëherë efikasiteti është i krahasueshëm me procesorët Pentium III 1400 dhe Pentium 4 2.4.

Në të njëjtën kohë, AMD nuk e ndoqi Intel për sa i përket frekuencave dhe, pasi kishte ruajtur arkitekturën praktikisht të pandryshuar K7, lëshoi ​​një linjë të procesorëve Athlon XP, procesorë në të cilët nuk shënoheshin më nga frekuenca, por nga vlerësimet me një "plus shenjë, e cila tregoi efektivitetin e procesorëve odo Pentium 4. Sipas tregtarëve të AMD, procesori Athlon XP 1800+ është krijuar për të konkurruar me Pentium 4 që funksionon në 1800 megahertz.

Mund të verifikojmë se sa adekuate është kjo qasje duke marrë parasysh faktin se efikasiteti i bërthamave Athlon XP është në nivelin 1.58 od./cikël në ALU dhe 0.163 od./cikël në FPU. Me frekuencën reale të modelit 1800+ që është 1533 megahertz, rezultati është 2422 njësi në CPU-në Queen dhe 250 në FPU SinJulia. Në të njëjtën kohë, rezultati i një Pentium 4 me një frekuencë prej 1.8 gigahertz është në magazinë 1908 dhe 195 njësi, padyshim. Duket se vlerësimi është nënvlerësuar. Do të doja të kujtoja se produktiviteti i aplikacioneve reale mund të jetë shumë i ndryshëm, pasi përdoren karakteristika të tjera të përpunuesve, cache, autobusët, etj.

Çuditërisht, është një e vërtetë e hidhur që inxhinierët e Intel nuk kanë mësuar asgjë të mirë dhe përsëri, pasi janë bërë të paaftë për të rritur frekuencën, ata përsëri do të shkojnë për ta rritur atë deri në fund të transportuesit. Për më tepër, jo me disa hapa, por edhe më domethënës - meqenëse bërthama e Northwood ka vetëm 20 hapa, atëherë Prescott është bërë 31. Dhe ky nuk është vetëm një transportues i gjatë, por edhe më i gjatë. Kështu, si rezultat i këtyre ndryshimeve, pragu për frekuencën maksimale të orës së bërthamave të reja ishte kryesisht për shkak të imazhit termik.


Bërthama Prescott është bërë një përmirësim i mëtejshëm në arkitekturën Netburst në garën për megahertz të lartë. Bërthama më efikase e Intel në histori.

Sidoqoftë, ndryshimi më i rëndësishëm, të cilin jo të gjithë mund ta vlerësonin, ishte rënia e ndjeshme e efikasitetit të paraardhësit, dhe megjithëse ardhja e teknologjisë HyperThreading në çdo kuptim do të kishte ndryshuar situatën, atëherë procesorët nuk do të ishin fitimtarë, tregoi vetëm një zell i pangopur për efikasitet. Gjeni në tabelë procesorët Pentium D 820 dhe 925, si dhe Celeron D 326 dhe do të kuptoni se për çfarë po flas. Rezultati për orë i demonstruar nga testi i CPU Queen ishte një shumë modest 0,75 njësi dhe FPU SinJulia vlerësoi efektivitetin e arkitekturës së përditësuar NetBurst në 0,081 njësi. Rënia e produktivitetit nga bërthamat Willamette/Northwood rezultoi në afërsisht 30 vat në ALU dhe deri në 40 vat në FPU.

Çiftimi i Prescott-256 dhe Smithfield me procesorët AMD K8 është plotësisht pa dhimbje. Pra, arkitektura e re kërkonte një transportues dy herë më të madh, K7 më të ulët, dhe me këtë shfaqjen e një njësie transferimi me ngjyra të konsiderueshme dhe efikase. Si rezultat, kernelet e bazuara në arkitekturën e re demonstrojnë efikasitet pak më të lartë të punës së ALU dhe FPU. Performanca mesatare e testit të CPU Queen u rrit në 1.74 njësi, dhe FPU SinJulia ishte e barabartë me atë të mëparshme. Siç e dini, jo më kot procesorët Athlon 64 dhe Sempron tashmë janë vlerësuar nga lojtarët - efikasiteti i tyre është edhe më i lartë, më shumë se dyfishi i Pentium 4 popullor me bërthamat Prescott dhe Smithfield, që është më shumë. suplementet nuk ndihmuan aspak. Disa frekuencë, asnjë shërbim i madh për cache-in e një niveli tjetër.


Athlon 64 i AMD ishte një zgjidhje më e suksesshme Në Pentium 4, këta procesorë kishin konsum të ulët të energjisë dhe efikasitet të jashtëzakonshëm.

Sidoqoftë, në këtë fazë është e rëndësishme të mbani mend se teknologjia HyperThreading është shfaqur në vetë thelbin e Prescott. Ajo u shfaq, padyshim, jo ​​nga një jetë e mirë dhe ishte një përpjekje e pasuksesshme për të maskuar të metat e transportuesit të gjatë. Në fakt, megjithë teknologjinë ende jo të plotë në atë kohë, inxhinierët ishin në gjendje të reduktonin kohën e funksionimit të transportuesit. Për shembull, procesori Pentium 4 2800E i bazuar në bërthamën Prescott dhe mbështet HT demonstron të njëjtin efikasitet si bërthamat me një tubacion 20 fazash, por pa HT. Megjithatë, rritja e efikasitetit për shkak të mbështetjes HyperThreading për bërthamat Willamette/Northwood nuk u arrit, krahasuar me rezultatin e procesorit të rrallë Pentium 4 3.46 GHz Extreme Edition, i cili bazohet në bërthamën Gallatin (analog me Northwood, por me 2 MB me cache L3).

Pak më vonë, në fund të serisë NetBurst, inxhinierët e Intel arritën të përmirësojnë ndjeshëm HyperThreading dhe të arrijnë një rritje të konsiderueshme të efikasitetit të bllokut të robotit për shkak të koma lundruese. Riktheni respektin për më të fundit në linjën e Pentium 4 Extreme Edition me një bërthamë 3,73 GHz dhe Pentium 955 Extreme Edition me dy bërthama. Efikasiteti i robotit FPU është tashmë 0,138 njësi, ndërsa produktiviteti i ALU është në të njëjtin nivel. Sidoqoftë, për të qenë të sigurt, AMD Athlon 64 X2 nuk arriti të tejkalojë produktivitetin e konkurrentëve të tij kryesorë, pavarësisht se të tjerët funksionojnë me një frekuencë më të ulët të orës dhe nuk mbështesin HT.

Shikoni tabelën - Athlon 64 X2 5200+ nuk mund të konkurrojë me procesorët e arkitekturës NetBurst, e lëre më AMD Athlon 64 6400+ të nivelit të lartë në atë kohë. Sidoqoftë, Intel e kuptoi shumë kohë më parë se ndjekja e "gigahertzit të madh" ishte e qetë dhe po përgatitte një arkitekturë të re, e cila do të ishte jo më pak e suksesshme në aspektin e marketingut se Pentium 4, por edhe më efektive.


Athlon 64 X2 është ndoshta i vetmi procesor i mbetur sot që mund të tejkalojë procesorët më të mirë të Intel. Sidoqoftë, nuk ishte e vështirë të ringarkosh Pentium D-të joefektive dhe të nxehta.

Le të flasim, para së gjithash, për Core. Pasi çmontuan këtë arkitekturë, inxhinierët e Intel iu drejtuan linjës së montimit, e cila kërkon vetëm 14 faza, për ta shkurtuar atë në mënyrë të barabartë me pjesën tjetër të përfaqësuesve të NetBurst. Natyrisht, në mendje të tilla, nuk dëgjohej më fjala për arritjen e disa gigaherz, por përfaqësuesit e parë të familjes së re, pavarësisht nga frekuenca e ulët, treguan produktivitetin më të madh. Të dy procesorët e kësaj gjenerate - Pentium M 730 në bërthamën Dothan dhe Core Duo T2500 në bërthamën Yonah treguan rezultate për orë që tejkalojnë Pentium III dhe janë dukshëm më të ulëta se ato të familjes konkurruese AMD K8.

Arkitektura është testuar në zgjidhjet celulare në një formë pak të modifikuar dhe ka ardhur në tregun e desktopit në formën e procesorëve Core 2 Duo dhe Pentium Dual Core. Në kohën e lëshimit, ata nuk mund të mburreshin me frekuenca të larta, por në të njëjtën kohë ata demonstruan efektivitetin më të madh dhe si rezultat, me sa duket, nuk u interesuan për praninë e mbështetjes HyperThreading! Në këtë pikë, është e natyrshme të punohet dhe të zvogëlohet ndjeshëm blloku i transferimit. Mrekullohuni me rezultatet. Në testin e CPU Queen, efikasiteti mesatar i bërthamës Conroe dhe atyre të ngjashme u rrit në më shumë se dy njësi për orë dhe arriti një mesatare prej 2.13. Testi FPU SinJulia ka një rezultat shumë të mirë - 0.175. Sidoqoftë, kjo nuk është shumë, por më shumë, më pak për procesorët e arkitekturës Core të gjeneratës së parë dhe shumë më tepër sesa për AMD K8, të cilin Pentium 4 e luftoi kaq gjatë dhe pa sukses.


Arkitektura Core 2, e cila zëvendësoi NetBurst, tregoi se Intel mund të ekzekutojë procesorë të shpejtë dhe të ftohtë që ofrojnë efikasitet të lartë.

Efikasiteti i lartë i bërthamave u arrit edhe një herë nga Celeron me një bërthamë, i cili ishte vetëm disa vjet më vonë, i cili me një frekuencë modeste, dhe bërthama Conroe-L, duke treguar produktivitet të barabartë me paraardhësit e tij, performuan në një frekuencë. dy herë më e lartë. Dhe kjo, ki parasysh, është në të njëjtin thelb. Në përgjithësi, kjo arkitekturë e ka dëshmuar veten të jetë sa më efikase dhe tashmë ka bërë të mundur që AMD të përpiqet të arrijë hapin me super konkurrentët e saj.

Dhe këtu filluan problemet për AMD. Tani ka përmirësime të konsiderueshme në efikasitetin e bërthamës, dhe në vend që të merren me këtë problem të ri, inxhinierët, pasi krijuan gjeneratën K10 dhe procesorë të ngjashëm me emrat Phenom dhe Athlon, filluan të përmirësojnë numrin e bërthamave dhe memorieve të fshehta. Produktiviteti i përgjithshëm i këtyre zgjidhjeve është rritur ndjeshëm, por ndikimi në efektivitetin e ndryshimeve ka qenë i parëndësishëm. Produktiviteti i ALU është rritur pak, ndoshta përmes përmirësimeve shtesë në njësinë e parashikimit të tranzicionit, dhe efikasiteti i FPU ka humbur absolutisht pa ndryshime - me karakteristika të tilla ishte e mundur të konkurrohej me Core 2 vetëm për numrin e bërthamave ose më tepër nga frekuenca. Procesorët e gjeneratës K10 kanë ende disa probleme serioze, siç mund ta imagjinoni.


Phenom është padyshim një procesor i ngadaltë. Efikasiteti i tij nuk arriti në Core 2, gjë që shkaktoi probleme serioze me frekuencat.

Si rezultat, Phenom nuk u bë kurrë një konkurrent i procesorëve Core 2 Duo dhe Core 2 Quad. Sidoqoftë, problemi me frekuencat vazhdoi të vazhdonte, dhe procesorët e rinj Phenom II dhe Athlon II të arkitekturës K10.5 ishin gati të konkurronin me zgjidhjet e Intel për këtë performancë. Dhe efikasiteti i gjeneratës së re humbi në të njëjtin nivel, dhe zgjidhjet AMD nuk mund të konkurronin me konkurrentët për frekuenca të barabarta. Më parë, gjatë kalimit në teknologjinë e procesit 45 nanometër, Intel përsëri i kushtoi pak vëmendje arkitekturës dhe arriti një rritje të konsiderueshme të efikasitetit të njësisë FPU, në nivelin 0,185 njësi/cikël.

Pavarësisht komoditetit, në punëtoritë dhe laboratorët e Intel-it, tashmë është bërë një punë e re për të zhvilluar arkitekturën Core, e cila është zhvilluar për procesorët Core i3, i5 dhe i7 me emrin sekret Nehalem. Ndryshimet në blloqe dhe ulja e të gjithë parametrave çuan në rezultate të shkëlqyera. Mrekullohuni me performancën e Core i5-750: efikasiteti i ALU pothuajse ka humbur në të njëjtin nivel me Core 2, por në të njëjtën kohë produktiviteti i bllokut më të rëndësishëm të të gjithë operacioneve është rritur ndjeshëm - deri në 0,225 njësi për ora!

Përveç përmirësimeve arkitekturore, Intel ka përgatitur një tjetër veçori të shkëlqyer - teknologjia HyperThreading është përsosur. Kjo strategji na lejoi të arrijmë një efikasitet thjesht fantastik. Kjo teknologji, kur optimizohet siç duhet, ka dhënë një efekt të madh dhe mund të ketë rritur dyfish efikasitetin! 3.05 për ALU dhe 0.36 për FPU - ky është thjesht një rezultat i mrekullueshëm. Në të njëjtën kohë, edhe pa mbështetjen e kësaj teknologjie, përpunuesit e bazuar në arkitekturën Nehalem doli të ishin më efektiv se paraardhësit dhe konkurrentët.


Nehalen u bë arkitektura e parë e Intel që vendosi theksin maksimal në efikasitetin bazë. Rezultati ishte i jashtëzakonshëm. Uljet në Sandy Bridge dhe Ivy Bridge treguan se ka ende potencial.

Dy gjeneratat e fundit nga Intel - procesorë të bazuar në bërthamat Sandy Bridge dhe Ivy Bridge - demonstruan gjithashtu produktivitet më të madh jo vetëm për shkak të rritjes së frekuencës. Ndryshimet e vogla në kernel bënë të mundur rritjen e vazhdueshme të produktivitetit të një blloku operacionesh të tëra, me 0.25 njësi/cikël për brez, si me dhe pa HyperThreading. Dhe boshti për ndryshimin e efektivitetit të FPU nuk është i disponueshëm. Megjithatë, pa asnjë zbukurim, kjo shfaqje është shumë e sjellshme. Bazuar në trendin, ne kemi të drejtë të përjetojmë efikasitet të shtuar edhe kur shfaqet gjenerata e ardhshme e procesorëve Intel.

AMD nuk do të shqetësohet kurrë për një efikasitet të tillë. Për më tepër, nuk duhet të uleni duke u përpjekur të pikturoni ekranet e procesorëve tuaj. Bazuar në bërthamat e arkitekturës K10.5, procesorët Llano demonstruan efikasitet pak më të ulët ALU sesa procesorët e mbetur Phenom dhe Athlon. Në thelb, pjesa kryesore e njësisë së ripërpunimit u degazua, ndërsa efikasiteti i FPU nuk ishte më i njëjtë me atë të demonstruar nga të gjithë procesorët më të fundit AMD, duke filluar me familjen e parë Athlon K7.


Përfaqësuesi i mbetur i familjes AMD, i cili filloi përsëri në gjeneratën K7 - APU Liano. Është për të ardhur keq që nuk përputhet me efikasitetin e procesorëve të mbetur Intel

Megjithatë, sipas Llanos, është e mundur të merren parasysh vendimet që tashmë janë të vjetruara, pasi procesorët AMD në të ardhmen më të afërt do të shoqërohen me procesorë të arkitekturës së re Bulldozer, e cila u prezantua në procesorët AMD FX dhe të ngjashme. Vetë këta procesorë, të cilët rezultuan të jenë aspak të përsosur, na vunë në një situatë të keqe kur ishte fjala për uljen e efikasitetit të bërthamave. Dhe të gjitha përmes atyre në të cilat parimi i organizimit të bërthamave është tashmë i palosshëm. Procesori FX-8150 përmban module me dy bërthama dhe është deklaruar nga kompania si tetë bërthama. Për të ndëshkuar kompaninë për këtë, do të ishte e mundur të mbrohej efektiviteti i saj nga zgjerimi i tetë bërthamave, megjithëse teknikisht do të ishte i pasaktë, dhe rezultati do të ishte në të njëjtin nivel me procesorët Intel në arkitekturën NetBurst. Prandaj, besohej se efektiviteti nuk ishte në thelb, por në modul, gjë që është plotësisht e justifikuar, në fakt, se moduli i lëkurës ka më pak se një bllok për t'u numëruar me një koma lundruese.


AMD FX në arkitekturën Buldozer ka treguar një rritje të konsiderueshme në efikasitet, por arkitektura e palosshme nuk është zbuluar ende. Dhe, ndoshta, nuk do të zbulohet më.

Me ALU, gjithçka është më komplekse - nuk ka blloqe të tilla në asnjë procesor modular, por ato nuk mund të përpunohen paralelisht me efikasitet të mjaftueshëm për shkak të veçorive të menaxherit të detyrave në Windows 7 dhe OS të mëparshëm nga Microsoft. Prandaj, u vendos që efektiviteti i ALU-ve të mund të ndahej në një numër modulesh. Vendimi është i diskutueshëm dhe nuk do të theksoj objektivitetin e këtij rezultati. Dhe rezultatet, para fjalimit, doli të ishin absolutisht të neveritshme. Shumë më mirë se paraardhësit, natyrisht. Sipas efikasitetit të rezultatit ALU, procesorët e arkitekturës Buldozer treguan një rezultat prej 2.2 njësi/cikël, që është dukshëm më i ulët se K10.5, Llano dhe pak më i ulët se Core 2, megjithëse Sandy Bridge, pa çdo mbështetje Hyper Threading ende larg. Efikasiteti i FPU (rezultati i të cilit mund të besohet plotësisht) gjithashtu tejkaloi ndjeshëm të gjitha zgjidhjet e mëparshme AMD dhe u shfaq pikërisht midis arkitekturës së hershme dhe të vonë Core 2.

Bazuar në këto rezultate, është e mundur të konkludohet se procesorët e arkitekturës Bulldozer nuk janë konkurrentë të procesorëve Intel duke filluar me Nehalem, dhe boshti Core 2 mund të luftojë në mënyrë më efektive dhe të kthehet në frekuenca të barabarta. Jo zhvillimi më pozitiv për “të gjelbërt”.

Për lehtësinë tuaj, ne kemi përmbledhur të gjitha rezultatet në një tabelë me tregues të performancës mesatare për bërthama të ndryshme.

Mbi këtë mund të vendosim një pikë në hetimin tonë. Jo, aspak, sepse ky material nuk pretendon të jetë absolutisht global dhe siç thashë në fillim të materialit, nuk ndikon në efektivitetin e shumë blloqeve të rëndësishme të procesorit. Megjithatë, pa ALU dhe FPU produktive, nuk ka procesorë efikas dhe ky material konfirmon plotësisht këtë postulat. Historia e ka vënë çdo gjë në vendin e vet dhe nga lartësia e fateve që kanë kaluar, mund të vendoset lehtësisht e pacenueshëm vula dhe të tregohet mëshirë. Dhe e njëjta mëshirë është gjithashtu një shoqërues i domosdoshëm i përparimit, i cili, pavarësisht nga të gjitha rrugët qorre, na çon në mënyrë të pashmangshme drejt një të ardhmeje të lumtur dixhitale.

Materiale të ngjashme: