Referat Microprocesoare PENTIUM IV
Mai jos puteti citi fragmente din
Referat Microprocesoare PENTIUM IV si de asemenea puteti face
Download Referat Microprocesoare PENTIUM IVCiteste fragmente din Referat Microprocesoare PENTIUM IV
Microprocesoare PENTIUM IV
Pentium IV cunoscut ÅŸi sub numele de cod Willamette, este cel mai nou
model al familiei de microprocesoare Intel pe 32 de biţi, care
lucrează la frecvenţe mai mari şi înregistrează performanţe
superioare faţă de modelele precedente.
Noua microarhitectură a acestor procesoare a fost denumită de către
Intel, NetBurst, în spatele acestei tehnologii aflându-se următoarele
noi facilităţi:
busul sistemului la 400MHz – utilizând noua tehnologie ‚quad
pumped’ cu o lăţime a magistralei de 64 biţi şi ceas de 100MHz, se
ajunge la o rată de transfer între procesor şi memorie de 3200 MB/s,
de 3 ori mai mare ca cea a procesoarelor Pentium III. Pentium III putea
transfera doar 1.06G la o frecvenţă de 133MHz. Pentium IV lucrează
prin intermediul a două canale de transmisie cu RDRAM, la o viteză de
3.2G/s.
Advanced Transfer Cache – se concretizează în mărirea ratei de
transfer a datelor între memoria cache L2 şi nucleul procesorului.
Dimensiunea memoriei cache L2 este de 256KB. La schimbul de date cu
sistemul (memorie, AGP, PCI) se folosesc blocuri de 64 bytes, ceea ce
asigură o performanţă mare pentru transferurile în rafală, iar
conexiunea cu nucleul se face prin intermediul unei interfeţe de 256
biţi, care poate transfera date la frecvenţa procesorului. Se obţine
o lărgime de bandă de 44.8GB/s pentru un Pentium IV la1.4GHz,
aproximativ de 3 ori mai mult ca un Pentium III la1GHz.
Advanced Dynamic Execution – optimizări ale arhitecturii de
prelucrare şi stocare temporară a instrucţiunilor – mod speculativ
şi arbitrar de execuţie care împiedică procesorul să aibă stări
de stagnare când instrucţiunile aşteaptă rezolvarea dependentelor,
cum ar fi de exemplu încărcarea de date în memorie. Pot fi rulate
astfel până la126 de instrucţiuni în curs de rulare, faţă de 42
în cazul microarhitecturii Pentium III. Execution Trace Cache – în
cazul procesorului Pentium IV nivelul 1 de cache pentru instrucţiuni
este poziţionat după unitatea de decodare. În acest caz nu mai este
necesară redecodarea instrucţiunilor repetitive odată ce ele se află
în acest cache, în plus sunt mai uşor de dedus dependentele în
procesul de predicţie. Poate conţine până la 12000 de
microinstrucţiuni (comparativ este de 6 ori mai mare ca nivelul L1 de
cache al unui PentiumIII ) şi oferă spre execuţie 3
microinstrucţiuni la frecvenţa microprocesorului. Trace Cache-ul este
un cache de instrucţiuni care încearcă să înregistreze
instrucţiunile în ordinea lor de execuţie, ceea ce simplifică
procesarea, asigurându-se că instrucţiunile sunt în ordinea
corectă.
Un nou algoritm de predicţie a instrucţiunilor, Enhancced Branch
Prediction, cu un buffer în care se pot stoca 4096 de alternative, de 8
ori mai multe ca la un Pentium III, eliminându-se astfel 33% din
predicţiile greşite în cazul procesorului menţionat anterior.
Unitatea de execuţie rapidă asigură un nr mai mare de instrucţiuni
–126, dintre sare unităţile de execuţie pot alege; acest lucru
permite microprocesorului să evite aşteptările care apar atunci când
o instrucţiune foloseşte datele furnizate de o altă instrucţiune.
Unitatea aduce şi o mai mare acurateţe în predicţia salturilor
(ranch prediction), rata de predicţie greşită fiind cu 33% mai mică.
Acurateţea este posibilă datorită implementării unui buffer de 4K ce
stochează mai multe detalii despre ramurile accesate anterior, dar şi
datorită unui nou algoritm de predicţie.
@
ì˜ÂÄ„ËÂ愀̤摧ç—â€n
Ã¢ÂÆ’à ¼ƒÃ‚„市„愂̤摧ç—â€n
Ì€Ì¤â˜Šà ¬€Ñ†æ„€Ì¤æ‘§ç—â€n
Numărul total de cicluri necesare procesării unei instrucţiuni se
numeşte timp de latenţă. O linie de asamblare mai lungă înseamnă
timp de latenţă mai mare.
Rapid Execution Engine – combinând inovaţii ale arhitecturii interne
şi proiectării fizice ale circuitelor, s-a reuşit ca cele 4 unităţi
logice aritmetice simple (ALU) care execută microinstrucţiunile
simple, să ruleze la de 2 ori frecvenţa procesorului. Se încarcă
astfel 2 microinstrucţiuni la fiecare ceas procesor rezultând o
durată totală de execuţie a unei instrucţiuni mult mai mică.
Operaţiile cu întregi sunt procesate de către unităţile de
execuţie pt întregi. În mod normal, o unitate procesează o
instrucţiune numai în partea crescătoare a impulsului de tact, dar
Pentium IV poate procesa şi în partea descrescătoare a acestui
impuls, reuşind astfel să dubleze viteza de lucru pentru anumite
operaţii cu întregi.
Streaming SIMD Extensions2 (SSE2) – extind capabilităţile MMX şi
SSE de la generaţiile anterioare de procesoare cu 144 de noi
instrucţiuni (SSE2) care pot opera cu pachete de date de 128 biţi,
numere întregi sau în virgulă mobilă cu dublă precizie. Aceste noi
instrucţiuni reduc timpul necesar executării programelor optimizate
pentru ele. Ele accelerează în special aplicaţiile vide, audio,
procesările de imagini, aplicaţiile tehnice şi ştiinţifice. SSE2
înseamnă 76 de noi instrucţiuni SIMD, aî există în total 144de
instrucţiuni pentru mărirea performanţei lucrului în virgulă
mobilă şi a aplicaţiilor multimedia. Setul de instrucţiuni este
destinat atât pentru întregi pe 128 biţi cât şi pt nr în virgulă
mobilă dublă precizie, tot pe 128 biţi. Datorită noilor
instrucţiuni programatorul are o mobilitate mai mare deoarece acestea
permit calculelor de tip SIMD să fie efectuate în virgulă mobilă
cât şi pe întregi împachetaţi în registrele MMX. Prezentând o
arhitectură cu totul nouă, Pentium IV este destinat aplicaţiilor
multimedia ÅŸi Internet, cum ar fi editare video, encodare ÅŸi
încărcare de materiale în format video pe Internet, encodare MP3 şi
aplicaţii de vizualizare 3D. Pentru a rula astfel de programe, noua
arhitectură a procesorului Pentium IV (NetBurst) conţine o magistrală
de date la400 MHz, noi tehnologii de realizare a memoriei cache ÅŸi a
canalului de date, alături de un set îmbunătăţit de instrucţiuni
interne şi un coprocesor matematic optimizat pentru aplicaţii
multimedia. Modificările de arhitectură care au dus la
îmbunătăţirea performanţelor obţinute în aplicaţiile de tip
Internet (viteza superioară, canal de comunicaţie mai mare, set nou de
instrucţiuni SSE2, dimensiune redusă a memoriei cache, magistrala de
date mărită) nu se dovedesc la fel de benefice în cazul aplicaţiilor
uzuale. Astfel de programe obişnuiesc să depună mari cantităţi de
date în memoria cache şi în plus, mărirea magistralei de memorie
la 3.2 GB pe secundă nu este atât de semnificativă pt aplicaţiile de
birou, acestea accesând de foarte multe ori memoria cache şi nu
memoria principală.
Pe măsură ce dispozitivele microelectronice devin mai integrate, cu
funcţii mărite şi niveluri de performanţă mai ridicate,
complexitatea soluţiilor de împachetare creşte proporţional.
Ca rezultat al măririi caracteristicilor de integrare, frecvenţelor
ridicate şi al cerinţelor de alimentare ale ultimei generaţii de
microprocesoare, densitatea de interconectări între chipul
procesorului ÅŸi substrat a crescut remarcabil. Un nou tip de tehnologie
cu un nou substrat de împachetare (factor de formă) este necesar
pentru a beneficia din plin de progresele tehnologiilor pe silicon.
Acest lucru a creat o serie de provocări în designul factorului de
formă, dezvoltarea designului de substrat şi a procesului de
asamblare. Pentru a asigura un factor de formă de înaltă integrare
ÅŸi un cost redus, a fost propus Flip Chip Pin Grid Array (FCPGA) ca
soluţie inovativă de împachetare. Acest factor de formă a fost
proiectat ca o soluţie socket. Factorul de formă FCPGA oferă nu numai
o împachetare de înaltă performanţă, pe un substrat eficient din
punct de vedere al costurilor ci şi foloseşte în mod inteligent
echipamentele de asamblare pentru a minimiza, per ansamblu, costurile de
producţie.
Actualmente, preţurile microprocesoarelor PentiumIV variază între
150$ şi 500$ fiind proporţionale cu vitezele de prelucrare.
ì¥Â@