AMD Zen- uutisia ja spekulaatiota

Viestiketju alueella 'Tietotekniikkauutisia maailmalta' , aloittaja hkultala, 03.10.2015.

NOSTOJA MUROPAKETIN SISÄLLÖSTÄ
  1. C64Ever

    Rekisteröitynyt:
    05.12.2015
    Viestejä:
    194
    Socket AM4 muuttaa coolerin kiinnitysreikien paikkaa verrattuna AM2/AM2+/AM3/AM3+/FM/FM2+/FM3/AM1 jne kantoihin. Siksi Zeniä tukevat emolevyt tarvitsevat uudenlaiset prosessoricoolerit tai vähintään erilaiset kiinnikkeet cooleria varten. Toistaiseksi vain Noctua on luvannut tarjota ilmaiseksi AM4-yhteensopivat kiinnikkeet vanhojen coolereiden omistajille.

    Tässä olisi valmistajilla hyvä tilaisuus positiiviseen mainontaan. Hiljaista on ollut monta kuukautta. Ehkä asiaa "säästellään" AM4 emolevyjen julkaisuajankohtaan? Tai Intel on maksanut valmistajille jotta asiasta ollaan hiljaa? Vai onko valmistajien ajattelutapa "kannattavampaa myydä uusi cooleri"?
     
  2. Melbac

    Rekisteröitynyt:
    15.01.2001
    Viestejä:
    10 374
    Miksi alkaa mainostamaan jotain tuotetta kun sitä prossua ja niitä emoja ei ole edes myynnissä?.Eiköhän ne ilmoittele noista sitten kun zeniä ja am4 emoja on kaupassa ostettavissa.
     
  3. FireFly classic

    Rekisteröitynyt:
    16.01.2001
    Viestejä:
    8 037
    No ehkä sinä ja schoolmaster ja joku tuntematon muu nauttii tästä perseilystä, mutta eiköhän suurin osa rauta/uutisalueiden lukijoista haluaisi keskustella teknisistä asioista nyt ja jatkossa ihan asia- ja faktapohjalta ilman näitä "kuumia" keskusteluja. Jos pitää lähteä polla kuumana trollaamaan tunnepohjalta asiallisen keskustelun sijaan oikea osoite on räbä tai yk.
     
  4. Griffin

    Rekisteröitynyt:
    29.11.1999
    Viestejä:
    17 157
    Tällähetkällä VAIKUTTAA siltä, että kyseessä voi olla EHKÄ ihan välttävä tuote. TOSIN sen näkee vasta, kun LUOTETTAVAT KOLMANNET OSAPUOLET pääsevät VAPAASTI testaamaan ja arvioimaan noita.
    Emme tiedä alkuunkaan luotettavasti:
    - IPC:tä. (On vain epämääräisiä arvioita, epämääräisistä lähteistä.)
    - Miten hyvä HT ratkaisu tuossa on.
    - Miten hyvin välimuistit toimivat.
    - Miten hyvä on muistiohjain 8nopeus ja yhteensopivuus muistien kanssa.
    - Onko kivi oikeasti miten "kiuas" kovassa rasituksessa (onko ilmoitettu TDP ylä vai alakanttiin jne).
    - Onko kivessä mitä bugeja, jotka johtavat esim epävakauteen tai ominaisuuspuutteisiin julkaisussa.
     
  5. sChoOlmAStEr

    Rekisteröitynyt:
    03.02.2003
    Viestejä:
    3 425
    Totta, JOS amd on onnistunut saamaan zen ytimien ipc suorituskyvyn ja kulutuksen intelin sb - bw tasolle niin propsit siitä. Intelin ht tekniikka on hyvällä tasolla joten siitä on oikeasti hyötyä hyvin säikeistyvissä sovelluksissa (suorituskyky nousee 10-30%). Aluksi (P4) se paransi lähinnä vain käytettävyyttä single ja dual-core suorittimilla mutta sovelluksissa hyöty oli olematon tai pahimmassa tapauksessa ht:n käyttö saattoi jopa hidastaa. Pahimmassa skenaariossa zen ht voi siis olla ongelma joten toivottavasti amd on tehnyt tällä kertaa kaikki oikein. Zenin kehityksestä paremmin perillä olevat tahot tullee kertomaan juu/ei faktoja. @hkultala
     
  6. hsalonen

    Rekisteröitynyt:
    15.08.2009
    Viestejä:
    10 441
    - IPC on tosiaan vaan arvio ja markkinointikalvoista.
    - HT on SMT, mitä Intelkin käyttää https://en.wikipedia.org/wiki/Simultaneous_multithreading
    - Välimuistia on enemmän kuin intelillä ja se vaikuttaa prosessorin kellotettavuuteen. Lähinnä niin, että kellottuu vähemmän ja kellot on alhaiset.
    - AMD:n muistiohjaimet on parempia kuin Intelin. Tämä on fakta. AMD:lla oli prosessoriin integroitu muistiohjain ennen Inteliä ja näistä on niin paljon kokemusta/patentteja, etteivät voi mokata. Myös AMD64 on loistava käskykanta. Intel käyttää sitä myös.
    - AMD on "tehdasylikellotanut" FX-sarjaa aiemminkin, jolloin TDP on alakanttiin ja korkea. Varmaan myös tällä kertaa.
    - Muistatko Phenomin TLB-bugin vai oliko tämä vain valistunut arvaus? AMD ryssi cachen toteutusta oikein urakalla, ja joutui disabloimaan koko TLB:n, jolloin prosessori otti 10-15% nopeussakon ja ei se ainakaan maineelle hyvää tehnyt.

    On se IPC-suorituskyky SB-tasolla ainakin. Kulutus ei. Ja kellotettavuus ei. En olisi yllättänyt, jos muron kellottajien SB:t/Ivy:t olisivat corekohtaisesti nopeampia, varsinkin kun kelloja on yli 4.5GHz, johon Zenillä tuskin päästään ilmalla.

    Teoriassa AMD sanoo oppineensa läksynsä. Bulldozerin suurin ongelma oli, että yhden moduulin sisällä tuo MT kusi pahasti, kun siellä oli vain yksi kapea putki sisään (jaettu fetch/decode). Olisi parempi, jos scheduleri olisi osannut jakaa ensisijaisesti moduulien kesken, ja toissijaisesti moduulien sisällä. Mutta ei, tätä ei saatu neljässä vuodessa tehtyä/korjattua. Nyt jokainen ydin on paljon itsenäisempi ja scheduleri voi tehdä, mitä haluaa, eikä siitä tule performance hittiä, niinkuin ennen.
     
  7. hkultala

    Rekisteröitynyt:
    18.06.2001
    Viestejä:
    8 284
    P4ssa symmetrinen multisäikeistys(SMT, intelin markkinointi kutsuu nimellä "hyperthreading") toimi huonosti mm. seuraavista syistä:

    1) L1D-välimuistit oli niin pieniä että niihin ei usein mahtunut kunnolla yhtä aikaa edes molempien säkeiden kaikkein kriittisin ja useimmin käytetty data, ja L1-välimuistihuteja tuli kahdella säikeellä paljon enemmän kuin yhdellä säikeellä. (kaikilla prossuytimillä kahden säikeen suorittaminen kyllä lisää välimusitihuteja jonkin verran, mutta isomman välimuistin kanssa selvästi vähemmän, ja toisaalta kahden säikeen suoritus myös piilottaa niitä välimuistihuteja, kun voidaan suorittaa toisenkin säikeen koodia välimuistihudin aikana)

    (bulldozerhan yritti ratkaista tätä ongelmaa eriyttämällä molemmille säikelle omat L1D-välimuistinsa, ja päätyi samalla duplikoimaan koko kokonaislukudatapolun, jotta L1D-kakuista voidaan tehdä tarpeeksi nopeita(ja steamrollerissa ja excavatorissa tuplikoitiin myös myös käskydekooderi). Jälkikäteen voidaan todeta, että paljon parempi ratkaisu oli vaan suurentaa yhtä L1D-kakkua tarpeeksi että siihen mahtuu riittävästi dataa molemmista säikeistä, minkä intel toteutti Nehalemista(eka core i7) lähtien ja AMD on toteuttamassa Zenissä, koska suurempi yksi L1D-kakku mahdollistaa nopeamman L2-kakun toteuttamisen ja auttaa myös yhden säikeen suorituskykyyn)


    2) P4:n todella pitkä liukuhihna tarkoitti, että jopa käskyjen skedulointi piti liukuhihnoittaa, ja optimistisesti skeduloida käskyjä kellojaksolle, josta ei vielä tiedetty, onko kaikki käskyn tarvitsema data saatavilla vai ei, eli saako käskyä suorittaa silloin vai ei Jos data ei ollutkaan saatavilla, tämän käskyn suoritus peruutettiin ja siirrettiin myöhempään ajanjaksoon (replay-mekanismi). Tämä tarkoittaa, että prosssorin back-endissa alettiin suorittaa paljon suurempaa määrää käskyjä kuin lopulta suoritettiin, ja prosesorin backendin laskentayksiköt tulivat helpommin pullonkauloiksi kuin perinteisemmilä prossuilla.

    Keskimääräisessä suoritettavassa ohjelmakoodissa on kohtalaisen vähän käskytason rinnakkaisuutta, keskimäärin voidaan suorittaa vain pari käskyä kellojaksossa, ja normaalissa OOE-prossussa (P6, i7, K7-K10 jne) melkein puolet prosessorin laskentayksiköistä voi usein idlata. Tämä tarkoittaa, että prosessorissa riittää hyvin laskentayksiköitä myös toisen säikeen koodin ajamiseen ilman että ensimmäinen säie hidastuu merkittävästi säikeiden kilpaillessa samoista laskentayksiköistä.

    P4ssa taas replay-mekanismin takia yksikin säie "tuhlaa" laskentayksiköitä ja paljon useammin käyttää ne kaikki tai melkein kaikki, jolloin toiselle säikeelle ei jää "vapaita" laskentayksiköitä, ja kahden suorittaminen yhtä aikaa hidastaa molempia säikeitä selvästi enemmän.



    Zenissä on riittävän isot L1D-välimuistit, melko nopeat L2-välimuistit eikä replay-mekanismia eli kumpaakaan näistä suurimmista syistä miksi P4n "hyperthreading" ei antanut kovin hyvää suorituskykyä.
     
    Viimeksi muokattu: 29.10.2016
  8. C64Ever

    Rekisteröitynyt:
    05.12.2015
    Viestejä:
    194
    Tietääkseni AMD ei ole Athlon64:sta alkaen julkaissut yhtäkään prosessoria joka kuluttaisi vakioasetuksilla yli TDP arvon.
     
  9. farry

    Rekisteröitynyt:
    13.12.2012
    Viestejä:
    1 017
    SMT:n toteutuksesta ei ole tainnut tulla kunnollista tietoa ollenkaan, niin ei voi sanoa että sama mitä Intelkin käyttää
    AMD:n välimuistit on moninverroin hitaampia (korkeampi latenssi) kuin Intelin, mikä heikentää lisää suorituskykyä (en ole varma heikentääkö myös kellottuvuutta)
    AMD:n muistinohjaimet ovat moninverroin huonompia kuin Intelin, tämä on fakta. Se että AMD integroi muistinohjaimen aikaisemmin prossuun ei tee siitä nykypäivänä parempaa. Esim AM3+ alustalla yli 2 kampaa tais heinkentää kellottuvuutta, eikä muisteista saada niin paljoa irti vrt. Intelin tekeleet.
     
  10. C64Ever

    Rekisteröitynyt:
    05.12.2015
    Viestejä:
    194
    Zenin välimuistit eivät ole moninverroin hitaampia kuin Intelin. L1 välimuisti lienee samaa luokkaa. L2 välimuisti on hitaampaa mutta sitä on tuplasti enemmän. Korkeampi latenssi nimenomaan parantaa kellottuvuutta. Zenin heikko kellottuvuus johtuu käytännössä kokonaan GF/Samsungin:n valmistusprosessista.

    Suurempi määrä kampoja heikentää kellottuvuutta millä tahansa alustalla.
     
  11. hkultala

    Rekisteröitynyt:
    18.06.2001
    Viestejä:
    8 284
    Siitä on julkaistu Hotchipissä käytännössä kaikki oleellinen tieto. Eri asia on sitten, ymmärtääkö sitä tietoa.

    [​IMG]

    Ei ole olemassa merkittävästi "erilaisia SMT-tekniikoita".
    On olemassa monta eri tapaa toteuttaa monisäikeistys yhdellä ytimellä, ja SMT on niistä yksi tekniikka, jota käyttää sekä Zen että Intelin X86-prossut ekan sukupolven Atomia lukuunottamatta.

    (vanha ekan sukupolven Atom ja jotkut Itaniumit sitten käyttävät aivan erilaisia tekniikoita eivätkä pysty samassa kellojaksossa aloittamaaan monesta eri säikeestä tulevan käskyn suoritusta kuten SMT pystyy, mutta intel sotkee markkinoinnillaan ja kutsuu niitäkin nimellä "hyperthreading" vaikka kyse on täysin eri tekniikoista)

    Ei yleisty ihan noin mustavalkoisesti. Esim, Phenom II:n L1D-latenssi on 3 kellojaksoa, vaikka sen koko on melko isokin(64kiB), intelillä ollut Nehalemista lähtien 4 kellojaksoa pienemmässä L1D-kakussa

    Bulldozerin L2 oli toki hidas, mutta syitä sen hitauteen oli myös se, että se oli iso, sekä se, että siihen oli kytketty 3 L1-välimuistia tyypillisen kahden sijaan.

    L1-kakku tulee Zenissä olemaan hyvin samanlainen kuin Intelilläkin. WB, 4 kellojaksoa, 8-way set associative, 32 kiB, kaikilta oleellisilta specseiltään identtinen haswellin kanssa.

    L2-kakku taas tulee Zenissä olemaan hiukan isompi ja hiukan hitaampi kuin Intelin nykyprossuilla, mutta tämä "hiukan hitaampi kuin intel" tarkoittaa melkein tuplasti nopeampaa kuin bulldozerissa.

    "Fakta", jonka perustelut on täyttä bullshittiä kun ei ymmärretä muistiväylän toiminnasta yhtään mitään.

    Se ei ole fakta vaan se on pelkkää mutua.

    AM3+-alustalla on kaksi muistikanavaa. Jos AM3-sokettiseen koneeseen kytketään useampi kuin kaksi muistikampa, tällöin pitää välttämättä olla samassa kanavassa useampi muistikampa.

    Muistien siirtonopeutta rajoittaa signaalin laatu muistiväylässä. Mitä "puhtaampi" se reitti väylään kytkettyjen laitteiden välillä on, sitä suurempi nopeus siitä saadaan luotettavasti. Se, että samaan väylään tule kahden laitteen sijasta 3 laitetta haittaa huomattavasti sen siinä kulkevan signaalin säilymistä hyvälaatuisena.

    Sillä, että AM3+-alustalla yli 2 muistikamman kanssa saavutettavat vakaat muistikellot on pienemmät kuin 2 kamman kanssa saavutettavat ei siis ole oikeastaan mitään tekemistä muistiohjaimen laadun kanssa.
     
    Viimeksi muokattu: 30.10.2016
  12. mrkukov

    Rekisteröitynyt:
    26.03.2006
    Viestejä:
    2 378
    "Hyvä" esimerkki, mutta Intelin vehkeet käyttäytyy aivan samoin. Vähemmän kampoja => kovemmat kellot.
     
  13. Saiso

    Rekisteröitynyt:
    25.10.2007
    Viestejä:
    166
  14. hkultala

    Rekisteröitynyt:
    18.06.2001
    Viestejä:
    8 284
    Tämä ei ollut mikään suuri ongelma,

    Bulldozerin suurin ongelma käyttäjän näkökulmasta oli huono yhden säikeen suorituskyky, johon tällä jaetulla front-endillä ei ollut mitään vaikutusta.

    Siihen huonoon yhden säikeen suorituskykyyn taas oli enemmän syynä esim.
    1) Yhdistelmä pieni write-back L1D-kakku ja hidas L2-kakku,
    2) Tavoiteltua pienemmät kellotaajuudet(joihin syynä ilmeisesti ole että vaikka L2-kakulla oli suuri viive, sinne silti jäi jotain pahoja kriittisiä polkuja); Bulldozer suunniteltiin alunperin toimimaan n. 20% suuremmilla kellotaajuuksilla kuin mitä se lopulta toimi.
    3) Vain 2 kokonaislukuyksikköä/säie

    Bulldozerin rakenteelle optimoitu thread scheduler tuli windows 8ssa. Sillä saavutettiin yleensä muutaman prosentin nopeuksia windows7n thread scheduleriin verrattuna, best case-nopeutus oli luokkaa 10%.

    Ja SMT-prossulla tulee nimenomaan SUUREMPI suorituskykypudotus kuin bulldozerilla, jos scheduler ei ymmärä prosessorin rakennetta, koska kahden säikeen skedulointi saman SMT-ytimen kahdelle virtuaaliytimelle hidastaa niitä ENEMMÄN kuin bulldozerissa kahden säikeen skedulointi saman "modulin ytimelle".
     
    Viimeksi muokattu: 30.10.2016
  15. IcePen

    Rekisteröitynyt:
    02.06.2000
    Viestejä:
    6 567
    Esim. tuo on vielä kaikenlisäksi sellainen että AMD ei yksin voi varmistaa sen kunollista toimintaa vaan se on riipuvainen esim. käyttiksen kunnollisesta tuesta sille, eli se AMD toeutus voi olla niin lähellä Intelin vastaavaa että sen saa toimimaan käyttiksessaä pienellä viilauksella mutta siiitä huolimatta sen täysitehoinen hyödynnys voi vaatia laajamittaisemman tuen tekoa käyttikseen minä epäilen että käy niin että esim. Microsoft ei pidä liikaa kiirettä sen laajamittaisen täyden tuen teossa.

    Hkultala voi korjata jos puhun tästä eteenpäin puutaheinää
    Esim. sen onko kysessä todelline ydin vain HT tunnistuksen ja sen mukaan käytettävän ytimen valinnan teko ei varmaankaan vaadi hirveää eroa jo Inteliä varten tehtyyn toteutukseen mutta miten rekisterejä, välimuisteja, yms käytetään tehokaasti tuon tehtävien HT swappauksen yhteydessä on varmasti aivan erilainen siinä AMD Zen prosessorissa kuin Intel prosessorissa joten jos se jätetään sille Intel versiolle kirjoitetun kodin varaan se ei taatusti toimi parhaalla mahdollisella tavalla.
     
  16. SiiliMulkeroinen

    Rekisteröitynyt:
    09.10.2013
    Viestejä:
    3 219
  17. hkultala

    Rekisteröitynyt:
    18.06.2001
    Viestejä:
    8 284
    Vaikka ziljoonasta julkisesti jo kuukausia esillä olleesta roadmap-slidestä.

    Tai AMDn omista benchmarkeista:

    http://www.anandtech.com/show/10585...hmark-is-zen-actually-2-faster-than-broadwell

    Oikeasti, lukekaa esim ne Zenin HotChips-slidet läpi ennen kuin tulette väittämään että "jotain ei ole vielä kerrottu Zenistä".

    Piirille tulevien ytimien määrä päätetään paljon yli vuosi ennen piirin julkaisua, mutta kelloja voi säätää vielä muutama viikko ennen julkaisua.

    Ja kelloistakin on ollut melko vakuuttavia huhuja liikkeellä.
     
    Viimeksi muokattu: 06.11.2016
  18. IcePen

    Rekisteröitynyt:
    02.06.2000
    Viestejä:
    6 567
    Juu ei riitä luokkaan nyt tuli wau peliprossu mutta on kumminkin riittävä luokkaan peliprossu (siis jos se toimii muuten odotetulla tavalla siinä käytössä), sitten taas hyötykäyttö puolella vaikuttaa paljon se mikä on todellinen laskentateho/Watti suhde johon vaikuttaa myös käytetty valmistusprosessi ja sen prosessin sen hetkinen laatu joten se jäänähtäväksi pääseeekö Zen hyötypuollella merkittävästi eteenpäin niin kuin AMD antaa ymmärtää mutta hyötypuolella ei kellot näytä olevan ongelma.
     
  19. hkultala

    Rekisteröitynyt:
    18.06.2001
    Viestejä:
    8 284
  20. -Cone-

    Rekisteröitynyt:
    17.12.2000
    Viestejä:
    1 435
    Vieressä sattuu istumaan kiinalainen, joten ko. postauksessa puhutaan 8-ytimisen turbotaajuudesta, eli olettaisin kyseessä olevan korkein yhden ytimen taajuus (oma oletus, koska postauksessa ei sitä tarkasti mainita, mutta aiempi 4 GHz tähän viittaa). Maininta on myös, että turbotaajuus on 3.5 GHz tai enemmän, eli voi olla myös korkeampi. Ja, että aikaisemmissa mainittu 4 GHz on epätodennäköinen. TDP-tavoite coolerille on 140 wattia. Kuulemma google translate on tässä tapauksessa varsin hyvä.
     
    Viimeksi muokattu: 17.11.2016
  21. prorauta

    Rekisteröitynyt:
    09.11.2011
    Viestejä:
    89
    ZENIÄ on nyt käytännössä odotettu mitä .. oiskohan jo jotain 6 vuotta. 2500K on jo ollut todella pitkään käytössä. Eikä vielä ole sen selkeästi voittanutta rautaa myynnissä. Jos poisluetaan nää 1700 euroa maksavat 10 ytiminen ja Xenonint. About F. Time.
     
  22. IcePen

    Rekisteröitynyt:
    02.06.2000
    Viestejä:
    6 567
    Jos kaikilla ytimillä yhtäaikaa pääsee tuohon niin se on aika hyvin, en tarkoita etteikö parempi olisi toivottava mutta tuo on kumminkin hyvin kun parin tai yhden coren kellot voi olla selvästi paremmat (jää nähtäväksi).
     
  23. Lagittaja

    Rekisteröitynyt:
    29.07.2009
    Viestejä:
    7 128
    Zen mikroarkkitehtuurin suunnittelu on aloitettu vasta reipas neljä vuotta sitten kun AMD palkkasi Jim Kellerin sitä tekemään. Zen nimi on ollut tiedossa käsittääkseni reippaat kolmisen vuotta?
     
  24. C64Ever

    Rekisteröitynyt:
    05.12.2015
    Viestejä:
    194
    Zenin kehitys alkoi 4 vuotta ja 3 kuukautta sitten. Vertailun vuoksi edellisen kerran kun Intel suunnitteli uuden arkkitehtuurin työpöytäprosessoreille, siinä meni yli 5 vuotta. Puhutaan siis Pentium 4:sta.
     
  25. hkultala

    Rekisteröitynyt:
    18.06.2001
    Viestejä:
    8 284
    [offtopic]

    Edellinen kerta kun intel suunnitteli täysin uuden arkkitehtuurin työpöytäprossulle tosin tapahtui paljon myöhemmin; Se oli Sandy Bridge.

    Nehalem pohjautui vielä rankasti modattuun P6een, mutta Sandy Bridge pisti ytimen oleelliset osat täysin uusiksi, kun koko ytimen toimintaperiaate muuttui täysin erilaiseksi (vaihdettiin Tomasulosta PRF-pohjaiseen OoOE-systeemiin).

    Myöhemmät intelin ytimet on sitten Sandy Bridgestä jatkokehitettyjä.
    [/offtopic]
     
Tagit:

Jaa tämä sivu

Alibi
Anna
Deko
Dome
Erä
Hymy
Kaksplus
Kippari
Kotilääkäri
Kotiliesi
Koululainen
Ruoka.fi
Parnasso
Seura
Suomen Kuvalehti
TM Rakennusmaailma
Tekniikan Maailma
Vauhdin Maailma
Golfpiste
Vene
Nettiauto
Ampparit
Plaza
Muropaketti