1. MuroBBS toimii nyt XenForo-alustalla. Tervetuloa! Säätö jatkuu parhaillaan mm. nopeuden suhteen.

    t: Sysop
  2. Bugiraportit ja palaute XenForo-MuroBBS:stä tähän viestiketjuun

    Tuliko vastaan englantia tai huonoa suomea, raportoi tähän viestiketjuun

AMD:n Bulldozer

Viestiketju alueella 'Tietotekniikkauutisia maailmalta' , aloittaja Sewerbreath, 24.06.2010.

  1. 12.10.2011 klo 14:28

    jorgelius

    Rekisteröitynyt:
    11.12.2003
    Viestejä:
    689
    Löysin tämän hardforum.com. Alkoi itseäni kiinnostamaan BD aivan uudella tavalla.

    ----------------------------
    * New AES instructions for existing AM3(+) Users -- Linux kernel (I primarly run Linux 95% of the time and game on windows maybe 2 hours/week) hopefully implements support for these. I'd love to have hardware accelerated dm-crypt on the desktop. IMHO this would make it worth upgrading my 1090T, but until I see it tested & working, I'm holding out.

    * What intel doesn't have: Overclocking + iommu (aka vt-d in intel world). Intel doesn't currently have a whole bunch of choices for overclocking + vt-d. AMD now has a pretty good choice of boards that support IOMMU (990FX, 890FX, SR5670/90...) while intel has.....Z68 ? Maybe? Some of the old Q series? Not a whole lot of choices.

    At just over $100 ($130?) For the lowest end quad, I'd recommend this over an i3-2100 for desktop users if they want to run an encrypted system with truecrypt (windows) or dm-crypt (linux).

    In any case, that is my alternative take. I'm still hoping to find linux kernel compile benchmarks vs 2500 and 2600 as well as virtualization (kvm/xen) benchmarks vs 2500/2600/thuban (most of my home studying/infrastrutcure is on kvm/AMD 965...)
     
  2. 12.10.2011 klo 14:32

    TuBBe2

    Rekisteröitynyt:
    06.01.2011
    Viestejä:
    426

    Siinä olisikin AMD'lla markkinarako, jokaisen FX prossun kylkeen tuo vesijäähy. Onko missään edes kerrottu millainen se stocktuuletin on jos se ei ole tuo vesijäähy?
     
  3. 12.10.2011 klo 14:42

    Artsi_

    Rekisteröitynyt:
    24.03.2008
    Viestejä:
    3 528
    Olisi nykyinen Intel setti saanut väistyä AMD:n tieltä mutta petyin jonkinverran ja ei lähde tilauksiin ainakaan vielä. Taitaa sigun prossu olla aika samoissa tehoissa kun kellottaa +4Ghz tuon FX X8 kanssa? Entäs onko FX X4 tai X6 prossuilla mitään vastusta nykyiselle? Tekis mieli vaihdella kamppeita. :kippis: Ainakin kun kahtelin tilastoja niin ei hyvälle näytä, mites sitten kun niitäkin kellottaa?

    Kait sitä pitää nykysessä pysyä tai laitella SB settiä tilalle. :smoke: Tämän prossun vuoden olen omistanut ja uutena ostin niin olis jo korkea aika laittaa uutta tilalle, yleensä oon vaihtanu osia vuoden välein, emolevy onkin ostettu viime viikolla...
     
  4. 12.10.2011 klo 14:59

    zewius

    Rekisteröitynyt:
    21.02.2010
    Viestejä:
    1 203
    laita nyt ihmeessä i5 2500k tilaukseen mielummin kuin bullshittii. kellottuu paremmin ILMALLA, lämpenee vähemmän, vie vähemmän virtaa, hinta ja parempi suorituskyky :smoke:
     
  5. 12.10.2011 klo 15:30

    specops

    Rekisteröitynyt:
    23.10.2010
    Viestejä:
    1 774
    "At launch, AMD plans to ship its FX CPUs with the same heat sinks you find in a Phenom II X4 or X6 Black Edition processor-in-box package." Lähde.
     
  6. 12.10.2011 klo 15:37

    SatanTwister

    Rekisteröitynyt:
    18.02.2011
    Viestejä:
    1 461
    Tässä yksittäisessä testissä alkaa olemaan varmaan massiivisin riman alitus miltään uutuus-tuotteelta mitä voidaan benchmarkata.

    [​IMG]
     
  7. 12.10.2011 klo 15:37

    Henriquez

    Rekisteröitynyt:
    19.02.2010
    Viestejä:
    836
    Odotin salamyhkäisesti kyllä Bulldozerin vievän 2500K:ta reilusti, mutta toisin kävi näköjään. Harmittavan surkeata paskaa työntävät suhteessa siihen, kuinka kauan tuota on kehitetty ja viilattu. Paskaa perseestä tarjoaa sinulle AMD.

    Mitäköhän helvettiä on sitten tapahtunut tuossa tuotekehityksessä ja suunnittelussa? Luulisi, että tuossa ajassa saataisiin ulos muutakin kuin kasa prosessoreita, joiden huippumalli ja lippulaiva hädin tuskin voittaa Intelin budjettiprossua.

    Mitä järkeä noissa AMD Bulldozer 160 euron - 200 euron hintaluokan prossuissa on? ovat toivottaman paskoja verrattuna kilpailijaansa.

    Missäköhän muuten Kaotika on kun ei ole näkynyt...
    Aiemmin ottanut vilkkaasti osaa tähän keskusteluun. :/
     
  8. 12.10.2011 klo 15:40

    aop

    Rekisteröitynyt:
    02.03.2001
    Viestejä:
    5 890
    edit: Napataas pois kun muisti teki tepposet.
     
    Viimeksi muokattu: 12.10.2011
  9. 12.10.2011 klo 15:48

    Juginabi

    Rekisteröitynyt:
    07.07.2004
    Viestejä:
    7 595
    Pikaisella katsauksella Kaotikan postauksissa ei varsinaisesti huokunut mikään jeesuksen uusi tuleminen bulldozerissa.
     
  10. 12.10.2011 klo 15:49

    Henriquez

    Rekisteröitynyt:
    19.02.2010
    Viestejä:
    836
    Edes Kaotika ei kykene tätä paskaa nielemään saatikka puolustamaan.
    Kannattaa vaan laittaa Inteliä alle niin ei pety.

    Mutta asiaan, milloin tietoa tosissaan tuosta X4:sta? Olisi mielenkiintoista nähdä, pärjääkö se esim 965BE:tä vastaan mitenkä hyvin...

    FX prosessoreitahan itsekkin odotin pitkään kuten moni muukin - ja hartaasti, josko sieltä olisi tullut se "uprising" niinkuin aikoinaan. Tällä hetkellä AMD tyytyy viiltelemään ranteitaan auki voiveitsellä.
     
  11. 12.10.2011 klo 15:50

    TuBBe2

    Rekisteröitynyt:
    06.01.2011
    Viestejä:
    426
    Itse olen siinä mielessä autuaassa asemassa, että kyllä nuo varmaan E8400'sen voittaa, mutta silti kyllä aika suolainen pettymys.
     
  12. 12.10.2011 klo 15:50

    Henriquez

    Rekisteröitynyt:
    19.02.2010
    Viestejä:
    836
    kyllähän sen tiesi etukäteen jo melkeinpä, että AMD:n lafka ei saa ulos sitä big bangia.
     
  13. 12.10.2011 klo 15:52

    aop

    Rekisteröitynyt:
    02.03.2001
    Viestejä:
    5 890
    Ei pärjää, polakit ajeli testejä, joissa osa FX-8150 moduuleista oli disabloitu:
    Test AMD FX-8150 - Bulldozer kontra Intel Sandy Bridge | PurePC.pl
     
  14. 12.10.2011 klo 15:53

    keijjjoo

    Rekisteröitynyt:
    19.09.2009
    Viestejä:
    1 048
    Mitä Tekemistä Kaotikalla on AMDn prossujen kanssa, sehän käyttää Intelin tuotteita.
     
  15. 12.10.2011 klo 15:55

    Kanapulla

    Rekisteröitynyt:
    16.08.2006
    Viestejä:
    1 670
  16. 12.10.2011 klo 15:56

    taikio

    Rekisteröitynyt:
    14.03.2002
    Viestejä:
    751
    AES-NI on ollut Intelin prossuissa jo suht kauan. VT-d:n hyöty on aika kyseenalainen vaikka työpöytävirtualisaatiota käyttäisikin. Toisaalta jos ei halua kellottaa niin halvemmissakin i5:sissa on nuo ominaisuudet, mutta K-malleista pudotettu VT-d valitettavasti pois.
     
  17. 12.10.2011 klo 15:57

    aop

    Rekisteröitynyt:
    02.03.2001
    Viestejä:
    5 890
    Joo niin onkin:
    Eiku ajattelin et sillä olis korkeat odotukset, kun niin kovasti kävi noitten leakattujen benchien kimppuun tuolla ~10 sivua takaperin (50 viestiä/sivu)
     
  18. 12.10.2011 klo 16:01

    hkultala

    Rekisteröitynyt:
    18.06.2001
    Viestejä:
    5 778
    Mielenkiintoisia lukuja.

    Onko näissä ollut turbo-mode päällä?

    Ilmeisesti yhden säikeen lukua ei ole saatavilla? Olisi kiva verrata sitä kahteen säikeeseen yhdessä moduulissa.

    Kun vertaa tuota 4 modulea*SC vs 4 modulea*DC niin "moduulin toinen ydin" tuo tässä (vain) 50% lisää suorituskykyä, tosin L3-kakku, muisti yms. tietysti rajoittaa myös skaalautuvuutta.

    AMDn markkinointimateriaalin mukaan modulen toisen ytimen pitäisi antaa "80% oikean tuplaytimen suorituskyvystä", eli luokkaa 60% lisäys.

    Tosin tässä ajettu softa lienee käyttänyt melko paljon SSE-käskyjä? Ja SSE-yksiköt on jaettu moduulin molempien ytimien kesken.
     
  19. 12.10.2011 klo 16:18

    The Stilt

    Rekisteröitynyt:
    09.08.2001
    Viestejä:
    3 188
    Voin ajaa saman myös yhdellä corella (ei siis mitään affinity kikkailua vaan muut seitsemän ydintä disabloituna).

    Handbrake tukee uusimpia käskyjä (SSE4.x, AVX).
     
  20. 12.10.2011 klo 16:19

    Henriquez

    Rekisteröitynyt:
    19.02.2010
    Viestejä:
    836

    No huh huh :eek: Olisin odottanut, että saataisiin vanhalle Phenom II:lle hyvä jälkeläinen edes. Niillä, joilla on 965BE tai 980BE, ei ole tarvetta luopua suorittimistaan ainakaan Bulldozerin takia.

    i5 2500K:n hinta on noussut ja tulee varmaankin hieman nousemaan...
     
  21. 12.10.2011 klo 16:32

    EverDreamFin

    Rekisteröitynyt:
    15.08.2003
    Viestejä:
    157
    Vahva tämä. Nyt voi Intel hinnoitella oman tuotteensa ihan miten vaan :( Veikkaan sellaista 20% korotusta hintoihin syksyn ja kevään aikana. Ehkä enemmänkin.
     
  22. 12.10.2011 klo 16:43

    hurrhurr

    Rekisteröitynyt:
    30.07.2011
    Viestejä:
    386
    Onneksi en malttanut odottaa bullshittien julkaisua vaan ostin 2500k vielä silloin kun se oli n. 20€ halvempi. Pitää kyllä entistä vahvemmin pois amd leiristä.
     
  23. 12.10.2011 klo 16:48

    keijjjoo

    Rekisteröitynyt:
    19.09.2009
    Viestejä:
    1 048
    Ennen oli Phenomit vastassa ja hinnat pysyi kohtuullisina, nyt on Phenomit ja FXt ja Intel nostaa hintoja, mikä idea?

    Mitä enemmän Intel nostaa hintoja sen paremmalta AMDn hintatehosuhde näyttää joten ei tuossa ole juurikaan järkeä.
     
  24. 12.10.2011 klo 16:49

    hkultala

    Rekisteröitynyt:
    18.06.2001
    Viestejä:
    5 778
    Itselleni bulldozer oli pettymys, tämän päivän aikana olen sitten vähän miettinyt, mikä meni pieleen, ja tässä vähän ajatuksia siitä:

    Osuus: mihin tähdättiin:

    1) Piirin piti kellottua n. 30% korkeammalle, kuin K10n samalla valmistustekniikalla. Liukuhihnasta tuli n. 50% pidempi, ja monien käskyjen viiveet on 30-50% pidempiä.
    Välimuistille laidettiin kellojaksoissa hitaammat viiveet, jotta piiri kellottuisi ylemmäs

    2) Alkuperäisten, karkeiden simulaatioiden mukaan resurssien jakamisen piti haitata vain n. 20% verran suorituskykyä kun moduulin molemmat säikeet on aktiivisena vs 1 säie.

    3) Globalfoundriesin 32nm prosessin piti antaa selvästi parempi suorituskyky kuin 45 nm prosessin(pienempi lömmöntuotto/suurempi kellotaajuus)

    4) Piirin välimuistirakenne suunniteltiin optimaaliseksi palvelinkäyttöä, ei työpöytäkäyttöä varten. haluttiin tehdä L2-kakusta iso ja poissulkeva L3een nähden, ja tehtiin tässä kompromissi näiden välimuistien nopeuden suhteen.
    Fiksujen prefetchereiden piti auttaa saavuttamaan hyvä suorituskyky hitaillakin välimuisteilla.

    5) AMDn insinööreille yksi moduli on "ydin".


    Mitä taisi mennä eri tavalla kuin alkuperäisissä suunnitelmissa, tai asioita mitä alkuperäisissä suunnitelmissa ei vaan ajateltu..

    A) 32nm prosessi on vieläkin kaukana siitä, mitä sen pitäisi olla. Tämä nähtiin hyvin Llanon kanssa, Llanoa ei saada toimimaan edes samoilla kelloilla kuin Phenom IIsta.
    Vaikuttaisi siltä, että tällä hetkellä 32nm prosessilla kellotaajuudet on jopa huonompia kuin vastaavan piirin kellotaajuudet 45nm prosessilla, ja tämän johdosta Bulldozerin kellotaajuudet jäivät n. 20% alemmas kuin oli suunniteltu, JA senkin saavuttamiseksi käyttöjännite ja sen myötä virrankulutus ja lämmöntuotto ovat selvästi ylempänä kuin mikä oli tarkoitus

    B) Jaettu L1-käskyvälimuisti toimi käytännössä huonommin kuin mitä oli ajateltu. Ongelma virtuaalimuistin aliasoitumisen kanssa sekä liian pieni joukkoassosiatiivisuus. Sitä, miksi tätä ei huomattu ajoissa simulaatiossa, en ymmärrä.

    C) Fiksut prefetcherit ilmeisesti tukehtuivat omaan fiksuuteensa, ilmeisesti välimuisteihin prefetchailtiin liikaa kamaa mitä ei tarvittukaan, ja sitten niiden seurauksena sieltä lensi pois kamaa, mitä tarvitaan (tässä on sitten mukaan aika paljon mutua/omaa spekulaatiota, joka voi mennä metsään)

    D) Piiriä tullaan kuitenkin käyttämään eniten työpöytäpuolella, jossa prossuytimien välillä jaettavaa dataa on vähemmän, ja L2-välimuistin nopeus on paljon tärkeämpi kuin L3-kakun kapasiteetti.

    E) Käyttöjärjestelmien ytimiin ei saatu ajoissa sisään skedulerkoodia, joka osaisi skeduloida softat järkevästi bulldozerin moduleille ja ytimille. Nyt kuormitetaan liikaa saman modulen molempia ytimiä eri prosessien säikeillä, vaikka joku module olisi kokonaan vapaa, eikä toisaalta tajuta laittaa saman prosessin eri säikeitä samalle modulille.

    Tässä kyllä pitää syyttää myös AMDtä selvästi; HyperThreadingille optimoidun skedulerin pitäisi toimia melko hyvin myös bulldozerilla, mutta AMD ei ilmeisesti ole saanut aikaiseksi ajoissa edes kertoa microsoftille että "käyttäkää samaa skeduleria kuin intelin HyperThreading-koneilla" vaan nyt windowsilla käytetään bulldozerilla skeduleria joka ei millään tavalla erottele/ryhmittele eri ytimiä. (tällainen skedulervalinta olisi pitänyt saada sisään jo windows7aan, koska bulldozerista tiedettiin tuossa vaiheessa jo tarpeeksi)

    F) Markkinointi halusi mainostaa suurempia ydin-lukuja, ja yksi rypäle nimettiin ytimeksi ja "alkuperäistä ydintä" ruvettiin kutsumaan nimellä moduuli.


    Näistä sitten seurasi seuraavat asiat:

    1+4+A+C+D) Välimuistien suuret viiveet haittaavat merkittävästi yhden ytimen suorituskykyä, eikä piiri saavutakaan sitä kellotaajuutta minkä piti olla "ratkaisu" yhden ytimen suorituskykyyn. Nyt kellot ovat vain hiukan korkeammat, mutta viiveet paljon suuremmat. Lopputuloksena huono yhden ytimen suorituskyky

    A+B+C+D+E) Monen ytimen suorituskykykään ei media- ja työpöytäsoftilla eikä peleillä ole sitä mitä sen piti olla, kun L1I-välimuisti pelaa pingistä, jossa pallo vieläpä liikkuu hitaasti hitaan L2-kakun takia, suorituskyky palvelinsoftilla on vielä näkemättä.

    5+F) AMD nolasi itsensä totaalisesti, kun markkinoi tätä 8-ydinprossuna, vaikkei se pärjää intelin "4-ydinprossulle". Jos olisivat rehellisesti markkinoineet tätä 4-ydinprossuna, jossa "parempi monisäikeistys kuin intelin HypeThreading", olisi ollut paljon vähemmän selittelemistä.

    5+F) Palvelinpuolella saattaa tulla vielä sellainen ongelma, että jotkut softat lisensoidaan "ydinhinnalla", ja näissä hinnoissa hyperthreading lasketaa yhdeksi eikä kahdeksi ytimeksi. Eli 8-modulinen, 16 "ytimen" "Interlagos" saattaa vaatia kalliimman softalisenssin kuin intelin 8-*HT-ytiminen mutta samassa suorituskykyluokassa oleva Xeon, vaikka softalle molemmat näkyvät täysin samalla tavalla 16 ytimenä.



    Surullisinta bulldozerissa on välimuistirakenne. Sandy bridge on pienempi piiri lähinnä pienempien välimuistien takia, mutta ne pienemmät välimuistit ovat huomattavasti Bulldozerin välimuisteja nopeampia, ja Sandy bridgen välimuistirakenne nimenomaan mahdollistaa piirille selvästi paremman suorituskyvynkin.


    Miten sitten tästä eteenpäin? Miten AMDn pitäisi jatkaa/jatkokehittää bulldozeria. Mitä toivotaan paalunhakkaajaan, höyryjyrään ja kaivinkoneeseen:


    1) Välimuistirakenne pitää saada kuntoon.
    * Käskykakku kaipaa lisää joukkoassosiatiivisuutta. Kokoa voi vaikka pienentää hiukan.
    (Ja jos 64kiB/2sta siirryttäisiin 32kiB/8iin, korjautuisi tuo aliasing-ongelma samalla.. 64kiB/16 korjaisi sen myös, mutta voisi käydä liian hitaaksi)
    * L2-kakku kaipaa paljon lisää nopeutta. Kokoa saa pienentää selvästi.
    * L3-kakku kaipaa lisää nopeutta. Hitauteen yksi syy poissulkevuus, mutten silti ymmärrä miksi se on NOIN HIDAS(65 kellojaksoa vs SBn 25). Heittäisivät jo vesilintua noilla poissulkevilla kakuilla, hyödyt ei vastaa haittoja.

    Tosin ilmeisesti ainakaan L1I-kakku ei vielä piledriverissa ole parantumassa :(

    2) Valmistusprosessi jos alkaisi joskus toimia kunnolla/päästä edes lähelle sitä suorituskykyä, mitä sen pitäisi olla, saataisiin kelloa lisää. Tässä AMD itse ei voi kun odotella, GlobalFoundries on tässä se kenen pitää saada jotain aikaiseksi.

    3) Käyttiksien skedulerit pitää saada ymmärtämään millaiset säikeet pitää laittaa minnekin. En tiedä mikä Linuxilla on tässä tilanne, windowsilla windows 8 korjaa tämän.
     
    Viimeksi muokattu: 12.10.2011
  25. 12.10.2011 klo 16:52

    Bläkkis

    Rekisteröitynyt:
    29.07.2006
    Viestejä:
    659
    Hauskaa miten moni edelleen selittelee itselleen, että bulldozer pärjää ihan hyvin noissa testeissä "oikeilla" resoluutioilla pelatessa.

    Onko tuo pullonkaula-termi oikeasti noin vaikea sisäistää? Noissa testeissä näytönohjain rajoittaa FPS:ää ja siksi kaikilla prossuilla on melkein sama tulos. Heti kun näytönohjain päivitetään niin erot tulevat kaikissa peleissä todella tylysti esiin. Ja suurin osa ihmisistä varmaa päivittää näytönohjainta useammin kuin prossua.

    Siksi prossuja pitäisi testata mahdollisimman pienellä resolla ja ilman näytönohjainta rasittavia asetuksia kuten AA ym. Miksi Muronkin arvostelussa on monta pelitulosta, jossa näytönohjain estää erojen saamisen esiin?
     

Jaa tämä sivu