AMD Thunderbird のランダムアクセス性能

2003 年 3 月 10 日
SHIDA Koichiro

1. AMD Athlon

AMD Athlon CPU (Thunderbird コア) のメモリアクセス性能に 疑問があるという記事を書いたのは, もう二年以上も前である. その頃TLBについての理解が不正確なのではないかというご指摘をうけたまま, 気にしてはいたもののそのままになっていた. 今更 Thunderbird でもあるまいが,2月に Tom's Hardware Guide の この記事で,思い出したので補足しておきたい.

  1. ワーキングセットが1MBytesを超えたときのランダムアクセス性能の 低下は,Thunderbird について確かに存在する. そのことは Tom の File Compression: Winrar 3.1 のベンチマークグラフ を見れば分かる.Thunderbird 1.33GHz が Pentium III 800E MHz なみの 性能しか出ていない!
  2. Palomino コアでは落ち込みがずっと少なくなっている. これは志田のプログラムでも確かめられるし(Figure 1), Tom の同じグラフでも Tbird 1.33GHz と Palomino 1.33GHz (Athlon XP 1500+) で 140 秒対 102 秒と大幅に改善されていることからも分かる.
  3. これ以外の、ワーキングセットのより小さいと思われるベンチマークでは, Thunderbird CPU はもっとよい序列にいる. たとえば, Wideo-Encoding MPEG-2のグラフでは,
    Celeron 2.0GHz (597.9s) < Tbird 1.33GHz (596.5s) < XP 1500+(532.6s)
    となっていて1割強の差しかない.
  4. 公表されている Palomino コアの改良点は,
    1. ハードウェアプリフェッチのサポート,
    2. 一次データの TLBのエントリ数が 24 から 32 に増えた,
    3. 一次,二次 TLB の排他制御,
    4. TLB の投機的リロード,
    である. それによる性能の向上は同クロック同士の比較で約1割とされている.
  5. b, c の改良によってデータ TLB は実質的に 256 から 288 に増えたが, 構成が本質的に変わったとまではいえない.
  6. だから前の記事で書いた TLB 原因説は 正しくない. 公表されている TLB とキャッシュのマッピングから落ち込みの 原因を説明しようとしたのは無理があった.
  7. そのような単純な原因ではない考えられる. そしてその「バグ」は Palomino では修正されている.

AthlonMP1.2G
Figure 1: AMD Athlon MP1.2G (Palomino), Asus A7M266, PC2100CL2

2. intel Pentium-3 (Tualatin)

おまけに,Tualatin コアの Pentium-3 のグラフも見てみよう (Figure 2). SDR メモリでも DDR の Athlon よりむしろ若干上回るくらいの性能である.

Tualatin-256k 1.13G
Figure 2: intel Pentium3 1.13A (Tualatin-256K), Asus TUSL2-C, PC133CL3


UP