Skylake-XのAVX512とか爆熱ぶりとか

なんかいろいろ微妙らしいSkylake-Xについて…

いや、ほんといろいろ面白い。

まず演算器から。
http://users.atw.hu/instlatx64/GenuineIntel0050654_SkylakeX_InstLatX64.txt

この情報とかから推測すると…

・基本的にはSkylakeと変わらない
・変わったのはAVX512
・port0+1にあった256bit演算器を束ねてAVX-512として使える
・port5にあった演算器は(原則)512bit演算器に拡張された
・ついでに浮動小数のadd/sub/mul/fmaはport5に512bit演算器を追加
・port0だけだった一部のSIMD命令は256bitx2回に分けて実行 (div/sqrt/rcp)
・512bit gatherが(相対的に)速い
・512bitでもクロスレーンはレイテンシ3cycle

例外はあると思うけど、大雑把に推測するとこんな感じ?

HaswellSkylakeSkylake-X
FPadd/sub256bit x1256bit x2256bit x2 + 512bit x1
mul/fma256bit x2256bit x2256bit x2 + 512bit x1
div/sqrt/rcp256bit x1256bit x1256bit x1
Intand/or/xor/andn256bit x3256bit x3256bit x2 + 512bit x1
add/sub256bit x2256bit x3256bit x2 + 512bit x1
adds/subs256bit x2256bit x2256bit x2
mul256bit x1256bit x2256bit x2
min/max/cmp
abs/shift
256bit x1256bit x2256bit x2
sad256bit x1256bit x1512bit x1
shuffle/perm
alignr/broadcast
256bit x1256bit x1512bit x1
blend256bit x1256bit x1 ?256bit x2 + 512bit x1 (EVEXのみ)
rotate--256bit x2 ?
ternlog--256bit x2 + 512bit x1 ?

※↑ただの推測です

もうだいぶ前の、比較的おとなしめで微妙な性能向上にとどまったSkylakeの拡張は、これを見越してのことだったのかなあ、というのがなんとなくわかる気がする。

AVX512の恩恵があるものとないものがはっきり…。FPのadd/mul/sub/fmaは2倍、Intのadd/sub/and/or/xor/andnなどは1.33倍、shuffleは2倍といった速度向上がある一方で、まるで速度が上がらないものも…。vpternlog(論理3入力演算)がうまく使えれば論理演算はもっと性能上がりそう。

とまあ、AVX512まわりは結構頑張ってる感じだけど、そのほかのAVX512未使用の性能は順当にSkylakeを10コアにした感じの模様で、クロックの向上もあってそれなりの性能向上は期待できるみたい。

問題は、性能向上と一緒に発熱量も向上してしまったことで、とにかく多くのベンチマークの記事を見てもたいてい「熱い」って書いてあってなんだかなあ、という印象。どうもAVX512を使わなくても熱いようなので、AVX512のせいだけじゃないみたい。単にクロックを上げすぎたのか、あるいはL2/L3あたりの改造が裏目に出たのか…。

そのうえ、理解に苦しむ事にはんだじゃなくてグリスなので、より高温になってさらに消費電力が増える、という状態になっている気がする。

PCWatch …わりと当たり石 ? 「比較的おとなしい温度」
ascii … 「それほどでもない」 70℃以下におさまる
4.gamer … 「故障が気がかりになるレベル」,「莫大な消費電力はちょっと引くレベル」
tomshardware … 「グリスでさえなければ優秀だった」、「20℃の冷風を送風すれば良い」
guru3d … 「一瞬TDP=140Wという数字が信じられなかった
techspot … 本格水冷すれば、結構行ける
AnandTech … CPU性能は優秀
PCWorld … 優秀だが、ThreadRipperと比べないと…?

もうレビューごとの違いが面白すぎてそれだけでお腹いっぱいになりそう…。

そもそもコア数が多くて、AVX512を載せて、さらにクロックを引き上げているSkylake-Xが熱くなることは(ここまでとは思わなかったけど)わかりきっているのに、これをグリスにしようとしたのは本当に正気じゃない気がする…。

ついでにマザーまで熱くなるらしい…。寿命が短そうで怖い。

18コア版まで出揃うのを待ってから、冬に暖房機として買うのがよいのかしら…。
スポンサーサイト

コメントの投稿

非公開コメント

プロフィール

rigaya

Author:rigaya
アニメとか見たり、エンコードしたり。
連絡先(@を半角にしてください!)
rigaya34589@live.jp
github

最新記事
最新コメント
カテゴリ
月別アーカイブ
カウンター
検索フォーム
いろいろ
公開中のAviutlプラグインとかのダウンロード

○Aviutlプラグイン
x264guiEx 2.xx (ミラー)
- x264を使用したH264出力
- x264guiExの導入>
- x264.exeはこちら>

x265guiEx (ミラー)
- x265を使用したH.265/HEVC出力
- x265.exeはこちら>

QSVEnc + QSVEncC (ミラー)
- QuickSyncVideoによるH264出力
- QSVEncCはコマンドライン版
- QSVEncC 導入/使用方法>
- QSVEncCオプション一覧>

NVEnc + NVEncC (ミラー)
- NVIDIAのNVEncによるH264出力
- NVEncCオプション一覧>

VCEEnc + VCEEncC (ミラー)
- AMDのVCEによるH.264出力

ffmpegOut (ミラー)
- ffmpeg/avconvを使用した出力

自動フィールドシフト (ミラー)
- SSE2~AVX2による高速化版
- オリジナル: aji様

エッジレベル調整MT (ミラー)
- エッジレベル調整の並列化/高速化
- SSE2~AVX対応
- オリジナル: まじぽか太郎様

バンディング低減MT (ミラー)
- SSE2~AVX2による高速化版
- オリジナル: まじぽか太郎様

PMD_MT (ミラー)
- SSE2~FMA3による高速化版
- オリジナル: スレ48≫989氏

透過性ロゴ (ミラー)
- SSE2~FMA3によるSIMD版
- オリジナル: MakKi氏

AviutlColor (ミラー)
- BT.2020nc向け色変換プラグイン
- BT.709/BT.601向けも同梱

○その他
x264afs (ミラー)
- x264のafs対応版

aui_indexer (ミラー使い方>)
- lsmashinput.aui/m2v.auiの
 インデックス事前・一括生成

auc_export (ミラー使い方>)
- Aviutl Controlの
 エクスポートプラグイン版
 エクスポートをコマンドから

aup_reseter (ミラー)
- aupプロジェクトファイルの
 終了フラグを一括リセット

CheckBitrate (ミラー, 使い方, ソース)
- ビットレート分布の分析(HEVC対応)

チャプター変換 (ミラー使い方>)
- nero/appleチャプター形式変換

エッジレベル調整 (avisynth)
- Avisynth用エッジレベル調整

メモリ・キャッシュ速度測定
- スレッド数を変えて測定

○ビルドしたものとか
L-SMASH (ミラー)
x264 (ミラー)
x265 (ミラー)

○その他
サンプル動画
その他

○読みもの (ミラー)
Aviutl/x264guiExの色変換
動画関連ダウンロードリンク集
簡易インストーラの概要

○更新停止・公開終了
改造版x264gui
x264guiEx 0.xx
RSSリンクの表示
リンク
QRコード
QR