Zenの整数SIMDはどのくらい?

PCWatch - 相対的に大人しい設計のAMD次世代CPU「ZEN」の浮動小数点/SIMDユニットを見て思ったこととか。


まあ、記事にもある通り、伝統的にAMDのSIMDは微妙な感じで、その伝統はZenにも引き継がれるらしい。

ZenSkylake
整数SIMD (論理/加減算)128bit x?256bit x3
整数SIMD(積算/シフト)128bit x?256bit x2
整数SIMD(shuffle/blend)128bit x?256bit x1
浮動小数SIMD (MUL+ADD)128bit x4256bit x2
浮動小数SIMD (FMA)128bit x2256bit x2
L1-D Read128bit x2256bit x2
L1-D Write128bit x1256bit x1


基本は128bitなので、「256-bit命令は2個の128-bit SIMDマイクロOPに分解して実行」するらしい。256bit演算を使えば倍速、とかではないので256bit演算を使うメリットはやや小さいわけで、考えられる256bit演算を使うメリット・デメリットは

メリット
・2倍にループアンロールしたようなものなので、依存関係のない演算が増え、実行ポートをアクティブに保ちやすくなる(だろう)。

デメリット
・128bit演算から256bit演算にする際に、shuffle命令などが余計に増える場合があり、逆に遅くなる可能性がある。

…とまあ、もう128bitのままでいいや、という感じなのかもしれない。

とりあえず、x264/x265で重要なのは整数SIMDなので、そっちがどのくらいの性能なのか気になるところ。とはいえ、最大でも128bit x4だからなあ…。
スポンサーサイト

コメントの投稿

非公開コメント

No title

この前行われたHandbrakeのデモはAppleTV 3プリセットだそうなのでx264を使ってると思われます。
で、3.2GHzの6900Kよりやや速いくらいなので悪くはないんじゃないかな…と元AMDerとしては夢を見ています。
Zenのクロックが隠されていたのがめっちゃ気になりますけどね

No title

あの場で使われたzen(Ryzen)は3.4GHzだそうだよ。
個人的にはクロックよりかなり激しく上下してたCPU使用率が気になる(Intel、AMD機ともに)

ほぼ100%に張り付くAviutl、Avisynthのパイプ入力によるエンコードだとどうなるんだろう・・
プロフィール

Author:rigaya
アニメとか見たり、エンコードしたり。
連絡先(@を半角にしてください!)
rigaya34589@live.jp
github

最新記事
最新コメント
カテゴリ
月別アーカイブ
カウンター
検索フォーム
いろいろ
公開中のAviutlプラグインとかのダウンロード

○Aviutlプラグイン
x264guiEx 2.xx (ミラー)
- x264を使用したH264出力
- x264guiExの導入>
- x264.exeはこちら>

x265guiEx (ミラー)
- x265を使用したH.265/HEVC出力
- x265.exeはこちら>

QSVEnc + QSVEncC (ミラー)
- QuickSyncVideoによるH264出力
- QSVEncCはコマンドライン版
- QSVEncC 導入/使用方法>
- QSVEncCオプション一覧>

NVEnc + NVEncC (ミラー)
- NVIDIAのNVEncによるH264出力
- NVEncCオプション一覧>

VCEEnc + VCEEncC (ミラー)
- AMDのVCEによるH.264出力

ffmpegOut (ミラー)
- ffmpeg/avconvを使用した出力

自動フィールドシフト (ミラー)
- SSE2~AVX2による高速化版
- オリジナル: aji様

エッジレベル調整MT (ミラー)
- エッジレベル調整の並列化/高速化
- SSE2~AVX対応
- オリジナル: まじぽか太郎様

バンディング低減MT (ミラー)
- SSE2~AVX2による高速化版
- オリジナル: まじぽか太郎様

PMD_MT (ミラー)
- SSE2~FMA3による高速化版
- オリジナル: スレ48≫989氏

透過性ロゴ (ミラー)
- SSE2~FMA3によるSIMD版
- オリジナル: MakKi氏

AviutlColor (ミラー)
- BT.2020nc向け色変換プラグイン
- BT.709/BT.601向けも同梱

○その他
x264afs (ミラー)
- x264のafs対応版

aui_indexer (ミラー使い方>)
- lsmashinput.aui/m2v.auiの
 インデックス事前・一括生成

auc_export (ミラー使い方>)
- Aviutl Controlの
 エクスポートプラグイン版
 エクスポートをコマンドから

aup_reseter (ミラー)
- aupプロジェクトファイルの
 終了フラグを一括リセット

CheckBitrate (ミラー, 使い方, ソース)
- ビットレート分布の分析(HEVC対応)

チャプター変換 (ミラー使い方>)
- nero/appleチャプター形式変換

エッジレベル調整 (avisynth)
- Avisynth用エッジレベル調整

メモリ・キャッシュ速度測定
- スレッド数を変えて測定

○ビルドしたものとか
L-SMASH (ミラー)
x264 (ミラー)
x265 (ミラー)

○その他
サンプル動画
その他

○読みもの (ミラー)
Aviutl/x264guiExの色変換
動画関連ダウンロードリンク集
簡易インストーラの概要

○更新停止・公開終了
改造版x264gui
x264guiEx 0.xx
RSSリンクの表示
リンク
QRコード
QR