自動フィールドシフト 高速化版+10

Haswell向け高速化。

とはいえ、今までに比べればそんなに高速化しないのが残念。+6 → +8に比べるとたいしたことないと思う。拡張命令よりメモリアクセスパターンの改善のほうが効果があることを実感。

自動フィールドシフト 高速化版+8

高速化版+8
もっと高速化。
afs_analyze_xxとafs_analyze_shrink_infoを統合

高速化版+7 (結局この時点では公開しなかった)
・VC++2012のWinXP互換ビルドに変更。
特に影響はないと思うけど、VS2012 Update1で利用可能になったので、念のため。

・popcntの確認をSSE4.2のフラグの有無で確認していたのを、正しくpopcntのフラグで確認するようにした。
AMD Phenom等における、「SSE4.2非対応だけどpopcntはある」ケースにも対応。

・メモリアクセスパターンを変更することで、HD映像処理向けの高速化。
詳細は続きに。

・AVX2対応の準備。
Haswell実機で確認後、AVX2対応版を公開できるかも?

x264のAVX2は意外と効果が小さいようで(+5%)残念だけど…afsはどうだろう…。まあ自分で試してみてなんぼですわな。



ダウンロード>>



続きに高速化の細かい話とか。


自動フィールドシフト 高速化版+6

afs_get_stripe_countの高速化版におけるバグを修正。

HD解像度ではほぼ影響はないが、SD解像度の特定条件下(※)において、オリジナルとdrop数が大きく異なる問題を解決。

問題の報告ありがとうございました。

また、HDではほとんど影響がないため、長らくバグを発見できず、申し訳ありませんでした。扱うのがHDのみであっても、念のため、更新をお願いします。

※「特定条件下」というのはちょっとわかりにくいのですが、(横解像度 - 左 - 右)の値を32で割った余りを、16で割った答えが1の場合です。



ダウンロード>>



自動フィールドシフトのスレッド数

度々更新して申し訳ないです。
また、スレのほうでのファイルサイズに関する指摘・議論、感謝です。

これまで(+1~+4まで)スレッドの取り扱いに少し問題があったのを修正。スレッド数を変えても結果が同じになるように。

オリジナルの自動フィールドシフトもスレッド数によって結果が問題ではない範囲内で微妙に変わっていた。このへんが絡んで、エンコード結果のファイルサイズが違うという事になるんだと思う。そんなに大きな差ではないので気にする必要はないと思うけれど。



ダウンロード>>


解除Lv0の修正

自動フィールドシフト高速化版で、解除Lv0がバグっていた問題を修正。

報告してくださり、ありがとうございました。



ダウンロード>>


afs、Phenomでも速くなる…かも。

この前の自動フィールドシフトの高速化では、SSE2で動くと思っていた関数が実はSSE4.1を使ってしまっていた。(ご迷惑おかけしました。またご指摘ありがとうございました。)

結果、SSE4.1がないと殆ど効果なしということに…。

そこで、今度こそSSE2だけで動く関数を追加。SSE4.1/SSSE3のない環境でもちょっとは速くなるかもしれない?



ダウンロード>>


自動フィールドシフトを少し速くする

自動フィールドシフトはaji様によるAviutlのインタレ解除プラグイン。

とても簡単かつ綺麗にインタレを解除してくれる。いつもありがとうございます。

ただ、やや重め。そこで軽くするべくいじった。といっても、MMX命令をSSE2~SSE4.2命令に置き換えただけなので、少し速くなったぐらい?



2012.12.05 9:28 SSE4.1のない環境で落ちるのを修正。
ダウンロード>>


プロフィール

rigaya

Author:rigaya
アニメとか見たり、エンコードしたり。
連絡先(@を半角にしてください!)
rigaya34589@live.jp
github

最新記事
最新コメント
カテゴリ
月別アーカイブ
カウンター
検索フォーム
いろいろ
公開中のAviutlプラグインとかのダウンロード

○Aviutlプラグイン
x264guiEx 2.xx (ミラー)
- x264を使用したH264出力
- x264guiExの導入>
- x264.exeはこちら>

x265guiEx (ミラー)
- x265を使用したH.265/HEVC出力
- x265.exeはこちら>

QSVEnc + QSVEncC (ミラー)
- QuickSyncVideoによるH264出力
- QSVEncCはコマンドライン版
- QSVEncC 導入/使用方法>
- QSVEncCオプション一覧>

NVEnc + NVEncC (ミラー)
- NVIDIAのNVEncによるH264出力
- NVEncCオプション一覧>

VCEEnc + VCEEncC (ミラー)
- AMDのVCEによるH.264出力

ffmpegOut (ミラー)
- ffmpeg/avconvを使用した出力

自動フィールドシフト (ミラー)
- SSE2~AVX2による高速化版
- オリジナル: aji様

エッジレベル調整MT (ミラー)
- エッジレベル調整の並列化/高速化
- SSE2~AVX対応
- オリジナル: まじぽか太郎様

バンディング低減MT (ミラー)
- SSE2~AVX2による高速化版
- オリジナル: まじぽか太郎様

PMD_MT (ミラー)
- SSE2~FMA3による高速化版
- オリジナル: スレ48≫989氏

透過性ロゴ (ミラー)
- SSE2~FMA3によるSIMD版
- オリジナル: MakKi氏

AviutlColor (ミラー)
- BT.2020nc向け色変換プラグイン
- BT.709/BT.601向けも同梱

○その他
x264afs (ミラー)
- x264のafs対応版

aui_indexer (ミラー使い方>)
- lsmashinput.aui/m2v.auiの
 インデックス事前・一括生成

auc_export (ミラー使い方>)
- Aviutl Controlの
 エクスポートプラグイン版
 エクスポートをコマンドから

aup_reseter (ミラー)
- aupプロジェクトファイルの
 終了フラグを一括リセット

CheckBitrate (ミラー, 使い方, ソース)
- ビットレート分布の分析(HEVC対応)

チャプター変換 (ミラー使い方>)
- nero/appleチャプター形式変換

エッジレベル調整 (avisynth)
- Avisynth用エッジレベル調整

メモリ・キャッシュ速度測定
- スレッド数を変えて測定

○ビルドしたものとか
L-SMASH (ミラー)
x264 (ミラー)
x265 (ミラー)

○その他
サンプル動画
その他

○読みもの (ミラー)
Aviutl/x264guiExの色変換
動画関連ダウンロードリンク集
簡易インストーラの概要

○更新停止・公開終了
改造版x264gui
x264guiEx 0.xx
RSSリンクの表示
リンク
QRコード
QR