この文は Mix Space によって xLog に同期更新されています
最適なブラウジング体験を得るために、元のリンクを訪問することをお勧めします
https://www.do1e.cn/posts/deepl/AICodecIntro
デジタル画像処理#
電子版リンク:デジタル画像処理(中)第三版 (1).pdf
1、2、4、6.1-6.2、8章を学習し、第八章はJPEG エンコーディングの詳細紹介と合わせて見ることで、エンコーディングの大まかな流れを理解してください
深層学習#
まず、Python について十分に理解する必要があります。選択可能な電子書籍:Python プログラミング:入門から実践まで.pdf
Pytorch を学習し、Bilibili の関連コース:李沐と学ぶ AI の個人スペース - 実践的深層学習 PyTorch 版 - 哔哩哔哩動画 (bilibili.com)、特に00~29.2、31、33-37、47、47.2を重点的に見てください
入門基礎論文#
論文とコード(CompressAI)を組み合わせて、自分でモデルを訓練し、RD 曲線を描いてみてください
一般的な訓練・検証セット:ImageNet/COCO
一般的なテストセット:24 枚の Kodak 画像、元の画像の端に異常があるため、時々正方形にトリミングされた画像を使用します
-
Ballé, J., et al. (2015). "Density modeling of images using a generalized normalization transformation." arXiv preprint arXiv:1511.06281.
AI Codec で一般的に使用される活性化層 GDN、関連コード:CompressAI/compressai/layers/gdn.py at master · InterDigitalInc/CompressAI (github.com)
-
Ballé, J., et al. (2016). "End-to-end optimized image compression." arXiv preprint arXiv:1611.01704.
AI Codec の基本的なアーキテクチャを紹介し、JPEG エンコーディングと比較して、変換、量子化、エントロピーエンコーディングの流れを理解し、RD 損失関数を理解します。関連コード:CompressAI/compressai/models/google.py at a4ae2eeef7bdb1b84ba076ac0d650b523f3fa882 · InterDigitalInc/CompressAI · GitHub
-
Ballé, J., et al. (2018). "Variational image compression with a scale hyperprior." arXiv preprint arXiv:1802.01436.
基本的なアーキテクチャにハイパープライヤ(hyper)を追加、関連コード:CompressAI/compressai/models/google.py at a4ae2eeef7bdb1b84ba076ac0d650b523f3fa882 · InterDigitalInc/CompressAI · GitHub
-
Minnen, D., et al. (2018). "Joint autoregressive and hierarchical priors for learned image compression." Advances in neural information processing systems.
自回帰(autoregressive)とハイパープライヤ、関連コード:CompressAI/compressai/models/google.py at a4ae2eeef7bdb1b84ba076ac0d650b523f3fa882 · InterDigitalInc/CompressAI · GitHub
注:CompressAI は Linux で直接 pip インストールできますが、Windows 用のインストーラは提供されていません。以下の手順に従ってインストールしてください:
- Visual Studio の C++ 関連パッケージをインストールし、再起動します
- conda で新しい python 環境を作成し、pytorch、scipy、matplotlib、pytorch-msssim をインストールします
- 上記の環境をアクティブにし、CompressAI をローカルにクローンし、ターミナルでディレクトリに入って、
pip install .
を実行します