Do1e

Do1e

github
email

AI Codec 入門

この文は Mix Space によって xLog に同期更新されています
最適なブラウジング体験を得るために、元のリンクを訪問することをお勧めします
https://www.do1e.cn/posts/deepl/AICodecIntro


デジタル画像処理#

電子版リンク:デジタル画像処理(中)第三版 (1).pdf
1、2、4、6.1-6.2、8章を学習し、第八章はJPEG エンコーディングの詳細紹介と合わせて見ることで、エンコーディングの大まかな流れを理解してください

深層学習#

まず、Python について十分に理解する必要があります。選択可能な電子書籍:Python プログラミング:入門から実践まで.pdf
Pytorch を学習し、Bilibili の関連コース:李沐と学ぶ AI の個人スペース - 実践的深層学習 PyTorch 版 - 哔哩哔哩動画 (bilibili.com)、特に00~29.2、31、33-37、47、47.2を重点的に見てください

入門基礎論文#

論文とコード(CompressAI)を組み合わせて、自分でモデルを訓練し、RD 曲線を描いてみてください

一般的な訓練・検証セット:ImageNet/COCO
一般的なテストセット:24 枚の Kodak 画像、元の画像の端に異常があるため、時々正方形にトリミングされた画像を使用します

  1. Ballé, J., et al. (2015). "Density modeling of images using a generalized normalization transformation." arXiv preprint arXiv:1511.06281.

    AI Codec で一般的に使用される活性化層 GDN、関連コード:CompressAI/compressai/layers/gdn.py at master · InterDigitalInc/CompressAI (github.com)

  2. Ballé, J., et al. (2016). "End-to-end optimized image compression." arXiv preprint arXiv:1611.01704.

    AI Codec の基本的なアーキテクチャを紹介し、JPEG エンコーディングと比較して、変換、量子化、エントロピーエンコーディングの流れを理解し、RD 損失関数を理解します。関連コード:CompressAI/compressai/models/google.py at a4ae2eeef7bdb1b84ba076ac0d650b523f3fa882 · InterDigitalInc/CompressAI · GitHub

  3. Ballé, J., et al. (2018). "Variational image compression with a scale hyperprior." arXiv preprint arXiv:1802.01436.

    基本的なアーキテクチャにハイパープライヤ(hyper)を追加、関連コード:CompressAI/compressai/models/google.py at a4ae2eeef7bdb1b84ba076ac0d650b523f3fa882 · InterDigitalInc/CompressAI · GitHub

  4. Minnen, D., et al. (2018). "Joint autoregressive and hierarchical priors for learned image compression." Advances in neural information processing systems.

    自回帰(autoregressive)とハイパープライヤ、関連コード:CompressAI/compressai/models/google.py at a4ae2eeef7bdb1b84ba076ac0d650b523f3fa882 · InterDigitalInc/CompressAI · GitHub

注:CompressAI は Linux で直接 pip インストールできますが、Windows 用のインストーラは提供されていません。以下の手順に従ってインストールしてください:

  1. Visual Studio の C++ 関連パッケージをインストールし、再起動します
  2. conda で新しい python 環境を作成し、pytorch、scipy、matplotlib、pytorch-msssim をインストールします
  3. 上記の環境をアクティブにし、CompressAI をローカルにクローンし、ターミナルでディレクトリに入って、pip install .を実行します
読み込み中...
文章は、創作者によって署名され、ブロックチェーンに安全に保存されています。