普段は画像処理を使うときはRGBの3チャネルかグレースケールを扱うことが多いのですが、こないだ久しぶりにアルファチャンネルを持つRGBA画像を扱う機会があったので、OpenCVでのアルファチャンネルの読み込み方等々についてまとめておこうと思いました。
アルファは画像の透過度を示す値で、正規化の仕方にもよりますが、一般的には255で透過なし、0で完全透過になります。
最近のペイントソフトでは大体アルファを持たせた画像を作ることができますが、出力するときに透過度を保持して出力するようにしないといけないので注意してください。少なくともPNGとかTIFFは、(透過度を持たせる設定で出力すれば)透過度を保持できるはずです。
例えば以下の画像をペイントソフトで作ってみましたが、青が透けており、赤い円と青の正方形以外は完全に透過されています。
今回はRGBA画像を読み込み、A(アルファ)が閾値以上の部分だけを白、それ以外の部分を黒にしたマスクを吐き出すプログラムを作り、OpenCVでのアルファチャネルの読み込み方、扱い方を学習します。
・OS : Windows10(64bit)
・Visual Studio 2017 Community
・OpenCV 4.2.0
(上記全て環境構築済)
今回はOpenCVは環境済の状態でスタートするので、OpenCVの環境構築は以下の記事などを参照してください。
過去記事①:Visual Studio 2015でOpenCV 3.4環境構築(Windows10)
過去記事②:Nugetを使ってOpenCVの環境構築(Visual Studio 2015)
以下に、A(アルファ)が閾値以上の部分だけをフィルタリングしたRGB画像を出力するプログラムのソースコードを示します。
以下の画像で実験してみました。赤の部分がアルファ255、青の部分が127、他が0になっています。
実行結果は以下のようになります。
【th=127 : アルファが127より大きいところだけ白にする】
【th=126 : アルファが126より大きいところだけ白にする】
OpenCVでアルファを正常に扱えているようです。
(1)imreadで画像を読み込む際に、以下のように2番目の引数に負の値を与えることでアルファチャネルを読み込むことができます。
■ 2番目の引数が>0のとき:
強制的に3チャンネルカラー画像として読み込まれます
■ 2番目の引数が=0のとき:
強制的にグレースケール画像として読み込まれます
■ 2番目の引数が<0のとき:
画像はそのままの画像として読み込まれます
(2)アルファの値はデフォルトでは4次元のベクトル(BGRA)の4つ目の要素(インデックス的には[3])に入るようでした。
OpenCVでアルファチャンネルを持った画像を扱う方法について学び、適当なプログラムを作ってみました。
OpenCVであればアルファ入りの画像も容易に扱えることがわかりました。