C++, Python

[Python][C++]符号付16ビット整数のバイナリファイルを読み書きする

DICOM形式の医用画像を用いて画像処理などを行いたい場合、当たり前ですがDICOM形式の医用画像ファイルを読まなければいけません。
世の中にはDICOM形式の医用画像の読み書きが出来るライブラリが諸々ありますが、例えばImageJでちょっとだけ加工してからコードで色々試したい、というようなときには、わざわざDICOM形式の画像をもう一度作ると面倒なので、値だけが直書きされたRawファイルでExportすることもそこそこあるかと思います(私だけ?)。
そして例えばCT画像の場合には各ピクセルのCT値が負の整数のときもありますので、Rawファイルは符号付16ビット整数で出力することになると思います。

というわけで、そんな符号付16ビット整数のバイナリファイルを読み書きするにはどうすれば良いのか、というお話です。

例として、4×4の以下のような値を各ピクセルに持つ画像を考えてみます。

画像内の数字は、各ピクセルの値で、普通の10進数表示と、対応する16進数表示です。
これをImageJでRawファイルとして出力してバイナリエディタで見てみると以下のようになっています。

ff c8 ff ed 01 01 07 06 00 e8 07 3f 0d 6a 10 cf 0c d3 11 20 10 91 0d a3 10 ed 0d dc 0c 4b 0b f6

16進数表示で順番に並んでいるだけの単純なものです。

これを効率よく読み込んで、配列に代入することを考えます。まずはPython版。

唯一の正解はありませんが、私が最も効率的だと思った方法はPython標準である
array.array('h')
を用いる方法です。これを用いると、

の2行だけで、符号付16ビット整数が並んだバイナリファイルを一気に読み込むことが出来ます。
…だがしかし!その後の

この2行を忘れると、マシンによっては値がメチャクチャになります。Windowsマシンでは(※例外はあるかもしれません)具体的にはこうなってしまいます。

最初の図と16進数表示は同じなのに、対応する10進数表示がメチャクチャです。
array.array
を用いてバイナリファイルを読み込むと、そのバイナリファイルに書かれているそっくりそのままの状態がこのarray.arrayに書き込まれます。
いま、

と符号付short(Pythonではこれが符号付16ビット整数に対応)を指定していますが、これは2バイトなので、16進数2つずつが1つの整数として解釈されます。
image_value[0]
は、最初の16進数2つ、つまり

ff c8

から値が作られますが、メモリに配置されている通りに解釈されます。
ここでエンディアンの問題が発生します。Windowsはリトルエンディアンなので、メモリ上に

ff c8

と書かれている場合は、解釈としては

ffc8

ではなく、順番が逆になって

c8ff

になります。
なので、メモリ上に配置する際には各符号付16ビット整数で1バイト目と2バイト目とを入れ替えなければいけません。
プログラムを走らせているマシンがリトルエンディアンなのかビッグエンディアンなのかは、Pythonでは
sys.byteorder
という便利な機能で判定することが出来、バイトの入れ替えもarrayに対して
byteswap()
を行うと勝手にやってくれるという便利な機能があります。

次に書き込みですが、
array.array
の内容を全部バイナリファイルとして出力するための便利な機能がこれまた最初から用意されており、

の1行だけです。簡単ですね。
ただし、ここでもメモリの配置通りにファイルに書き込まれてしまいますので、もともとのファイルと同じにするためには、
byteswap()
を用いてエンディアンをビッグエンディアン表記にする必要があります。ファイルを書き込んだ後に再び
byteswap()
を行って、元に戻すのを忘れないようにしましょう。

Pythonではこのように、エンディアンの判定やbyteswapを簡単に行うことが出来て便利です。
が、Pythonはfor文がとても遅いため、画像全体に画像フィルタをかけたりするような場合には馬鹿にならない時間がかかります。
256×256の画像でも、ピクセル数は256×256 = 65,536もありますので、for文を回すと結構イライラしてきます。
Numbaなどを上手く用いれば高速化出来るのかもしれませんが…。

と言うわけで、C++でも書いてみました。

Pythonと比べると行数が2倍弱も増えてしまっていますが、これは、Pythonでは標準で備わっていた機能のいくつかを自分で実装しなければいけないことも影響しています。
とは言えそこまで大変なことにはなりませんでした。
int16_t型の配列であるstd::vector<int16_t>に一気にバイナリファイルの内容を突っ込むためには

の1行で事足りてしまいます。

ただ、ここでもやはりエンディアン問題が発生しますので、エンディアンを判定して、リトルエンディアンであればbyteswapが必要になります。

で、このエンディアン判定ですが、現在のC++の標準機能には無いようです。しかし判定が必要なときは少なからずありますので、誰かがうまいやり方を見つけているはずです。
検索すると簡単に見つかりました。

初心者のプログラミング体験記 ビッグ? or リトル?(エンディアンの判定)【C言語】

関数として実装すればこうなります。

しかしbyteswapはちょっとハマりました…。
上位8ビットと下位8ビットとを入れ替えれば良いので、

でOK!…かと思いきや、これではダメでした。正しくは

です。Stack Overflowにありました。
& 0xFF
とは何ぞや?と思ったのですが、
整数型とビット操作
を読んで解決しました。符号付整数のビット演算では、ビットをずらしても符号の部分の値はそのまま残るので、上位8ビットを8ビット右にずらした場合は、その結果の16ビットのうちの一番左側のビットを常に0にしなければいけません。
そのための
& 0xFF
です。
そこさえクリアすれば、あとは書き込みの場合も含めてPythonと基本的には一緒です。

これでPythonでもC++でも符号付16ビット整数のバイナリファイルを自由に操作できますね。
もっと簡単な方法があればぜひ知りたいです!

コメントを残す

メールアドレスが公開されることはありません。