EnsekiTT Blog

EnsekiTTが書くブログです。

目線検出用の顔画像の平均画像を作ることにした話

こんにちは、えんせきです。
今日は、急な出張から帰ってきた僕がディスプレイのどこを見つめているかを調べるためのデータセットを作ったので平均画像を作ってみた。

つまりなにしたの?

21350枚作った目線検出用画像から平均成分を抜くために平均画像を作った。
f:id:ensekitt:20171211023656j:plain

どんなふうに取った画像なのか

ひたすら色んな角度でディスプレイのある点を見つめたえんせきの画像が21350枚ある。大量の悪夢だ。
ただ、データオーグメンテーション系は今回とりあえずやっていない。
(効果確認でBlogのネタにできたらいいな)

詳しくはこちら
ensekitt.hatenablog.com

どんなふうに平均画像を作ったのか

処理自体は大した話ではないけど、出来上がったものはこちら。(一般的な画像処理でも使えるんじゃないかな)
f:id:ensekitt:20171211023302p:plain
ぼやけた悪夢だ。

大量の悪夢をぼやけた悪夢にするコード

import numpy as np
from PIL import Image

imgArray = None
for fname in fnames:
    im = Image.open(fname)
    if type(imgArray) == type(None):
        imgArray = np.asarray(im)/len(fnames)
    else:
        imgArray += np.asarray(im)/len(fnames)

pilImg = Image.fromarray(np.uint8(imgArray))
pilImg

fnamesには平均を取りたい画像のパスのリストを入れておく。

クリエイティブ・コモンズ・ライセンス
この 作品 は クリエイティブ・コモンズ 表示 4.0 国際 ライセンスの下に提供されています。