リアルタイム顔認識および年齢/性別推定

人の顔認識や、顔に基づいた年齢/性別の推定手法は、幅広い応用が期待されています。例えば、オフィスや工場の受付でお客様が毎回入場手続きをさせられる面倒を省きたい、勤怠管理や入退出管理、店舗の来客傾向を調べたいなど、応用分野は数えきれません。

Deep Neural Networkに代表されるAI技術の発展に伴い、顔認識の精度は飛躍的に向上しました。この事例では、入力画像に対して一般物体検知のアルゴリズムであるSSD (Single Shot Multibox Detector) を用いて顔検出を行った後、畳み込みニューラルネットワークCNN (Convolutional Neural Network) による性別推定と年齢推定を行っています。

顔認識および年齢/性別推定のネットワーク構造

(参考)SSD: Single Shot MultiBox Detectorについて

SSDは”Single Shot”という名前でもわかるように、1度のCNN演算で物体の「領域候補検出」と「クラス分類」の両方を行うことができます。これにより物体検出処理の高速化を可能にしました。

SSDネットワーク構造(SSD: Single Shot MultiBox Detectorより引用)

SSDネットワーク構造を記します。予測の際はそれぞれのレイヤーから特徴マップ (Feature map) を抽出して物体検出を行います。具体的にはそれぞれの特徴レイヤーに3×3の畳み込みフィルタを適用してクラス特徴と位置特徴を抽出します。

SSDによる検出(SSD: Single Shot MultiBox Detectorより引用)

(a) が入力画像と各物体の正解ボックスです。(b)と(c)のマス目は特徴マップの位置を表しており、各位置においてデフォルトボックスと呼ばれる異なるアスペクト比の矩形を複数設定します。各位置の各デフォルトボックスについてスコア(conf: confidence)の高いクラスを検出します。訓練時には各クラスの誤差と、デフォルトボックスと正解ボックスの位置の誤差を元に学習を行います。

SSDでは、サイズの違う畳み込み層をベースネットワークの後に追加することで様々なスケール(マルチスケール)で物体を検出することができます。

お問い合わせ

開発事例に興味がありましたら、お気軽にお問合せください。
下記お電話、または「お問い合わせ」からフォームにご記入ください。

株式会社ハイシンク創研 研究開発本部075-322-7088受付時間 9:00-18:00 [ 土・日・祝日除く ]

お問い合わせ