認識技術

現在の深層学習は,正確にラベル付けされた大規模なデータセットに対して精度良く動く.しかしながら,現実には,大量のデータに対して正確なラベル付けを行うには多くの時間とコストが掛かり,誤りが含まれることが多い.そのような状況に対処するための新しい認識技術として,ラベルと認識器の同時最適化を用いた誤ラベルの自動修正について研究している.また,認識器の更なる性能向上のために,CNNに対する新たな正則化技術について研究している.提案したParallel Grid Pooling(PGP)では,従来のCNNの学習において見落とされていた情報を利用することができ,ネットワークモデルの構造を変化させることなく高い認識精度を達成できる.

図1

ラベルと認識器の同時最適化

図2

Parallel Grid Pooling

最適化

コンピュータビジョンや機械学習の問題の多くは局所解が複数存在する非凸最適化問題である.例えばk-meansクラスタリングでは初期解によって異なるクラスタリング結果(異なる局所解)が得られる非凸最適化問題であり,良いクラスタリング結果(大域的最適解)を得るには異なる初期解から複数回最適化を行うことが一般的である.

当研究室では確率的探索や多点探索に頼らない,決定的なルールによる大域的最適化手法の研究をしている.k-meansクラスタリングや非負値行列分解などの最小二乗法による最適化問題や,外れ値の影響を無視して正しいパラメータを推定するロバスト推定のタスクにおいて,高い大域的最適化性能を持つアルゴリズムを提案している.

Bag of Features高速化の流れ

k-meansクラスタリングの異なる局所解