機械学習研究室
本研究室では人工知能の研究で近年最も注目を集めている機械学習の理論と応用の研究を行っています。計算機の高速化,メモリの大容量化によって,機械学習アルゴリズムの計算機実験が容易になり,様々な機械学習アルゴリズム提案されるようになってきました。そのような状況の中,機械学習アルゴリズムを利用した実世界問題の解決を目標として,新たな機械学習アルゴリズムの開発,機械学習アルゴリズムの特性を活かした新たな問題解決法の開発を研究しています。また,機械学習と人間の有する経験知識とのインタラクションによる問題解決の効率化についても研究しています。具体的には多くの機械学習の結果を利用するアンサンブル学習の基礎,学習データ数が少なくても高い性能を発揮するサポートベクターマシンの改良と応用,トランスダクティブ推論に基づく検索の効率化,外れ値検出による設備の保守保全などの研究を行っています。
研究紹介
アンサンブル学習 本研究室では,複数の弱学習仮説(弱識別器)の推定結果を統合してロバストな推定結果を出力するアンサンブル学習(下図参照)のアルゴリズムの改良およびその数理的な特徴の分析の研究開発に取り組んでいます. アンサンブル学習は,基本的に弱学習仮説h1,...,htをいかに獲得し,弱学習仮説の推定結果への重み付けα1,...,αtをいかに決定して,それら弱学習仮説と推定結果への重み付けを利用していかに推定結果を統合させるかという問題である.このアンサンブル学習を実現する代表的なアルゴリズムとして,Bagging(Bootstrap aggregating)やAdaBoost(Adaptive Boosting)がある. 我々は,実験的にその汎化能力の高さが様々な文献で示されているAdaBoostに注目し,その数理的な特徴を分析するとともに,その汎化能力を更に向上するようなアルゴリズムの研究および学習を高速化するアルゴリズムの研究に取り組んでいます.
サポートベクターマシンに基づくDB構築・管理 パターン認識方法の一つであるサポートベクターマシンは,分類問題に対して非常に高い汎化性能を示し,様々な現実問題に適用され始めています.しかし,サポートベクターマシンの扱う分類問題は基本的に教師あり学習であるため,正例と負例の両方が学習の際に必要となります.現実の問題では,この正例と負例から構成される事例データベースの構築と管理に人的コストがかかることになります.我々はこの人的コストを削減しながら,汎化能力の高い分類結果が得られるような事例データベースの構築・管理方法の研究に取り組んでいます. サポートベクターマシンに代表される高い汎化性能を示すパターン認識方法は,様々な機器診断などでもその活用が期待されています.しかし,サポートベクターマシンのような教師あり学習を用いる方法には,機器の異常例と正常例を多数収集し,正確な事例データベースを構築する必要があります(上図グレー部分).このデータベースの構築・管理には,滅多に起こらない異常例を収集しなければならない困難さと,収集したデータが異常例か正常例かを正確にラベル付けしなければならない困難さがあります.我々は,サポートベクターマシンの特性を利用して,この困難さを軽減する方法について研究しています.
トランスダクティブ推論に基づく検索の効率化 従来のキーワードを利用する文書検索ではなく,検索結果に対するユーザの評価(この文書「いる(○)」または「いらない(×)」)に基づき,ユーザの興味のある文書を効率的に見つけ出す方法(対話的文書検索方法)の開発を行っています(下図参照). 特許情報についてのデータベースや研究論文についてのデータベースなどを検索する際,簡単なキーワードを入力すると大量の文献が検索結果として提示されて困ってしまい,逆にちょっと専門的なキーワードを入力すると該当する文献がなくなってしまって困るという経験をしたことがないでしょうか.このような問題を解決するため,我々は検索結果に対するユーザの評価をすぐに反映させ,ユーザの興味のある文書を効率的に見つけ出す対話的文書検索方法について研究しています.特に,ユーザが評価していない大量の文書とトランスダクティブ推論との融合により,ユーザの興味のある文書をさらに効率的に見つけ出す対話的文書検索方法を研究してます.
外れ値検出による保守保全のリスク管理 信頼性が高いステムでは非常に稀にしか異常事象が起こらず,そのシステムを現在管理している専門家でさえ異常事象を経験したことがないという場合があります.経験したことがない,滅多に起こらない異常事象ですが,信頼性が高いステムにおいてこのような異常事象を見逃すことは,リスク管理の意味で非常に大きな問題となりかねません.我々はこのような稀にしか起こらない異常事象を的確に発見する方法の研究を行っています. 信頼性が高いステムでは非常に稀にしか異常事象が起こらないので,その異常事象を直接検出するのではなく,大量なデータからの外れ値検出手法と専門家の経験的な知識を融合した異常事象の予兆を発見する方法の研究開発に取り組んでいます.具体的には上図にあるように,与えられたデータから外れ値検出手法によって外れデータを抽出し,そのデータが異常事象に結びつきそうかどうかを専門家と吟味して,吟味して残ったデータに類似したデータの発生傾向を分析ことで異常予兆を発見する方法を研究開発しています.