公立大学法人 兵庫県立大学大学院シミュレーション学研究科

私が考えるデータ解析について
data analysis for me

English page

視覚、聴覚、触覚、味覚、嗅覚といった五感に基づいて、あるものの存在や状態を認識したり決定したりするとき、私達はその存在や状態を現象と呼びます。私は、世の中にある様々な現象を理解したり解明したりしたいと思っています。そして、そのためには何が重要なのか、どのような視点や枠組みで取り組めばいいのかが、いつも私の頭の中にあります。様々な現象がある中、時間の経過とともに不規則で複雑な振る舞いを見せる動的現象に、興味を持っています。さらに私は非線形性に大きな興味を持っています。非線形性とは、単純な比例関係が成り立たない性質のことです。
現象の中には、その基本原理が十分には分かっていないため、数学や物理の数式になっていないものが今も多くあります。基本原理を知るには、その対象の自然な状態での内部構造や動作原理といった組織化された仕組みを詳しく調べられると良いのですが、それは常に可能ではありませんし、むしろ難しいことです。しかし、そんなときでも、多くの場合において、対象を観測することが出来ます。観測によって、現象の振る舞いを数値として記録したものがデータです。その観測されたデータを使って、データの特徴を調べることが出来ます。さらに、そのデータにはその現象を発生させる仕組みに関する情報が含まれていると考えられます。したがって、そのデータの特徴やその現象が発生している状況などから、その現象を生み出す本質的な仕組みを自分で想像することも出来ます。その考えを組み入れたモデルを構築し、そこからデータを生成することが出来ます。そのデータと観測データを比較することで、自分の考えの妥当性や有効性を検証することが出来ます。このように、その現象を解明するために、データを用いて様々な考えを巡らせることが出来ます。これが、私が考える「データ解析」です。私の研究は、データ解析を用いて、現象を出来る限りありのままに眺め、現象の特徴や現象の背後にある仕組みを解き明かすことです。そのために私が取る主なアプローチは、以下の4つです。

1. データを用いたモデルの構築(統計的モデリング)
2. 統計的な仮説検定を用いたデータの特徴分析(サロゲート法)
3. データを用いたネットワークの構築
4. シミュレーションを用いた現象の解析

これらのアプローチにおいて、時間と空間のつながり、情報伝達の時間遅れ、要素の相互作用、非線形性は非常に重要だと考えています。
しかし、データ解析で現象の全てが分かるわけではありません。データ解析のそれぞれのアプローチは、ある視点に基づいたものでしかありません。データ解析で得られるモデルは統計的に構築されたものですし、シミュレーションを行う条件も実際の現象の条件と一致していないかもしれません。したがって、データ解析によって得られるモデルやシミュレーションが本物と同じであると考えるのには無理があります。一方で、現象を生み出す仕組みを制御と情報という面から見てみると、データ解析で得られるモデルやシミュレーションから生成されるデータの特徴や振る舞いが、実際の現象のそれらと十分に似ていれば、そのモデルとシミュレーションは本物の仕組みの本質を捉えている可能性があります。解析対象の基本原理が分からず、それを詳しく調べることが出来ないものに対して、データ解析は現象の真実に迫ることが出来る現実的に可能な数少ない有効な方法です。私の研究は、このような立場からデータ解析を用いて現象の解明を目指したものです。