公立大学法人 兵庫県立大学大学院シミュレーション学研究科

サロゲートデータ法
method of surrogate data (surrogate data testing)

English page

サロゲートデータ法は、サロゲート法とも言われ、データの特徴を統計的に調べる方法のことです。データには、その振る舞いや様子を見ただけでは分からない特徴があります。例えば、ある振る舞いが不規則な変化だったとき、その振る舞いを見ただけでは、その変化には何らかの法則(規則)性があるのか、それとも無いのかは分かりません。私たちはサロゲートデータ法を使って、データの隠れた特徴を統計的に調べることが出来ます。この手法は、自分が調べたいと思う特徴を仮説として設定し、その仮説に従うデータを多数作成します。こうして作られたデータを、サロゲートデータと言います。この後、解析対象のデータとサロゲートデータの統計量を推定し、それらの違いを調べます。もし、両者に十分な違いが無ければ、解析対象のデータには設定した仮説の特徴があったと考え、違いがあれば、その特徴がなかったと考えます。仮説の立て方は自由です。このようにして、現象の特徴を調べます。

サロゲートデータ法の基本的な考え方と使い方の一例:自分が調べたいデータが、不規則な振る舞いを見せています。不規則な振る舞いが現れる原因の1つに非線形性があります。そこで、そのデータに非線形性が存在しているかどうかを調べることにします。ここで設定される仮説は、『このデータは線形である』というものになります。そして、データから非線形性を取り除く(または、その非線形性を破壊する)ことが出来る方法があります。その方法を用いて、調べたいデータから非線形性を取り除く(または、その非線形性を破壊する)処理を施したデータを多数作成します。このようにして多数作成されたデータを、サロゲートデータと言います。もし、調べたいデータに非線形性が無い場合、サロゲートデータは調べたいデータと同じ性質を持つことになります。従って、調べたいデータとサロゲートデータから推定される統計量の値は、大きな違いはないはずです。一方で、もし調べたいデータに非線形性が存在する場合は、サロゲートデータは調べたいデータと違う性質を持つことになります。従って、調べたいデータとサロゲートデータから推定される統計量の値の間には、大きな違いがあるはずです。