ビッグデータによる太陽の探索

アナリティクスの進歩が宇宙に関する深遠な疑問の探査に貢献

執筆: ダニエル・ティーチー(Daniel Teachey)、「SAS Insights」編集者

地球から160万キロも離れた軌道を回る衛星から何を学ぶことができるのか?地球から見えない太陽の裏側の表面では何が起こっているのか?太陽圏(太陽系が巨大な磁気の泡に覆われている空間)と星間空間の間には、どのような相互作用が働いているのか?

宇宙物理学者や天文学者が宇宙の神秘を解明しようとすると、こうした数々の疑問に直面します。そして、太陽のコロナ(太陽表面の最も外縁にあるガス層)が、摂氏5,600度に達している太陽の表面と比べても、さらに300倍も高温である理由を解明することも、そうした課題の1つです。科学者たちは、磁場に捕らえられたエネルギーが何らかの形でこれほどの強烈な加熱の原因となっており、この進行中の調査の鍵を握るのがコロナループではないかと考えている。

今や科学者は、データのサブセットの分析を繰り返す代わりに、ビッグデータ内で注目すべきポイントを短時間で特定し、そこに何が関連しているのかを精査できるようになっています。

コロナループは、太陽表面上でアーチ状に明るく輝く動的な構造体です。光って見えるのは高温のプラズマであるからで、その温度は優に摂氏100万度を超えます。電気を帯びたプラズマが、強力な磁場の影響でアーチを描きながら流れているのです。この光り輝く磁気アーチは太陽黒点と関連しています。太陽黒点は、太陽外縁のガス層から放出され地球の上層大気に降り注ぐX線や紫外線を著しく増加させることが知られています。

宇宙物理学者の間で有力なのは、こうした強力なアーチが生み出されるのは、磁気エネルギーが運動エネルギー、熱エネルギー、粒子加速に変換される「磁場再結合」が発生するからだという説です。

そしてこれこそが、ラルス・ダルドルフ(Lars Daldorff)氏およびシャバウシュ・モハンマディ(Siavoush Mohammadi)氏という2人の研究者が特定および理解したいと考えている瞬間です。ダルドルフ氏は大気・海洋・宇宙科学を専門とするミシガン大学の研究フェローであり、NASAゴダード宇宙飛行センターのコンサルタントも務めています。モハンマディ氏は、ビジネス・インテリジェンスとデータウェアハウスに特化したスウェーデン企業、Infotrek社のコンサルタントです。

2人は協力して、発見プロセスの大きな障壁となっている課題、すなわち「データ量が膨大すぎて科学的なプロセスが情報を扱いきれず、洞察や知識を導き出すのが困難になっている」という状況と格闘しています。

分析ライフサイクルを管理する方法とは(英語)

物理学者が大規模なスーパーコンピューターを使って太陽をシミュレートするときには、膨大なデータが生成されます。しかし、関心対象の現象はどれも特定の時空点で発生するものであるため、まさに「干し草の山から1本の針を見つけ出す」作業になります。探し求めているものはデータのどこかに潜んでいますが、データのどこを、どの時点のデータの中を探せばよいのかも分からないのが通例です。そのため研究者は、探索対象の時空点を根拠にもとづいて推測し、データを小さな部分に分割しなければなりません。

問題は、たとえ最初の推測でたまたま興味深い現象を見つけることができたとしても、それがデータ内で関心対象となりうる唯一の現象かどうか分からないことです。そのため、データを収集(この例の場合は太陽の数値シミュレーションから取得)してから、そのデータに関する洞察が得られるまでに、非常に長い時間がかかります。

しかしもし、干し草の山全体を一度にスキャンして針を見つけられるとしたらどうでしょう?また、(複数の)針を見つけたのち、関心対象のデータを簡単にエクスポートし、重要なデータのみを徹底的に分析することができるとしたら?

ダルドルフ氏とモハンマディ氏が答えを出したいと思ったのは、まさにこれらの疑問です。そのために両氏が注目したのは、ダルドルフ氏が以前にNASAで行ったプラズマ・シミュレーションを対象にして太陽研究プロジェクト向けの膨大なデータを探索・分類・表示できる商用アナリティクス・ソリューションでした。「自動探索的データ解析」(automatic explorative analysis)と呼ばれる手法(ビジネスの世界ではカスタマー・インテリジェンスの作成などに広く使われています)の発展の方向性に、宇宙を理解したいと考える科学者たちを支援するという新たな役割が加わったのです。

2人が使用しているSAS® Visual Analyticsは、ビッグデータを対象にして発見や対話操作型の探索およびレポーティングを行うことができるインメモリ方式のツールです。SAS Visual Analyticsに組み込まれたアナリティクス手法の多くは標準化されており、幅広い業種のデータ・アナリティクスで活用されています。注目すべきポイントを特定し、データ間の関係性を洗い出し、分析とビジュアライゼーション(視覚化)を実行し、レポートを作成するための手法は、ビジネスデータを扱う場合も科学データを扱う場合も同じです。

シアトルで開催された「2015 Joint Statistical Meetings」(主催:American Statistical Association)で研究成果を発表したダルドルフ氏とモハンマディ氏は、次のように話しています。「これらの結果が太陽の磁気ループに関するNASAの研究に役立つと同時に、私たちの取り組みによって、探究的データ解析が他のデータ集約型の分野でも効果的であることが明らかになれば幸いです。この新しいアプリケーションは多大な可能性を秘めており、学術界、ビジネス界、科学界の幅広い研究者がビッグデータから洞察や結果を導き出すプロセスを飛躍的に高速化するためも役立つでしょう」