- Cachéテクノロジガイド
- JavaのためのCaché eXTreme
- 高可用性
- 機能と特徴
- デモンストレーション
- 導入事例
- ホワイトペーパー・アナリスト
レポート・カタログダウンロード - 製品仕様・ドキュメント
- Caché開発者向け情報
- InterSystems FAQ
- Caché eラーニング
(USページ) - 無償ダウンロード
ホワイトペーパーとアナリストレポート
欧州宇宙機関:
衛星ガイアと INTERSYSTEMS CACHÉ を使用し
銀河の地図を作成
William O’Mullane (欧州宇宙機関、科学事業開発マネージャ)
Vik Nagjee (インターシステムズ コーポレーション、プロダクト マネージャ)
要約
欧州宇宙機関 (ESA) は、衛星ガイアによって収集された天体データの分析に使用する AGIS 位置天文観測ソリューションのデータベース テクノロジに、 InterSystems Caché® を選択しました。
ガイア ミッションとは、約 10 億個の天体の正確な立体地図を作成するというものです。このミッションでは、AGIS ソリューションによって、ガイアが観測した空間データを反復的に収集してその精度を高め、最終的には約 20 マイクロアーク秒を達成する予定です。
このプロジェクトの非常に厳しいデータ要件に備えるためにインターシステムズが行った機能検証では、それぞれ約 600 バイトの独立した Java オブジェクト 50 億個 を 24 時間以内に Caché データベースに挿入することが求められました。機能検証では、Red Hat Enterprise Linux 5.5 を搭載した 8 コア 64 ビット Intel プロセッサ マシンで Caché を実行し、平均112,000 オブジェクト/秒の挿入速度で、12 時間 18 分ですべてのデータを取り込むことができました。
はじめに
宇宙ミッションは通常、15 ~ 20 年という長期にわたります。そのため、データの処理、操作、および保存には、長期間のミッションに対応できる堅牢なテクノロジが必要です。このようなテクノロジには、必要に応じて探査機を迅速に調整できるよう、重要な最新の処理によるフィードバックをタイムリーに行うことも求められます。
ガイア ミッションは、これまでの宇宙研究で、最大のデータ処理に挑戦するものと考えられます。2010 年 5 月のインターシステムズのプレス リリースに記載されているように、欧州宇宙機関 (ESA) は、ガイア ミッションに関連する科学データの処理を行うために InterSystems Caché® を選択しました。
インターシステムズと欧州宇宙天文学センター (ESAC) は2008年より協力し、ガイアで求められる一部またはすべてのデータを処理する上で、InterSystems Cachéが、 いかに優れているかを見極め、さらに、ガイア プロジェクトの非常に膨大なデータ処理をサポートする経済的なコンピュータ・アーキテクチャを構築しています。
ガイア ミッション
衛星ガイアは、2012 年にフランス領ギアナからソユーズ ロケットによって打ち上げられる予定です。地球から L2 までの 150 万 km を2か月かけて移動し、その後 5 年間、宇宙を観測します。目的は、銀河の立体的な宇宙地図を作成することです。
ギガピクセルの焦点距離と視線速度分光計という 2 つの観測方法を持つ 2000 kg の衛星は、すべてを備えた探査機です。生涯を通じて、ガイアは 10 億個の天体をそれぞれ約 80 回観測する予定です。
すべての天体の位置と光度を観測するほか、約 1 億 5000 万個の天体についてはスペクトルも測定します。最終的な地図の位置天文観測の精度は、約 20 マイクロアーク秒になると予想されます。この精度を達成するには、きわめて複雑な処理が必要です。
すべてのガイアのデータ処理ソフトウェアは、Java で記述されています。これには、Astrometric Global Iterative Solution (AGIS) という中核となる位置天文観測ソリューションも含まれ、反復的に測定することでガイアが測定したすべてのデータの空間精度を高めます。ガイアは自由に回転して観測を行います。ガイア以外の個々の観測データに関しては、一貫した方法で削減する必要があります。それにより、個々の天体観測、各天体の位置と動きのモデル、およびガイア自体の姿勢、軌道、速度すべてが調和し整理されるのです。
後に、座標系全体を国際天文基準座標系 (ICRS) に合わせて調整されることがあります。それが AGIS の課題で、InterSystems Caché が選択されたガイアのデータ処理全体の約 10 ~ 50% に相当します。
ガイアの科学的な目標は広範におよびます。しかし、全体的な目標は、銀河の構造と形成の歴史を明らかにすることであると言えます。
技術的な課題と要件
ガイアは、その焦点地点を横切る約 109 (10億) 個の天体を観測することになっています。それぞれの天体について約 100 個の属性を観測するため、観測データは合計 1011 (1千億) 件になる予定です。
このうち約 10 ~ 50% が、AGIS を使用したグローバル基準座標系の構築に使用される予定です。グローバル基準座標系のデータは、機体の傾きを考慮して修正、または調整されて、地図内の他の天体の位置と動きを更新するのに使用されます。図 1 は、メイン データベースと AGIS Caché データベース間のデータ の流れの簡単なワークフローを示したものです。
図 1: AGIS の抽出および処理の概略フロー図

これまで、AGIS Caché データベースには約 1億個の天体のデータ (合計 100億件の観測データ) が格納されると予測されていました。また、このデータのサイズは、約 20 テラバイトになると予想されていました。しかし最近では、最大 5億個の天体 (合計 500億件の観測データ) を AGIS データベースに格納する可能性があると考えられています。その場合は、100 テラバイトのデータベースになります。
このデータは、即座に処理を開始できるように、7 日以内にデータベースに取り込むこと (もしくは、挿入される) 求められています。
AGIS にデータが取り込まれると、全てのデータの修正と調整に約 40 回の処理の繰り返しが必要です。この作業は、120 日以内に完了しなければなりません。調整が完了すると、AGIS のデータはメイン データベースに戻され、次のサイクルが開始されます。ミッションの期間を通じて、この処理が繰り返されます。さらに、ガイアのデータ処理全体も反復的です。AGIS で調整された位置を使用することで、測光や変光などの他のプロセスでもより正確な結果を得ることができます。これらのデータで、さらに次の AGIS ソリューションがよりよいものになります。
AGIS Caché データベースへのデータの取り込み

図 2: AstroElementary データ モデル
AGIS データ モデルは複数のオブジェクトで構成され、Java インターフェースを使用して定義されます。
具体的に言うと、AGIS では、それぞれの観測データが独立した AstroElementary オブジェクトとして扱われます。図 2 に示すように、AstroElementary オブジェクトにはさまざまなプロパティがあり (大部分は IEEE Long データ型)、ディスク上では約 600 バイトです。
さらに、AGIS データベースには、取り込み段階で作成されるさまざまな補助インデックスが格納されます。これらのインデックスは AGIS のクエリ処理を補助するほか、アドホック レポートを高速化します。
InterSystems Caché と Java のための Caché eXTreme 機能を使用して、複数の AGIS Java プログラムは、ガイアで生成された 100 テラバイトのデータを 500億 個の独立した AstroElementary オブジェクトとして取り込みます。このデータ取り込みと補助インデックスの作成は、5 日以内に完了しなければなりません。そのため、1 秒間に約11万5千 個の AstroElementary オブジェクトを継続的に取り込む必要があります。
データ取り込みに関する機能検証
機能検証として、インターシステムズと ESAC は NetApp社の エンジニアと協力して、50 億 (5,000,000,000) 個の AstroElementary オブジェクトを取り込むためのテスト環境を構築しました。これは、ミッション完了時に AGIS データベースで予想される全体のデータ量の約 10% に相当します。基準に従えば、このデータを 12 時間以内に取り込む必要があります。ただし、この機能検証で使用するハードウェアは本稼働レベルに達していないため、ESAC は、このデータが 24 時間以内に取り込まれれば、機能検証は成功であると宣言することにしました。
表 1 は、このテストのために用意されたテスト システムの仕様をまとめたものです。
表 1: テスト システム アーキテクチャの概要

Java のための Caché eXTreme 機能を使用して、テスト装置では 50億個の独立した AstroElementary オブジェクトを 12 時間 18 分で取り込むことができ、1 秒間に 11万2千 オブジェクトという平均持続速度を達成しました。
表 2: 取り込みの機能検証結果の概要

テストは大成功だったと判断されました。特に、仮のシステム構成で、決められた 24 時間の半分強で挿入が完了したためです。
将来的に、複数の並列したプログラムで取り込みテストも含むことが見込まれ、さらに平均取り込み速度が向上し、取り込みの合計時間が短縮される可能性があります。
まとめ
欧州宇宙機関とインターシステムズが実施した機能検証プロジェクトでは、平均11万2千オブジェクト/秒という速度で位置天文観測のサンプルデータが InterSystems Caché データベースに挿入されました。テスト全体は、テスト用のハードウェアを使用して、12 時間 18 分で完了しました。これは、24 時間という限られた時間のほぼ半分です。この結果、銀河を調査する衛星ガイアの非常に過酷なデータ要件に対応可能なデータベース テクノロジとして、Caché が適切な選択であることが、さらに証明されています。
Caché について
InterSystems Caché® は、マッピング不要で、オブジェクト、SQL、および多次元のデータ アクセスを可能にする高性能なデータベースです。医療、金融サービス、政府、通信、小売、その他の特定市場において、世界中の革新的なアプリケーションで採用されています。
Java のための Caché eXTreme について
Java のための Caché eXTreme は InterSystems Caché データベースの新機能で、Caché が提供するエンタープライズ機能や高性能な機能を、JNI (Java Native Interface) を通して Java で利用できるようにします。Java と Caché 間の "インプロセス" 通信を可能にし、非常に短い遅延でデータの保存と検索を行います。
詳細は、intersystems.co.jp/extreme/ をご覧ください。
ESA について
欧州宇宙機関 (ESA) は、ヨーロッパにおける宇宙への窓口です。ESA のミッションは、ヨーロッパの宇宙開発力を推進し、宇宙への投資を通じてヨーロッパの市民および全世界に継続的に利益をもたらすことです。ESA の任務は、ヨーロッパの宇宙プログラムを策定し、遂行することです。ESA のプログラムは、地球、地球を取り巻く宇宙環境、太陽系、および銀河系に関する調査を進めること、衛星を基にしたテクノロジやサービスを開発すること、ヨーロッパの産業を促進することを目的としています。また ESA は、ヨーロッパ以外の宇宙機関とも密接に連携しています。
ESA は、ヨーロッパのいくつかの国に拠点を擁し、それぞれが異なる役割を担っています。欧州宇宙天文学センター (ESAC) は、スペインのマドリード近郊にあるESA の宇宙科学の中心です。ESAC で宇宙望遠鏡の科学的操作が行われ、生成された科学データすべてがアーカイブされて、世界中に配信されます。
インターシステムズについて
インターシステムズコーポレーションは、ソフトウェア テクノロジにおける世界的なトップ企業です。本社を米国マサチューセッツ州ケンブリッジに置き、23 ヶ国に拠点を擁しています。インターシステムズでは、革新的なアプリケーション向けの高度なソフトウェア テクノロジを提供しています。InterSystems Caché® は、アプリケーションの処理速度と拡張性の向上を実現する高性能なオブジェクト データベースです。InterSystems Ensemble® は、統合と接続可能なアプリケーションの開発のためのシームレスなプラットフォームです。InterSystems HealthShare™ は、地域や国内での医療情報交換で使用する EHR (Electronic Health Record:電子医療記録) の迅速な作成を実現するプラットフォームです。InterSystems DeepSee™ は、商取引アプリケーションへのリアル タイムのビジネス インテリジェンスの組み込みを実現するソフトウェアです。
詳細は、Intersystems.co.jp をご覧ください。
