トップ » バックナンバー » Vol.2 » 「天文学的数字」ほどの情報処理

Accumu Vol.2

「天文学的数字」ほどの情報処理

市川 隆

私たちの住む銀河系は,太陽のように自ら輝く約2千億の恒星で構成されている。また150億光年(1.4×1023キロメートル)の宇宙空間には銀河系と同じような銀河が100億個存在している。小さな銀河も含めると1000億以上にもなる。星の数に換算すると実に1021個である。私たちは日常,数が非常に多いことのたとえに「星の数ほど」という表現を用いるが,夜空のきれいな田舎でみることのできる星もせいぜい2000個程度であることを考えると,私たちの住むこの宇宙がいかに広大であるか想像できよう。

「宇宙は有限か,無限か」などの宇宙全体の構造を研究する分野では,星よりも銀河を中心に扱う。宇宙全体をイメージする時,私たちはどのような世界を描くだろうか。銀河がポツポツと漂うだけの真空の空間が無限に続いている。このような世界だろうか。そんな素朴な疑問に正面から取り組んでいる研究者は「天文学的数字」ほどの膨大な情報の処理に頭を痛めている。

乾板とCCDカメラ・・・入力装置

宇宙の構造を知る第一歩は,ひとつひとつの銀河を数えることである。プロの天体観測では,一般には使用されなくなった乾板(薄いガラスの表面に感光乳剤が塗布されたもの)が用いられる。世界最大のものは50センチ四方もある。シュミット望遠鏡と呼ばれる明るい光学系と広い視野を持つ望遠鏡では最大36センチ四方の乾板が用いられている。感光乳剤の中には,光を感知し,黒みとなって情報を記録するわずか100分の1ミリの粒子がびっしり詰まっている。従って,36センチ四方の乾板の上には1.3ギガビットの惰報を記録できる。

写真1

写真1はシュミット望遠鏡で撮影した銀河系から220万光年の距離にあるアンドロメダ銀河である。点状の天体は私たちの銀河系内にある星で,その星々を透かして系外の銀河を見ている。虫メガネでよく見ると,アンドロメダ銀河より遠方の銀河がたくさん写っているのがわかる。この写真のように天体の密度が小さいときは虫メガネをのぞきながら,星や銀河の数をかぞえることも可能だろう。

乾板上では感光粒子が天体の明るさに応じて黒い点の集合となり,星や銀河の像を記録する。最近では乾板にかわって,家庭用ビデオカメラに広く利用されているCCDカメラと呼ばれる撮像装置が天体観測にも応用されている。研究用のCCDカメラは宇宙の果てにある暗い銀河も観測できるように,真空容器に閉じ込め,摂氏マイナス100度に冷却するなど特殊な工夫がされており,大きさも一般用に比べてずっと大きい。ひとつひとつの感光素子はわずか15ミクロン程度の大きさしかないが,1.5センチ四方の中に,100万余りの素子が縦横びっしりと並んでいる。乾板の36センチという大きさに比べたらはるかに小さいものの,感度が数十倍すぐれており,乾板よりも極めて暗い天体を観測できる。しかもカメラからの出力を直接コンピュータに入力することができるので,乾板のように特殊な装置(高精度のイメージスキャナなど)による測定を必要としない。今後はますます大型化されていくCCDカメラが乾板にとってかわるはずである。

写真2

写真2は世界で最も高感度のCCDカメラを世界最大級の4m望遠鏡に取り付けて,長時間露光した画像である。所せましとびっしり写っている天体はほとんどが,星ではなく,宇宙の果てにある銀河である。写真1に比べてなんと6万倍もの数の銀河が写っている。写真1のアンドロメダ銀河も宇宙の彼方に持っていくと,このような点にしか写らない。これら銀河の数が銀河系からの距離によってどのように増えていくかを調べれば,宇宙が有限か無限かがわかる。しかし幾つも重なりあった像から個々の銀河をどのように分離したらよいだろうか。

虫メガネ・・・天文学者のイメージスキャナ

CCDカメラなどの半導体技術の発達に伴い,天文観測で得られるデータの量は加速度的に増大している。蓄積されていく膨大な天体情報に対して,天文研究者はどのように対処しているのであろうか。コンピュータが普及する以前はほとんどの情報を捨てていたといっても過言ではない。36センチ四方,視野6度の乾板1枚には,数万から100万の天体が写っている。現在でもそのような乾板を虫メガネでていねいになぞりながら,必要な情報(たとえば奇妙な形や色をした銀河や星など)を捜している研究者も多い。大きな乾板の場合1枚の探索に何時間,ときには何日もかかる。人の能力には限りがあるので,研究者当人が必要とする極めてわずかの情報以外,結局はほとんどが捨てられてしまう。平均すると写真1枚あたり,50個ほどの天体を拾い出しているにすぎない。

しかし,苦労の末,完成したカタログも個人差,時には本人の気分次第で抽出の基準が微妙に変わってしまい,系統的な誤差がつきものであった。莫大な情報の中から,できる限り短時間に,天文学者の要求に従って必要な情報を引き出す。しかも,無駄なく精度良く抽出するにはどうしたら良いだろうか。現在この課題に対して世界各国の天文研究者が積極的に取り組んでいる。英国はオーストラリアに世界最大級の口径124センチのシュミット望遠鏡を保有している。この望遠鏡を用いて南半球から見えるほとんどの天域での写真観測を行ってきた。乾板の大きさはやはり36センチ四方で約6度の視野を持つ。乾板の数は500枚にも及ぶ。これら大量の乾板に記録されている全情報を引き出すために,英国の2つのグループが独立に専用のイメージスキャナを製作した。15ミクロン間隔で乾板全面をスキャンすると10時間かかる。測定データは約3000本の磁気テープに記録され,全情報量は300ギガバイトにも及ぶ。かれらはこの磁気テープから必要な情報を引き出すため,スーパーミニコンに自動的に銀河と星,その他の天体に区別させるソフトウェアを開発した。天体があまり重なっていなければアルゴリズムはそれほと難しくない。しかし領域が広いために天体の数は膨大になる。結局約10億の星と400万の銀河のカタログができあがった。天体の明るさ,位置,大きさ,形など様々な情報も同時に記録されている。かれらは現在北半球から見える空でも同様のカタログを作っている。これが完成すると,全天で30億の星,1000万近くの銀河のカタログとなる。人が虫メガネで捜し,手動で測定していたら100年以上かかってしまう。ちなみに,いままでに人力で作られた最多の銀河カタログにはわずか3万個足らずしか収録されていない。

このようなコンピュータによる自動解析は銀河や星の検出のみならず,クウェーサーの探索,銀河の形状解析など様々な分野で試みられている。

情報の山・・・天文学者のためいき

日本の光・赤外線天文研究者は1990年代の完成を目指して,ハワイ島のマウナケア山に世界最大の口径8m級の反射望遠鏡の建設を準備中である。その主焦点には大きさが10センチ四方のCCDカメラを取り付ける計画だ。その感光素子数は従来の45倍,4000万個にもなる。ひとつひとつの素子には宇宙の果てからやってくる光が記録され,どれも捨てることのできない貴重な情報である。1回の露光(5分~1時間)で,80メガバイトのデータが得られる。一晩に20~200画像が得られるとすると,データ量はわずか1晩で最高16ギガバイトにも達する。

最近,スペースシャトルによって地球周回軌道上に口径2.4メートルの望遠鏡が打ち上げられた。この望遠鏡には800×800素子のCCDカメラが4基積まれている。天候に左右されず,しかも昼夜を問わず観則データを送り続ける。1回の露光を30分としても,このカメラだけで1日に250メガバイトになる。さらに他の観測機器からもデータは送られて来る。全観測データはしばらく後に,世界の研究者が自由に利用できるようになる。望遠鏡の寿命は15年。15年間,毎日毎日データが届けられるのである。

天文学者は地上望遠鏡や宇宙望遠鏡で,毎日生み出されるこの「天文学的数字」ほどの莫大なデータの山に立ち向かわなければならない。日本の研究者に果たして処理し切れるだろうか。残念ながら現状では不可と言わざるを得ない。天文画像から必要な情報を短時間のうちに自動的に抽出する技術の開発に世界の研究者はしのぎを削っている。しかし日本では天文研究に関するソフトウェア技術者が非常に不足しているのが現状だ。

筆者は,京都コンピュータ学院の画像処理ゼミナールで学院の生徒と共に文字画像の自動認識を勉強してきた。驚くほど独創性の高い才能の片鱗を見せてくれた生徒もいた。新しい技術の飛躍的な発展によって,斬新な研究分野が生まれる。学院の卒業生によるオリジナリティあふれるソフト技術の開発が思いもかけない分野で新しい可能性を生むかもしれない。宇宙を解明する努力を続けている私たち天文研究者も,目の前に山積みにされていく情報にためいきをつきながら,ソフト技術者の成長を切に期待している。

この著者の他の記事を読む
市川 隆
Takashi Ichikawa
  • 京都大学理学研究科博士課程修了
  • 理学博士
  • 銀河物理学専攻
  • 現在一橋大学地学研究室助手
  • 元京都コンピュータ学院講師

上記の肩書・経歴等はアキューム2号発刊当時のものです。