artscape
artscape English site
プライバシーステートメント
ミュージアムIT情報
掲載/歌田明弘|掲載/影山幸一
アメリカ議会図書館ウェブ・サイト保存プロジェクト「ミネルヴァ」
歌田明弘
短命なウェブ・サイトの収集・保存
 アメリカ議会図書館のウェブ・サイト保存プロジェクト「ミネルヴァ(MINERVA)」がしだいに充実した姿を現わし始めている。「ミネルヴァ」のサイトによれば、ウェブ・ページの平均寿命は44日だそうで、1998年にあったサイトのうち44パーセントは翌年にはなくなっているという。サイトが残っていたとしても、情報は頻繁に更新され短い期間で消えていく。しかし、「ウェブ・サイトのインパクトは大きく、ほかの場所では見出せない歴史的・社会学的データを提供してくれる」とのことで、すでに36,000のウェブ・サイトを収集したそうだ。「ミネルヴァ」は、ギリシア神話のアテネに相当するローマ神話の知恵や芸術の女神だが、議会図書館の大ホールのモザイク画に描かれ、議会図書館の象徴ともいうべき存在だ。その女神と「Mapping the INternet Electronic Resources Virtual Archive」の頭文字をかけたのが名前の由来である。2000年の大統領選挙、2001年9月11日のテロ、2002年の中間選挙などテーマを決めてそれに関連したサイトを集めている。この3つはすでにアーカイヴができており、2002年度の議会やソルトレークでの冬季オリンピック関連サイトの収集・保存も進められている。

インターネット・アーカイヴと議会図書館
 どういうサイトを含めるかは、300人以上いるスタッフと一般からの推薦によって決めているというが、データの収集にあたっては、この欄で以前紹介した「インターネット・アーカイヴ」も協力している。
 このアーカイヴは非営利の組織だが、代表者は私企業「アレクサ」の創立者でもあるブルースター・カールという人物だ。99年に「アマゾン・コム」傘下に入った「アレクサ」は、巡回ソフトを受け入れている世界中のサイトを原則2ヶ月おきにキャッシュして誰でもアクセスできるようにしている。そのキャッシュ・データは「インターネット・アーカイヴ」にも提供され、営利企業とは切り離して保存・公開されている。「インターネット・アーカイヴ」のサイトには、このキャッシュからデータを引き出す「ウェイバック・マシン(昔に戻る機械)」と名づけられたインターフェイスができていて、URLを入力すればそのURLの過去のウェブ・ページを呼び出せるようになっている。これも「アレクサ」が作って提供したものだ。議会図書館も、「インターネット・アーカイヴ」からデータの寄贈を受けている。

サイトを選別し、カタログ化する
 「インターネット・アーカイヴ」が世界中のサイトを「まるごと」、しかもいくつもの時間軸で収集するという活動をしているのだから、議会図書館はこのうえやることがないようにも思えるが、そんなことはない。原則2ヶ月おきにデータを集める「アレクサ」の設定では間隔があきすぎるということは当然ながら起こる。選挙時やテロのあとなどはサイトが時々刻々変化し、一日といわず、ときには数時間でサイトの様子ががらっと変わる。議会図書館のコレクションは資料的価値が求められ、そのためにももっと頻繁に、また完全な形でサイトを保存する必要がある。キャッシュすること自体は機械的に処理できるが、どのサイトをどれぐらいの頻度で保存していくかは人間が判断するしかない。「アレクサ」(=「インターネット・アーカイヴ」)のふだんの作業はすべて自動処理され、人間は微調整するぐらいの仕事だからスタッフは30人程度しかいない。一方、「ミネルヴァ」のように選別して保存するためには専門知識をもった多数のスタッフがいる。というところで、まさしく議会図書館のような組織が必要とされるわけだ。
 公開されている「ミネルヴァ」のサイトを見ると、なるほど図書館の作業らしい出来ばえになっている。たとえば2002年の中間選挙のアーカイヴは、それ以前の年度のコレクションと比べても一段とデータが整理されている。上下院選・知事選などの選挙別、州別、候補者別に分類されてそれぞれのサイトにアクセスできる。候補者のサイトはもちろんもともとはてんでんばらばらの時期にあちこちのサーバーに作られた。ふつうは検索などを使って探し当てることになるわけだが、「ミネルヴァ」にコレクションされたものは整然と並んでいて、ウェブ(蜘蛛の巣)とはいささか趣の異なった秩序が形成されている。
 それぞれの候補者のサイトにアクセスしようとするとフロントページが現われ、サイト名や候補者名、サイトの概要、分類、収集日(日にちをおいてサイト・データを何度もキャッシュしているから、いつからいつまでとなっている)と、いかにも図書館の作業らしくフォーマットが統一された形で情報が書きこまれている。分類やカタログ化に習熟してきた人々がコレクションすると、無秩序なウェブが別物のようになることが実感される。実際、議会図書館のほかの収集物の分類といかに整合性をとりながらウェブの特質にあったカタログ化をするかは、準備作業の過程で重要な検討項目になっていたそうだ。

すべてを集めることの意味、選ぶことの意味
 セレクションや分類、カタログ化という点で、「ミネルヴァ」のサイトの収集・保存作業は、このように「インターネット・アーカイヴ」の作業とは明らかに異なっている。現在の「ミネルヴァ」のように選択的収集をするよりも、じつはすべてを集めることにしたほうがずっと安上がりらしい。「インターネット・アーカイヴ」と比較してコストが百倍ぐらいちがうと議会図書館のスタッフは言っている。しかし、選択的収集は、サイトを絞ることで丁寧に収集しカタログ化でき、研究者が利用しやすい形に整理できる。経費はかかるものの、議会図書館の仕事にはふさわしいと考えたのだそうだ。
 とはいえ、いずれはまるごと、少なくともアメリカのドメインのものすべてを集める必要性も感じているという。包括的な収集は、重要人物の学生時代のサイトなど先々価値の出てくるサイトを保存できる。選択的収集とは別の意味で研究者に役立つはずだ。著作権のことを考えても、国の権限として集めるほうがより広範な収集ができるし、永続的な保存のためにも「インターネット・アーカイヴ」まかせにはできないということのようだ。「インターネット・アーカイヴ」のような組織は柔軟だが、柔軟ということは不安定の裏返しであり、長期間活動し続けられるかどうかは保証のかぎりではない。また、収集の方向性も変わってくる恐れがあると、議会図書館は見ている。

民間との協力
 しかし、さしあたりは小まわりがきく民間組織と大所帯の国の組織が補い合ってアーカイヴ化を進めるのが好都合と考えているようだ。「インターネット・アーカイヴ」以外にも、ニューヨーク工科大学とワシントン大学の研究者からなるWebArchivist.orgという組織がウェブ・サイトのコレクションの方法についての研究に加わっている。
 日本の国会図書館もウェブ・サイト保存プロジェクトを進めているが、民間組織とのこうした連携は感じられない。インターネットが大きな威力を発揮する21世紀の文化のありようは、民間組織、とくにNPOに積極的な価値を認めるかどうかが大きく左右する。そうした連携のなさが、こうした作業にも大きく関わってくると思われるが、それについては次回とりあげよう。
[ うただ あきひろ ]
前号 次号
掲載/歌田明弘|掲載/影山幸一
ページTOPartscapeTOP 
DNP 大日本印刷 ©1996-2007 DAI NIPPON PRINTING Co., Ltd.
アートスケープ/artscapeは、大日本印刷株式会社が運営しています。
アートスケープ/artscapeは、大日本印刷株式会社の登録商標です。
artscape is the registered trademark of DAI NIPPON PRINTING Co., Ltd.
Internet Explorer5.0以上、Netscape4.7以上で快適にご利用いただけます。