公開または滅びる:データストレージと文明
ホームページホームページ > ニュース > 公開または滅びる:データストレージと文明

公開または滅びる:データストレージと文明

Jun 14, 2023

古代文明について考えるとき、誰を思い浮かべますか? ローマ人? ギリシャ人? 中国人? インド? エジプト人? スキタイ人、ムイスカ人、ガーナ人、あるいはケルマ人はどうでしょうか? 2 番目のグループは、すべて文字体系を持っていなかったため、すぐには認識できないかもしれません。 程度は低いものの、エトルリア人、ミノア人、あるいは彼らが書いたイースター島の住民にも同じことが当てはまりますが、誰も彼らの文章の読み方を覚えていません。 ロゼッタストーンが発見されるまでは、エジプト人ですら謎に包まれていました。 エトルリア語で書いた作者は、将来誰もその文章を読むことができなくなるとは考えていなかったのではないかと想像します。おそらく彼らは、自分の考えを永遠に記録していると思っていたのでしょう。 自信過剰? おそらく、しかし、どこかにビットとして保存されることが増えている私たちの文書はどうなるのでしょうか?

パンチカードや磁気メディアを持っていたときは、十分にひどいものでした。 読み取りが現実的ではなくなったテープ形式がいくつかあることは確かです。 磁気バブルカートリッジを読み取れますか? 何年も経った後でもそれは実行可能でしょうか? しかし、問題は現在さらに悪化しています。 Hackaday のバックコピーはどこにありますか? あなたの電子メールはどこにありますか? 「クラウド内」は決まり文句ですが、適切です。 1000年後にはGoogleサーバーは存在せず、現在Googleサーバーが使用している記憶媒体は、たとえそれを読みたい人がその方法を知っていたとしても、ゴミになる可能性が高い。

そして事態はさらに悪化します。 落書きが書かれた石や羊皮紙を見たら、それが何かを書いていると推測できます。 結び目のある紐を見つけたらどうしますか? インカ人は物事を記録するためにそのようなシステムを使用していました。 正確な読み方はまだわかりません。 将来の考古学者はフラッシュ カードやハードディスクから何を作るでしょうか? 私たちがストリギル(体を洗うために使用されるローマのナイフ)を使用するのと同じように、彼らもそのようなものを使用する可能性は低いです。 脈絡もなくこれらの 1 つを見たら、それは浴室用具ではなく、大工仕事の道具だと思うかもしれません。 あなたが文字の読み方を知っているなら、将来の考古学者はなぜ小さな箱の中に文字が書かれているかもしれないと考えるのでしょうか?

少なくとも一部の最も古いメディアは生き残る可能性があります。 パンチカードや紙テープはおそらく本と同じくらい丈夫です。 石版と同様に、それらがデータを保持していることは非常に明白であり、手でも簡単に解読できるはずです。

ただし、磁気に関するものは確実性が低いです。 テープベースの酸化物は永久に持続するわけではなく、テープ上の磁気情報はさらに脆弱です。 光メディアは長持ちするかもしれませんが、データがエンコードされていたことに気づくかどうかは、決して確実ではありません。 芸術品と間違われるかもしれません。 テープにも同じ問題があります。 将来、高床式の聖域を含む未知の宗教儀式に使用されたテープが展示される博物館が登場することを想像するのは簡単でしょう。

現代のメディアはフラッシュベースになる可能性が高く、それが永遠に続くわけではありません。 何かが付着している可能性があることに気づくのはさらに困難です。 今でも私の机の上には 6 台の USB デバイスがあり、その半分はフラッシュ ドライブではありませんが、見た目はあまり変わりません。

次に、すべてのクラウド データがあります。 確かに、実際にはハード ドライブ (磁気メディアまたはフラッシュ) のどこかに保存されます。 おそらく、将来の考古学者がどこかに埋もれたデータセンターを発見した場合、大量のデータのロックを解除できるかもしれませんが、それはそれが何であり、それを読み取る方法を理解した場合に限ります。

現在でも、あるシステムを持っていない場合、そのシステムで書き込まれたディスクを読み取るのは困難な場合があります。 いくつかの形式はほぼ普遍的であるため、一般的なケースではいくらか簡単になりましたが、例外的なケースは常に存在します。

ただし、思考実験として、あなたが 21 世紀の遺跡を研究する将来の考古学者であると想像してください。 アシスタントは、「32 GB、クラス 10」とマークされた、サムネイルと同じサイズの小さな黒い長方形を持ってきます。 まず、これがフラッシュ デバイスであることを認識する必要があります。 次に、電源を投入し、シリアル バス経由で適切なコマンドを送信してデータを引き出す方法を理解する必要があります。

しかし、楽しいことはまだ始まったばかりです。 データに関しては、ファイル システムの形式を理解する必要があります。 次に、さまざまな種類のファイルを詳しく調べるようになり、それぞれがそれ自体で科学プロジェクトになります。 PDFファイル? 画像とビデオ? 幸運を。 エジプト人がさまざまな目的にさまざまな象形文字のセットを使用し、冗長性を最小限に抑えるためにデータ圧縮を行った場合を想像してください。

このことを考えているのは私たちだけではありません。 たとえば、ゲッティンゲン大学は、過去 40 数年にわたって収集された 5 ペタバイトのデータを「永久」アーカイブとして管理しています。 彼らは、使用するテープの寿命は 20 ~ 30 年であると主張していますが、テープを管理する技術は 10 年しか持続しません。 そのため、データをある媒体から別の媒体に常に移動しており、完了するまでに約 2 年かかります。 もちろん、運用が停止した場合、300 年か 400 年後にはデータを回収できる可能性はほとんどなくなると想定できます。

データをクラウドに「永久に」保存するサービスには事欠きませんが、それをどのようにして実際に保証できるのか、またそれが機能しなかった場合にどのような意味があるのか​​を理解するのは困難です。 たとえば、Ardrive は分散方法でデータを保存するために「ブロックウィーブ」を使用していますが、これが中断される可能性のある方法は数多く想像できます。 大英図書館のデジタル保存責任者であるアダム・ファークハー氏は、「注意しないと、21世紀初頭よりも20世紀初頭についての方が多くのことを知ってしまうことになる」と述べている。

紙の記録がはるかに優れているというわけではありません。 紙は劣化します。 言語は失われます。 アレクサンドリアの図書館が燃えたことは有名です。 しかし、石は長持ちするようです。 皮肉なことに、ツタンカーメン王の父親であるアクエンアテンについては、エジプト人が彼の作品を破壊することで歴史から抹消しようとしたため、私たちは多くのことを知っています。 彼らは石を再利用し、多くの場合新しい建築物の基礎として使用したため、その多くが良好な状態で保存されていることがわかりました。

より特殊なストレージ メディアに移行するにつれて、問題はさらに悪化します。 データをガラスに保存する (下のビデオを参照) ことや、液体窒素を使用して 80K で分子を保存することについて読みました。 これらのどれも、現在私たちが使用しているものより明白で、より存続しやすいものはありません。 実際、その多くは問題を悪化させます。

彼らがどれほど真剣であるかはわかりませんが、「10億年アーカイブ」プロジェクトは、イーロン・マスクの宇宙旅行テスラのグローブボックスにアイザック・アシモフの財団三部作を収めた石英ディスクを送りました。 彼らはまた、2019年に月にライブラリを送ったようだ。しかし、これらのライブラリはDNAストレージを使用しており、今日では古いDNAを回収するのが困難であり、薄いニッケルフィルムに小さなテキストをエッチングすることによっても行われるため、これは奇妙に思われる。 その上、ヒッチハイクしていた探査機が墜落し、図書館の存続が危ぶまれている。

しかし、黙示録的な考古学者が月面をさまよい、金属箔といくつかの結晶の重要性を認識する様子を想像するのは難しい。 このことから、2 つの興味深い疑問が浮かび上がります。1 つ目は、遠い将来の明白なデータを、存続して理解できる方法でどのように保存できるでしょうか? この質問は、他の存在が何を解読できるかを理解するのが難しい、宇宙人のメッセージのようなものです。 その答えがなければ、私たちはいつかまた謎の「失われた文明」になってしまうかもしれません。

2 番目の質問は、これが以前に起こった場合はどうなるかということです。 それはおかしな科学のようなものですが、古代の遺物に情報がエンコードされていて、それが私たちに認識されなかったらどうなるでしょうか? もちろん、それらの中には私たちが見覚えのあるものもありますが、下のビデオのインカの結び目のように、それらについてどうすればよいのかわかりません。 これらの質問のいずれかに対する答えはありますか? コメントに残してください。

[バナー画像:『エジプト象形文字』マーティー・スワート著)

エンコーディングの問題