世界最大のマルウェア ソース コード コレクションを所有していると主張する研究チームである vx-underground は、最近、ソーシャル プラットフォーム X に、現在保存されているマルウェア データの総量が約 30 TB (テラバイト) であると投稿しました。その直後、オンライン マルチエンジン ウイルス スキャン サービス VirusTotal の創設者である Bernardo Quintero 氏は、ユーザーが長年にわたって VirusTotal に送信したマルウェア サンプルの総数が約 31 ペタバイト (ペタバイト) に達したと返信で述べました。一般的に使われている換算によれば、1ペタバイトは約1000テラバイトに相当し、両者のデータ規模は一般ユーザーの直感的な想像をはるかに超えていることになります。

サイバーセキュリティ企業、人工知能研究者、脅威インテリジェンス機関は一般に、このタイプのマルウェア サンプル ライブラリを、検出モデルのトレーニング、攻撃手法の進化経路の研究、および新しい脅威の分析のための重要な基礎データとみなしています。ただし、多くの場合、テラバイトやペタバイト単位で測定されるこれらのデータが数値に抽象化されると、それらがどれくらい「大きい」かを物理世界で参照するのが困難になることがよくあります。したがって、誰かがかなり生々しい質問を提起しました。このすべてのデータが従来のハード ドライブに保存され、1 つずつ積み重ねられた場合、これらの「マルウェア バンク」はどれくらいの高さに積み上げることができますか?現実世界のランドマーク的な建物とどう違うのでしょうか?

TechCrunchの記者はニュースルームのAIチャットボットにこの質問を試みたが、得られた答えは「信じられないほどとんでもない」もので、断念せざるを得なかった。そこで編集チームは最も直接的な方法、すなわち紙とペンを取り出し、常識に基づいて「ナプキンの裏で大まかな計算」を行うことに切り替えました。 vx-underground と VirusTotal の両方がデータ量を「およそ TB/PB」という単位で表現していることを考慮して、記者もこの「およそ」のアプローチに従いました。

読者が直感的な概念を形成しやすいように、記者は標準的な 1 TB 3.5 インチのデスクトップ機械式ハード ドライブが使用されると仮定しています。このタイプのハード ドライブは、一般的なシャーシに収まるように基本的に同じ物理サイズで、高さは約 1 インチ (約 2.54 cm) です。この前提の下では、「ハードディスクを 1 つずつ持ち上げる」効果をシミュレートするには、「高さ」の寸法にのみ注意する必要があります。また、この記事では、控除を簡素化するために、公称容量と実際に使用されるハードディスクの空き容量との差を無視し、公称 1 TB に基づいて直接計算しています。

オンライン ストレージ ユニット変換ツールの結果によると、vx-underground は約 30 TB のマルウェア データを主張しており、これは 1 TB ハード ドライブ 30 台の容量にほぼ相当します。これら 30 台のハード ドライブを下から上に積み重ねると、高さは約 30 インチ、つまり約 2.5 フィート (1 メートル未満) になります。記事の著者は自分の身長を比較として使用しました。彼の身長 6 フィート (約 1.83 メートル) に比べれば、このようなハードドライブの積み重ねは足元に積み上げられた小さな箱に似ています。

視点が VirusTotal に変わると、この比較はすぐに「規模のジャンプ」が発生します。合計 31 PB の容量を換算すると、これを完全に収容するには約 31,744 台の 1 TB ハード ドライブが必要になります。同じ「垂直に積み重ねる」方法を使用すると、ハードドライブで構成されるこの「データタワー」の理論上の高さは約2,645フィート(約806メートル)に達します。世界の超高層ビルのリストでは、この高さはドバイにある世界一高いビル、ブルジュ・ハリファの約2,722フィート(約829メートル)にすでに迫っている。

言い換えれば、VirusTotal のマルウェア サンプルをハード ドライブだけでできた柱とみなした場合、その高さはブルジュ ハリファよりわずか 80 フィート未満しかなく、この「垂直都市」のスカイラインに匹敵するには十分です。記者はまた、もう一つの象徴的な参考として、高さ約 1,083 フィート (約 330 メートル) のパリのエッフェル塔を選びました。この記事の大まかな見積もりによると、VirusTotal が現在蓄積しているマルウェア サンプルの量は、「エッフェル塔 2 つ半」もの高さのハード ドライブのスタックにほぼ相当します。

TechCrunchは、複数の参照オブジェクトを高さに応じて高いところから低いところへ水平に並べた情報可視化の模式図をレポート内で配布した。左から右へ:高さ約8,722フィートのブルジュ・ハリファ。高さ約 2,645 フィートの VirusTotal のハードドライブの「データタワー」。高さ約 1,792 フィートのワン ワールド トレード センター。高さ約1,083フィートのエッフェル塔。身長6フィートの記者自身。そして高さわずか約 2.5 フィートの小さなハードドライブのスタックは、vx-underground の 30 テラバイトのデータを表します。この配置により、読者は、異なる「マルウェア バンク」間のデータ サイズの大きな差をはっきりと感じることができます。

報告書は最後に、これらの驚くほど大規模なマルウェア サンプル ライブラリがセキュリティ研究の「必需品」であるだけでなく、今日のネットワーク脅威状況の大きな影を目に見えない形で描写していることを指摘しました。セキュリティ企業や研究者がこれらのデータの山を検索、ラベル付け、モデル化するとき、実際には次の攻撃の波の手がかりをできるだけ早く発見するために「目に見えない塔」と競争していることになります。