米国人の「つぶやき」全て保管へ、議会図書館
このニュースをシェア
【1月24日 AFP】世界で最も多い書籍を所蔵する米議会図書館(US Library of Congress)が、より軽量ではるかに短命なものを保管するという膨大な仕事を自らに課した――ツイッター(Twitter)で米国人が発した千億ものツイート(つぶやき)だ。
米ワシントンD.C.(Washington D.C.)の由緒ある議会図書館は、米国人が毎日投稿する4億ツイートの全てを集めている。国民の語りの記録として、それぞれのツイートが小さいながらも重要な役割を担っているとの信念からだ。
「議会図書館のミッションの要素には、アメリカの物語を収集し、研究価値のあるコレクションを手に入れることがある」と、議会図書館広報責任者のゲール・オスターバーグ(Gayle Osterberg)氏は語る。
議会図書館には、膨大な数の書籍や歴史資料が所蔵されている。オンラインアーカイブにはこれに加え、米国人の手からなる大量の資料が2世紀以上分ある。
そして今度は、議会図書館は米国人による140文字までの短文インターネットメッセージの保管者になろうとしている。ツイッター社は2010年、ツイッター社が創設した06年以降のツイートへのアクセス権を米議会図書館に与える契約を交わしている。
■ツイート数1700億件、保管上の難題
図書館側の大きな課題は、現在1700億件にも上るツイートを保管することだ。ツイッターのアクティブユーザー数は先月、2億ユーザーを突破している。この大半は米国在住者だ。削除されたツイートや非公開設定のツイートは収集しないという。
後世のために保管されるメッセージの中には、ツイッターの創設者ジャック・ドーシー(Jack Dorsey)氏が送った史上初めてのツイートや、バラク・オバマ(Barack Obama)米大統領が2008年11月に初当選したときの名高いツイートなどがある。
「われわれは歴史を作った。これら全てのことが起きたのは、あなたが時間と才能と情熱を注いでくれたからだ。これら全てのことが起きたのは、あなたのおかげだ。ありがとう」と、オバマ大統領は当時ツイートした。
伝統的な紙媒体の書籍や、あるいはウェブサイトとも異なり、ツイートを保管することの最大の課題は、ツイートの数がほとんど指数関数的に増加し続けているところににある。
議会図書館の集めたツイートは、米コロラド(Colorado)州ボルダー(Boulder)に本社を構えるGnip社が保管している。Gnipはこのために13万3000ギガバイト以上の保存領域を準備した。
Gnipによると、特に課題なのが、2011年3月の東日本大震災のように世界中が見守るニュースが起きたときなどの「ピーク時」におけるツイートの収集という。東日本大震災では、毎秒数千ツイートが投稿されていた。
収集したデータの閲覧も難関だ。世界中の研究者がこのアーカイブにアクセスを希望しているものの、ツイッターの最初の4年間にあたる2006~10年の範囲だけの検索でも、およそ24時間かかるという。
米コーネル大学(Cornell University)のリー・ハンフリーズ(Lee Humphreys)助教(コミュニケーション学)は、手短なオンラインメッセージは「そのメッセージが作り出された場所の文化について」雄弁に明らかにすることができると語っている。(c)AFP/Anne Renaut
米ワシントンD.C.(Washington D.C.)の由緒ある議会図書館は、米国人が毎日投稿する4億ツイートの全てを集めている。国民の語りの記録として、それぞれのツイートが小さいながらも重要な役割を担っているとの信念からだ。
「議会図書館のミッションの要素には、アメリカの物語を収集し、研究価値のあるコレクションを手に入れることがある」と、議会図書館広報責任者のゲール・オスターバーグ(Gayle Osterberg)氏は語る。
議会図書館には、膨大な数の書籍や歴史資料が所蔵されている。オンラインアーカイブにはこれに加え、米国人の手からなる大量の資料が2世紀以上分ある。
そして今度は、議会図書館は米国人による140文字までの短文インターネットメッセージの保管者になろうとしている。ツイッター社は2010年、ツイッター社が創設した06年以降のツイートへのアクセス権を米議会図書館に与える契約を交わしている。
■ツイート数1700億件、保管上の難題
図書館側の大きな課題は、現在1700億件にも上るツイートを保管することだ。ツイッターのアクティブユーザー数は先月、2億ユーザーを突破している。この大半は米国在住者だ。削除されたツイートや非公開設定のツイートは収集しないという。
後世のために保管されるメッセージの中には、ツイッターの創設者ジャック・ドーシー(Jack Dorsey)氏が送った史上初めてのツイートや、バラク・オバマ(Barack Obama)米大統領が2008年11月に初当選したときの名高いツイートなどがある。
「われわれは歴史を作った。これら全てのことが起きたのは、あなたが時間と才能と情熱を注いでくれたからだ。これら全てのことが起きたのは、あなたのおかげだ。ありがとう」と、オバマ大統領は当時ツイートした。
伝統的な紙媒体の書籍や、あるいはウェブサイトとも異なり、ツイートを保管することの最大の課題は、ツイートの数がほとんど指数関数的に増加し続けているところににある。
議会図書館の集めたツイートは、米コロラド(Colorado)州ボルダー(Boulder)に本社を構えるGnip社が保管している。Gnipはこのために13万3000ギガバイト以上の保存領域を準備した。
Gnipによると、特に課題なのが、2011年3月の東日本大震災のように世界中が見守るニュースが起きたときなどの「ピーク時」におけるツイートの収集という。東日本大震災では、毎秒数千ツイートが投稿されていた。
収集したデータの閲覧も難関だ。世界中の研究者がこのアーカイブにアクセスを希望しているものの、ツイッターの最初の4年間にあたる2006~10年の範囲だけの検索でも、およそ24時間かかるという。
米コーネル大学(Cornell University)のリー・ハンフリーズ(Lee Humphreys)助教(コミュニケーション学)は、手短なオンラインメッセージは「そのメッセージが作り出された場所の文化について」雄弁に明らかにすることができると語っている。(c)AFP/Anne Renaut