以前ブログで「Microsoftのサポートページに載っているファイルがリンク切れを起こしているときは?」という記事を書いたのですが、思っていたよりアクセスがあったので、今回は続編としてDownload Centerのファイルがリンク切れを起こしているときの、私なりの対処法を紹介したいと思います。
利用するのはご存じ「Internet Archive(Wayback Machine)」。
Internet Archiveといえば、国立国会図書館インターネット資料収集保存事業(WARP)でも紹介されている超有名サイトで、このサイトを利用すれば消えてしまったWebサイトも見ることができます。
使い方は上記WARPのページを見れば分かると思いますが、このInternet Archive、「How did I end up on the live version of a site? …」にもあるように、「*」を使ってワイルドカード検索することもできます。
例:
上記テキストボックスのリンクを開くと、下図のようにアーカイブされたページがリスト表示されます。
ここまでくればもうお分かりだと思いますが、Internet Archiveを使えば、アーカイブされたMicrosoft Download Centerのファイル一覧を取得することができるわけです。
肝心のDownload Centerのファイルですが、URLは
のようになっているので、不定部分をアスタリスク(*)に置き換えたリンク、
を開けば一覧を取得できます。
・・・が、アーカイブされたファイルの量は膨大で(確認時で12万件弱)、ページの容量も60MB程度あるので、ページを丸ごとローカルに保存した後、目的のファイルのリンクを調べた方が良いかもしれません。
目的のファイル名が分かっていないとあまり意味はないし、必ずしもファイルがアーカイブされているわけではありませんが、どうしてもお困りの方は一度試してみてください。
■ 編集後記
Internet Archive上のファイルって著作権的にはどうなのかな?と疑問だったので以前は上記方法は紹介しなかったのですが、WARPのページに下記のような記述があったので、今回記事を書くことにしました。
インターネットアーカイブがこれほど大規模にウェブアーカイブを構築できるのはフェアユースに基づいているからです。米国では著作権にフェアユースと呼ばれる規定があります。著作物を利用する場合に、それが公正な利用であれば著作権の侵害には当たりません。その規定を基にWayback Machineは運営されています。
Internet Archive“Wayback Machine” より
それに、問題があればサイト管理者 = MicrosoftからInternet Archiveに削除申請を出しているはずなので、大丈夫でしょう!
たぶん・・・。
この記事へのコメントはありません。