互联网图书馆：一个储存近20年绝大部分网页历史版本的海量信息在吸纳图书馆，被称作互联网“时光机”

2022-02-16

网站分享

互联网档案馆（网址web.archive.org），是一个公益项目，专门收集互联网上的各种信息，例如视频、音频、网页等等并存储在他家的服务器中。

互联网档案馆（英语：Internet Archive）是美国的一个由Alexa创始人布鲁斯特·卡利创办于1996年的非营利性的、提供互联网多媒体资料文件阅览服务的数字图书馆，总部位于加利福尼亚州旧金山的列治文区，其使命是“普及所有知识”（英语：universal access to all knowledge.）[注 1][注 2]。该“档案馆”提供的数字资料有如网站、网页、图形材料音乐、视频、音频、软件、动态图像和数百万书籍等的永久性免费储存及获取的副本。迄至2012年10月，其信息储量达到10PB（即10,240TB）[5][6]。除此之外，该档案馆也是网络开放与自由化的倡议者之一。

其中值得关注的就是他们的网页备份项目。这个项目已经做到了对于非常多的网页，对于每一个版本都留下了历史记录。即通过这个项目可以访问大多数网页的任意时间节点的版本，即使这个网站本身已经关停

以百度为例，我可以选择20年前、10年前的版本进行查看，可以看到除了Flash由于已经被淘汰不能播放之外，其他内容都很清晰。

链接地址：百度在线网络技术(北京)有限公司 (archive.org)

大家也可以用这个项目看看阿里、腾讯等网站以前的样子。只需要在最上方地址处进行修改，然后左右箭头条件时间就可以了。

附注：

由于这个项目的体量非常庞大，在其中检索访问数据时会比较慢，也是可以理解的。

参考：