离线浏览
此条目可能包含原创研究。 (2013年1月14日) |
此条目没有列出任何参考或来源。 (2013年1月14日) |
离线浏览(Offline Browsing,又称脱机浏览,俗称扒站)是指用户将网络的共享文件或网页文件存储至本地,便于浏览存储文件。用户有可能会因为以下原因而需要离线浏览:
- 获得网站中的图片、音频等不易复制的资源
- 防止网页丢失或者迁移的风险
- 成为个人信息管理(PIM)的知识储备更为稳定
- 保存动态网页中的资料
离线浏览在网费昂贵而且稍后读软件不够普及(类似Pocket和Safari中内置的阅读列表)时可以方便于阅览,但是在网费低廉同时又有大量优秀的稍后读软件时,离线浏览仍然有其需要的地方。
扒站软件
扒站软件的原理是利用服务器提供给客户端的源代码为基础并分析其中的连接和文件来完成过程。完成下载整个网站的时间,则跟网站的深度、网站的文件数目、网站的文件大小有关。如果网站的结构越深越复杂,所需要下载的时间则越多。
比较优秀的扒站软件会分析其中重复的链接,可以在条件中设置排除或者是要抓取的网站目录、文件类型或者是文件名称,从中以比较快的方式分析结构纳入抓取调度,如果结构非常的复杂,则还需要用户电脑的运算速度所影响。
而网站的文件数目、文件大小则影响下载的速度,增加速度的方式可经由用户网络环境的速度、或者是网络连线的数目去做调整,越大的网络速度、越多的网络连线数目可以有效的增加扒站的速度。
离线浏览共享文件
网络上的共享文件或文件夹可以被指定为允许离线浏览。使用这种方式可以使你在网络接断开后,仍然能看到可以离线浏览的文件和新创建的文件,重新连接网络后,“同步管理器”将根据离线时所作的更改来更新网络文件。要注意到是在首次使用时,要先对本地脱机文件进行相关的设置。
离线浏览因特网文件
因特网上的网页甚至整个网站也可以被指定为允许离线浏览。你可以提前下载因特网上的网页或网站到本地磁盘,以便离线时浏览。
离线浏览网页
离线浏览网页就是在连接到因特网时快速打开感兴趣的网页,这样在断开连接时就可对刚刚打开过的网页进行离线浏览,任何支持临时文件的浏览器均可以用这种方式。这种离线浏览的方式可以有效节省连接到因特网的时间,在网费比较昂贵时应用比较广泛。但是必需要提前手工打开要浏览的网页,在想要离线浏览的东西比较多时显得效率比较低下。
离线浏览网站
离线浏览网站就是在连接到因特网时将整个网站或网站的一部分下载到本地,在断开网络时就可对下载下来的网站进行离线浏览,这种方式需要使用专门的软件,这类软件通常被称作离线网页浏览器(Offline Browser)。
使用专业的离线浏览器下载网站
使用专业的离线浏览器(如Webzip、Teleport)允许你用更加定制的方式将网站下载到本地,软件内置多线程可以获得更快的下载速度,并且支持将下载的网站保存成一个文件,加快检索的速度的同时减少所占的空间。甚至可以将网站镜像保存在移动介质中,供完全没有网络连接到计算机使用。
使用扒站软件会将整个网站的资料内容复制回自己本机硬盘里,因为扒站软件时常一次发出许多的连线数,使得服务器的硬件资源无法承受,且占去网站的带宽,导致连线速度变的很缓慢,甚至是服务器主机死机,导致真正有浏览网站的需求的网友无法连上网站。
扒站软件
- Teleport Pro,俗称“瑞士刀”,为共享软件,原创公司:Tennyson Maxwell Information Systems, Inc. (页面存档备份,存于互联网档案馆)。
- HTTrack,为自由软件,原创公司:Xavier Roche & Yann Philippot. (页面存档备份,存于互联网档案馆)。
- wget,为自由软件,操作系统:UNIX。
预防办法
限制带宽
限制带宽的缺点是,倘若网站有提供文件下载,那么用户可能会不满文件的下载速度。
屏蔽IP地址
屏蔽IP地址是经由网站服务器的LOG档或者是服务器防火墙去分析不正常且频繁的浏览要求。
例如:一个IP地址瞬间同时开启许多页面(一般正常的浏览者不可能在一段时间内达到每秒数个页面同时浏览,发生这种状况则非常有可能是被扒站)