一、静态网页资源
1.静态网页资源介绍
在网页设计上,纯粹HTML格式的网页(可以包含图片、视频、JS(前端功能实现)、CSS(样式)等)通常被称为“静态网页”,早期的网站大多都是静态网页制作的。静态网页是相对于动态网页而言的,是指没有后台数据库、不含程序(如php、jsp、asp)和可交互的网页。
2.静态网页资源特点
静态网页资源的特点是,开发者编写的是什么,它显示的就是什么、一旦编写完成,就不会有任何改变。静态网页的维护和更新相比较麻烦,每个不同的网页都需要单独编辑更新,静态网页一般适用于更新较少的宣传展示型网站,是早起(2000年以前)很多中小网站展示的形式。
静态网页资源的对应程序及资源文件的常见扩展名为:
纯文本类程序或文件:如htm、html、xml、shtml、js、css等。
图片类文件或数据文档,如jpg、gif、png、bmp、txt、doc、ppt等。
视频类流媒体文件,如mp4、swf、avi、wmv、flv等。
静态网页资源有几个重要的特征:
(1)每个页面都有一个固定的URL地址,且URL一般以.htm、.html、.shtml等常见形式为后缀,而且地址中不含有问号“?”或“&”等特殊符号。
(2)网页内容一经发布到网站服务器上,无论是否有用户访问,每个网页的内容都是保存在网站服务器文件系统上的,也就是说,静态网页是实实在在保存在服务器上的文件实体,每个网页都是一个独立的文件。
(3)网页内容是固定不变的,因此,容易被搜索引擎收录(容易被用户找到)(优点)
(4)网页没有数据库的支持,在网站制作的维护方面工作面比较大,因此当网站信息很大时完全依靠静态网页制作的方式比较困难(缺点)。
(5)网页的交互性较差,在程序功能实现方面有较大的限制(缺点)。
(6)网页程序在用户浏览器端解析,并且不需要读取数据库,因此服务器端可以接受更多的并发访问。当客户端向服务请求数据时,服务器直接把数据从磁盘文件系统上返回(不作任何解析),待客户端拿到数据后,在浏览器端解析展现出来(优点)。
3.静态网页语言
常见的静态网页语言有html、js、css、xml、shtml等。
二、动态网页资源
1.动态网页资源介绍
所谓的动态网页是与静态网页相对而言的,也就是说,动态网页的URL后缀不是.htm、.html、.shtml、.xml、.js、.css等静态网页常见的后缀扩展名形式,而是以.asp、.aspx、.php、.js、.do、.cgi等形式作为后缀的,并且一般在动态网页网址中会有标志性的符号——“?,&”,此外,在大多数情况下后缀都需要有数据库的支持等。
2.动态网页资源特点
(1)网页扩展名后缀常见为:.asp、.aspx、.php、.jsp、.do、.cgi等。
(2)网页一般以数据库技术为基础,大大降低了网站维护的工作量。
(3)采用动态网页技术的网站可以实现更多的功能,如用户注册、用户登录、在线调查、投票、用户管理、订单管理、发博文等 。
(4)动态网页并不是独立存在于服务器上的网页文件,当用户请求服务器上的动态程序时,服务器解析这些程序并可能读取数据库返回一个完整的网页内容。
(5)动态网页中的“?”在搜索引擎的收录方面存在一定的问题,搜索引擎一般不会从一个网站的数据库中访问全部网页,或者出于技术等方面的考虑,搜索蜘蛛一般不会去抓取网址中的“?”后面的内容,因此在企业通过搜索引擎进行推广时,需要针对采用动态网页的网站做一定的技术处理(伪静态技术),以便适应搜索引擎的抓去要求。
(6)程序在服务器端解析,这相当于顾客点餐,饭店厨师做饭做菜,耗时长,效率低。由于程序在服务端解析,因此,会消耗大量的CPU和内存、I/O等资源,并且多数还要读取数据库等服务,因此,其访问效率远不如静态网页。
(7)在服务端解析动态程序的服务常见的有PHP引擎,Java容器(Tomcat、resin、Jboss、weblogic)。
三、伪静态网页
1.伪静态网页介绍
伪静态就是某些技术把动态网页的URL地址伪装成静态网页URL地址,但实质上用户访问的还是动态网页,只不过给用户看起来URL地址是符合静态网页地质特征的,因此,用户及某些搜索引擎会误认为是静态网页。
2.伪静态网页特点
从网站的URL地址看,伪静态表面上看起来是静态内容,这是通过rewrite规则来实现的URL地址重写。改写后的URL地址规范、美观,有利于搜索引擎抓取,以及提升用户访问体验。从表面看,两个地址都是伪静态的,因为伪静态网页还是动态网页,从性能上考虑,伪静态功能不但没有提升网站性能,反而会降低网站的性能。
3.伪静态网页作用
由于搜索引擎无法正确读取带参数的动态网页内容,造成网页中很多具有丰富信息的页面无法被搜索引擎收录,因此才有了伪静态技术,它的作用是把动态网页URL改成静态网页的URL,虽然同样是消除了动态网页中的参数,但是并不需要生成任何网页,仅仅是改变了网页地址路径,找我养的主要目的有两个,一是让搜索引擎收录网站内容,实现更多的用户访问企业网站内容,二是提升用户访问体验,动态地址带特殊符号等的URL看起来也不知道看着静态网页地址舒服。
4.伪静态网页的缺点
动态网页伪装静态网页,虽然可以让搜索引擎收录,并且可以提升用户访问体验,但伪静态网页并不能提示我那个网站的访问效率性能,从理论上说还会降低网站的性能,没有动态转静态网页效率高,但是对于一些并发不是超大的情况来说,或者是硬件资源充足的情况来说伪静态还是一个不错的实用功能,因为,要把动态网页真正转成静态网页,不是一朝一夕的事,需要技术团队同力配合才能行。
现在很多的大型网站都采用了动态网页生成静态网页的技术,消除动态网页中的参数,使搜索引擎收录更多的内容,达到优化网站的效果。当网站遇到访问瓶颈时,如果有技术力量将动态网页转化成静态网页,那就再好不过了,但是,有些更新频率很快的业务并不适合这么做,或者将动态转为静态有很大难度,这时就可以可考虑设置伪静态了。
5.伪静态网页小结
利用rewrite技术将动态伪装成静态网页(URL地址改写)。
便于搜索引擎收录提升用户访问量以及用户体验。
访问性能没有提升,并且转为伪静态网页会消耗资源,因此性能反而会下降。
如果为了性能,就尽可能将动态网页转换成真正的静态网页。
并发量不是很大或者动态更新过于频繁的时候,用rewrite实现伪静态也是不错的。
伪静态网页的实现过程,一般是由运营产品提出要求,开发和运维共同实现的。
四、生产Web架构优化实战方案
1.门户新闻业务
新闻的特点是一旦发布完成,几乎不会再改动网页内容。因此,对于新闻业务内容的静态化相比较简单。
第一步:程序要支持发布动态内功转成静态功能。
第二步:运营编辑人员发布新闻网页(内容进数据库,图片、视频进入存储)后,后台程序立刻将动态网页生成静态文件。
第三部:运维人员通过发布或事件触发把运营编辑生成的静态网页发布到时间搭建好好的公司缓存集群服务器上,或者把静态内容同步到购买的全国所有CDN服务器节点上,然后,再提供给用户访问浏览。
2.视频网站业务
视频网站和新闻网站类似,特点都是一旦发布完成,几乎不会再改动网页内容。因此,实现视频业务网站高效访问也很简单。
以优酷视频网为例,用户在上传视频时,需要经历转码—>审核的过程(大约一个小时),然后一些热点视频也可能会被提前推送同步到CDN的核心节点或全国所有CDN服务器节点,用户访问时才会更快。
3.Blog/BBS/SNS/微博社区业务/电商(如淘宝、京东)
五、网站流量度量术语
1.IP(Internet Protocol)
这里指独立的IP数,独立IP书是指不同IP地址的计算机访问网站时被计算的总次数。独立IP是衡量网站流量的一个重要指标。一般一天内相同IP地址的客户端访问网站页面只被计算一次,记录独立IP的时间可为一天过一个月,目前通用的标准为“一天”。
独立的IP地址不是很准确,却是IT技术人员比较关心的一个衡量网站的指标。
2.PV(Page View)
中文翻译为页面浏览,即页面浏览量或点击量,不管客户端是不是相同,也不管IP是不是相同,用户每次访问一个网站页面都会被计算一个PV。
用PV衡量网站时,PV数反映的是浏览某网站的页面数量,每刷新一次页面也算一次。因此,可以说PV数与来访用户的数量成正比,但PV数并不是真正的页面来访者数量,而是网站被访问的页面数量,因为一个来访者可能产生多个PV。
3.UV(Unique Visitor)
UV(独立访客),同一台客户端(PC或移动端)访问网站被计算为一个访客,一天内相同的客户端访问同一个网站只计算一次UV。UV一般是以客户端Cookie等技术作为统计依据的,实际统计会有误差。
考虑到一台客户端电脑可能会有多人 使用的情况,因此,UV(独立访客)实际上并不一定是独立的自然人访问。
六、企业网站对IP、PV、UV的度量
1.对IP的度量:
分析所有的Web服务器的访问日志,对IP地址去重后技术,这是IT人员的基本计算手段。
在网站额每一个页面结尾,嵌入JS等统计程序代码,待用户加载网页后,IP即传给统计IP的服务器,这种方法一般被第三方统计公司或企业内部开发日志分析程序时使用。
用第三方大家比较信任的统计工具例如:谷歌的统计(GA)。
IP的统计方法简单、易用,因此,成为了多数网站衡量网站流量的重要指标之一。
2.对PV的度量:
分析Web服务的访问日志(需要排除js、css及各种图片的 日志信息),只计算HTML、PHP结尾等页面数量。
在网站的每一个页面结尾,嵌入JS等统计程序代码,待用户加载网页后,访问数量即传给统计PV服务器,这种方法一般被第三方公司或企业内部开发日志分析程序时使用。
用第三方大家比较信任的统计工具例如:谷歌的统计(GA)。
3.对UV的度量:
通过客户端HTTP请求报文分析
通过Cookie鉴别
UV的度量相对IP和PV来说,不但麻烦,而且要开发比较复杂的程序系统才能得到期望的结果,因此,在Linux运维领域大家提及的较少,一般企业级运营人员可能会关注网站的UV。