2.1.1. Web的基本原理
Web应用遵循客户端/服务器(C/S)的架构模式。其中,客户端被称为Web客户端; 服务器被称为Web服务器。 一个典型的Web应用系统通常是三层体系架构,即数据层、逻辑层和表现层,如图2. 1所示。 很多情况下,Web客户端是Web浏览器。 因此,Web应用架构也被称为浏览器/服务器(B/S)架构。 Web应用的基本工作流程如下:
用户使用Web客户端(往往是Web浏览器), 通过在地址栏上输入网络资源的URL( Uniform Resource Locator;统一资源定位符)地址, 或点击网页上的URL链接,向Web服务器发出请求;
Web服务器收到请求后,搜索服务器上存储的文件或脚本, 并将文件或执行脚本得到的结果返回给Web客户端;
Web客户端收到响应结果,并把返回的结果渲染和显示出来。

Fig. 2.1 一个基本Web应用的三层架构
HTn>、URL和HTML是WWW技术的三大基石。这些协议由Tim Bemers-Lee提出,现在已成为国际标准,由W3C(世界万维网联盟)管理与维护,以下分别对其进行简要介绍。
HTTP
大多数Web应用中涉及两个或多个组成部分,因此需要定制一套各组成部分都应该遵循的规范。 HTIP作为一种协议,则是定义了一套Web服务器与客户端进行请求和应答时所应遵守的规范。 例如,HTTP 请求和应答信息都包含消息头和消息体,根据 HTTP 协议, Web服务器知道把哪些信息放在消息头中、哪些放在消息体中, Web客户端也知道应当到消息头中和消息体中读取哪些信息。
HTTP 共定义了八种请求方式,分别为
GET
、
POST
、
HEAD
、
PUT
、
DELETE
、
TRACE
、
OPTIONS
和
CONNECT
,其中
GET
和
POST
最为常用。 HTTP 消息头中包含缓存控制信息、内容类型和状态码等。 HTTP 协议的主要特点包括
HTTP S (Secure Hypertext Transfer Protocol;安全超文本传输协议)是建立在安全套接层之上的安全版 HTTP 。在普通 HTTP 连接中,服务器和客户端间传输的数据可以被拦截; 而 HTTP S通过加密避免数据被窃听,通常用来传输敏感数据,如用户的个人信息、登录密码和信用卡信息。 采用 HTTP S协议的网站需要在服务器上安装认证机构所颁发的证书文件。
URL
URL是描述Internet上网页和其他资源地址的一种标识方法。简单来讲,
URL就是Web地址,俗称“网址”。每个网页都有一个全球唯一的URL标识。 就像现实生活中街道地址用来定位家庭住址一样,网址是用来定位万维网上成千上亿的网页的。 没有URL, Web客户端就无法找到Web服务器上的资源; 没有URL,互联网上的资源也不能相互连接形成万维网。
URL的基本格式是
Protocol : //hostname [ : port ] /filepathname ? query—string
Protocol
(协议):指客户端与服务器间的传输协议, 常用的有 HTTP 、 HTTP S、FTP和MMS等协议;
hostname
(主机名)或IP地址:是指存放资源的服务器;
Port
(端口号):省略时系统将使用默认端口。例如, HTTP 默认端口为80; HTTP S默认端口为443;
path
(文件路径):表示Web服务器上资源存放的目录和文件名 (这些目录和文件名可以是虚拟的,即不是真正的文件路径);
query_string
(查询字符串):可选,用于向Web服务器发送 HTTP 请求参数。
HTML
HTML是用于创建网页的主要语言,目前大多数网页源代码都使用这种格式。 与Word文档相似,HTML也包含内容、布局和格式等信息。 当Web页面被加载到Web浏览器时,Web浏览器解释HTML代码,按照其中指定的格式显示网页内容。 作为一种标记语言,HTML本质上是一个由一套标签所标识的纯文本文件, 如head、body、table、center和fonts等标签。 此外, HTML的外观和布局信息可由CSS(cascading style sheets;层叠样式表)来定义。 CSS可以直接包含在HTML文件中,或者存放在一个单独的文本文件中被HTML引用。
发展到今天,HTML标准将逐渐更替为HTML5。 HTML5是包括HTML、CSS和JavaScript在内的一套技术组合,它希望能够在不依赖AdobeFlash和Mi¬crosoft Silverlight 等插件的情况下实现丰富的互联网应用。 HTML5添加了许多 新的语法特征,其中包括