万维网WWW是World Wide Web的简称,也称为Web、3W等。WWW是基于
客户机/
服务器方式的信息发现技术和
超文本技术的综合。WWW服务器通过超文本标记语言(HTML)把信息组织成为图文并茂的超文本,利用链接从一个站点跳到另个站点。这样一来彻底摆脱了以前查询工具只能按特定路径一步步地查找信息的限制。
概念
WWW (World Wide Web,万维网)是存储在
Internet计算机中、数量巨大的
文档的集合。这些文档称为
页面,它是一种
超文本(
Hypertext)信息,可以用于描述
超媒体。
文本、
图形、
视频、
音频等
多媒体,称为超媒体(
Hypermedia)。Web上的信息是由彼此关联的文档组成的,而使其连接在一起的是
超链接(
Hyperlink)。
相关概念
超文本
超文本(Hypertext)是由一个叫做网页浏览器(Web browser)的程序显示。
网页浏览器从网页服务器取回称为“文档”或“网页”的信息并显示。通常是显示在计算机显示器。人可以跟随网页上的超链接(Hyperlink),再取回文件,甚至也可以送出数据给服务器。顺着超链接走的行为又叫浏览网页。相关的数据通常排成一群网页,又叫网站。
网上冲浪
网上冲浪(Surfing the Internet,浏览网络),最早由一个叫简・阿莫尔・泡利(Jean Armour Poly)的作家通过他的作品《网上冲浪》使这个概念被大众接受。这本书由威尔逊出版社在1992年6月正式出版。泡利在互联网领域被称作“网络妈妈”(Netmom)。
网页、网页文件和网站
网页是网站的基本信息单位,是WWW的基本文档。它由文字、图片、动画、声音等多种媒体信息以及链接组成,是用HTML编写的,通过链接实现与其他网页或网站的关联和跳转。
网页文件是用
HTML(
标准通用标记语言下的一个应用)编写的,可在WWW上传输,能被浏览器识别显示的文本文件。其扩展名是.htm和.html。
网站由众多不同内容的网页构成,网页的内容可体现网站的全部功能。通常把进入网站首先看到的网页称为首页或主页(homepage),例如,
新浪、网易、
搜狐就是国内比较知名的大型门户网站。
HTTP和FTP协议
HTTP是Hypertext Transfer Protocol的缩写,即
超文本传输协议。 顾名思义,HTTP提供了访问超文本信息的功能,是WWW浏览器和WWW服务器之间的应用层通信协议。HTTP协议是用于分布式协作超文本信息系统的、通用的、面向对象的协议。通过扩展命令,它可用于类似的任务,如域名服务或分布式面向对象系统。WWW使用HTTP协议传输各种超文本页面和数据。
HTTP协议会话过程包括4个步骤。
(1)建立连接:客户端的浏览器向服务端发出建立连接的请求,服务端给出响应就可以建立连接了。
(2)发送请求:客户端按照协议的要求通过连接向服务端发送自己的请求。
(3)给出应答:服务端按照客户端的要求给出应答,把结果(
HTML文件)返回给客户端。
(4)关闭连接:客户端接到应答后关闭连接。
HTTP协议是基于TCP/IP之上的协议,它不仅保证正确传输超文本文档,还确定传输文档中的哪一部分,以及哪部分内容首先显示(如文本先于图形)等。
文件传输协议(FTP)是Internet中用于访问远程机器的一个协议,它使用户可以在本地机和远程机之间进行有关文件的操作。FTP协议允许传输任意文件并且允许文件具有所有权与访问权限。也就是说,通过FTP协议,可以与internet上的FTP服务器进行文件的上传或下载等动作。
和其他Internet应用一样,FTP也采用了客户端/服务器模式,它包含客户端FTP和服务器FTP,客户端FTP启动传送过程,而服务器FTP对其做出应答。在Internet上有一些网站,它们依照FTP协议提供服务,让网友们进行文件的存取,这些网站就是FTP服务器。网上的用户要连上FTP服务器,就是用到FTP的客户端软件。通常Windows都有ftp命令,这实际就是一个命令行的FTP客户端程序,另外常用的FTP客户端程序还有CuteFTP、Leapftp、FlashFXP等。 HTTP将用户的数据,包括用户名和密码都明文传送,具有安全隐患,容易被窃听到,对于具有敏感数据的传送,可以使用具有
保密功能的HTTPS(Secure Hypertext Transfer Protocol)协议。
超文本和超链接
超文本是把一些信息根据需要连接起来的信息管理技术,人们可以通过一个文本的链接指针打开另一个相关的文本,只要用鼠标点一下文本中通常带下划线的条目,便可获得相关的信息。网页的出色之处在于能够把超链接嵌入到网页中,使用户能够从一个网页站点方便地转移到另一个相关的网页站点。HTTP协议使用GET命令向Web服务器传输参数,获取服务器上的数据。类似的命令还有POST命令。
超链接是万维网上的一种链接技巧,它是内嵌在文本或图像中的。通过已定义好的关键字和图形,只要单击某个图标或某段文字,就可以自动连上相对应的其他文件。文本超链接在浏览器中通常带下划线,而图像超链接是看不到的;但如果用户的鼠标碰到它,鼠标的指标通常会变成手指状(文本超链接也是如此)。
超文本传送协议(外语缩写:
HTTP),它负责规定浏览器和服务器怎样互相交流。
超文本标记语言(外语缩写:
HTML、
标准通用标记语言下的一个应用),作用是定义
超文本文档的结构和格式。
URL
在WWW上,任何一个信息资源都有统一的并且在网上唯一的地址,这个地址就叫做URL。URL也被称为网页地址,是因特网上标准的资源的地址(Address)。它最初是由蒂姆·伯纳斯一李发明用来作为万维网的地址的。现在它已经被万维网联盟编制为因特网标准RFC1738了。
Internet地址
Internet地址又称IP地址,它能够唯一确定Internet上每台计算机、每个用户的位置。Internet上主机与主机之间要实现通信,每一台主机都必须要有一个地址,而且这个地址应该是唯一的,不允许重复。依靠这个唯一的主机地址,就可以在Internet浩瀚的海洋里找到任意一台主机。
互联网、因特网的区别
要回答这个问题,必须先回顾一下因特网的历史。因特网于1969年诞生于美国。它的前身“阿帕网”( ARPAnet)是一个军用研究系统,后来才逐渐发展成为连接大学及高等院校计算机的学术系统,现在则已发展成为一个覆盖五大洲150多个国家的开放型全球计算机网络系统,拥有许多服务商。
普通电脑用户只需要一台个人计算机用电话线通过
调制解调器和因特网服务商连接,便可进入因特网。因特网并不是全球唯一的互联网络。例如在欧洲,跨国的互联网络就有“欧盟网”( Euronet),“欧洲学术与研究网”(EARN),“欧洲信息网”(EIN),在美国还有“国际学术网”( BITNET)等。
这样一来它们之间的区别就比较明朗了。大写的“Internet”和小写的“internet”所指的对象是不同的。当我们所说的是上文谈到的那个全球最大的也就是我们通常所使用的互联网络时,我们就称它为“因特网”或称为“国际互联网”。这时“因特网”是作为专有名词出现的,因而开头字母必须大写。但如果作为普通名词使用,即开头字母小写的“internet”,则泛指由多个计算机网络相互连接而成一个大型网络。
按全国科学技术审定委员会的审定,这样的网络系统可以通称为“互联网”。这就是说,因特网和其他类似的由计算机相互连接而成的大型网络系统,都可算是“互联网”,因特网只是互联网中最大的一个。
国际标准的互联网写法是internet,字母i一定要小写。因特网是互联网的一种,它使用
TCP/IP协议让不同的设备可以彼此通信。但使用TCP/IP协议的网络并不一定是因特网,一个局域网也可以使用TCP/IP协议。判断自己是否接入因特网,首先是看自己电脑是否安装了TCP/IP协议,其次看是否拥有一个公网地址(所谓公网地址,就是所有私网地址以外的地址)。国际标准的因特网写法是 Internet,字母I一定要大写。WWW是基于客户机/服务器方式的信息发现技术和超文本技术的综合。
万维网与TTT
凡是上网的人,谁不知道“WWW”的重要作用?要输入网址,首先得打出这三个字母来。这三个字母,就是英语的“World Wide Web”首字母的缩写形式。“WWW”在中国曾被译为“环球网”、“
环球信息网”、“超媒体环球信息网”等,最后经
全国科学技术名词审定委员会定译为“
万维网”。国柱先生在《胡说集》《妙译WWW》一文中,对它的汉语对译词“
万维网”(Wan Wei Wang)大加赞赏,这是毫不过分的。“
万维网”这个近乎完美的对译词妙就妙在传意、传形、更传神,真是神来之译!
无独有偶,“WWW”的世界语的对译词“TTT”,也是由三个相同字母组成的,译得也令人叫绝。“TTT”是世界语的“Tut-Tera Teksa o”首字母缩写。据
俄罗斯世界语者Sergio Pokrovskij编写的《Komputada leksikono》(计算机专业词汇)上的资料,“WWW”最初的对译形式是“Tutmonda Tekso”,就在这一译名出现的当天,即1994年8月5日,便立即有人在网上建议改为“Tut-Tera Tekso”,8天后,也就是8月13日,才经另一人根据一位匿名者的提议,定译为“Tut-Tera Teksa o”(字面义为“全球网”)。这个译名的缩写TTT,形式整齐,语义完全吻合,好读、好记、好写。这是集体智慧的创造。它也雄辩地证明了世界语的表现力是很强大、很灵活、很有适应力的,比起汉语和英语来并不逊色(请比较一下WWW的
法语对译词“Forum elektronique mondial”和西班牙语对译词“Telarana Mundial”,它们的缩写形式分别是“FEM”和“TM”)。写到这里我不由得又想起中国近代翻译大师
严复先生的一句名言:“一名之立,旬月踟蹰”。一个好的译名只有在译者,有时甚至数位译者,长时间搜肠刮肚、苦苦思索后才能产生出来。
万维网是无数个
网络站点和网页的集合,它们在一起构成了
因特网最主要的部分(因特网也包括
电子邮件、Usenet以及
新闻组)。它实际上是多媒体的集合,是由
超级链接连接而成的。我们通常通过网络浏览器上网观看的,就是
万维网的内容。关于
万维网以及浏览万维网的一些世界语术语,我将在以后所发的帖子中陆续作些介绍。
Internet是一个把分布于世界各地不同结构的
计算机网络用各种传输介质互相连接起来的网络。因此,有人称之为网络的网络,中文译名为
因特网、英特网、国际互联网等。Internet提供的主要服务有
万维网(WWW)、
文件传输(FTP)、电子邮件(E-mail)、
远程登录(Telnet)、手机 (3GHZ) 等。
WWW(World Wide Web)简称3W,有时也叫Web,中文译名为
万维网,
环球信息网等。WWW由欧洲核物理研究中心(CERN)研制,其目的是为全球范围的科学家利用Internet进行方便地通信,信息交流和信息查询。
WWW是建立在客户机/服务器模型之上的。WWW是以超文本标注语言(
标准通用标记语言下的一个应用)与
超文本传输协议为基础。能够提供面向
Internet服务的、一致的用户界面的信息浏览系统。其中WWW服务器采用超文本链路来链接信息页,这些信息页既可放置在同一
主机上,也可放置在不同地理位置的主机上;本链路由
统一资源定位器(URL)维持,WWW
客户端软件(即WWW浏览器)负责信息显示与向服务器发送请求。
Internet采用超文本和
超媒体的信息组织方式,将信息的链接扩展到整个Internet上。用户利用WWW不仅能访问到Web Server的信息,而且可以访问到FTP、Telnet等网络服务。因此,它已经成为Internet 上应用最广和最有前途的访问工具,并在商业范围内日益发挥着越来越重要的作用。
硬件组成
客户机
客户机是一个需要某些东西的程序,而服务器则是提供某些东西的程序。一个客户机可以向许多不同的服务器请求。一个服务器也可以向多个不同的客户机提供服务。通常情况下,一个客户机启动与某个服务器的对话。服务器通常是等待客户机请求的一个自动程序。客户机通常是作为某个用户请求或类似于用户的每个程序提出的请求而运行的。协议是客户机请求服务器和服务器如何应答请求的各种方法的定义。WWW客户机又可称为浏览器。
通常的环球信息网上的客户机主要包括:Lynx、Mosaic、Netscape等。通常的服务器来自于CERN、NCSA、Netscape。让我们来看一下Web中客户机与服务器的具体任务。客户机的主要任务是:
(1)帮助你制作一个请求(通常在单击某个链接点时启动)。
(2)将你的请求发送给某个服务器。
(3)通过对直接图像适当解码,呈交HTML文档和传递各种文件给相应的“观察器”(Viewer),把请求所得的结果报告给你。
一个观察器是一个可被www客户机调用而呈现特定类型文件的程序。当一个声音文件被你的www客户机查阅并下载时,它只能用某些程序(例如,Windows下的“媒体播放器”)来“观察”。通常www客户机不仅限于向Web服务器发出请求,还可以向其他服务器(例如,Gopher、FTP、news、mail)发出请求。
服务器
服务器的主要任务有:
(1)接受请求。
(2)请求的合法性检查,包括安全性屏蔽。
(3)针对请求获取并制作数据,包括Java脚本和程序、CGI脚本和程序、为文件设置适当的MIME类型来对数据进行前期处理和后期处理。
(4)把信息发送给提出请求的客户机。
原理流程
原理
当你想进入万维网上一个网页,或者其他网络资源的时候,通常你要首先在你的浏览器上输入你想访问网页的统一资源定位符( Uniform Resource Loca-tor,URL),或者通过超链接方式链接到那个网页或网络资源。这之后的工作首先是URL的服务器名部分,被命名为域名系统的分布于全球的因特网数据库解析,并根据解析结果决定进入哪一个IP地址(lP address)。
接下来的步骤是为所要访问的网页,向在那个IP地址工作的服务器发送一个Http请求。在通常情况下,HTML文本、图片和构成该网页的一切其他文件很快会被逐一请求并发送回用户。
网络浏览器接下来的工作是把HTML、CSS和其他接收到的文件所描述的内容,加上图像、链接和其他必需的资源,显示给用户。这些就构成了你所看到的“网页”。
流程
总体来说,WWW采用客户机/服务器的工作模式,工作流程具体如下:
不同之处
发展简史
与其说WWW是一种技术,倒不如说它是对信息的存储和获取进行组织的一种思维方式。从这个意义上说,它的历史要追溯到很多年以前。在因特网从研究专家使用的领域走向平常百姓使用的过程中,两项重要的创造发挥了关键的作用。这两项技术是超文本(hyper text)和图形用户界面(GUI)。
1945年,当时任美国科学研究和发展办公室(USOSRD)主任的范内瓦-布什(VannevarBush)在《大西洋月刊》(Atlantic Monthly)上发表了一篇文章,文章探讨科学家应如何把二战中获得的技术运用于战后的和平建设活动。文章提出了许多生动有趣的想法,涉及如何利用先进的技术来组织和利用信息资源。他推测,工程师最终将建成一种他称为Memex的机器,这是一种记忆扩展设备,它可以将一个人所有的书籍、磁带、信件和研究结果都储存在微型胶卷上。Memex带有机械的辅助设施,如微型胶卷阅读器和内容索引,可以帮助用户迅速灵活地找到资料。20世纪60年代,特德·尼尔森(Ted Nelson)描述了一种类似的系统,在这个系统中,一个页面的文本可以和其他页面的文本链接到一起。
Nelson把这种页面连接的系统称为超文本。与此同时,计算机鼠标的发明者道格拉斯·恩格尔巴特(Doug la sEn glebart)在大型计算机上创造了第一个实验性的
超文本系统。1987年,尼尔森出版了《文字机器》( Literary Machines),在这本书中,他介绍了Xana du计划,这个计划是一个进行在线超文本出版和商务的全球系统。
1989年,欧洲粒子物理实验室(CERN)的蒂姆·伯纳斯一李(Tim Berners-Lee)和罗伯特·卡利奥( Robert Calliau)开始着手改进实验室的研究档案处理程序。CERN当时连因特网已有两年时间了,但科学家想找到更好的方法在全球的高能物理研究领域交流他们的科学论文和数据。他们俩各自提出了一个超文本开发计划。
在接下来的两年,伯纳斯一李开发出了超文本服务器程序代码,并使之适用于因特网。超文本服务器是一种储存超文本标记语言(HTML)文件的计算机,其他计算机可以连这种服务器并读取这些
HTML文件。今天在WWW上使用的超文本服务器通常被称为WWW服务器。
超文本标记语言是附加在文本上的一套代码(标记)语言。这些代码描述了文本元素之间的关系。例如,HTML中的标记说明了哪个文本是标题元素的一部分,哪个文本是段落元素的一部分,哪个文本是项目列表元素的一部分。其中一种重要的标记类型是文本链接标记。
超文本链接( hyperlink)可以指向同-HTML文件的其他位置或其他HTML文件。
读取HTML文件的方式有很多,但大部分人所用的WWW浏览器是网景公司的Navigator或微软公司的InternetExplorer。WWW浏览器是一种软件界面,它可以使用户读取或浏览HTML文件,也可以使用户利用每个文件上附加的超文本链接标记从一个HTML文件转移到另一个HTML文件。如果这些HTML文件放在连人因特网的计算机上,用户就可以利用WWW浏览器从一台计算机上的一个HTML文件移到因特网上另一台计算机上的一个HTML文件。HTML的基础是标准通用标记语言(SGML),多年来各种机构一直用这种语言来管理大型的文档管理系统。
HTML文件和文字处理文件是不同的,它们的区别在于前者对一个特定文本元素的m现方式不做规定。例如,使用文字处理软件产生文件标题时,可以把标题文本的字体定义成Arial字体,字号定义成14磅,位置居中。无论何时用该文字处理软件打开这个文件,文件将严格按照上述设置显示或打印出来。与之相反,HTML文件只是在这个标题文本上简单地加上一个标题标记。很多程序都可以读取HTML文件。这些程序识别出标题标记,然后以自己的标题显示方式把这个标题文本显示出来。这时不同的程序对这个文本的显示就会是不同的。
WWW浏览器在其图形用户界面上以一种易读的方式把HTML文件显示出来。图形用户界面是一种向用户显示程序控制功能和输m结果的显示方式。它显示图片、图符和其他图形元素,而不仅仅显示文本。现在几乎所有的个人计算机都使用了微软的Windows或Macintosh等图形用户界面。
伯纳斯·李把他设计的超文本链接的HTML文件构成的系统称为WWW。WWW迅速在科学研究领域普及开来,但在此领域之外,几乎没有人有可以读取HTML文件的软件。1993年,伊利诺斯大学的马克·安德列森( MarcAndreessen)领着一群学生写出了Mosaic,这是第一个可以读取HTML文件的程序,它用HTML超文本链接在因特网上的任意计算机页面之间实现自由遨游。Mosaic是第一个广泛用于个人电脑的WWW浏览器。
程序设计人员很快意识到,用超文本链接构成的页面功能系统可以帮助因特网的众多新用户方便地获得因特网上的信息。企业界也发现了全球性的计算机网络所蕴藏的赢利机会。
1994年,安德列森和伊利诺斯大学Mosaic小组的其他成员同SGI公司的詹姆斯·克拉克(JamesClark)合作成立了网景公司。公司的第一个产品,基于Mosaic的网景Navigator浏览器,立即获得极大的成功。网景公司成为有史以来发展最快的一家软件公司。看到网景公司的成功,微软也不甘示弱,随即开发出了InternetExplorer浏览器。虽然还有其他的一些WWW浏览器供应商,但目前的浏览器市场几乎为这两种产品所垄断。
WWW网站数目的增长速度甚至超过了因特网自身的发展速度。据估计,全球的WWW网站已超过亿万家,WWW文件数可能已经不计其数。每个网站都可能含有数百甚至数千个独立的WWW页面。
社会影响
万维网使得全世界的人们以史无前例的巨大规模相互交流。相距遥远的人们,甚至是不同年代的人们可以通过网络发展亲密的关系或者使彼此思想境界得到升华。数字存储方式的优点是,可以比查阅图书馆或者实在的书籍更有效率地查询网络上的信息资源。可以比通过事必躬亲地去找,或通过邮件、电话、电报或者其他通信方式来更加快速地获得信息。
万维网是人类历史上最深远、最广泛的传播媒介。它可以使它的用户与分散于全球各地的其他人群相互联系,其人数远远超过通过具体接触或其他所有已经存在的通信媒介的总和所能达到的数目。
创建者轶事
奖赏
千年技术奖由芬兰技术奖基金会设立,是迄今世界上颁发的奖金数额最高的科学奖,每两年颁发一次,以表彰在科研或发明领域作出重大成就的个人或研究小组,奖金100万欧元(1100多万人民币)。首届“千年技术奖”于2004年6月15日授予有着“互联网之父”之称的英国科学家蒂姆·伯纳斯·李教授。
1989年的时候,如果蒂姆·伯纳斯·李为自己发明的万维网申请了知识产权,那么如今的互联网世界将完全是另外一个模样。
天下真有免费的午餐。蒂姆将自己的发明无私地奉献给了全世界,分文未取。他给无数人创造了暴富的平台,自己却一直苦于无钱修厨房。不过,有人却借机发了大财。比如Amazon的创办人杰夫·比佐斯、Yahoo的创始人杨致远、Netscape的创始人马克·安德森。蒂姆将自己的发明公布于众之后不久,网络公司便风起云涌。一夜之间,一批富翁呱呱坠地,宣告诞生。“万维网之父”却依然坚持着自己清贫的科研工作。
“千年技术奖”众望所归的首位得主。2004年6月15日,在芬兰埃斯波市的一个仪式上,芬兰技术奖基金会指定现年49岁的蒂姆·伯纳斯·李为“千年技术奖”这一全球最大的技术类奖的首位获得者,并颁发给他100万欧元的奖金。别人都是实至名归,蒂姆15年后才名至实归。
“这的确是个惊喜,”蒂姆说,“但金钱还不至于令我疯狂。100万欧元的奖金我得妥善分配。我家住郊区,子女上学不方便,另外,妻子总在抱怨,说我们该修修厨房了。”
1989年,在欧洲粒子物理研究所工作的蒂姆出于高能物理研究的需要发明了万维网。4年后,美国网景公司推出了万维网产品,顿时风靡全世界。万维网的诞生给全球信息的交流和传播带来了革命性的变化,一举打开了人们获取信息的方便之门。
“千年技术奖”评选委员会的主席佩卡·塔亚内将蒂姆的获奖称为“众望所归”。评委会8名成员在全部78位候选人当中,一致推举蒂姆为“千年技术奖”的首位获奖人。
在互联网的发展史中,有许多“之父”,比如E—mail的发明者雷·汤姆林森,发明了将不同计算机网络互联和互动系统的维顿·瑟夫和罗伯特·卡恩,但只有蒂姆发明了World Wide Web。
商业价值
回忆起当年自己发明创造,蒂姆谦虚地说:“它的发现不是源于‘尤里卡’式的瞬间灵感,也不像落到
牛顿头上证明了重力概念的苹果。相反,人们逐渐认识到,不拘一格地把各种主意结成一张网(即
web),能产生力量。网的诞生是对一种公开挑战的回应。”
“在超文本和计算机诞生后,我正好时间充裕,又不乏兴趣和爱好。落在我头上的任务就是把它们有机地结合起来。”
有人曾经问蒂姆:“你认为网上的商业活动和你最初的‘通过共享知识和互相协调实现联系’的动机有没有可能找到平衡点?”
蒂姆说:“没有必要为这种平衡下定义。在平衡状态下,当商用业务量增长时,协作性业务量就会下降,但它们并非在互相竞争。实际上,协作的商业价值更大。学会使用网络来更好地协同工作的公司也许就是最终胜出的公司。”
也许,在别人看来,蒂姆的一切举动都超凡脱俗。而在蒂姆眼里,生活就要顺其自然。