HTML的全称为超文本标记语言,是一种
标记语言。它包括一系列标签,通过这些标签可以将网络上的文档格式统一,使分散的Internet资源连接为一个逻辑整体。HTML文本是由HTML命令组成的描述性文本,HTML命令可以说明文字,图形、
动画、声音、表格、链接等。
简介
由来
HTML的英文全称是 Hyper Text Markup Language,即
超文本标记语言。HTML是由
Web的发明者
Tim Berners-Lee和同事
Daniel W. Connolly于1990年创立的一种
标记语言,它是标准通用化标记语言
SGML的应用。用HTML编写的超文本文档称为HTML文档,它能独立于各种操作系统平台(如
UNIX,
Windows等)。使用HTML,将所需要表达的信息按某种规则写成
HTML文件,通过专用的
浏览器来识别,并将这些HTML文件“翻译”成可以识别的信息,即最终呈现的网页。
自1990年以来,HTML就一直被用作
万维网的
信息表示语言,使用HTML描述的文件需要通过web浏览器显示出效果。HTML是一种建立网页文件的语言,通过标记式的指令(Tag),将文字,图形、动画、声音、表格、链接、影像等内容显示出来。事实上,每一个HTML文档都是一种静态的网页文件,这个文件里面包含了HTML
指令代码,这些指令代码并不是一种
程序语言,只是一种排版网页中资料显示位置的标记结构语言,易学易懂,非常简单。HTML的普遍应用就是带来了超文本的技术―通过单击鼠标从一个主题跳转到另一个主题,从一个页面跳转到另一个页面,与世界各地主机的文件链接
超文本传输协议规定了浏览器在运行HTML文档时所遵循的规则和进行的操作。
HTTP的制定使浏览器在运行超文本时有了统一的规则和标准。
万维网(world wide web,简称
www)上的一个
超媒体文档称之为一个页面(外语:page)。作为一个组织或者个人在
万维网上放置开始点的页面称为主页(外语:Homepage)或首页,主页中通常包括有指向其他相关页面或其他节点的指针(
超级链接),所谓超级链接,就是一种
统一资源定位器(Uniform Resource Locator,外语缩写:
URL)指针,通过激活(点击)它,可使
浏览器方便地获取新的网页。这也是HTML获得广泛应用的最重要的原因之一。在逻辑上将视为一个整体的一系列页面的有机集合称为
网站(Website或Site)。超文本标记语言(英文缩写:HTML)是为“网页创建和其它可在网页浏览器中看到的信息”设计的一种
标记语言。
网页的本质就是超文本
标记语言,通过结合使用其他的
Web技术(如:
脚本语言、
公共网关接口、组件等),可以创造出功能强大的网页。因而,超文本标记语言是万维网(
Web)编程的基础,也就是说万维网是建立在超文本基础之上的。超文本标记语言之所以称为超文本标记语言,是因为文本中包含了所谓“超级链接”点。
定义
超文本标记语言是
标准通用标记语言下的一个应用,也是一种规范,一种标准,它通过
标记符号来标记要显示的网页中的各个部分。网页文件本身是一种
文本文件,通过在文本文件中添加标记符,可以告诉浏览器如何显示其中的内容(如:文字如何处理,画面如何安排,图片如何显示等)。浏览器按顺序阅读网页文件,然后根据标记符解释和显示其标记的内容,对书写出错的标记将不指出其错误,且不停止其
解释执行过程,编制者只能通过显示效果来分析出错原因和出错部位。但需要注意的是,对于不同的浏览器,对同一标记符可能会有不完全相同的解释,因而可能会有不同的显示效果。
历史
发展
1980年,物理学家蒂姆·伯纳斯-李在欧洲核子研究中心(CERN)在承包工程期间,为使CERN的研究人员使用并共享文档,他提出并创建原型系统ENQUIRE。1989年,伯纳斯-李在一份备忘录中提出一个基于互联网的超文本系统。他规定HTML并在1990年底写出浏览器和服务器软件。同年,伯纳斯-李与CERN的数据系统工程师罗伯特·卡里奥联合为项目申请资助,但未被CERN正式批准。在他的个人笔记中伯纳斯-李列举“一些使用超文本的领域”,并把百科全书列为首位。
HTML的首个公开描述出现于一个名为HTML Tags的文件中,由蒂姆·伯纳斯-李于1991年底提及。它描述18个元素,包括HTML初始的、相对简单的设计。除了超链接标签外,其他设计都深受CERN内部一个以标准通用标记语言(SGML)为基础的文件格式SGMLguid的影响。这些元素仍有11个存在于HTML 4中。
HTML版本
HTML是用来标记Web信息如何展示以及其他特性的一种
语法规则,它最初于1989年由
CERN的Tim Berners-Lee发明。HTML基于更古老一些的语言SGML定义,并简化了其中的语言元素。这些元素用于告诉浏览器如何在用户的屏幕上展示数据,所以很早就得到各个
Web浏览器厂商的支持。
HTML历史上有如下版本:
①HTML 1.0:在1993年6月作为
互联网工程工作小组(
IETF)工作草案发布。
②
HTML 2.0:1995年1 1月作为
RFC 1866发布,于2000年6月发布之后被宣布已经过时。
③HTML 3.2:1997年1月14日,W3C推荐标准。
④HTML 4.0:1997年12月18日,W3C推荐标准。
⑤
HTML 4.01(微小改进):1999年12月24日,W3C推荐标准。
⑥HTML 5:
HTML5是公认的下一代Web语言,极大地提升了Web在
富媒体、富内容和富应用等方面的能力,被喻为终将改变
移动互联网的重要推手。
Internet Explorer 8及以前的版本不支持。
HTML在Web迅猛发展的过程中起着重要作用,有着重要的地位。但随着
网络应用的深入,特别是电子商务的应用,HTML过于简单的缺陷很快凸现出来:HTML不可扩展。HTML不允许
应用程序开发者为具体的应用环境定义自定义的标记。HTML只能用于
信息显示。HTML可以设置文本和图片
显示方式,但没有
语义结构,即HTML
显示数据是按照布局而非语义的。随着网络应用的发展,各行业对信息有着不同的需求,这些不同类型的信息未必都是以网页的形式显示出来。例如,当通过
搜索引擎进行数据搜索时,按照语义而非按照布局来显示数据会具有更多的优点。
总而言之,HTML的缺点使其
交互性差,语义模糊,这些缺陷难以适应Internet飞速发展的要求,因此一个标准、简洁、结构严谨以及可高度扩展的XML就产生了。
XML
XHTML是使用XML 1.0改写自HTML 4.01的独立语言。它不再被作为单独标准开发。
undefined XHTML 1.0 , 2000年1月26日作为W3C推荐标准发布。修订版于2002年8月1日发布,它提供与HTML 4.0和4.01相同的三个变化,这些变化被重新在XML中制定。
undefined XHTML 1.1,基于XHTML 1.0 严格版,2001年5月31日 作为W3C推荐标准发布。修订版可使用模块化XHTML(页面存档备份,存于互联网档案馆)的模块,2001年4月10日作为W3C推荐标准发布。
undefined XHTML 2.0为工作草案,但为支持HTML5与XHTML5的工作,此草案被放弃。 XHTML 2.0与XHTML 1.x不兼容,因此更确切的说这是一个XHTML风格的新语言而不是XHTML 1.x的更新。
undefined 在HTML5草案中规定一个XHTML语法,称为“XHTML5.1”。
HTML特点
超文本标记语言文档制作不是很复杂,但功能强大,支持不同
数据格式的文件镶入,这也是万维网(
WWW)盛行的原因之一,其主要特点如下:
编辑方式
编辑
HTML其实是文本,它需要浏览器的解释,它的编辑器大体可以分为以下几种:
字符集
除了常见的ASCII字符和汉字,HTML还有许多
特殊字符,它们一起构成了HTML
字符集。有2种情况需要使用特殊字符,一是网页中有其特殊意义的字符,二是键盘上没有的字符。HTML字符可以用一些代码来表示,代码可以有2种表示方式。即字符代码(
命名实体数据类型
超文本标记语言定义了多种
数据类型的元素内容,如脚本数据和
样式表的数据,和众多类型的
属性值,包括ID、名称、URI、数字、
长度单位、语言、媒体描述符、颜色、
字符编码、日期和时间等。所有这些数据类型都是专业的字符数据。
常见实体
整体结构
一个网页对应多个HTML文件,超文本标记语言文件以.htm或.html(外语缩写)为
扩展名(其中.htm是因为之前的
文件系统只支持最多三位扩展名)。可以使用任何能够生成
TXT类型
源文件的
文本编辑器来产生超文本标记语言文件,只用修改文件后缀即可。标准的超文本标记语言文件都具有一个基本的整体结构,标记一般都是成对出现(部分标记除外例如:
),即超文本标记语言文件的开头与结尾标志和超文本标记语言的头部与实体两大部分。这些成对出现的标签中,第一个标签是开始标签,第二个标签是结束标签。两个标签之间为元素的内容,有些标签没有内容,为空元素,如
有三个双标记符用于页面整体结构的确认。
部分标记也可以不成对出现,如
,但是一般并不赞同这样做。
标记符,说明该文件是用超文本标记语言来描述的,它是文件的开头;而,则表示该文件的结尾,它们是超文本标记语言文件的开始标记和结尾标记。
头部内容
标记符:说明该文件是用超文本标记语言来描述的,它是文件的开头,而则表示该文件的结尾,它们是超文本标记语言文件的开始标记和结尾标记。
<
head>:这2个标记符分别表示头部信息的开始和结尾。头部中包含的标记是页面的标题、序言、说明等内容,它本身
不作为内容来显示,但影响网页显示的效果。头部中最常用的标记符是标题标记符和meta标记符,其中标题标记符用于定义网页的标题,它的内容显示在网页窗口的
标题栏中,
网页标题可被浏览器用做书签和收藏清单。
以下表格列出了 HTML head 元素:
主体内容
<
body>;,网页中显示的实际内容均包含在这2个正文标记符之间。正文标记符又称为实体标记。
定义二级标题定义三级标题定义四级标题定义五级标题定义六级标题以此类推
示例:
相关要求
在编辑超文本标记语言文件和使用有关标记符时有一些约定或默认的要求。