HTML5正名记:两家机构的博弈与一种标准的诞生

2015年03月23日 15:24 0 点赞 0 评论 更新于 2025-11-21 18:19

你可能已经知道,10月28日,万维网联盟(以下简称“W3C”)正式推荐HTML5。你或许也了解,这与应用和万维网存在一定关联。但问题是:这跟你有什么关系呢?

答案是,至少与网民息息相关。因此,我们有必要了解HTML5是什么,以及究竟是谁掌控着W3C。此外,还有必要知晓HTML5获得W3C推荐背后的种种冲突。未来10年,将有数十亿人使用万维网,然而真正有资格为“万维网”下定义的人却寥寥无几。W3C便是这样一个组织。那么,它的成员都有哪些人?他们的目标是什么?又是谁为他们提供资助呢?

W3C诞生

万维网已迈过千禧年。其设计方案最早于1989年提出,距今已有25年。6年后,网景的首次公开招股(IPO)触动了硅谷的神经。当万维网尚属新生事物时,许多精通电脑的人对它嗤之以鼻——与其他超文本发布系统相比,它是一项极为原始的技术。例如,你可以将自己的网页链接到其他任何页面,但却无法得知何时有人链接你的网页。而且,万维网也不允许在浏览器中编辑页面。对于众多超文本领域的精英思想家和程序员而言,这些都是极为严重的缺陷。

然而,万维网易于搭建,学习难度也较低。它拥有自己的一套传送模式——任何人都可以通过阅读网页学习HTML语言,进而查看底层的HTML代码。万维网完全由简单的文本和图像构成,它们与其他同样简单的文本和图像相互链接。

科技行业向来崇尚功能主义,于是人们开始往万维网中添加他们所能想到的一切。如何展示3D图像?如何让文本发光,甚至滚动过整个页面?如何将网页转变为软件?不同的浏览器纷纷涌现,各自形成了独特的文化,并占据了一定的市场份额,如Mosaic、网景、IE、Cyberdog、Spyglass、Lynx和Amaya。

随着万维网日益复杂,这一生态系统逐渐形成了群雄割据的局面。当时,每种浏览器只能渲染一种格式的图片,如果使用另外一种格式,当向他人发送某张图片的链接时,对方就无法看到真实的效果。倘若这种局面持续下去,当今世界将会出现多个万维网并存的情况。无序状态也会接踵而至,摄影师必将怨声载道。

当这种割裂局势愈演愈烈时,人们意识到需要有一个组织来定义一种通用的语言,将所有必要的功能都涵盖在内。之后,该组织还必须撰写一份文档,记录超文本标记语言的所有演变过程。这是一个标准化流程,是一种出于商业目的而开展的技术外交,对互联网的发展至关重要。事实上,这并非计算行业的首创。

1908年,自动钢琴生产厂家在水牛城的Iroquois酒店参加“水牛城大会”时,人们对钢琴纸卷上每英寸的穿孔数量存在分歧,有人偏好9个,有人则喜欢8个。这种差异导致成本增加,不仅对厂家不利,还会让用户感到困惑。最终,他们达成了一致,如今,每英寸9孔的钢琴纸卷已成为标准,不再有厂家生产其他标准的自动钢琴。

在冲突中前行

当然,网页的问题要复杂得多,它需要通过数十种标准来规范文字、声音、图像、交互、协议、代码等各种元素。而W3C则扮演了“万维网议会”的角色。这是一个标准制定组织,他们会组织各种会议,让相互竞争的组织坐下来共同制定统一的标准,然后将这些标准从“工作草案”过渡为“候选推荐”和“提议推荐”。最终,如果标准能够经受住考验,便会获得“W3C推荐”资格。

万维网发明人、W3C理事蒂姆·伯纳斯 - 李(Tim Berners - Lee)领导该组织召开了20年的会议。它的会员包括近400家学术机构、非营利组织和公司。其中最为积极的参与者是开发网络软件并拥有大量网站的企业,如谷歌、微软和Facebook。他们需支付会员费——美国大型企业的年费为6.85万美元,而非营利组织和小公司的年费则少得多,欠发达国家也会按比例减少费用。

W3C的文化使命是“向所有人开放万维网,无论硬件、软件、网络基础设施、语言、文化、地理位置以及身体和心智能力如何”。要实现这一目标,就需要一个专门的委员会来制定标准文件。

如果你想了解万维网发展的最新消息,可以访问W3C的主页,查看最新新闻。当你阅读那些枯燥的标准时,或许会认为制定标准的过程是一个文雅甚至有些学术化的流程——所有的参与者都会冷静地讨论分号的位置等问题。但实际情况并非如此。制定重要标准的过程有时风平浪静,有时却会经历激烈的交锋。

这并非什么难以启齿的秘密,相反,这恰恰代表了一个良性的流程。“技术标准化是一种商业外交。”多次参与这类活动的惠普商业战略总监史蒂芬·瓦利(Stephen R. Walli)写道,“与外交家一样,所有的参与者都希望在扩大经济影响的同时捍卫自己的主权。”

曾在1974年开发了HTML的先驱语言“标准泛化标记语言”(Standard Generalized Markup Language)的查尔斯·古德法布(Charles Goldfarb)表示:这类标准与立法一样,都要经历深层次的冲突才能最终确立。

跳舞的猴子

从一开始,HTML就为文本内容制定了一系列标记规则。如果你想添加标题,就要使用<h1>标签,例如<h1>你的标题</h1><h1>是一个标记,“你的标题”只是字符数据。浏览器可以解读这些HTML规则,然后以相应的格式展示出来。

HTML的本质就是大量的标签。但HTML5却成为了一种“结缔组织”,负责将多种多样的其他技术粘合在一起,包括音频、视频、图片、文字、标题、引文、开放式画布、3D图像、电子邮件地址等。它可以让你知晓这些内容的存在,并提供各种途径将其融入同一个页面。你甚至可以“验证”页面。截至目前,Apple.com有1个HTML5错误。这其实已经相当不错了,《纽约时报》网站的错误达到141个。

在这种情况下,验证是一种理想的构造。其意义在于,如果你遵守W3C的规定,你的网站将会吸引更多的访客。不过,这两种页面对大多数人来说都是可以接受的,毕竟浏览器的容错率极高。事实上,任何一个标准组织最终都会形成一种认识论:由于意见多种多样,所以他们必须从中挑选出一些作为基本信念。自动化的验证器是一种编码信念系统。并非每个网站都提供有效的HTML,就像并非所有天主教徒都会遵守婚前性行为禁忌一样。事实上,完全遵守HTML规范的网页比例,与遵守婚前性行为禁忌的天主教徒比例可能极为接近。

这些冲突让HTML5受到了格外的关注。为了理解其中的缘由,必须回溯到1996年6月,当时新版HTML刚刚推出。HTML3.2是一次重大更新,因为它将之前的许多实践正式列为官方标准。JavaScript已经被添加到浏览器中,于是,页面上的所有元素都可以活跃起来。HTML3.2其实并未对JavaScript过多着墨,只是写道:“今后的HTML将有脚本。”

“JavaScript的目标是当你把鼠标移动到一只猴子上面时,能让它跳舞。”一位著名评论家写道。这些跳舞的猴子最终催生了更多“跳舞的猴子”,首先是弹窗,随后在微软的帮助下,又可以在不刷新浏览器的情况下通过IE加载新的数据——谷歌地图、Gmail、Twitter和Facebook等“网页应用”均属此类。如今,整个万维网到处都是跳舞的猴子。我们仍把网页称作“页面”,但其中有很多其实已经变身为软件应用,其复杂程度之高甚至可以完成文字处理、运行视频游戏。

2004年,这种从页面向应用的转变吸引了众多跨国公司的兴趣,他们从这种动态网页中看到了巨大的利润前景。然而,W3C已经对万维网进行了数年的改造。他们在力推“无障碍网络”——通过为网页赋予自我描述的功能,让盲人和其他残疾人也能使用网络。他们还希望开发语义网络,将所有的思想都集中到一套分散化的思想库中。为了实现这一目标,W3C着手开发新版HTML,也就是XHTML2。配合着其他一些标准,便可通过更好的技术改造很多网页的功能特性。然而,当W3C希望构建无障碍网络时,整个网络行业却都希望“让猴子跳舞”。

WHATWG扭转趋势

必须强调的是,在追求这一目标的过程中,W3C似乎有些脱离实际。例如,W3C的情感标记孵化集团希望通过情感来标记任何内容。他们表示:“EmotionML提供了一种机制,通过科学有效的描述符来代表情感。”他们还补充道:“由于无法达成一致,EmotionML并不提供单一的情感词汇表,而是让用户在他们的注释中选择最适合的情感词汇。”

具体效果如何呢?你可以使用下面一段代码来描述0.5的快乐值:

<emotion dimension-set="http://www.w3.org/TR/emotion-voc/xml#pad-dimensions"><dimension name="pleasure" value="0.5"/></emotion>

EmotionML还擅长表达愤怒、焦虑、痛苦和轻蔑。如果这种标准得到W3C的推荐并广泛普及,那么政治博客的愤怒情绪便可量化,你甚至可以选择只阅读包含快乐情绪的万维网。

但这显然并未成为现实。2004年,正当W3C开展这一项目时,万维网也悄然发生了诸多变化。谷歌上市,苹果通过基于Web的iTunes商店售出了不计其数的歌曲,苹果还推出了自己的Safari浏览器。

除此之外,一群来自苹果、Mozilla和Opera的工程师组成了一个名为WHATWG的组织,即“网络超文本应用技术工作组”的缩写。他们对W3C的XHTML发展方向感到担忧,担心该机构忽视HTML,忽视真正的需求。

WHATWG开始承担起本应由W3C承担的工作——定义新版HTML,也就是HTML5,将各种新兴的万维网技术集合起来并进行标准化。把这些新技术整合在一起,可以让浏览器变成通用的高速电脑,提供更智能的表格、更好的视频和音频,还能更出色地把文档转换成代码,使越发紊乱的万维网更加有序。此后,浏览器成为了应用的载体,可以在上面运行软件。

2007年,W3C认可了WHATWG的方向,开始亲自处理HTML5。而XHTML2所倡导的情绪化网络从未真正发展起来。WHATWG仍然保持独立,双方展开了并不顺利的合作。

尽管W3C接纳了HTML5,但有关这种语言究竟如何部署以及何时部署,仍然存在诸多疑问。CNET的史蒂芬·夏克兰(Stephen Shankland)常年追踪这一标准化流程,据他记录,W3C讨论这项技术的邮件列表中曾出现过“幼稚”“不可忍受”“可笑”和“鬼把戏”这样的词汇。

同样是在2010年,史蒂夫·乔布斯(Steve Jobs)发出了一封公开信,宣称HTML5风格的网络技术才是未来的发展方向,Adobe的Flash专有平台无法担此重任。这封信意义重大,因为它意味着HTML5得到了一家顶尖科技企业的认可,从纸上谈兵进入到实践探索阶段。

如今,经过7年的发展,HTML5的命运似乎终于有了定论。据夏克兰报道,WHATWG和W3C之间仍然存在分歧。孰是孰非似乎并不重要。双方都在各司其职地履行着自己的责任。各种各样的冲突仍会不断涌现,然后逐一解决,如此循环往复,最终形成通用标准。WHATWG显然希望W3C终止现有的模式,但它毕竟已经统领万维网20年。

如今的浏览器速度早已今非昔比,代码编写者再也不必担心不兼容的问题。不过,他们似乎只看重速度,没人试图改变核心。以文档驱动的传统万维网仍是网页的基础,但以应用驱动的万维网却可以跨越平台,支持任何手机。它更加复杂,有时甚至令人困惑,但多数时候都能正常运行。

终成行业标准

W3C的HTML5标准内容极为“丰富”,光是图片部分就有1.4万个单词,这还只是一小部分,全文多达53万单词,是HTML4的5倍多。但即便如此冗长,它也只是描述了万维网定义的一小部分。例如,它并未提及如何制作JPG图片或GIF图片,以及这些文件如何安排在二进制数据流中。其他内容则由其他组织负责制定相应的标准,这些标准又基于更多的标准而来,甚至可以追溯到数十年前的内容。

万维网最初是用于发布和分享文档的,如今已成为一套操作系统,它能监控手机电量、录制和发送语音,还能管理电子邮件和聊天、提供游戏运行环境。

与微软Windows或苹果Mac OS操作系统不同,HTML5标准是开放的,所有人都可以使用。如果你想编写一个浏览器,随时可以获取足够的信息,不会有任何隐瞒。甚至还有专门的教程帮助你开展初期的工作。

任何标准都能折射一种文化,HTML5也不例外。它体现了我们对文字、标题、视频和音频的偏好:我们喜欢把各种内容组织成列表,我们还喜欢看图片,我们希望任何事情都具备动画和互动能力——每个字、每个标签、每个结构元素。HTML5的所有内容都可以由代码解读,也都可以由用户来旋转和操纵。

万维网曾经是获取信息的地方,但现在,它也成了一个可以做事的地方。这花了10年时间才最终实现。现在是2014年,HTML5终于得到了官方的认可。就像1908年的水牛城大会一样,只要你使用了合乎标准的自动钢琴,便可倾听百年之前的乐曲。

作者信息

feifeila

feifeila

共发布了 3994 篇文章