返回列表 发帖

[交流] 【转贴】 全面了解RSS

下面的介绍是对RSS发展以及主要概念的一个较为全面的介绍,有好奇心的朋友不妨看看,真正了解RSS这项技术,真正去体验一种全新的阅读方式。

RSS发展历程

    肯定有人还记得IE4刚刚推出来的时候有一个有趣的功能--新闻频道。其功能与Netscape(网景)推出的新闻频道是很相似的(当时Netscape还是市场上领先的浏览器)。为此Netscape定义了一套描述新闻频道的语言,这就是RSS,只不过当时网景公司每况愈下,所以最终也没有发布一个正式的RSS规范(只发布了一个0.9版本)。

    而微软也在当时推出了支持自己IE的CDF(Channel Definition Format)数据规格,与RSS非常接近。微软试图用新闻频道的功能把“推”(Push)技术变成一个应用主流,并与Netscape抗衡。不过出乎预测的是,“推”技术自始至终没有找到合适的商业模型,而且伴随着其他各类网络特性的出现,也日益无法显现自身的优势,新闻频道最后也在IE的后续版本中消失了。

    新闻频道进入了低谷,但是RSS并没有被业界人士所抛弃。过去两年,Blog从一个专业群体开始,逐步成为了网络上最热门的新话题。而RSS成为了描述Blog主题和更新信息的最基本方法。RSS技术被著名Blogger/Geek戴夫·温那(Dave Winner)的公司UserLand接手,继续开发新的版本,以适应新的网络应用需要。新的网络应用主要就是针对Blog,因为戴夫·温那的努力,RSS升级到了0.91版,然后达到了0.92版,随后在各种Blog工具中得到了应用,并被众多的专业新闻站点所支持。

    在广泛的应用过程中,众多的专业人士认识到需要组织起来,把RSS发展成为一个通用的规范,并进一步标准化。一个联合小组根据W3C新一代的语义网技术RDF对RSS进行了重新定义,发布了RSS1.0,并把RSS定义为“RDF Site Summary”。这项工作并没有与戴夫·温那进行有效的沟通,而戴夫则坚持在自己设想的方向上进一步开发RSS的后续版本,也并不承认RSS1.0的有效性。RSS由此开始分化形成了RSS 0.9x和RSS1.0两个阵营,也由此引起了在专业人群中的广泛争论。

    因为争论的存在,一直到今天,RSS 1.0还没有成为标准化组织的真正标准。而戴夫·温那却在2002年9月独自把RSS升级到了2.0版本,其中的定义完全是全新的模式,并没有任何RSS1.0的影子。这引发了网络上进一步争议,究竟让一个越来越普及的数据格式成为一个开放的标准,还是被一家公司所定义和控制,成为了争议的焦点。戴夫·温那并没有为自己辩解,他的观点是RSS还需要进一步发展,需要专业人士更明确的定义,但是这也不能消除人们对RSS“被一家商业公司独占”的担心。

RSS介绍

    RSS是一种用于共享新闻标题和其他Web内容的XML格式标准和各个平台之间数据交换规范,起源于Netscape的推"Push"技术,将订户订阅的内容传送给他们的通讯协同格式(Protocol)。RSS可以是以下三个解释的其中一个:Really Simple Syndication(真正简单的整合)、RDF (Resource Description Framework) Site Summary、Rich Site Summary(丰富站点摘要),但其实这三个解释都是指同一种Syndication的技术。

    RSS目前广泛用于blog、wiki和网上新闻频道,世界多数知名新闻社网站都提供RSS订阅支持。

RSS版本和推荐

    到目前为止,RSS共有RSS0.90、0.91、0.92、0.93、0.94、2.0和1.0一共七种版本,推荐使用的是RSS1.0和RSS 2.0,对于一些基本的站点同步,也可以选用RSS0.91。

    从RSS的发展历程可以了解造成今天的这种局面的原因,后果是形成了两个主要的竞争版本:一个基于RDF的RSS1.0,而另一个则不是(RSS0.9x和RSS2.0),但它们两个都共用相同的名字。这是一种可怕的混乱,因为版本号导致人们误认为 2.0 是 1.0 的改进版本,而实际上它们是两个目标完全不同的规范。另一组开发人员已经下狠心着手解决这种混乱问题,通过定义新的摘要(syndication)规范来与RSS名字的随意性决裂,这个解决方案称为Atom(原子)项目。

    其实使用哪个版本是无关痛痒的,大多数RSS阅读服务支持所有的RSS版本(有些甚至支持Atom)。

XML介绍

    XML即可扩展标记语言(eXtensible Markup Language)。标记是指计算机所能理解的信息符号,通过此种标记,计算机之间可以处理包含各种信息的文章等。如何定义这些标记,既可以选择国际通用的标记语言,比如HTML,也可以使用象XML这样由相关人士自由决定的标记语言,这就是语言的可扩展性。XML是从SGML中简化修改出来的。它主要用到的有XML、XSL和XPath等。

    SGML,是英语Standard Generalized Markup Language的缩写,意即标准通用标记语言,是现时常用的超文本格式的最高层次标准,是可以定义置标语言的元语言,甚至可以定义不必采用<>的常规方式。由于SGML的复杂,导致难以普及。有非常强大的适应性,也正是因为同样的原因,导致在小型的应用中难以普及。

    HTML和XML同样衍生于SGML:XML可以被认为是SGML的一个子集,而HTML是SGML的一个应用。

    XML的产生就是为了简化SGML,以便用于更加通用的目的。比如语义Web.它已经应用于大量的场合,比较著名的有XHTML、RSS、XML-RPC和SOAP。

Feed(我们称为信源)简介,如何订阅它

    信息输出站点以RSS文档形式为其内容提供一个提要,这个提要我们将它称为Feed。Feed文档可以通过URL获得,RSS文档是一个XML文件,它包含大量离散的信息,如某个博客(新闻)的标题,正文、时间等元素。由于RSS是XML格式文件,所以它很容易被其它程序所使用。

    RSS阅读服务是一个读取RSS文档并显示新闻项的程序,在线RSS阅读服务(比如和讯博揽)用户只要输入RSS的URL,就使得订阅博客(新闻)成为可能。

[ Last edited by RAY on 2005-9-20 at 11:46 AM ]

受益匪浅!

TOP

好好学习天天向上。

TOP

有的网站不支持rss咋办啊?

TOP

赞楼主~~~
面壁归来......

TOP

不错

介绍得很详细,不错.多谢!

TOP

最近这个是很火.等几天偶试试!

TOP

有些RSS订阅不了,是什么原因呢?

TOP

提示: 作者被禁止或删除 内容自动屏蔽

TOP

很好的帖子,顶......
浪子心,快活人!

TOP

RSS可以省很多时间,目标非常的明确.
WIN7.PRO.SP1+全补丁+IE9,TW最新版,一般不乱说!

TOP

提示: 作者被禁止或删除 内容自动屏蔽

TOP

返回列表