繁体版 | 简体版 | 手机版
您当前的位置:Home> 科技前沿> 科技巨头> 网络巨头> > 正文
协作引擎:维基百科揭秘
时间:2012-11-30 13:33 来源:美国资讯网
字号:【

    对于许多人来说,维基百科就是一个黑盒子。你提交一个查询就得到相应信息。但是那些明白维基百科是一个志愿者驱动的项目的人却有不同见解:你提交的是一群聪明人,得到的是一部百科全书。这个黑盒子到底是什么,它是怎样工作的?

维基百科的成功很大一部分要归功于其社会政策和原则,可能我们会在今后的文章中来探究这个问题。今天,我更喜欢看看这个百科全书及其姊妹项目背后的关键技术机制。维基百科是一个wiki系统,数据库开放给任何人修改。 “编辑”链接使你可以立即改写绝大多数文章的内容。这种基本的开放性(原文:openness)是怎样产生有用内容的?我认为以下技术机制至关重要:
    • Wiki语法。 这是编写wiki的法典。它比HTML更简单,又比纯文本复杂的多。如果你想大大有助于维基百科,你最好学一下最基本的wiki语法,并且有好多帮助和教程让你轻松上路。
    • 永恒的记忆。 维基百科保存了每一篇文章自创立始的每一个变化,允许编辑者立即恢复修改,在他们需要的时候。(Jon Udell’s Heavy Metal Umlaut 视频是一个对该原则很好的可视化说明) 除了内容的变化,甚至管理操作如删除或用户封锁也可以被撤消,并被完整记录。
    • 完全监督。不错,我是有点夸大戏剧性效果。我们很严肃地对待隐私。但是所有对维基百科的修改会直接链接到相应用户帐户或者IP地址,并且我们有很多工具帮助我们巡逻每天进入维基百科项目的内容。
    • 讨论页。一个社会工具,于每篇文章相关的讨论页对于在做决定时产生一致性是至关重要的。
    • 用户作为工具制造者。关于wiki很酷的一件事情就是,用户可以创造自己的程序。比如,我们一个关键的质量保证程序“特色文章候选”,不过是一个wiki页面,用户可以在此提名高质量文章并讨论这些提名。更多的用户授权如下(More on empowering users below)。
    与维基百科的前身作比较是很受启发的。Nupedia是Jimmy Wales的第一个百科全书工程,它戏剧性的失败了。不像维基百科,Nupedia实施了严格的,自上而下的同侪审查过程。
    代码就是法律
    我总是发现,“软件”这个词有点可笑:它没有什么所谓“软”的特别之处,或者它根本不是任何东西。而今,电脑程序支配着我们太多的日常生活,然而我们却将他们粉面掩藏。的确,他们是工具,但他们也有监督职能,尤其在社会层面。支撑他们的计算机代码深深影响着任何在线社区之间可能的相互作用。较之“软件”我更喜欢“代码”这个词儿。据学者了Larry Lessig观察,计算机代码在网络中的影响与法律法规在社会中的影响有得一比。
    代码可以接受检验使它倍加重要。这是如今运行Wikipedia的核心代码。它被称作“MediaWiki“,一个对"Wikimedia“的深刻误导。该代码可基于自由软件开放源代码许可-”GNU通用公共许可证“而获得,允许任何人共享和修改它,并免费提供他们做的修改。
    该代码是用叫做”PHP“的编程语言写成的,PHP同样是自由和开放的。学习如何使用这种语言也是免费的。这意味着任何人的时间和爱好都可有助于Wikipedia代码更优秀。浏览MediaWiki网站可获得更多信息。
    而这正是已经发生的事情。对于它的大部分的历史,Wikipedia没有任何拿薪水的雇员。近来,Wikimedia基金会聘请了两个最多产的志愿者程序员,Brion Vibber和Tim Starling。他们的贡献是巨大的;并且有无数的其他个人和公司也在工作于该代码。可能我在吹嘘,但我经常说MediaWiKi软件对自由知识和开放式学习的未来的重要性不亚于Linux Kernel对未来计算的重要性。
    捐助Wikimedia基金会将使我们能雇佣更多的开发人员,系统地改善MediaWiki关键模块的代码,这反过来将提高百科及其姊妹项目。但是在我详细阐述未来要做的事情之前,先解释一下过去一些形成我们项目的关键技术的变化是有帮助的。
    MediaWiki的里程碑
    Wikipedia,而今拥有丰富的多媒体应用。图片特别地装饰着成千上万的网页,其中一些有非常棒的质量。事情并非总是如此,并且很少有对代码关键行的提高,从而导致了用于网站的图片爆炸式增长。例如,在2004年三月,在获得矢量图形支持后,使自动产生图片的大、小版本和画廊特性成为可能。
    2004年9月,我们创造了一个多媒体仓库,叫做Wikimedia Commons。它现在存有超过2百万可自由使用的图片,声音文件和视频。技术上讲,它成功的关键一点是能够及时地将仓库的任何图片嵌入到任何语言的Wikimedia项目中。最近,Tim Starling 实现了一个嵌入的视频和音频播放器,由此嵌入文章的视频和音频已经有了本质上的增长。
    另一个重要的变化是2004年夏季新分类系统的实现,它由Magnus Manske和Brion Vibber领导。今天,我们有了一个庞大的分类索引。在分类系统实现之初,它令人神魂颠倒,一个特性的变化是如何引发内容上的爆炸的?在短短的几天之后,几千个分类无中生有的被创造了。
    为了是Wikipedia在其他语言里可用,并提高它的可用性,它一个不可否认的重要特性是可以通过wiki本身来编辑所有用户接口文本(比如在Wikipedia左侧的工具条的链接)。但是我们把这个开放原则更进一步:我们的软件可以之间通过wiki被任何人重组。不相信我?那就来看看Lupin的导航弹出工具吧,它从根本上改变了你浏览Wikipedia的方式。
    它是怎么完成的?本质上,在你访问Wikipedi网页时,我们的软件允许你告诉你的浏览器(Firefox, Internet Explorer或其它任何)去运行一些脚本。这些程序可能会非常的复杂,但它们使Wikipedia更容易使用。当然,出去安全原因这些脚本不会被运行,除非你按照消息的说明激活了他们。
    再次,代码就是法律:如果我们没有给我们的用户权力去写这些脚本,他们就从来不会被创造,从而Wikipedia将是一个与现在不同的地方。这里只说了几个例子,你可以从Wikipedia文章中读到更多有关的MediaWiki变革。现在想像我们可以做什么了,如果我们不只是雇佣2个而是10个软件开发人员。我会帮忙的。
    合作之未来
    请注意,我不是说我们的代码不应该通过大量志愿者的合作来继续加以改进。事实上,我相信我们大部分的努力应该着重于整合和改善他人的工作。读了以上所述,你不该惊讶于MediaWiki可以通过插件添加功能而被高度定制。他们不同于我上面提到的浏览器端的脚本,且可能更强大。
    来看看那大量的扩展吧。一些拥有强大的潜力:比如,语义MediaWiki扩展,改变了处理诸如你在Wikipedia文章中找到的infoboxes里面的数值信息之类的结构化数据的方式。想像一下,你不仅可以把Wikipedia用作百科全书,还可以把它当作一个以任何可以想到的方式查询的巨大的数据库:“给我看人口小于10,000的国家。”——“给我看朋克乐队的最新专辑。”——“生成所有罗马帝王的图形化时间线。”
    或许,那还不能令你兴奋,何不把Wikipedia弄得更用户友好呢?LiquidThreads,是我参与的一个项目,它重塑讨论页面,使他们更容易使用。也有很多尝试来为Wikipedia建立富文本编辑器。我个人认为,(由于我们能在现有wiki语法上所作的任何事情的复杂性)要把可用性真正地向前推一大步,需要相当可观的资源投入。但是,总有只需稍作努力就可获得的增长性的改善。
    有一些非常酷的扩展拖延了,令人遗憾的是,它们已不被使用好多年。出于完全原因,我们从未部署WikiTex,一个可以使我们的编辑们很容易添加音乐乐谱,图形图表,化学公式及类似内容到Wikipedia文章中去。
    在许多情况下,所需要的是最后的冲刺:安全和可伸缩性工作,集成,测试,写文档。也就是说,部分工作相当无趣。通常,MediaWiki插件的作者探求的只是满足自己的个人需求,让这些扩展运行在他们自己创建的独立wiki环境。这正是Wikimedia基金会需要投入一些钱来改编和实现最好和最重要工具的原因。
    也存在内部的战略重点,某项目非常重要以至于我们不能依赖志愿者去做。这里有一些:
    • 标记的修正。这个工具,让我们授权于贡献者,以确定Wikipedia文章的版本,确认他们有很高的质量。读者就可以选择是否要读文章的最新版本(它可能被恣意破坏了),还是最近被复查过的版本。FlaggedRevs实施的敲定是我们提高质量的行动。为了让你知道我们的资源是多么的有限,我们不得不撤出这个项目的开发人员,以确保我们能在这次筹款会上得到技术上的支持。诚然,每一个捐助都能有助于我们执行此类关键行动的能力,使Wikipedia更有用给你更好的内容。
    • 跨项目集成。现在,每个单独的Wikimedia项目有一个单独的用户帐户数据库。想要整理一篇来自德语Wikipedia的文章吗?如果你只有一个英文帐号,你不得不创建一个新的帐户。这不是一个简单的问题要解决:数以千记的帐户名字存在于多个项目,因此我们需要合并同一的帐户并分开非一致的。幸运的是,部分工作已经完成了,但更多的还留在那里。一旦帐户数据库统一起来,对许多现有的特性就有潜在功能——比如可以从Wikipedia修改Wikinews的内容,从Wikibooks上传图片至Commons文件夹等等。这样,我们就可以把Wikimedia项目家庭更紧密地联系起来。
    • Wiki打印和输出技术。目前,我们不提供许多工具让你很容易打印或下载文集。这将很快改变,通过一个接下来几周将发布的现有合作。它使得很容易下载所选文章的高质量PDFs。我们的目标是同时支持输出为文字处理机格式。虽然这只是个开始,但是已经有一堆工具使Wikibooks项目生成高质量,开放访问的文本书籍变得容易。这项技术是开发世界的关键,所以我们可以以任何格式发布免费知识是最有帮助的。
    • 混合 & 烧毁Wikipedia。涉及到上述情况,我们想使你很容易就可以创建你自己的Wikipedia/Wikimedia DVD或USB存储,或是包含所有文章或是包含所选文章。这需要一个阅读应用程序,它的运行不依赖互联网访问。幸运的是,已经有很多项目,只是需要再一次做最后的冲刺。现在,想像这样一个程序,不仅可以阅读文章,还可以改变他们并在一旦有互联网连接的时候同步你的改变——这将会使我们能制作在世界任何地方的吸引人参与的Wikipedia终端。
    再次,这些只是几个例子。我相信,今后的合作仍然会更大:将会有文章上的实时协作,甚至是图像和视频。维基人将会在编辑文章的时候通过IP语音跟对方通话,而Wikiversity将变成全球的免费机构用以学习使用相同工具是师生间的全球互动,连接那些有知识和寻求知识的人们。Wikinews可能变成一个全球性的虚拟新闻室,从而有可能使你作为“公民记者”立即报道事件,并与其他人协作来讲述完整的故事。
    我们的捐赠旗帜宣告说:“你可以帮助Wikimedia来改变这个世界”。的确,通过在这样的筹款动员会上支持我们,你将让我们做得更多而不只是保持Wikipedia运行。对非盈利性机构Wikimedia基金会的捐赠就是对未来学习的捐赠。每一项捐赠都有帮助,如果你想送份大礼,请联系我们:majordonors AT wikimedia DOT org。
    Erik Möller自2001年一直是Wikepedia的捐助人,并于2006年当选进入Wikimedia基金会董事会。该文纯属个人观点,不代表wikimedia的官方陈述。
 
( 编辑:admin)
    美闻网---美国生活资讯门户
    版权申明 | 关于我们 | 广告服务 | 联系我们
    ©2012-2014美闻网版权所有