元宇宙的史前史

作者:蓬岸 Dr.Quest
知乎文章编号:429996217
创建于:2021-11-05 9:49:14
修改于:2021-11-05 9:01:01


这篇文章是CryptoC“风潮思想沙龙”系列活动的第二期的讲稿,从虚拟社交、三维空间、虚拟身份等领域回顾了“元宇宙”相关的技术要素及其发展历史上的重要实践

我们今天就来讲一下“元宇宙”的史前史。虽然这一次关于元宇宙的热潮可能会非常多的讨论是关于交易的部分,比如说虚拟物品上链这样的事情,但是这一次我对我来说,我认为大家在讨论元宇宙或者虚拟世界里的东西上链之前要先考虑一另外的两个元素,人们对它们的探索起步的更早,但同样重要,这两个元素一个是数字空间的社会、社交属性,另一个就是展现虚拟空间的、与网络操作互动的三维图形和交互技术。

“新话题”往往并没有那么新

这次的元宇宙热潮在许多情况下会视为16~19年前后AR、VR热的回潮,我带来的Treo 700上正好有一个AR游戏Arcade Reality,早在Pokemon Go出现9年之前的2007年,我们其实已经可以在一些智能手机上玩到这样的游戏了。

Arcade Reality上的“太空入侵者大战上海滩”

因此我们应当意识到,大多数的时髦的概念往往都没有那么新,而是一大半是旧的,一小半是新的。很多时候科技界标榜这些新技术其实都没有那么神奇。在这一波元宇宙热潮里“虚拟偶像”概念被炒的很火,但它却是一个18世纪就验证过的概念。

土耳其行棋傀儡

1770年奥地利发明家沃尔夫冈·冯·肯佩伦发明了“土耳其行棋傀儡”,它是一个早期的机器人,许多评价认为它是一个著名的“骗术”,但我更愿意说它是一种魔术,它上面“土耳其人”形象是一个可以由机械装置操纵的木偶,而棋盘下面的桌子里藏着的,就是操纵它的人类棋手。

在这个机器人被带到欧洲各地巡演,并和路上遇到的各种名人下棋,它曾经在国际象棋棋盘上战胜过拿破仑和富兰克林这样的历史名人,论人气绝对是顶级的虚拟偶像了。而且它由隐藏在装置中的人类棋手操作,和我们今天所看到的虚拟偶像背后的“中之人”的逻辑也是一样的。因此虽然那些运营虚拟偶像的企业在努力的把它们的虚拟偶像渲染成“新物种”,但实际上来说,目前网络上这种虚拟偶像和“中之人”的组合不过是18世纪土耳其行棋傀儡和人类棋手组合的电脑版。

现在还有一个概念叫“Amazon Mechanical Turk - 亚马逊上的机器土耳其人”或者叫“亚马逊土耳其行棋傀儡”,这个概念用调侃的语气描述了“众包”的情形,特别是那些雇佣发展中国家的外包员工工作,然后标榜自己是运用了“人工智能”的欧美企业。

国内其实也有这样的例子,比如“AI数据标准村”很大程度上也是把人类的劳动匿名化之后贴上了“人工智能”的标签,所为之“多少人工、多少智能”。因此我们会发现许多科技公司向大众宣称的那些所谓的新东西,其实都是一个旧概念换了一个高科技的形式转移到IT行业中而已。

因此我们要想更清晰的去认识这一波的元宇宙热潮,而不被那些营销话术带跑,就要去了解之前的人们在构建虚拟世界中已经做出了哪些努力,和即有的技术栈已经走到了哪里。然后才能够找到那些真正创新,并对未来有意义的东西。

社交属性:元宇宙的第一属性

元宇宙首先需要社交属性,单机上的、或只在封闭的小圈子里运行的虚拟空间只能是个游乐场。而“宇宙”需要把很多人都装进去,并让人们能够在其中充分互动。正像我前面所说的,AI其实到现在来说仍然是个蛮“弱智”的东西,它过不了图灵测试,没法足够真实的模拟人类的活动。

关于AI扮演的NPC的限制,我赞同这个回答的观点:为什么大部分游戏里都不用 AI 随机生成 NPC 的故事和对话,而是开发者自写故事和对话?

因此至少在可预见的未来的一段时间里,我们要建设的“元宇宙”首先应该是一个带有社交属性的信息系统。这个系统会把许多人放到虚拟的空间里面去,并依靠人和人之间的互动来使之充实,这包括资讯上的互动、情绪上的互动、经济上的互动,都会通过这个信息系统完成。

这种带有社交属性的信息系统最早的实现就要数Community Memory(社区内存)。反主流文化组织“一号工程”(Project One)的参与者们把一台电脑终端机放到了加州伯克利的一个唱片店里,然后通过Modem将其连接到一台施乐SDS-940大型机上面,实现了一个最早的电子公告牌系统。

这项1973年开始的技术实验,与反文化运动的诉求息息相关,参与者希望通过这些技术手段把反文化运动社群连接起来。

strong, free, non-hierarchical channels of communication--whether by computer and modem, pen and ink, telephone, or face-to-face--are the front line of reclaiming and revitalizing our communities.
强大的、自由的、非等级化的沟通渠道--无论是通过电脑和调制解调器、笔墨、电话,还是面对面——都是开垦和振兴我们社区的前线
——Community Memory宣传册

随着参与者的增加,这个系统逐渐成为一个信息跳蚤市场,各种各样的信息都在上面出现,而不仅限于反文化社群内部的联络了。

与之类似的,同样出现于1973年的一个系统叫PLATO Notesfiles,有时也被简称为“Notes”。在网页里电脑博物馆中的实验室栏目,可以连接到IRATA.Online提供的PLATO服务中,并体验Notes的功能:compumuseum.com/standal

PLATO是60年代开始在美国的大学里流行的终端机系统,它是世界上最早的触摸屏屏设备之一,也是最早广泛使用的计算机辅助教学的系统。

IRATA.Online提供的Notes

通常这样的终端安装在学校的电脑房里,并通过本地线路连接到校内的一个大型主机上。我们在PC上运行的是模拟器,用guest登陆出现菜单后,按“D”是进入Notes,然后我们按“A”打开Announcements系统公告,你会发现其实它也是一个类似论坛系统,每一个“笔记”都是一个帖子,而这些带有社交属性的信息系统是出现在互联网所使用的TCP/IP之前的。

社交信息系统另外一个比较重要的发展就是以芝加哥CBBS为代表的电话拨接式BBS的出现,它是搭建在微型电脑上的,这种变化让社交信息系统不再是那些运作大型主机的组织的专利,而同样可以被个人爱好者所搭建和使用。

这种BBS系统在90年代的中国也有过一段繁荣的时期,许多中国互联网早期的大佬们,像求伯君、马化腾等都曾经是活跃BBS站长。网页里的电脑博物馆重建了1998年北京天堂资讯站Paradise BBS的系统,登入这个系统你会发现它的所有的节点都是一个单独的电话号码,因为它并不连接到在互联网上,如果在1998年的时候想用自己家电脑连接到天堂站或类似的BBS系统,就需要用电脑上的Modem通过电话拨打BBS站点某个节点的电话号码来连接到它的系统里面去。

天堂站中的信用点抽奖程序

BBS里信息的基本格式是电子邮件,论坛也是通过电子邮件来组织的,论坛里的每一个版面被称为一个“信区”。即使是拨号BBS在这样在以今天的标准看来简陋的系统,也可以包含一个小型的经济系统,比如“天堂站”中的信用点,就可以用来抽奖,或者兑换上线时间。

“网络社会”不只是Internet

在今天使用TCP/IP协议的互联网还没有成型的时代里,靠电话线网络运行的信息系统就已经支撑起相对丰富的这种社交活动了。在70年代到80年代中,人们也曾尝试把若干个像这样的信息系统连接起来,构建更大的“网络社会”。

最成功的尝试一个是Usenet,也被称作“新闻组”(News group)服务。Usenet的主要用户是在大学中,早期的Usenet服务器之间通常使用电话线拨号和UUCP协议交换信息。而迁移到TCP/IP协议的Usenet服务器则使用NNTP协议,直到现在仍然有不少延续自Usenet时代的新闻组服务器运行在互联网上。

运行在Tornado+ for DOS上的NEON BBS

然后那么另外一个比较重要且繁荣的网络是FidoNet,FidoNet是由若干像前面所展示的拨接式BBS站点相互连接所组成的网络。通过FidoNet,不同地区、国家的BBS用户只要连接到本地BBS站,就可以通过Fido网络和远方的BBS用户进行通信了。在国内也曾有过全国性的BBS网络,被称作CFido。

另外值得一提的是欧洲学术和研究网络(EARN),我们现在描述互联网历史时往往是以美国为中心的,却时常忽视欧洲的电信网络发展的也非常早。欧洲的ERAN曾经和和美国的学术网络BITNET一起连接了50个国家的数千所大学和研究机构。

The History of the EARN Network

Minitel与Internet共存了许多年,直到2012年才结束运行,这是2000年的Minitel终端阿尔卡特Web Touch Easy

面向公众的大型信息网络Minitel,是法国政府主导的重要的信息化实践。虽然它只能传输与FidoNet类似的纯文本和简单图形,但由于大型公共机构的加入,它能够实现网上银行、网上订票、远程购物等电子商务功能。

Minitel博物馆:Musée du Minitel ,在旁边的SERVICES MINITEL OUVERTS栏目里提供了一些可以通过网页访问的Minitel模拟器站点

因此我们需要清醒地认识到,我们今天看到互联网它既不是头、也不是尾,它即没有最早出现,也不会是终极的解决方案。可能在未来的某一天,今天的互联网也会被一个新的形态去取代掉。这个事情,不仅可能发生,而且我相信它会发生。但至于它未来的形态是什么样子,我认为这种可能性是开放的,可能是今天我们描述Web3,也可能是其他的形式。或是若干种形态共存的。

在今天的Internet发展起来之前,还过许多不同的网络,这包括一般来说认为是互联网前身的ARPANET和互联网骨干网络的基础NSFNET国家科学基金网络,以及美国军方网络MILNET。互联网被称作“Network of Networks”网络的网络,这描述了互联网的来源,是若干个网络连接在一起。只是原先这些网络上运行的各种不同的协议,都被TCP/IP所取代了。但TCP/IP是不是“终极的网络协议”,我认为这个答案仍旧是开放的。

The History of the EARN Network网站中关于网络协议之争的内容:The Protocol Wars

《The “Hidden” Prehistory of EuropeanResearch Networking》书中对网络协议的变化有着更详细的介绍 ictconsulting.ch/report

2021年四月,欧洲电信标准协会(ETSI)发布了第一份非IP网络报告 etsi.org/newsroom/press

网络空间的可视化实践

对Cyberspace(网络空间)的三维可视化的实践最开始并不在World Wide Web上。即使我们现在讲“互联网”这件事时往往会追溯到Tim Berners-Lee在1991年发明的WWW,但就像TCP/IP并不是网络层上的唯一选择那样,WWW其实也并不是应用层上唯一的选择,比如GopherVR所使用的,就是明尼苏达大学所开发的Gopher协议。

网页里的电脑博物馆有一个小代理服务器,可以把Gopher转换成WWW:Gophper - 用现代浏览器浏览Gopher

我们可以看到Gopher协议的基本组成方式是文件和目录,跟WWW自由组织的页面形态还是有所区别的。因为Gopher协议相对来说较为简单,非常适合用来作为网络空间可视化的实验,所以在1995年的时候明尼苏达大学的开发者们开发了Gopher VR,将Gopher以三维空间的形式展示出来。

在GopherVR中搜索内容 https://www.zhihu.com/video/1440092557129261057

从Gopher VR的形态中可以看出,网络上的三维空间并不是连续的,你并不能从一个场景一直走然后就无缝的走进到另外一个场景里面去,而往往是需要“链接”像传送门那样进行跳转,从一个场景跳到完全不同的场景里面去。直到现在,网络上构建三维空间的实践里面这种限制仍然是普遍存在的。同时Gopher系统也是去中心化的,因为每个人都可以host自己的Gopher服务器,即使一个人的服务器掉线了,但是由诸多Gopher网站构成的“Gopherspace”仍然是可用的。

我来回顾这些技术的目的,正是为了回应目前外界在宣传“元宇宙”时充斥的“宏大理想”和“路演话术”。实现“元宇宙”是需要非常清晰的物质基础和技术基础的,就像我们刚才提到的,远程信息系统的普及的前提是电话线路和Modem的普及。没有Modem这样的硬件,就不能把网络连到电脑上面去。换做今天的背景,就是我们需要光纤,需要交换机,需要芯片,需要电信服务商,需要无线基站等等一些硬件在背后支持,才可能有元宇宙的体验。

“光纤搜索挖掘机”对于网络服务终端来说是一种“不可抗力”

同时它需要有操作系统,要有技术栈,需要网络协议等一系列基础软件的支持。如果没有这些技术基础,元宇宙就是空中楼阁。业界许多“元宇宙”概念的鼓吹者认为“元宇宙”会挑战物质世界的地位,但他们一定无法抵抗“拔网线”或者“光纤搜索挖掘机”不是?没有广泛可用的基础设施,把大多数人排除在外的信息系统是显然是不符合“元宇宙”的愿景的。

90年代的虚拟空间实验

在整个90年代,开发者们做了相当多的尝试去把人们带进一个网络上的三维空间里面。“Metaverse”这个词其实也在这个时候开始用来描述这种带有社交属性的、网络上的三维空间。

How To Build A Metaverse》最初发表在1995年10月14号的《新科学人》杂志上,距今已经整26年了,这篇文章就提到了《雪崩》小说中对“Metaverse”的描述,也提到了当时人们对实现“元宇宙”的探索。文章中提到的Worlds, Inc.这个公司直到今天仍然存在,并且仍然在提供虚拟三维空间的技术。

Worlds, Inc.主页:worlds.net/

但如果我们打开Worlds, Inc.网站的主页,却发现Flash制作的内容却打不开了。这是一个非常鲜明的例子来指出网络内容的可用性问题。就像我们今天说元宇宙中的物品上了区块链,然后这个东西我们真的如宣传的那样就永远可用吗?

实际上Flash动画遇到的问题在链上内容上同样可能遇到,如果播放和操作它的技术栈不再广泛地可用了,那么对大多数观众来说它就被“破坏”了。就像这个Flash文件每一个字节都被完整的保存下来,但由于没有了可以播放它的Flash Player也支持,观众也无法访问它。今天的NFT所定义的收藏品模型的问题其实更明显,且不说大部分NFT都只向电驴链接或BT种子那样保存了一个哈希值,而并不是保存了所有的数据,即使存储了所有的数据,它也会像Flash动画一样,面临着可用性的问题。

早期的AlphaWorlds的样子

我们幸运的看到,Worlds, Inc.在1995年时的产品AlphaWorld的后续产品Active Worlds仍然可用,我们也可以下载它的客户端去体验。它提供了可以导航的导航三维空间,并且能够跟别的用户说话,以及它还有若干个不同场景。

今天仍在运行的Worlds.com服务器

但90年代更多有趣的实践却很可能永远无法被再次访问,比如另外一个很有意思的实践:英特尔的Distributed MOO,它的基础是多人文本线上游戏MOO,而MOO则是历史悠久的多人在线游戏MUD的面向对象版。

英特尔Distributed MOO截屏

MUD是一类多人在线的文字冒险游戏,在国内最流行的MUD服务器是北大侠客行,直到今天仍然可以登陆。而MOO即"MUD, object-oriented",它提供了一个编程语言,可以让玩家自行改变MUD环境中的物品和功能。

维吉尼亚大学的MOO编程语言手册: www2.iath.virginia.edu/

北大侠客行

但是这些系统就没有上面提到的Active Worlds那么幸运,即使我们利用互联网档案馆去在互联网的废墟中“考古”,得到的往往也只有图文信息。下面的链接提到了教育性MUD游戏“多元大学”(Diversity University)提供的基于VRML的三维空间。但“多元大学”在2006年关闭,我们也没有机会去访问它,所有的数字媒体都会面对这样的问题,一旦它的软件过时了,没有人维护了,你就有可能面临不能访问的困境。我们也只能在图片里面怀念一下当时的系统。

在《MUDs, MOOs, WOOs and IRC》中提到了诸多与MUD和MOO有关的试验:MOOs

“多元大学”的VRML MOO环境

这一系列在MUD、MOO上增加三维可视化层的实践与GopherVR是相似的:都在基于文本的内容上增加了一个三维可视化层,就变成了一个个三维的可交互空间。

Scol Engine提供的演示场景

另外一个有趣的实践则是游戏《沙丘》系列的开发商Cryo Interactive(在经历过若干次收购后,目前是Microids的一部分),他们开发的SCOL语言(Standard Cryo OnLine Language)也曾经广泛用于构建网络上的三维空间。

这项SCOL目前主要是由OpenSpace3D引擎的开发者在使用:openspace3d.com/support

OpenSpace3D网站保存的SCOL语言主页:SCOL Language

在90年代,还有许多软件产品希望能够提供网络里的三维空间,比如Superscape VRT浏览器插件就是比较流行的一个,我这里有一个他们做的三维威尼斯的场景。

而且Superscape也开发了Do3D这样较为傻瓜化的三维场景搭建软件,降低爱好者们搭建三维网络空间的门槛,这款软件曾经在台湾地区以“VR烘培机”之名引进过,“烘培机”是个人主页“Homepage”的音译,用户可以轻易地将三维内容嵌入到网页里面并分享给别人。

将Superscape VRT场景嵌入网页是非常简单的,我只要需要写少量HTML代码,然后就可以把自制的SVR场景嵌入到网页里面去,再像一般的网页内容那样它上传到主页空间里就完工了。同时Superscape VRT也支持一般网页和VRML的特性,比如可以加入链接,这样就可以实现点一下某个物体,然后进入到介绍界面、或者购买链接里去。吧Superscape场景SVR文件嵌入到网页里的代码如下:

<CENTER>

<OBJECT CLASSID="clsid:1B487523-BEC2-11CF-BF9E-0020AF998FF5"

WIDTH=512 HEIGHT=384 align="center" border="8" id="VirtualMachine">

<PARAM NAME="World" VALUE="Assignment1.svr">

<embed SRC="Assignment1.svr" WIDTH="512" HEIGHT="384">

</OBJECT>

</CENTER>

Superscape自有的格式需要通过浏览器插件来访问,但Do3D也可以将场景导出为VRML从而让支持更多的浏览器。通过超链接,可以将多个不同作者、不同技术栈的虚拟空间联系起来。

虚拟身份

接下来值得去讨论的一个概念就是虚拟身份,其实我觉得考察虚拟身份这个概念最好的一个参考的资料就是Bruce Damer的《Avatars!》一书,1997年这本书就总结了当时虚拟身份的各种实践。

完整的书籍内容可以在网上看到:Avatars! Exploring and Building Virtual Worlds on the Internet

当然虚拟身份不一定基于三维空间,《Avatars!》一书中就提到了Comic Chat,也就是微软的漫画聊天软件,它是基于另外一种互联网协议IRC的。使用者可以在聊天时候给自己赋予一个虚拟的漫画形象,电脑会使用自然语言处理技术来产生一系列表情和动作,虽然当时的语言处理其实还蛮原始的,但确实也让网络聊天变得更加生动,并且这项技术也被认为是在网络上表现虚拟身份、虚拟替身的一个标志性的进步。

在1990年代中其实还有很多相似的实践,比如说像Sony Community Place(SAPARi - さぱり)以及CyberTown都曾经产生过不小的影响。但是由于这些系统目前都已经不可用了,我们也只能通过图片来想象它们运行的情况。

网上已经有国外爱好者恢复了SAPARi服务器和客户端的安装包,可以在本机安装体验:Sapari (Sony Community Places)

在本机安装运行的SAPARi服务器和客户端

最后值得一提的是2004年的Croquet Project,在Croquet Project的开发者中我们能找到那些对计算机图形交互界面产生过重要影响的人物,比如Smalltalk的发明人Alan Kay,以及第一款可以自由移动的三维第一人称视角射击游戏引擎The Colony(Mindscape,1988)的开发者David A. Smith。

David A. Smith维护的Croquet Project博客: Croquet

Croquet Project希望提供一种三维协作环境,希望让参与者可以在其中完成虚拟会议等之前需要在线下完成的工作。它展现了一些非常超前的三维交互特性,比如能够连接不同场景的“镜子”、可以通过手绘生成三维物体的“绘图板”、以及在三维空间内的IDE开发环境。

Croquet Project在其三维空间内提供的开发环境

介绍Croquet Project的论文《Croquet - A Collaboration System Architecture》:citeseerx.ist.psu.edu/v

这就是到现在位置人们对于基于通信网络的,不只是互联网,也包括各种历史上的网络技术的,‍‍具有社会、社交属性的三维可视化环境的一系列的‍‍努力的一个非常最简单的这种介绍,谢谢大家。