疯子写手:文本终端上的生成写作实验

作者:蓬岸 Dr.Quest
知乎文章编号:410713129
创建于:2021-09-15 2:40:17
修改于:2021-09-15 2:52:45


在今年早些时候北京德国文化中心的“不透明游戏”展览的开幕式的模拟拍卖环节中,曾经展示了我的一件作品“疯子写手”。它运行在2000年代在银行和邮局中常见的网络液晶终端机上,并生成“古董电脑室”的梦话版——它生成的语言并没有意义,但语汇却与此专栏一致。当然你或许也可以从中找到一些“大快所有人心的大好事”之类的搞笑文案,或是“冬天在南方发生的任何意外”式的乌力波灵感。

在线体验:网页里的电脑博物馆

搞笑文案是自然是意料之中的效果,但在戏谑的效果之外,我在制作它的时候,还是希望它能够作为某种“教材”,包含一些新媒体艺术史中的重要节点。这其中就包括了远程信息艺术(Telematic Art)、以随机为核心的生成艺术(Generative Art),以及以生成可阅读的文本为目标的生成文学(Generative Literature)。

远程信息艺术

在形式上“疯子写手”是国内少见的终端艺术(Terminal Art),与这次展览中的另一间作品“绿屏应用程序”一样,它们都是为在纯文本的终端机上操作而设计的。在20世纪90年代末图形化的WWW浏览器成为商业互联网几乎唯一的访问方式之前,纯文本终端和仿真终端软件都被广泛用于访问各种计算机网络。

罗伊·阿斯科特在1983年使用TI-745终端机连接到运行在ARTEX上的电子邮箱程序,与来自12个不同地点的艺术家共同创作了著名的《文之褶》(La Plissure du texte)——这是最早的线上协作创作之一。

德国新媒体艺术家David Schmudde在其主题演讲“误用者”中详细讲解过这个作品 Misuser - Strange Loop

以及可以参考PPT:Misuser: The Case For a Steady Diet of Creative Misuse in Computing by D. Schmudde

2019年纽约新美术馆(New Museum)展示了巴西艺术家Eduardo Kac复原的1986年作品Reabracadabra,这是另一个标志性的使用终端机的作品,它使用的Minitel终端机及其背后的网络系统曾经被认为是法国版的“信息高速公路”,除了法国之外,它的用户还遍及英国、巴西和加拿大。Minitel终端机展示了通常文本终端所不具备的视频图文(Videotex)功能。

美术馆中展示的复原的Reabracadabra

在描述这件作品时,Eduardo Kac提到:“这个网络已经不存在了,就像我们现在的互联网有一天会不存在一样,当我们谈论网络文化时,有一个普遍的误解。每个人都对互联网如此痴迷,但对我来说,它是一种历史现象。它将在未来被其他网络所取代”。而这正是这件作品中以终端艺术的形式呈现的原因——我们应当去查考那些互联网之前的网络形式,并找到通向替代互联网的途径。

纽约时报的报道:nytimes.com/2019/01/23/

生成艺术中的随机

在最初的设想中,这个作品会聚焦于一个低算力的计算环境,它就像我之前移植到步步高学生电脑的GBK版10 PRINT一样。至少,它应该保留某种向老式电脑移植的可能。

步步高学生电脑上基于GB2312改编的“10 PRINT”

回望历史,我们会发现在乌力波在文学界出现的同一时期,视觉艺术中也出现了规则生成的实践,弗朗索瓦·莫尔莱及其创立的(François Morellet)法国视觉艺术研究小组(Groupe de Recherche d´Art Visuel)就是此领域的先锋。

《依据电话簿中的奇偶数随机分布的四万个方块,50%蓝,50%红》

《依据电话簿中的奇偶数随机分布的四万个方块,50%蓝,50%红》(Random Distribution of 40,000 Squares Using the Odd and Even Numbers of a Telephone Directory, 50% Blue, 50% Red)展示了一张类似于“二维码”的图形。

《四种随机分布的元素》

法国视觉艺术研究小组的另一位创始人薇拉·莫尔纳(Vera Molnar)的《四种随机分布的元素》(Quatre éléments distribués au hasard)则以更显见的方式影响到个人电脑工业。

1982年Commodore 64家用电脑说明书中的程序示例“10 PRINT”将四种元素减少为两种,并随着这款家用电脑的流行而成为了许多爱好者,特别是青少年生成艺术的启蒙老师。时至今日,#10print已经成为一个与随机图案紧密相关的标签。

生成文学

随机算法也与生成文学的出现有着紧密的联系,早在1952年,英国计算机科学家克里斯托弗·斯特雷奇(Christopher Strachey)使用Mark I电脑的随机数发生器制作了基于计算机的“情书生成器”。

情书生成器生成的“情书”

它的算法非常简单:

  1. 印出从敬语列表中抽取的两个词
  2. 重复五次:
    2.1 根据随机值在两个句子结构中选择一个。
    2.2 从形容词、副词、实词和动词的列表中填写句子结构。
  3. 印信件的结尾。

情书生成器的现代PC移植版:github.com/gingerbeardm

关于情书生成器的更多内容,可以参考:An Account of Randomness in Literary Computing

而1984年的The Policeman's Beard is Half-Constructed,可以译为《警察的胡子是半成品》或《那个警察的胡子被构造了一半》则是第一本由程序编写并出版的书,而生成这本书的程序,叫做RACTER,其名字来自于说书人的英文单词raconteur。

RACTER的开发者之一比尔·张伯伦(Bill Chamberlain)的《让电脑自己写作》(Getting a Computer to Write About Itself)一文介绍了RACTER的算法:

Getting a Computer to Write About Itself

……但也可以通过在纸条上写下数以千计的单词和我们称之为 "层次指令"的东西(即组成规则),通过掷骰子获得随机数种子,然后以符合一套任意规则的方式在这些移动堆中的纸条——比如从A堆中挑选一个纸条,从B堆中挑选一个纸条等等,通过执行随机挑选的层次指令,组成一个句子。

虽然许多人认为RACTER是某种形式的AI,但比尔·张伯伦却不这么认为:“真正的人工智能取决于仪器学习的东西,而Racter则是一个封闭的系统。”

The Policeman's Beard is Algorithmically Constructed -

就像许多电子游戏可以找到对应的桌游原型一样,这种规则拼接式的生成我们也可以在经典的美式写作游戏Mad Libs找到影子。

一篇关于Mad Libs的中文介绍:这么经典好玩的美式写作游戏你知道吗?_腾讯新闻

疯子写手是如何工作的?

“疯子写手”延续了RACTER的实践,它使用古董电脑室的文章作为数据源,在展览的版本中,为了回应展览关于“加密”的主题,它使用了通过Matataki保存在IPFS上的文章副本。当文本被下载之后,程序就会做以下动作:

  1. 随机选取一篇文章,删除HTML标签,仅保留文本
  2. 用 jieba “结巴”中文分词库抽取文章词库,按词性归类
  3. 选择随机的词汇,用模板拼接成句子,不平衡地随机(imbalanced random)加入标点符号和分段
  4. 停顿随机的时间,将新编的句子写(显示)在终端上
  5. 每写满1000个字,重新开始写作

正如《警察的胡子》所写下的文字本质上来自于其作者,而程序所输出的的其实是对其作者所投入在其中的知识和经验的变形那样,疯子写手中的语言也来自古董电脑室,而且也被程序扭曲而产生了新的阅读体验。