复杂系统和人工智能的进化(下)

 《复杂性中的思维》

经典的确定论机器:
  输入
  →
  输出
  经典可观测量
  确定论演化
  经典可观测量
  经典随机计算机:
  输入
  →
  输出
  经典可观测量
  随机演化
  经典可观测量
  量子计算机
  输入
  →
  输出
  量子可观测量
  确定论演化
  量子可观测量
  图5.13经典的和非经典的计算机

  在量子力学中,如动量或位置这样的矢量,必须用算符来代替,此种算符满足某种依赖于普朗克量子的非对易关系(图2.18)。由哈密顿函数描述的经典系统被量子系统代替,例如,电子或光子用哈密顿算符来描述。量子系统的状态由希尔伯特空间的矢量来描述,由其哈密顿算符的本征矢量来确定空间距离。算符状态的因果动力学是由叫做薛定谔方程的偏微分方程确定的。经典的可观测量是可对易的,而且总是取确定值,而非经典的量子系统的可观测量则不可对易,一般没有共同的本征矢量,结果也就没有确定的本征矢量。对于量子状态的可观测量,可以计算的只是统计的预期值。

  与经典力学的一个主要区别在于叠加原理。它揭示了量子力学的线性特征。在一个关联的纯量子叠加态,可观测量只有不定的本征值。简言之,量子力学的叠加或线性原理提供了复合系统相关(“关联”)状态,这得到了EPR实验的高度确证(Alain Aspect,1981)。从哲学上看,(量子)整体要大于其部分的加和。

  叠加原理对于量子系统的测量有重要的后果。在量子形式化中,一个量子系统和一套测量装置由两个希尔伯特空间来表示,它们以张量积组合起来H=H1H2。以H1和H2分别出于两个独立的状态和,在时刻O,测量系统的始态(O),相应有(O)=。两个系统的因果发展是由薛定谔方程确定的,即(t)=U(t)(O),U(t)是归一化算符。由于U(t)的线性,态(t)是与不定本征值关联的,而测量仪器在时刻t显示出一定的测量值,它们显示出不同的测量值。因此,线性的量子动力学不可能解释测量过程。

  以更通俗的方式来说明测量过程,可以用薛定谔的一个关于猫的思想实验,其中涉及“死”和“生”两个状态的线性叠加(图5.14a)。设想一只猫,被关在一个封闭箱子中。箱子中装有镭,镭一小时发生一次衰变,其几率为1/2。如果发生了衰变,电路闭合,引起相应机制的动作,使得小锤打破装有氰氢酸的小瓶,从而杀死这只猫。该箱子继续保持封闭一小时。

  按照量子力学,猫的两种可能状态——死和生——都是不确定的,直到观测者打开箱子才能得到结论。对于箱子中的猫的状态,如薛定谔解释的,量子力学预见了一种相关(“关联”)的叠加态,即猫的死和活各占一半。按照测量过程,“死”和“活”状态被解释为测量指示器,代表着镭“发生了衰变”或“未发生衰变”状态。

  在玻尔、海森伯和其他人的哥本哈根解释中,测量过程被解释为所谓的“波包坍缩”,即把叠加态分裂成测量仪器的两个状态,并测得了量子系统有两个确定的本征值。显然,我们必须把量子系统的线性动力学与测量的非线性动作区别开来。原因在于,世界的非线性常常被解释为人的意识突现。

  

  欧基尼·威格纳(1961)主张,薛定谔方程的线性,对于有意识的观测者可能不适用,应该以某种非线性程序来代替,据此其中的任何一种选择都可以得到解决(图5. 14b)。但是,威格纳的解释使我们不得不去相信,复杂的量子线性叠加仅仅在宇宙中出现了人这样的意识的角落,才将被分解为独立的部分。在弹子球、行星和星系的宏观世界中,EPR关联性是测量不到的,它只在基本粒子如光子的微观世界中才显示出来。显得十分奇怪的是,在宏观世界的独立系统状态——它们可以用具有确定测量值的经典力学来描述的,却是由人这样的意识引起的。

  

  埃弗里特的量子力学的“多世界”解释,将人的意识分裂成不同分支,使不同的、互不相容的世界受到抑制(图5.14c),从而仿佛避免了非线性还原的问题。

  

  在测量过程中,测量仪器和量子系统的动力学的描述使用的方程(t)=ci(t)ii,式中状态(i)涉及测量仪器的测量值。埃弗里特认为,态矢量(t)不分裂成部分状态,但是出现了所有的分支ii状态(t)描述了多重的同时存在的真实世界,ii相应于第i个平行的世界。因此,所测量的分系统决非一个纯态。在埃弗里特的意义上,n可以解释为相对态,它依赖于观察者或测量仪器的状态:n=Cn-1(n,)H2。如果n被看作记忆状态,那么具有一定记忆的观察者只可能意识到他自己的世界分支n×n。但是,他能够观测其他的分世界。

  埃弗里特解释的优点在于,叠加的非线性还原并不需要解释。而缺陷在于他的多世界的本体论信念,这样的世界原则上是不可观察的。因此,埃弗里特的解释(如果数学上协调)需要奥卡姆剃刀。

  在科学史上,拟人的或目的论的论据往往表明,科学在此存在着解释的分歧或失败。因此,一些科学家如罗杰尔·彭罗斯提出,量子力学的线性动力学对于解释出现意识的宇宙演化是不能令人信服的(爱因斯坦说它是“不完善的”)。他争辩道,线性量子力学和非线性广义相对论的统一理论,至少在原则上可以解释世界上的独立宏观系统状态,而不必牵涉到拟人的或目的论原理。在彭罗斯主张的统一理论中,物理系统的线性叠加,当系统对于相对论引力效应充分大时,就会分裂成独立状态。彭罗斯计算了在一个引力子水平上,对于这种效应的最小的曲率单位的情况。该思想是,这种水平应该令人满意地落在线性量子力学定律的原子、分子等等的量子水平与日常经验的

  经典水平之间。彭罗斯论据的优点在于,量子世界的线性与宏观世界的非线性将可能用统一的物理理论来解释,而不必牵涉任何人F的干预。当然,我们仍然缺乏可检验的统一理论(参照2.4节)。

  然而,由此引出的问题是,量子力学是否提供了人的大脑进化的框架,或至少为新的计算机技术去取代经典的计算机系统提供了框架。量子力学的基本思想是量子状态的叠加,这种叠加是由某种测量实现的线性量子动力学和叠加归并的结果。因此,一个量子计算机世界需要一种逻辑门的量子版本,在此输出将是某种统一算符应用于测量的输入和最终作用的结果。量子系统(例如光子)的叠加提醒我们计算的平行性。如果我们感兴趣的是对于许多计算结果的某种适当组合,而不是其部分的细节,量子计算机将变得非常有用。在此意义上,量子计算机可以在相对短的时间内实现可能的数量巨大的平行计算的叠加,从而克服经典计算系统的效率问题。但是,量子计算机仍将按照某种算法方式运行,因为它们的线性动力学是确定论的。测量的非线性将带来非确定论方面。因此,我们不可能期待,量子计算机将以超出图林机能力而以非算法算符方式运行。所以,量子计算机(如果它们构造出来了)对于复杂性理论和克服实际的计算约束可能更有趣。

  关于人的大脑,我们想要争辩的是,量子水平上的基本粒子、原子和分子对于其进化是必要的,而不是需要其他的东西——物理学相关态的归并所必要的大脑精神状态。实际上,相当多的神经元对于单个量子及其叠加和牵连状态的归并并不敏感。但是,这些量子状态当然不可能被大脑的精神状态所察觉。我们既不能意识到叠加,也不能意识到它们由非线性的随机事件引起的分裂成单个状态。然而,在大脑的精神状态的形成和相互作用中涉及到量子效应,它们还远未被满意地理解。

  5.3神经计算机和协同计算机

  在逻辑、经典力学和量子力学之后,我们还要考察复杂动力学系统对于计算机科学和人工智能发展的关系。显然,图林类型机的算法机制面临着严重的障碍是不可能随经典或量子计算机能力的增长而克服的。例如,模式识别和其他的关于人的感知的复杂任务,不可能由程序控制的计算机来把握。人脑的结构看来是完全不同的。

  在科学史上,大脑是用最先进的机器技术模型来说明的。因此,在机械化时代,大脑的功能被看作是沿着神经对于肌肉进行作的液压。随着电子技术的出现,大脑被拿来与电报或电话交换机进行比较。由于计算机的发展,大脑也就被当作最先进的计算机。在上一章中,我们见到,甚至量子计算机(如果它们被构造出来)也不可能使它们的能力增加到超出图林类型算法的复杂性。

  与程序控制的系列计算机不同,人的大脑和精神的特征包括矛盾性、不完全性、顽健性和抗噪声、混沌态、对于初始条件的敏感性最后但并非最不重要的是还有学习过程。这些特征在复杂系统探究方式中是众所周知的。关于图林类型和复杂系统的构造,一个根本的局限性来自经典系统的顺序的、集中的控制,而复杂动力系统是内在平行的和自组织的。

  然而,历史上,最初的神经网络计算机的设计仍然受到了图林机概念的影响。在麦卡洛克和皮茨的著名文章《神经活动中思想内在性的逻辑演算》(1943)中,作者提出了一种被神经元作为阈值逻辑单元的复杂模型,单元中有激发和抑制突触,这里就运用了罗素、希尔伯特、卡纳普及其他人的数理逻辑概念以及图林机概念。一个麦卡洛克- 皮茨神经元在时刻n+1发放一个沿其轴突的脉冲y,如果在时刻n它的输入x1,…,xm和权重WI,…,Wm的权重和超过了神经元的阈值O(图5.15a)。

  

  麦卡洛克-皮茨神经元的特殊应用是如下的逻辑关联模型:或门(图5.15b)模拟了句子x1和x2的逻辑析取x1ORx2(形式上是x1Ⅴx2),它为假,仅当x1和x2是假句子,否则它是真的。真值是二元表示0(代表假)和1(代表真)。对于阈值Θ=1和权重W1= 1和W2=1,或门以x1w1-x2w2≥Θ的方式发放,只要x1或x2或者x1和x2都是1。

  与门(图5.15c)模拟了x1ANDx2的逻辑合取x1并x2(形式上是x1x2),它为真,仅当x1和x2是真句子,否则它是假的。对于阈值Θ=2和权重w1=1和w2=1,与门以x1w1 +x2w2≥Θ的方式发放,仅仅当x1和x2都是1。

  非门(图5.15d)模拟逻辑否定NOTx1(形式上是x1),它为真,仅当x1是假的,否则它是假的。对于阈值Θ=0和权重w1=-1,非门以x1w1≥Θ的方式发放,仅当x1为 0。因此如果x1是1,那么非门并不发放,这意味着输出y=

  x1=0

  一个麦卡洛克-皮茨神经网络是一个麦卡洛克-皮茨神经元系统:把每一神经元的输出分解成为线路而相互关联起来,其中一些输出还与其他神经元的输入相关联(图5. 16)。尽管这种系统概念非常简单,但是任何“经典的”冯·诺意曼计算机都可以用这种神经元网络进行模拟。1954年,约翰·冯·诺意曼写了一篇报告稿。它以首次明确阐述存贮程序的思想而闻名,存贮程序与其要操作的数据都可驻留在计算机的记忆装置中。该历史文献表明,冯·诺意曼完全意识到用麦卡洛克-皮茨网络进行计算的可能性。

  

  数学上,一台冯·诺意曼计算机可以设想为一台有限自动机,包括有限输入集X、有限输出集Y和状态的有限集Q。有限自动机的动力学用下一状态的函数&来定义,将时刻t的状态q和输入X变换为时刻t+1的状态&(q,X),以及将输出函数B与状态q关联成为输出B(q)。

  一台冯·诺意曼计算机的组件,诸如输入-输出单元、存贮器、逻辑控制单元和算法单元,都容易表明是有限自动机。甚至一台现代的数值计算机,它是由数千元素集成在芯片上的网络,也可以理解为麦卡洛克-皮茨类型的神经网络。一般地说,每一寄存机、图林机或递归函数,都可以用适当的有限自动机网络来模拟。但是这些麦卡洛克- 皮茨神经网络的应用仍然是在程序控制系列计算机的框架中工作。

  最先试图将图林的通用计算机概念扩展到自繁殖自动机思想又是约翰冯诺意曼。他注意到,一台建造其他机器的机器,会降低被建造机的复杂性,因为它使用的材料不可能多于由建造机所给定的材料。与这种传统的机械观点相反,生物进化中的活的有机体看来至少是可以与其父代一样复杂,而在长期进化中会增加其复杂性(赫伯特·斯宾塞)。

  冯·诺意曼的细胞自动机概念,把活的有机体设想为细胞的自繁殖网络从而首次提出了为其建立数学模型的线索。态空间是均一点阵,它被划分为相同的元胞如同棋盘。一台初等的元胞自动机是一个元胞,它可以具有不同的状态,例如可以有“占态”(用一个记号)、“空态”或“色态”。初等自动机的集合体,被叫做一台复合自动机或构型。每一自动机都以其环境即相邻元胞为标志。自动机的动力学是由同步变换规则确定的。冯·诺意曼证明,活系统的典型特征,它们的繁殖自身的趋势,都可以用(平面上的)2

  0个元胞的自动机来模拟,在此每一元胞有29种可能的状态,4个相邻角上的元胞则作为环境。

  这种思想由约翰·康韦发展了,他的元胞自动机可以模拟活系统群体的生长、变化和死亡。下面是一个简单的例子,其中元胞有两种可能的状态“占态”(记号)或“空态”,使用同步规则:

  1)生存规则:一个有2至3个占态相邻元胞的占态元胞保持不变化。

  2)死亡规则:一个元胞丢失了它的记号,如果它有3个以上的邻居元胞(“群体过密”)或少于两个邻居(“孤立”)。

  3)新生规则:如果一个空的元胞正好具有3个占态的相邻元胞,那么它就获得一个记号。

  图5.17a示意了一种构型在第三代的“死亡”,图5.17b示意在第二代的“生存”。康韦的理论还有一些更令人吃惊的结果,它们是通过计算机实验发现的。

  

  元胞自动机不仅仅是优美的计算机游戏。它们还是描述了其动力学演化的非线性偏微分方程复杂系统的离散化和量子化模型。让我们再想像一块类似棋盘的元胞的平面。一条有限的元胞串,构成了一台1维元胞机自动机,其中每一个元胞都可以取两种状态之一(“黑”(0)或“白”(1)),它仅仅与其两个最近相邻发生关联,在此它们交换关于其状态的信息。1维元胞自动机的紧随的(下一个)状态是空时平面紧随的元胞串,其中每一都由取得一种或两种状态的元胞构成,依赖于它们先前的(上一个)状态和它们的两个最近相邻。图5.18b-e表示4个元胞自动机在60步中的时间演化。因此, 1维元胞自动机的动力学是由3个变量的布尔函数确定的,其中的每一个变量都可以取值 0或1。

  

  对于3个变量和两个值,3个近邻有2[3]=8种可能性。在图5.18a中,它们是按照相应的3个数字的二进制数排序的。对于3个近邻中的每一个,必定有一个规则确定中间元胞的随后状态。对于8个数字的序列和两种可能状态,有2[8]=256种可能的组合。这些可能的组合之一,确定了一个1维元胞自动机的动力学,这示意在图5.18a中。

  每一规则,由8个数字的二进制数的状态来标志,这些状态是每一随后的元胞串可以采取的。这些二进制数可以按照它们的相应的十进制数来排序。

  这些规则的时间演化标志了1维元胞自动机的动力学,从随机的初始条件出发产生出非常不同的元胞模式。计算机实验给出了演化的元胞模式所要采取的如下的吸引子类型。经过一些步骤以后,类型1的系统到达了与起始条件无关的平衡均匀态。这种平衡终态示意为完全的白平面,并相应于某种作为吸引子的不动点(图5.18b)。

  类型2的系统,经过一些步骤后,表现出恒定的或周期的演化模式,它是相对独立于其起始条件的。模式的特定位置可能依赖于起始条件,但不是总体模式结构都取决于起始条件。

  类型3的系统向混沌态作为终态吸引子演化,而没有任何的总体周期性。这些混沌模式敏感地取决于起始条件,并表现出具有分数维数的自相似行为(图5.18d)。类型 4的系统产生高度复杂的结构,具有局域传播形式(图5.18e)。类型3和4的系统对于微小的涨落是敏感的,微小的涨落可以影响秩序的总体变化(“蝴蝶效应”)。因此,在这些情形中,演化过程不可能作出长期预测。

  显然,这4种类型的元胞自动机模拟了自组织过程中大家熟悉的非线性复杂系统的吸引子行为。在前面的章节中,我们已经看见了许多物质、生命和精神-大脑进化的例子。在第6章中,我们将要考虑许多与人类社会进化的类似性。一般地,自组织被理解为复杂系统中的相变。宏观模式从微观元素的复杂非线性相互作用中出现。相变的不同终态相应于数学上不同的吸引子。

  在图2.27a-e中,已经对于流体的不同吸引子进行了考察,流速是逐步加速的。这些流体模式,与相应的元胞自动机的演化模式有许多相似之处。在最初的水平上,流体到达了均匀的平衡态(“不动点”)。在较高速度时,可以观察到两个或多个顶点的分叉,相应于周期的和准周期的吸引子。最后,有序衰退为确定论混沌,它是复杂系统的分形吸引子。元胞自动机的类型3和类型4对于建立过程模型极为有趣。类型3提供了混沌系统的演化模式。类型4表现了耗散系统的演化模式,这样的系统有时具有拟有机形式,它们可以在有机体和群体的进化中观察到。

  从方法论的观点看,一个一维的元胞自动机提供了一种离散的量子化相图模型,描述了依赖于一个空间变量的具有非线性偏微分演化方程的复杂系统的动力学行为。人们局限在离散模型的原因是多方面的。非线性系统的复杂性往往太大了,难以在合理的时间内计算出近似数值。在这种情形下,一个离散的模型对于系统的长期的总体动力学行为,可以提供大致的,但是充分的信息。如果进化规则的相关性被扩大到元胞串中的两个邻居以上,动力学行为就不同了。

  二维的元胞自动机,在康韦的生命游戏中已经使用了,可以被解释为采取非线性演化的复杂系统的离散模型,依赖于两个空间变量。显然,当非线性系统的复杂性增加,以及由求解微分方程或甚至由计算数值近似来确定其行为变得越来越无望时,元胞自动机是非常灵活有效的建模工具。

  从历史角度看,元胞自动机的现代发展可追溯到冯·诺意曼早期的自繁殖自动机思想。除了自繁殖以外,与传统的计算机相比较,还有另一个特征对于自然复杂系统是根本性的。人的大脑具有学习的可能性,例如,通过感知进行学习。在麦卡洛克-皮茨网络提供的大脑的一级逻辑模型中,人工神经元的功能对于所有时间都是不变的。麦卡洛克-皮茨成功地揭示出,这种类型的形式神经元网络可以计算任何有限的逻辑表示。

  但是,为了使神经计算机能够执行复杂的任务,有必要去发现自组织机制,使神经网络能够进行学习。唐纳德·霍布1949年提出的第一个神经生理学习现则,在神经计算机的发展中具有重要意义。神经元突触的敏感性并非一成不变,而是在改变着自身,以有利于重复出过去已经反复出现过的发放模式。

  1958年,罗森布洛特设计了第一台学习神经计算机,它以名字“感知机”而闻名。罗森布洛特原先是一位生理学家,专注于人的学习过程的生理学活动。他设计的学习机具有复杂的适应性行为,工程师和物理学家都很感兴趣。因此,用不着惊奇,生理学家的新颖思想被工程师抓住了,那些工程师对机器人和计算机技术,比对于模拟人脑中的过程,具有更大的兴趣。从技术的观点来看,神经计算机的学习程序是否与心-脑系统的学习过程类似不是根本性的。它们必须在管理复杂的适应行为时是有效的,但是可以利用完全不同于已知的生物进化中的方法。

  罗森布洛特的神经计算机是一种馈向网络,采用二进制阈值单元,有3个层次。第一层是感知面,叫做“视网膜”,它由刺激细胞构成(S单元)。S单元与中间层相联接,其间的权重固定,在学习中不发生变化。中间层的元素叫做联想细胞(A单元)。每一A 单元都有某些S单元的固定权重的输入。换言之,一些S单元将其输出投射到一个A单元上。一个S单元还可以将其输出投射到几个A单元上。中间层是完全与输出层相联接的,输出层的元素叫做反应细胞(R单元)。中间层与输出层之间的权重是变量,因此是能够学习的。

  感知机被看作神经计算机,它可以将感知模式分成可能的若干组。在两组的情况下,每一R单元学习以激活和去活方式去区别输入模式。感知机的学习程序是受指导的。因此,必须清楚地认识与所要学习的模式相应的所希望的每一R单元的状态(激活或未被激活)。要学习的模式提供给了该网络,在中间层和输出层之间的权重按照学习规则进行适应。重复此程序,直至所有的模式产生出正确的输出。

  学习程序是一种简单的算法:对输出层的每一元素i,实际上输出o,它是由一定模式产生出来的,与所希望的输出d;相比较。如果oi=di,那么该模式就已正确地分类。如果所希望的输出di等于1以及实际上的输出oi等于0,那么在时刻t的所有的权重wij (t)以及激活单元(oj>0)在随后的步骤t+1树放大,或形式上有wij(t+1)=Wij (t)+σoj。常数u是学习速率,它可以按照其大小增加或减少学习的速度。如果所希望的输出等于0,实际上输出等于1,那么所有具有激活元素的权重都会消失,或形式上有wij(t+1)=wij(t)-σoj。

  感知机看来是以无所不能的神经网络开创了一个计算机技术的新时代。感知机小组在早期的文章中进行了如此的夸张。但是,1969年,尖锐的批评使得这种热情消失了。那一年,马尔文·闵斯基和西摩·帕佩特出版了一本著名的书《感知机》,书中以数学精确性讨论了感知机的局限性。对于这一分析的反应是,大多数研究小组都放弃了它们对于神经网络和复杂系统探究方式的兴趣,而转向经典的AI和计算机技术,看来这比感知机迷的“猜测”要更有益。

  但是1969年以后的这种科学共同体的态度,当然是又一次反应过度了。无批判的热情和无批判的谴责,对于科学的进化都是不合适的做法。达尔文进化用了成千上万年,才使得我们的大脑具有了模式识别的能力。如果我们的工程师只用几年就成功地构造出来类似的神经计算机,那就是奇迹了。

  关键是随后的一些问题。感知机能够干什么?不能干什么?感知机为何不能干?回答这些问题的一个基本步骤是闵斯基和帕佩特证明的所谓感知机收敛定理。它保证了原则上可用此种网络学习并可在有限的学习步骤中发现解。在这种意义上,系统收敛到一个解已经得到了证明。

  但是由此引出的问题是,特定的解是否原则上可以用感知机进行学习。一般地说,我们必须确定适用于感知机的问题类型。一些简单的例子表明,感知机并非如最初热情中所相信的那样是通用的。例如,一台感知机是不可能区别偶数和奇数的。一个特例是所谓的奇偶性问题对于初等逻辑的如下应用。

  感知机不能学习排除OR(缩写为XOR)。这种无法解决的认知任务是感知机应用于 AI的一个严重局限。此原因容易说明。排除OR对于xXORy,仅当或x或y为真时为真,并非

  x和y都为真。一条OR语句的xORy,仅当x和y都为假时为假,否则为真。如下的表提供了布尔函数OR和XOR的值:

  现在,设想一个网络,有两个输入单元x和y,以及一个输出单元z,它们可以采取状态1(激活)和0(末激活)。要模拟XOR,对于一个偶的输入(两个输入单元都是激活的或都是末激活的),输出应该为0,而对于一个奇的输入(一个单元是激活的,另一个是末激活的),输出应该为1。在图5.19a,b中OR和XOR的可能输入构型示意在一个坐标系中,其中输人x和y作为坐标。

  坐标x和y的每一对(x,y)具有相应的值z,它是用白点(0)或黑点(1)来标记的。一个线性的阈值元素Θ计算加权输入x和y,权重是w1和w2,形式上即是Θ=w1x+ w2y。一个简单的求导提供了一条直线,示意在图5.19a,b中。直线的位置是由权重w1 和w2确定的。它将阈值元素的激活和末激活的状态隔离开来。

  为了求解(“学习”)OR问题或XOR问题,权重w1和w2必须以这样的方式加以调整,使点(x,y)以及值z=1与具有0值的点隔离开。这种线性的隔离对于OR问题从几何上是可能的,但是对于XOR问题是不可能的。一般地说,感知机对于输入模式的分类,局限在线性隔离模式的范围。

  这种结果能够容易地被推广到两个以上输入单元和真值。许多问题在线性不可隔离的意义上,类似于XOR。实际上大多数有趣的计算问题都具有这种特征。XOR问题可以由加上一个隐含单元到具有两个输入与输出相关联的网络中来解决。隐含的元素是与输入和输出都关联的(图5.19c)。

  当两个输入都是0时,具有正值的隐含中间单元就关闭了。一个0信号到达输出,以及由于在这种情况下阈值为正,所以输出为零。如果两个输入中只有一个为1,隐含单元保持关闭,输出单元由输入和输出之间的直接关联而接通。最后,当两个输入都是1,隐含的单元发放到1,并以负的权重-2抑制了输出的接通。

  因此,隐含单元允许某种适当的内部表示。XOR问题已经成为一个在三维坐标体系中用二维平面进行线性分隔的问题,3维坐标系以输出单元的3个输入为坐标。分割是可能的,因为输入(1,1),现在z平面上移动到了点(1,1,1)(图5.19d)。

  一台感知机只有一个中间层,它是可以学习的处理元素。对于多层网络,问题是,对于与外界没有关联的多层神经元,产生的错误是不可能直接察觉的。一个错误可以是直接在输出层和其下的中间层之间产生的。

  多层神经网络可能具有的表示能力和问题求解能力,取决于学习层的数目和在这些层中的单元数目。因此,对于神经计算机的一个至关重要的问题就是要研究计算的复杂性,因为神经网络的复杂性的增加是从感知机的局限性中走出来的方式。

  在4.2节中,我们已经讨论了在多层神经网络中的后向传播(图4.17)。一个后向传播的学习算法使得我们去定义甚至处于隐含层上的一个错误的信号。输出层上的错误是递归地向后传播给下面的层次的。该算法是能够构造具有许多隐含层的网络的,其神经元能够进行学习。比起单层网络来,多层网络在其隐含的层次中可以表示多得多的信息,所以后向传播网络对于克服感知机的弱点是非常有用的模型。

  但是,后向传播仅仅从技术上提供了成功的模型,这些模型一般并不与生物进化相类似。它们的权重调整看来很不同于人们所知道的生物突触的行为。计算机技术的目的并不在于模拟大脑,而是在合理的时间内实现的问题有效求解。另一方面,我们必须要放弃孩童式的幻想,认为自然是类似上帝的工程师,进化中他总是在发现最好的解。正如我们在前面的章节已经强调的,自然中没有集中化的控制和编程单元。常常只有局部的解。它们一般并非是“最优”的。

  1988年,戈尔曼和西杰诺夫斯基设计了一种馈向网络,并用误差后向传播方法对其进行训练,试图将其用于区别岩石与矿石的声纳系统。要区别出岩石与矿石的回声是相当困难的,甚至用受过训练的人耳也难以胜任,而这对于海底的工程是相当重要的,海底工程需要能区别爆炸矿石和岩石的声纳系统。用于这种目的的网络构造中,输入层有 60个单元,隐含层有1-24个单元以及两个输出单元,每一个代表将要进行区别的原型 “矿石”或“岩石”(图5.20)。

  

  最初,一定的声纳回声是用频率分析器来处理的,它分解成60个不同的频率带。每一复盖间隔的值域在0和1之间。这些60个值是一个输入矢量的组分,输入矢量给予相应的输入单元。它们由隐含的单元进行变换,导致了两个输出单元之一的激活,这里的值也在0和1之间。因此在一个经过训练的很好调节了权重的网络中,一种矿石的回声导致输出信号(1,0),而岩石的回声则具有输出信号(0,1)。

  为了训练此网络,我们必须向它输入矿石和岩石回声的样品。在每一种情况下,输出单元的实际值,都按照相应的输入,进行了测量并与预期值进行比较。其差异是错误信号,引发单元中的权重发生小的变化。用这种梯度下降的程序,网络的权重就缓慢地进行了调整。

  戈尔曼和西杰诺夫斯基的矿石-岩石网络是复杂系统对于AI的一种应用。当然,它并没有声称,此系统在模拟人的大脑来区分像“矿石”和“岩石”这样两个概念。但是,我们可以说,这种技术系统也具有某种内部表示,即表示了作为其隐含层中原型矢量的两个概念。在这种限制的意义上,人工系统是有“智能”的,因为它可以完成在人脑情况下用智能来进行评价的任务。人工网络并不局限于对概念进行二元区分。1986年,西杰诺夫斯基和罗森伯格设计了一种叫做NETalk的网络,它已经学会了如何阅读。它采取从英语教科书中形成的字符串,并将它们转化成音素串以输入到语音合成器中。惊人的事实并不是它像小孩似的口吃的声音,在通俗书中它已经被赞为辉煌的成功。NETalk的基本能力是对于若干拼音概念的内部表示。对于字母表中的每一字母,至少有一个音素指定给它。对于许多字母,其中有若干音素需要标记,这取决于词汇的上下文。

  西杰诺夫斯基和罗森伯格运用了3层馈向网络。它有一个输入层,一个中间隐含层和一个输出层。尽管后向传播与生物学大脑中“自然地”实现颇为不同,但与其他的解相比,它都表现为最快的学习程序。输入层注视课文的七字符窗口,例如,图5.21a中的短语“The-phone-is-”中的词“phone”。每一个七字符都被29个神经元相继地进行了分析,每一神经元代表了字母表中的一个字母,也包括括号和标点。因此,正好是每一具有29个元素的神经子系统的一个神经元被激活。

  输出层包括26个神经元,每一个神经元表示一个拼音组分。对于拼音的位置有6个组分,对于发音有8个组分,对于音高有3个组分,对于标点法有4个组分,对于重读和音节划分有5个组分。于是,从这4组组分中,每一声音都有4种特征。输出层有7×29= 203个神经元,与80个隐含层内部神经元联结起来,它又是与输出层的26个神经元相互联结的(图5.21b)。在这些层中的神经元是不联结的。输入和输出层的神经元也是不直接联结的。

  隐含层的神经元接收来自203个输入神经元的信号,但是只把26个信号送给输出层。由于内部神经元是阈值单元,具有阈值T1,…,T8,输出是乘以特定权重的,这些积的和的大小决定了此神经元是否激活(图5.21c)。现实中,激活的发生是按照一个连续的“sigmoid曲线”,并非某种数字跃迁。

  最初,权重是随机固定的。因此,NETalk始于无意义的结结巴巴的发音。在学习阶段,NETalk运用了特殊的供小孩阅读的课文,其发单是人人皆知的。随机的声音与所希望的声音进行比较,权重由后向传播进行校正。令人瞩目的是,这种程序是一种自组织,而不是一种基于规则的发育程序。对于由实际输出来近似所希望的输出造成的权重改变,仅仅存在一种总体上的要求。对这种课文运行10遍以后,网络已经能够有理解地进行发音。经过50遍以后,就只有5%的错误了。在这一阶段,对于未知的供小孩阅读的课文的发音,错误也只有22%。

  今天,像NETalk这样的网络还必须用传统的冯·诺意曼计算机来模拟,因为还没有直接的复杂网络的硬件。因此,每一神经元必须顺序进行计算。甚至在今天,自组织复杂网络的原理还主要是在软件上实现的,而不是在硬件上实现的。然而,我们将谈论 “神经计算机”,因为硬件的实现只是一个未来的技术发展问题,有赖于诸如固体材料或光学程序这样的新技术,而不是原则性的理论局限问题。

  由神经网络进行的映射,看来是颇为成功的,用于财政、保险和股票交易预见中是有益的。原因在于,对于股票行情的短期预测以混沌时间系列为基础,如果预测的时间周期减少,那么它就变得越来越混沌。

  通常的统计程序仅仅在长期预测中才是成功的,它假定了股票的发展可以平稳进行,而又不丢失有关信息。好的统计程序的精确性在60%-75%之间。但是,短期的预测则是颇为有限的。传统的统计程序为了平稳股市的发展,必须要忽略短期预测的基本特性,即经常发生着的小的交换涨落。通常的统计程序中,相关计算因子必须明确给出。一个经过良好训练并适当设计的神经网络能够识别出关联因子,而毋需明确的编程。它能够以自组织的程序权衡输入数据并减少预测的错误。而且,它可以采取改变系统环境的条件,而不像计算机程序必须由编程者明确改变。为了设计一个用于股票预测的神经网络,必须对股市数据进行二进制编码使之作为输入数据。输入矢量的构成中,包括若干分矢量,它们代表着交换量,从昨天来的绝对变化,变化方向,从前天来的变化方向,以及与昨天相比的大于1%的相关量。如果输入矢量具有固定的长度,例如40个单元,那么分矢量的长度可以有些不同,依赖于它们所希望的相关。该系统可以有两个输出单元。左边单元的激活标志了股票值的减少,而右边单元的激活则标志了增加。

  在学习阶段,网络中输入的是一定时期实际上的每天的交换率,例如从1989年2月9 日至1989年4月18日。以这种学习数据为基础,该网络对于后面19天的发展进行预测。预测结果与实际上的曲线进行比较,以测量该系统的精确性。已经用后向传播方法对于几个多层结构进行了考察。它们以自组织方式发展起来对于预测特定的总体启发性。例如,如果一次预测接近该日期以后某天的实际值,那么错误就是相对小的。这种拇指规则的启发方式,在于这一事实:行情趋势的变化比起它保持不变来是更为不可能的。图 5.22a,b示意了,预测曲线(+)和对于银行(Commerzbank)、公司(Mercedes)的实际股票行情曲线(-)。

  显然,后向传播的馈向网络在技术上非常有趣,尽管它们看来与生物大脑中的信息处理没有多少相似性。在4.2节中,我们已经分析了具有反馈(图4.8b)和霍布类型学习(图4.9a)的霍普菲尔德系统,它显得也是生物大脑的工作方式。在均匀的布尔神经元网络的情形,神经元的两种状态可以与处于外磁场中的电子自旋的两个可能值联系起来。一个霍普菲尔德模型是一个动力学系统,与金属退火过程类比,将它看作是一种能量函数。由于它是非增的单调函数,系统进入局部能量极小值,相应于局部的稳定稳恒态(不动吸引子)。

  因此,霍普菲尔德系统的动力学演化可以相应于精神认识。例如,一个代表字母 “A”的始态噪声图像向代表正确图像的终态演化,它用若干个例子来对系统进行了训练(图4.9b)。物理解释使用了平衡热力学的相变。正确的模式与不动点或平衡终态相联系。一个更灵活的推广是波耳兹曼机,它具有非确定论处理器元的随机网络构造,以及分布的知识表示,数学上相应于一个能量函数(图4.11b)。

  关于弛豫的一般思想是,一个网络收敛到以局域相互作用为基础的或多或少总体平衡状态。通过反复地修订局部的联接(例如在霍普菲尔德系统通过霍布学习策略),网络作为一个整体终于弛豫地进入了稳定的、优化的状态。我们可以说,局域相互作用导致了协同寻求,它不是受指导的,而是自组织的。一些网络对于精神类型的活动运用了协同寻求策略,例如,对于寻找可能的假设。设想竞争假说的一定范围由神经单元来表示,它们可以激活或抑制自己。于是该系统就离开了不太可能的假设,而奔向更可能的假设。

  1986年,麦卡洛克和拉梅尔哈德把这种认知解释运用于模拟两可图的识别。两可图是在格式塔心理学中为人们所熟知的问题。图5.23a示意了一个协同寻求的网络,模拟识别尼克尔立方体两种可能的取向之一。每一单元就是一种涉及尼克尔立方体的一个顶点的假设。缩写是B(黑)、F(前)、L(左)、R(右)。U(上)、L(下)。假设网络由两个联接的子网络构成,每一子网络相应于两种可能解释之一。

  

  不相容假设是负的联接,一致性假设是正的联接。权重的分配使得2个负的输入与3 个正的输入格均衡。每一单元都具有3个正的相邻联接和2个竞争的负的联接。每一单元都接受来自激发的一个正的输入。要寻求的假设子网络是最适合于输入的网络。微小的涨落(观察者特定视野的某个小的细节)可以决定哪一种长期的取向被观察到。

  为使网络的动力学形象地表示出来,假定所有的单元都是关闭的。然后,一个单元接收了一个随机的正值输入。网络将向一个子网络的所有单元都被激活而所有其他网络的单元都被关闭的状态变化。在认知解释中,我们可以说,此系统已经弛豫地进入了尼克尔立方体两可图左面和右面的两种解释之一。

  图5.23b示意了3种不同的演化模式,它们敏感地依赖于不同的起初条件。环路的大小表明每一单元的激活程度。在第3种变化中,达到的是一种决非处在平衡态中的未确定的终态。显然,这种网络的构造原理是协同计算、分布表示和弛豫程序,这是人们在复杂系统动力学中所熟知的。

  过去已经提出来许多人工神经网络的设计。它们是受到不同的原理如物理学、化学、生物学、生理学的启发,有时只是出于技术的目的。复杂系统探究方式的共同原理是什么?在前面的章节中,协同学引进了作为处理非线性作用复杂系统的跨学科方法论。对于推动从许多科学学科中确立的共同原理来建立特殊复杂系统的模型,协同学看来是一种成功的自上而下的策略。其主要思想是:复杂系统整体状态的形成可以解释为,处于 远离热平衡的学习策略中系统元素的(宏观的)相互作用的演化。整体的有序状态解释为相变的吸引子(不动点、周期、准周期或混沌)。

  例如,模式识别被解释为类似于应用在物理学、化学和生物学中的演化方程的相变。我们获得了一种跨学科的研究纲领,它使我们把神经计算的自组织解释为由共同原理支配的物理的、化学的和神经生物学的演化的自然结果。正如在模式形成的情形下,一种特定的识别模式(一张原型的脸)用序参量描述为一组所属特征的集合。

  一旦其中属于该序参量的部分特征给定了(例如一张脸的一部分),序参量将完成所有的其他特征,所以整个系统是作为联想记忆发生作用的(例如给出脸的一部分使脸面根据贮存的原型脸重建出来)。按照哈肯的役使原理,识别出来的模式的特征相应于模式生成期间受役使的子系统(图5.24)。

  如果将作为原型学习的一小部分脸部提供给一台协同计算机,那么它就能够用编码了的姓名来完成整张脸(图5.24b)。不同程度的模糊图像序列相应于协同计算机中状态的相变。

  当一个不完整的模式提供给神经元,在不同神经元状态——每一状态都相应于一个特定的原型模式——之间的竞争就开始了。这种竞争中取胜的是相应于原型模式的神经元系统的整体状态,它对所提供检验的模式有最大的相似性。与对于模式形成有效的动力学完全相似,当一个检验的模式提供给协同计算机时,它将把检验的模式从起始状态(t=0)拉向一个特定的终态,相应于原型模式之一。

  检验模式的演化,可以用势场中具有一定位置矢量的粒子的阻尼运动来说明。图 5.24c示意了一个这种二维势场的例子。这两个原型相应于两个低谷。如果提供了一个模式,它的特征不可能精确地表明与原型的特征一致,那么该粒子的位置就处于势场的低谷之外。显然,识别是一种对称破缺,这已在图4.20a中的一维例子中进行了说明。

  在协同学系统中,势场地形的形状可以由调整序参量来改变。由于协同学系统是开放的,控制参量可以代表能量、物质、信息或其他来自系统环境刺激的输入。当控制参量低于某个临界值,地形可以具有一个稳定的位置如图4.20a中的用虚线标出的一个低谷。在涨落引起的每一激发以后,序参量弛豫地向其静止态演化。当控制参量超过了一定的临界值时,先前稳定的状态就变得不稳定了而被图4.20a中两个低谷的两个稳定状态所取代。

  协同计算机的学习程序相应于势场地形的构造。势强度用地形形状表示,示意神经联接的突触力。协同学探究方式的一个优点在于,标志着一个模式的数量巨大的微观细节是用一个宏观序参量来确定的。因此,协同计算机运用了典型的复杂性约化方法,这种方法已经应用在自然进化的协同学模型中(对照3.3节)。

  序参量方程允许一种新的(非霍布的)学习,即一种最小化突触数量的策略。与旋晶类型的神经计算机(例如霍普菲尔德系统)相比较,神经元不是阈值元素,而是实施简单的乘法和加法。但是,旋晶类型的神经计算机与协同学计算机的基本区别在于:旋晶类型的复杂系统是物理学上的封闭系统。因此,它们的模式生成是由保守自组织推动的,没有任何的能量、物质或信息从外部输入。由保守自组织形成的典型模式是冬天窗户上的“死的”冰花,它们是在低能低温的平衡态冻结起来的。保守自组织的相变可以完全用波耳兹曼的平衡热力学原理来解释。

  在3.3节中,我们已经解释了活系统的模式生成。它只有在远离热平衡时输入能量、物质或信息,才是可能的。这种自组织叫做“耗散”自组织(普里戈金)或“协同”自组织。然而,它们甚至也是可以在物理学、化学进化中发现的。因此,作为活系统的人脑敏感地依赖于来自外部世界的涨落,它将为协同学框架中的新计算机技术提供“蓝图” 或模型。自旋玻璃类型的神经计算机对于特定的技术目的可以是实用的、成功的。但是,由于它们是物理上封闭的系统,在原则上不同于如人脑这样的活系统中发生的东西。

  协同计算机的模式识别过程自发地产生出对于平移、旋转和标度的不变性。这些识别特征相应于现实的情形。例如,脸部并非总是如同学习阶段给出的那样,而是它们可以平移、旋转、缩小和放大、靠近和置远。协同计算机的一个出色的应用,是振荡的识别(例如两可图)和感知滞后现象。图5.25a示意了一个人们熟悉的滞后现象的例子。当人们的注视力开始从图的左边移向右边,一张男人的脸将在大约6幅模式以后变成一个女孩脸。当人们从相反的方向来进行,从感知到女孩变到一张男人的脸只有在接近左端时才发生。

  图5.25b示意了协同计算机在特征序参量的时间演化中的感知过程。间断线指的是解释“女孩”,实线指的是感知“脸部”。第一幅图示意了,从男人脸的感知向女孩的感知的转移,第二幅图示意了从女孩的感知向男人脸的感知的转移。

  也许可以提出反对意见,认为至今协同计算机仍然必须用传统的串行计算机来模拟。协同计算机的原理仅仅是在软件领域中实现了,而不是在机器的硬件中得到了实现。但是协同学及其跨学科应用将导致它的材料和技术上的实现。如同激光是一个为人们所熟悉的协同学模型(对照2.4节),它可能在协同学原理的光学计算机的构造中起着根本性作用。在激光中,不同的模出现依赖于激光阈值的临界值。它们可以由它们的光子数来标志。在微观水平上,光子数目的变化率是用非线性演化方程来描述的,依赖于模的获得、丢失和饱和。在宏观水平上,序参量相应于标志若干种光波迹的场幅度(图2. 28a,b)。

  这是主张一种3层的构造,数据的输入层可以用全息图映射到激光上。激光及其序参量是中间层。它利用它的模,通过自组织起着决策装置的作用。在役使原理意义上的生存的模,

  激发起新的特征集合。这种水平被设想为输出层。协同计算机的激光构造当然必须得到实验的证实和改进。一台协同计算机将是一种真正的远离热平衡的耗散系统。

  显然,复杂动力学系统对于模拟认知行为和技术系统也很有用。人脑可以作为非线性复杂系统来建模,其动力学可以受到不动点、周期或准周期吸引子,甚至是混沌吸引子的支配。例如,实验上已经证明,混沌是一种有效的大脑再置的机制。在对兔子的嗅觉球进行了研究以后,人们对于种种气味的识别已经用神经网络趋向环状渐进状态的滞后现象进行了建模。混沌态在发散、消除先前的气味记忆时就出现了。在发散期间,特定气味作为输入推动了系统趋向相应于该气味的极限环。

  混沌态的技术应用是颇为有趣的,因为混沌系统能够产生信息。人们熟知的是,混沌系统敏感地依赖于其起始条件。因此,在动力学演化过程中,两条轨迹可以在一定时间惊人地分开,甚至它们的起始条件仅仅有微小差别时也是如此。由于任何观测都只能以有限精度来实现,因此就可能存在着两种不同的状态,其间的距离要小于我们的分辨能力。在初始状态,观测者看它们是相等的。但是,经过一段时间以后,一个混沌系统就使得在初始看来等同的状态之间的差异表现出来。

  实际上,人们已在若干工业领域中对神经计算机的技术应用进行了探索。例子有机器人学、航空学和宇航学(敏感和适应系统,空中导航等等)、医学(医疗数据、治疗和诊断等等的评价和控制)、工业生产(质量控制、产品优化等等)、安全技术、国防、通信技术、银行、邮政等等。技术中的复杂系统探究方式不应该被看作是对于经典AI的竞争甚或对立。在目前的技术发展状态,神经网络和经典的AI系统如专家系统看来是很有用的,并适用于不同的应用领域。对于信号、图像、语音、语音合成、机器人中感觉运动协调等等的分析和识别,复杂系统显得比经典的AI系统更为合适。显然,这些神经网络的例子并非是单个的计算机或机器人,而是指不同程度的复杂功能,它们集成在多任务的复合系统中。从拟人的观点看,由神经网络实际上管理的这些问题,可以划入 “低级水平”的问题。

  在本章中,以AI类型专家系统为基础的推理模型已经失败了,因为它们精确的串行的程序行为是不容出错、没有灵活性的。与专家系统和知识工程相反,自组织的复杂过程不可能由明确形式化的专家知识来进行控制。另一方面,具有推理算法的以规则为基础的系统,在所有的具有逻辑结构的问题上都是成功的。例如,与感觉运动的协调相对照,逻辑编程显得是一种“高级水平”的知识。然而,低级水平的非线性动力学系统的问题却可以具有极其高度的复杂性。当然,非线性复杂系统并不局限于低级水平的知识,正如我们在前面的章节中已经看到的那样。复杂系统的原理看来是颇为适合于为高级功能建模,例如为概念、思维、自参照状态等等人脑的功能建模。但是,神经网络的技术仍然处于初期阶段。

  在当今和未来的技术中,具有多模的基于规则和复杂动力学系统的多相系统对于专门用途的研究是有意义的。一个语音理解系统的构成中,可以包含实施语音识别的神经网络和可以进行句法和语法分析的基于规则的符号模式。混成系统集成了推理和动力学技术,可能对于若干种医学目的是很有用的。例如,设想一个系统,它可以用神经网络来识别和控制医学参量,并结合了与以规则为基础的演绎系统,此种演绎系统可以从识别出的数据中对于特殊的疾病进行诊断。如同大自然中的情形,一个工程师不应该教条地局限在某个“最优”策略上,而是要有目的地发现解答,最终把若干个解集成起来,但不必是最优解的集成。

  5.4神经仿生学和电子空间

  我们所有实现神经和协同计算机的技术努力,其目的是什么?复杂系统探究方式将使我们能够在科学、技术、工业、经济以及甚至在文化生活中,创建一种新的计算机辅助方法论。但是我们决不要忘记,必须对技术发展的方向及其伦理学目标作出决定。今天,目标是多种多样的,包括认识论的兴趣和科学的兴趣,还有技术、经济、文化以及最后——但不是最少——还包括军事上的应用。毫无疑问,医学研究和应用必定在所有这些研究目标等级中处于较高等级上。这里要提醒持有老观念的读者,医学的目的不仅仅在于从事科学的认知和研究,而且还在于运用。运用也不仅仅是工程意义上知识的技术应用,而且也是为了医治、帮助和康复。知识和研究不过是实现医学的这种基本目的的工具,自从希波克拉底时代以来医学的基本目的就是保护生命。

  人的中心器官是大脑。因此,医学上保持大脑健康的任务这种重大责任就落在了神经医生身上。他们必须将其医学治疗看作是针对整个心-脑实体。为了对人的心-脑实体提供最仔细的可能医学治疗,需要一个应用性研究来致力于拓展和提高诊断和治疗能力,包括可能的神经手术、手术计划、手术技术和术后恢复。正如我们已认识到的,人的心 -脑实体是进化中最复杂的系统。包括计算神经科学、物理学、工程学、分子生物学、 医学和认识论的跨学科研究纲领,对于处理这种复杂系统是必要的。这也就是为什么,一些科学家已经开始了对大脑和精神的跨学科研究纲领,包括伦理学和人类学方面。我们将其称为“神经仿生学”。

  一般地,“仿生学”意味着用技术的和人工的程序和系统模拟自然功能和过程。众所周知的例子是,飞机和潜水艇的设计模仿了鸟类和鱼类身体的空气动力学。历史上,仿生学是人类的一种古老的梦想,即试图以用技术手段去模拟自然原理,从而解决复杂的生命问题。在这种传统中,神经仿生学意味着,阐明普通的技术-生物学如何去加强自然神经元的发生学和功能性质以及发展起神经修复术,制备出以硅片和(或者)有机材料为基础的类似于大脑的计算机系统。这并非一幅令人毛骨悚然的弗兰克斯坦的妖怪图景。为了推动人们投身于这些研究目标,只需要让人们看一看患有大脑肿瘤或受意外伤害的病人的凄凉情景就可以了。

  神经外科是关注中枢神经系统和人脑的专门医学学科。由于大脑是人的人格和智能的生物媒体,神经外科医生不仅仅要弄清有关大脑的神经学的原理,而且还要获取人的精神及其功能的知识。神经外科已经在病人治疗上取得了进步。通过引入诊断影视程序如计算机化和核磁共振断层照相术,手术中运用微手术程序,在这方面取得了显著的成功。

  不过,关于脑疾病人治疗的根本性问题仍然没有解决。例如,成人的中枢神经系统中,从功能角度看,仅仅可以换掉非常有限的受损区组织。这是由于与身体中的其他细胞截然不同,神经细胞在胚胎阶段完成以后不可能进一步分裂。只有胚胎的组织才有这样的潜能,可以使自己适合于周围的宿主组织。所以,疾病或事故引起神经细胞组的损坏往往导致永久性功能障碍。在这个应用领域,人工复杂系统及其自组织原理将受到高度关注。

  医学史上曾有过用自体移植物来恢复受损的周围神经的尝试。这种方法是以这样的事实为基础的:甚至成人也有能力再生神经细胞的伸展,这种伸展从脊髓索状组织伸向末梢区域直到目标器官。因此,部分功能上不重要的敏感神经被从身体中的适当地点移走,并插入想要恢复的被打断的神经区域。然而,被打断神经纤维的再生至今还没有得到完全的理解。因此,控制移植物的生长是不可能的,移植物中包括了数百的单个神经细胞伸展——它们应到达目标器官。由于中枢神经细胞是不可能再生的,对于非常接近脊髓索状组织的中心受损,移植也是无效的。

  对于周围神经移植的一个改进是在分子生物学的领域中提出来的。对于神经细胞及它们联接的细胞如星状细胞和施旺细胞的生理学和生物化学的理解,可能导致新的神经移植方法。一种中枢神经系统中组织替代的高级方法是身体中自己的细胞移植,这样的细胞在移植前已是遗传上选择过并适应了的。神经生长因子的效应、在移植源和受体大脑的目标区域之间的关系,以及许多其他分子生物学的问题都必须加以调查研究。这些方法是以遗传工程的知识为基础的。

  另一个周围神经移植的可能的方法,是运用人工的而不是生物的移植体。用人工替代物来恢复神经系统的受损部分,这在医学和神经病学中都已经进行了尝试。

  人工移植体配有学习算法作为自然的“蓝本”。与MCP(麦卡洛克和皮茨)网络不同,它们是工作在真实时间中的BPN(生物脉冲处理)网络。图5.26示意了这种神经-技术植入体的一般图式:学习神经网络编码感觉和运动控制信号,使之成为许多平行脉冲序列,它们被一组植人的微接触体接受,以刺激未受损的神经(图5.26a)。由神经寄存的信号,被神经网络解码,用来控制运动修补体(图5.26b)。

  人们对于脊髓索状组织受损的病人,也尝试了借助于BPN系统的电刺激来增进其站立和行走功能。假定末梢组织器是未受损的,末梢神经的电刺激引起了肌肉的收缩。这是由适应性学习网络的平行脉冲引起的,学习网络对病人的感觉系统的听觉命令进行编码(图5.26a)。这个系统具有学习能力,因为它通过把感觉反馈到运动的腿上,以适应特定的病人条件。但是,此系统仍然依赖于病人的意识和说话。在下一步的研究中,脑的无意识的意向性必须由脊髓索状组织中寄存的信号进行解码。然后这些信号可以被例如无线电波送往具有适应性神经编码器的接受器中,再引起如图5.26a所示的肌肉收缩。

  有一项雄心勃勃的神经技术项目,它针对的是一定类型的盲人。视网膜色点炎病人的视网膜层受到一定损坏,而视网膜是负责感觉轮廓、表面、颜色和其他的视觉特征的。受损的视网膜层由神经修补术沟通。在所谓的视网植人体的构造中,观景由镜框中的光子接受器(例如半导体)寄存,其中装备了某种适应性的神经网络。外部世界的光信号由神经网络(BPN)处理,神经网络能够学习像人眼一样为接受域建立模型。它们的信号被编码,并测距地输给诱导接受器,在此受损视网膜上排列有电极,以刺激光神经和中枢神经系统(CNS)。在更先进的研究阶段,将不再需要视镜排列,具有适应性神经网络的接受单元可以直接地植人眼中。在最初的试验中,神经技术不可能完全地取代种种视觉功能;然而,所存贮的轮廓和表面的感知,将有助于病人把握方向,这就是目前努力的目标。

  如果不同肌肉组的刺激可以直接在修复神经的末端分枝处进行,而不用无机金属电极,那么就可以获得决定性进展。这就必须要使用分子装置来实现生物技术的传导性,即要使用从有机分子设计制造出的电子元件。过程控制器控制着电极并处理信息,它必须以人工神经网络为基础,才能够实现高速数据处理,满足人的行走和站立的要求。显然,这些复杂神经网络的发展需要分子生物学、计算神经科学和高技术硬件工程的跨学科合作。

  人工替代受损神经功能的例子还有内耳的耳蜗移植。如果听觉神经是未受损的,通过微手术置入一个有25个极的电极作为皮质器官的代替物。听觉神经现在由适当的电极脉冲来激发,它们模拟了声音模式。脉冲是由串行的以语言知识进行了编码的微处理器来控制的。但是,在进行困难的移去听觉神经的赘生物手术中,有听觉神经受损坏的危险,结果会造成病人变聋。今天有可能把人工神经网络直接联接在中心听觉通道的区域。于是听觉可以得到恢复而不论听觉神经丢失与否。生物技术、计算神经科学和工程技术的跨学科合作再一次表明是必要的。

  一般来说,神经外科手术必须要考虑到如下的临床观点:神经外科的诊断、手术计划、手术技术和神经的康复,这些是受生物技术和计算神经科学中的复杂系统探究方式支持的。在诊断方面,计算机化的断层显示过程已经开创了一个新时代。由于神经外科医生不得不处理一种进化中的最复杂的器官,手术计划和进行模拟已成为准备取得成功医治的一个基本步骤。在这一方面,复杂性意味着病人的人格特征,涉及他或她的特定病史,一定致病过程的病理,个体的解剖特征以及一个手术的可能手术后果。

  一种新的方法已经用于实践。一个神经外科手术可以用CAD(计算机辅助设计)辅助技术来进行模拟。用计算机产生出一个病理解剖的三维构造,它是由一个特殊的程序来控制的。在模拟中可以发现潜在的困难,从而在实际的手术中得以避免。手术技术的不断发展将减少实际的大型开放手术。立体视镜和内窥镜技术对于减少手术引起的损伤是重要的方法。激光技术与神经外科内窥镜、术内显示过程、计算机控制的调节技术结合的进一步发展,将成为一种有广泛应用的复杂手术工具。

  在波士顿的麻省普通医院的一个研究小组,已经用磁共振成像技术(MRI)揭示了人的任务激活的功能成像图,这种任务激活是在视皮层中由光刺激引起的。按时间周期地注入对比剂。采用快速NRI扫描而不用注射,甚至初级的视觉皮层成像也实现了。图 5.27显示了作为神经网络的脑认知活动的真实的时间成像。这些高级的基于计算机的复杂神经网络的图像,不仅仅有助于受损的病人,而且最终使我们看见自己的思维和情感。

  

  发展人工神经网络的最重要动力来自这样的事实:以化学元素硅为基础的高度集成电路的生产,将达到它的物理极限。这种技术以程序控制的微处理器原理为基础,不可能进一步微型化。自组织的高度平行计算和策略对于处理大脑的复杂性是必要的。因此,运用某种新的底物来作为信息处理系统的基础,就显得必要了。在此迈出的第一步是开始发展以生物元件为基础的分子电子器件。在神经细胞之间的电信号可能通过有机传导物进行传导。

  关于计算神经科学,神经网络的计算机模拟可以有助于鉴明由中枢神经系统和大脑实际运用的算法。现在研究的人工神经网络模型,主要是用矢量计算机、工作站、特殊的合作处理器或移植芯片(transputer arrays)来进行模拟研究。但是,当然,复杂网络中的空间-时间平行计算的优点,在用经典计算机来进行模拟时已是全部地或部分地丢失了。只有用特殊设计的神经硬件,才能满足实时任务的要求。

  在未来的神经仿生学应用中,神经芯片的训练将引起巨大复杂性的非线性作用动力学,这样的芯片可用作人的神经纤维之间的界面。芯片的设计者面临着相互联结的问题:如果成千上万的权重线路要以物理方式联接起来成一个神经元,并要作出数千个神经元,那么这个线路区域将达到这样的数量级,即线路引起的时间延迟将超过代表神经元功能块的运行时间。由于技术结构尺寸的减少受到经济上和物理上的限制,仿生学的设计者现在对相互联结问题倾向于一种构造解。首先,他们要考察神经网络的真实处理时间;其次,要考虑在何种程度上有可能偏离理想的大规模平行计算。

  显然,平行计算硬件将显著增加软件的复杂性,并需要新的方法。强大的操作系统。编程工具和灵活的使用者界面都必须这样设计,使得容易与系统进行界面通信。这种任务,在由计算机科学知识程度不一的人员组成的跨学科队伍中将变得特别重要;以知识为基础的专家系统可以有助于研究小组成员,使之与仿生软件一起工作,并将它们集成进研究小组中。编程神经网络硬件将完全不同于经典的冯·诸葛曼计算机的编程。一位编程者必须要鉴明必要的网络拓扑和构造,还必须说明具有相互联结图式的神经元的行为。因此,运用多相的、混成的系统——集成神经网络系统和经典的以知识为基础的系统(在5.2节中已描述),成为神经仿生学中的现实观点。

  有些人可能担心,混成的计算机系统及其复杂性的增长不经过高度的专门训练,是不可能把握的。现在的计算机系统和使用者之间的界面必须加以发展。计算机生成图像的操作,应该在“虚拟现实”中直接由语音、视觉和触觉来进行。使用者将获得这样的印象,即通过若干种与其感官相连的技术设备来获得计算机产生的现实的印象。

  

  视觉印象是由操作者及位置感知器——它可以作为眼睛罩戴上——产生的。一个小话筒与语音识别系统联系起来,把人的命令翻译给系统。所谓的“数据手套”把手和手指的运动变换成电信号,产生出触觉并进行建模(图5.28)。

  在数据手套中,在两层布之间埋设了光学纤维。它们以特定的模式把光信号变换成电信号。例如,这一技术在航空学中已经有了实际的应用。美国国家航空与宇宙航行局对于机器人的发展很感兴趣,通过模拟空间站中宇航员的手的运动,机器人可以在空间执行复杂而危险的行动。看来可能的是,数据手套原理,甚至适用于模拟整个身体的运动和反应的数据服。

  这种情形对于人类的想像力有久远的影响。因此,化学中的分子建模,不仅仅可以用计算机来实现,而且也可以用引入触觉要素来实现。通过数据手套的手段,化学家可以想像抓住一个分子,感觉到它的表面并以所希望的方式对它进行操作。工程师试图通过特殊的技术系统,产生出这些接触和用力的效应。在虚拟现实中,通过数据手套进行的人的操作,必定要接受触觉到的影像客体的反馈。经验世界的复杂性,应该在所有方面被模拟。

  宇航学和化学的例子中,模型的虚拟现实相应于宏观和微观宇宙中的某种真实现实。但是,图像计算机产生的奇妙世界景色,仅仅是作为电子实在而存在。在技术可能性与科学幻想之间的界限看来是模糊的。在计算机产生的“远程现实”中,人们感觉到如同影像物体。已经有人建议构造一种所谓的“家庭现实发动机”,它把使用者移入所希望的和不希望的幻想的虚拟世界。如果你愿意,你就可以与玛丽莲·梦露有性关系,或是与阿尔伯特·爱因斯坦进行讨论,这都是计算机产生的虚拟实在——预言家就这样向人们保证。科幻作家如威廉姆·吉布逊描述了由计算机产生的世界——“电子空间”,它将由人们作为惊人的幻觉而经历:

  电子空间,每天由成千上万合法操作者经历的交感幻觉,无论在哪个国家,只要是学习了数学概念的孩子……都可以从人类社会中所有的计算机库数据中提取出来的数据图形表示,获得不可思议的复杂性。光线布满精神的非空间中,数据奔流激荡,如同城市中的照明,退去了……

  这些见解,当然对于我们文化的发展提出了根本性的批判。人们被锁在塞满自己隐私的箱子中,或操作着由超级克雷和神经网络产生的虚拟现实,这看来是一幅如同奥韦尔的《老兄》(Big Brother)中那样的可怕图景。

  除了那些伦理学问题以外,还有一些严重的认识论问题,它们是计算机产生复杂人工世界的可能性问题。在传统的认识论中,哲学家如贝克莱和休谟采取了唯我论和怀疑论的立场,认为任何手段都不可能证明外在世界的实在性。我们所有的印象也许都是由我们的大脑及其精神状态产生出来的幻象。这些迷惑人的问题,并非是如同孩子般的不诸世事的哲学家的玩笑。它们应该是推动我们去考察和分析我们的论据的有效性的动力。现代逻辑学家和精神哲学家如希拉里·普特南已经以如下的方式对这些问题进行了翻译,它使我们想起了著名的图林试验。

  设想一个人被一位“邪恶科学家”动了一次手术。他的大脑已经从身体上移去,置入充满营养物的罐子中,保持大脑还活着。其神经末梢与混成的神经计算机联接起来,使此人——他的大脑——仍然获得对一切事物完全正常的幻觉。他所经历的一切,都来自计算机对于神经末梢的电刺激。如果此人想要举起他的手,计算机的反馈将使他“看见”和“感觉”到手被举起,尽管存在着的仅仅是大脑中相应的模式,而非物理的眼睛或耳朵。那位邪恶的科学家可以使这个可怜的人经历任何情形。普南特说:

  这个受害者甚至可以觉得自己正在阅读这些令人愉悦的但是相当荒谬的假设:一位邪恶的科学家把人们的大脑从身体中移去,并将它置入充满营养物的罐子中,保持此大脑活着。再将其神经末梢与超级科学计算机联接起来,使此人即他的大脑获得幻觉……

  如果我们的大脑以这种方式置于一口罐子中,我们能够说我们还是自己吗?普南特 争辩道,我们不能。我们实际上是置于一口罐子中的大脑这个命题不可能是真的,因为它是自驳斥的。自驳斥的命题是这样一种命题,其真意味着其伪。一个逻辑上的例子是万能定律:所有的普遍陈述都是假的。如果它是真的,那么因为它的普遍性,它就必定是假的。一个认识论的例子是定理“我不存在”,如果这是由我所思维到的,它就是自驳斥的,因此,笛卡尔的论据是,人们可以确信自己的存在,只要人一想到这个定理。我们是置于罐子中的大脑这一命题就具有这一性质。

  假定我们是置于营养液罐子中的大脑,传入神经末梢与超级神经计算机联接,产生出大脑的所有感觉产物。由于置于罐子中的人的大脑在很好地发挥功能,当然它就有意识和智能。但是,它的关于树、马等等的思想和形象都与实际的树。马等等没有因果联系,因为实际的树、马等等是处于罐子中的大脑的外部世界,而这些思想和形象是由我们的超级神经计算机产生的。因此,如果我们假定,我们是置于具有所有这些条件的罐子中的大脑,那么词汇“罐子”、“营养液”等等,也就不涉及一个实际的罐子、营养液等等,而是涉及由我们的超级神经计算机产生的一定的思想和形象。结果是,“我们是置于罐子中的大脑”这个句子是假的(图5.29)。

  我们必须意识到这样的可能性,即我们是置于罐子中的大脑,并非被物理学、而是被逻辑和哲学排除。物理学上的可能世界——我们是置于罐子中的大脑——与物理学定律是相容的。但是,在一个思想实验中,我们甚至能够必然地导出超出物理世界的真结论。

  这些特征的原因看来要归于自参照性的结构,这是心-脑系统高级能力的典型特征。在4.3节和4.4节中,我们已经论证了,自参照性可能是使得意识和自我意识成为可能的根本特征,不仅仅是对于作为生物进化产物的心-脑系统是如此,而且甚至对于采取了完全不同硬件的人工复杂系统也是如此。

  图林自己主张一种人们熟知的检验,它可以确定一个如计算机那样的人工系统是否是有意识的:让一个人在一个键盘上与计算机进行交谈,以及与一个并不知道的人进行类似的交谈。如果他不能区分出哪一个是计算机,哪一个是人,那么计算机就是有意识的。简言之,一台计算机,如果它可以通过图林检验,就是有意识的。

  关于“罐子中的大脑”的思想实验已经表明,图林的对话检验必定会在某些特定意义上失效。由人工系统使用的词语和句子并不必涉及到实际的对象和事件,而我们在人的自然语言中要涉及到它们。词语和句子的使用可以是由句法模式支配的,它们能够被以高度精致的方式编程为图林机。魏征鲍姆的程序ELIZA模拟了病人与心理学家的对话,可以提供这些可能性的最初线索。在此意义上,图林检验不可能排除,机器的谈话仅仅是一种类似于有智能的人的演讲的句法演示。然而,原则上不可能排除,自组织的复杂系统,通过以原型模式和对于环境的经验作为特殊参考,是能够学习它们的合乎句法的词语和规则的。从这种长远观点看,它是一个伦理问题,即我们是否想要发展那些高度自主的(耗散)系统。 

免责声明:本文仅用于学习和交流目的,不代表素心书斋观点,素心书斋不享任何版权,不担任何版权责任。

 

第二卷 序言 - 来自《法律、立法与自由》

我原以为,完成本书第二卷的文稿并不需要很长的时间,但是后来却发生了好几件事情,使得第二卷的出版时间延误了。最重要的一件事情便是我对本卷初稿所处理的那个构成本卷书名之论题的核心章节的原稿不太满意。在本卷的初稿中,我就这个论题撰写了篇幅庞大的一章,其间,我力图用大量的实例来说明那些被宣称为“社会正义”(social justice)之要求的事例不可能是正义的,因为个中的基本考虑(人们很难把这种考虑称作是一项原则)根本就不可能得到普遍适用。当时,我急于想证明的主要是这样一个论点,即人们永远不可能就“社会正义”所要求的东西……去看看 

1-2 论分工的原由 - 来自《国富论》

引出上述许多利益的分工,原不是人类智慧的结果,尽管人类智慧预见到分工会产生普遍富裕并想利用它来实现普遍富裕。它是不以这广大效用为目标的一种人类倾向所缓慢而逐渐造成的结果,这种倾向就是互通有无,物物交换,互相交易。   述种倾向,是不是一种不能进一步分析的本然的性能,或者更确切地说是不是理性和言语能力的必然结果,这不属于我们现在研究的范围。这种倾向,为人类所共有,亦为人类所特有,在其他各种动物中是找不到的。其他各种动物,似乎都不知道这种或其他任何一种协约。两只猎犬同逐一兔,有时也象是一种协同动作。它们把……去看看 

第七章 攻取武昌 2、湖北巡抚做了彭玉麟的俘虏 - 来自《曾国藩 第1部 血祭》

曾国藩出门后,悄声问刘蓉:“孟容有何见教?”  刘蓉说:“克复武昌,就在青麟身上。”  “此话怎讲?”  刘蓉附在曾国藩耳边,说出一条计策来。曾国藩笑着说:“人称你为小亮,果真名不虚传。”  说着,二人一先一后回到厅里。曾国藩皱着眉头对青麟说:“墨卿兄的处境,实在令人同情。不过,”他的神情变得严峻起来,“省城丢失,不管出于何种原因,巡抚罪当斩首。”  青麟脸色惨白,冷汗直流,抖抖地说:“我亦知皇上不会饶过,还望诸君为我将实情奏报,即使皇上不能网开一面留……去看看 

第14章 为了拯救民族危亡:上海,1935—1937年 - 来自《宋庆龄》

(一)抗日统一战线的形成:高涨而曲折的潮流   自从1931年日本强占中国东北以来,中国共产党就主张武装抵抗日本侵略。红军提出愿与任何真正抗日的部队停战并结成统一战线,但没有得到响应。   尽管如此,这些行动已经反映出这样一个客观事实,即:中国所面临的主要矛盾已不再是革命与反动之间的、属于国内的、社会的矛盾,而是全中国与日本之间的、属于外部的、民族的矛盾。共产党的主动建议在时机成熟时将会扩大到包括国民党政府在内 ——只要它同意抗日。必须要做到这一步,因为只有这样,中国的革命才能在保持既定目标的条件下,同一……去看看 

第十五章 进击莱特 - 来自《麦克阿瑟》

昔日诺言终实现,神气活现登红滩;   海陆同谱英雄曲,双雄大战莱特湾。   话说大政方针已定,麦克阿瑟便开始了紧张的准备工作。他知道,进攻莱特的战役将是他指挥作战以来最复杂、最庞大和最困难的行动。进攻莱特,谈何容易。该地在美军战斗机掩护范围500英里以外,并位居菲律宾日军机场掩护网的中心。日军可从各条航线对其守军进行增援和补给,而美军只能依靠舰载机来阻止这种增援和补给,地面部队也只能靠舰载机的掩护向前推进,并制止日本海军攻击滩头阵地。看来,与海军搞好协同是取得这次战役胜利的关键。按照部署,得到加强的第 7……去看看