“意思”是什么意思?

近年来自然语言处理的进展不小,各种语音助手和翻译软件已经有些实用价值了。但尽管如此,它们对稍微复杂一点的句子的处理结果还是常被人们作为笑话来说。这不免又让我们想起个老问题:计算机是否有一天真能明白我们的意思?要回答这个问题,我们先得说清什么是意思。

早在计算机出现前,意义就是语言学、逻辑学、心理学、哲学等领域中的一个关键问题了。研究语言中的意义问题是语义学的范围,而这里语言不仅包括人类历史上形成的自然语言,也包括人工设计的符号语言,如数学语言、逻辑语言等。在使用语言进行通讯时,语词和语句是意义的载体。为保证通讯的有效进行,对词句意义的约定需要提前达成。即使在一个系统之内,词句的意义也应当是对其进行处理的根据。明确和稳定的意义在交流和思维中的重要性无需赘言,但怎样才能确定意义呢?

对一个语词或符号来说,最传统的(也是目前最常用的)意义刻画方式有两种:指称和定义,前者是把它看作语言之外的事物的名称(比如说鸟的意思即指所有的鸟),而后者是把它看作语言之内的结构的名称(比如说鸟的意思即是有羽毛的卵生脊椎动物)。这两种方式常常被结合使用,即用指称的办法确定简单语词的意义,然后用它们定义复杂语词。尽管这种确定意义的办法很直观、自然,而且对很多问题来说已经够用,但它仍不能完全满足人工智能和认知科学的要求。主要的问题出现在以下方面:

●既然在计算机内对符号的处理只涉及其形式,不涉及其指称,人工智能系统似乎无法只用形式化的处理规则把握符号的意义。尽管一个计算机程序可以编辑和存储两个黄鹂鸣翠柳,一行白鹭上青天这样的句子,它可能完全不知道黄鹂和白鹭指什么。

●我们所使用的大量词汇(甚至包括那些在科学和数学中的)都是既无明确指称,也没有普遍接受的定义的。这里的例子包括前文《当你谈论人工智能时,到底在谈论什么?》中对智能的分析。你最近在考虑哪些问题?其中的主要概念有广泛接受的严格定义吗?

由于在认知系统中语词一般表示为概念,对意义的研究在心理学中对应于各种概念理论。和语义学中情况相似,经典概念理论把一个概念看成一个实例集合,其意义来自定义。一个概念的定义可以是外延性的,即列举其中所有实例,也可以是内涵性的,即列出其中实例的共同特征。这样的概念定义为判断一个实例是否属于此概念提供了充分必要条件。毫不奇怪,经典概念理论遇到了和经典语义理论类似的困难:我们所用的概念常常没有明确边界,而且其用法极其灵活,不像固体,反像流体。关于这方面的讨论,可以看侯世达的《哥德尔、埃舍尔、巴赫:集异璧之大成》和其它著述。当然更直接的例子在我们的生活中俯拾皆是,只不过我们往往视而不见罢了。

在心理学中,经典概念理论的替代方案主要有下面几种:

●原型理论:概念是由其中大多数实例的共同特征所确定的,而一个实例在多大程度上属于此概念取决于它与这些特征所塑造的原型的相似程度。按照这种理论,我们心中有一个鸟的原型,由会飞,有羽毛,卵生等特征所塑造。不会飞的鸵鸟仍可被当作一种鸟,只是隶属度较低罢了。这可以看成一种内涵性方案,只不过概念特征大都成了统计性的,而且均不再是充分必要条件。

●范例理论:概念是由其中的代表性范例所确定的,而一个实例在多大程度上属于此概念取决于它是否和某个范例相似。比如说鸵鸟、黄鹂、白鹭都可以成为鸟的范例,而它们不必被整合为一个唯一的原型。鸸鹋被当成成鸟,因为它有些像鸵鸟。这可以看成一种外延性方案,只不过概念中的实例不再被一一列出。

●理论理论:概念是由其在一个理论(即信念体系)中所扮演的角色来确定的。比如说羽毛的意义依赖于我们对鸟类的知识,包括其在护体、飞翔等方面的功能。这可以看成一种内涵性方案,只不过这里概念特征体现为在信念体系中的位置和作用,而且同一个概念中的实例未必在各方面均相似。

就像在心理学中常见的情况那样,这些理论各有证据,而心理学家们尚未就如何确定概念的意义达成共识。

作为一个智能理论的一部分,参考资料[2]给出了一个新的概念模型,下面姑且称之为纳思模型。这个模型的基本想法是以从经验中形成的概括关系作为概念的意义。如果甲概念被乙概念所概括,这通常可以被表达成甲是一种乙,比如黄鹂是一种鸟。在这种关系中,主项黄鹂揭示了谓项鸟的部分外延(实例),而谓项鸟又同时揭示了主项黄鹂的部分内涵(特征),因此在这个模型中外延和内涵是概括关系的两个方面。这个关系可以向两个方向延伸,即一个是一种关系中的谓项可以同时是另一个是一种关系中的主项,比如鸟是一种动物。这样一来,单靠这个关系就可以构造一个概念层次结构,其中高层概念更抽象(外延更大,内涵更小),而低层概念更具体(外延更小,内涵更大)。

在概括关系中,主项和谓项都可以是由其它项组成的复合项。比如在乌鸦是一种黑色的鸟中,谓项黑色的鸟就是由黑色的和鸟 组成的。借助复合项,其它概念关系可以被改写成意义相同的概括关系。比如说唐僧和孙悟空是师徒可以改写成唐僧是孙悟空的师父和孙悟空是唐僧的徒弟,这里孙悟空的师父和唐僧的徒弟都是复合项。

尽管在上面的例子都是中文的,其中表达的关系是概念间的关系,而非语词间的的关系。这里的项是概念在系统中的标识,并不依赖于特定的自然语言。比如说乌鸦是一种黑色的鸟可能实际上在系统中被表示成t1978 → t135。当然自然语言中的词语也有对应的概念,比如系统中可以有‘乌鸦’是一个名词和‘乌鸦’由两个字组成这样的概念关系,但这里的‘乌鸦’和前面例子中的乌鸦指不同的概念。为简单起见我们称‘乌鸦’为词语项,因为而它指向一个语言中的词语,因而可以在系统间的通讯中使用。与此相反,t1978为内部项,因为它们只能在一个系统之内被使用。词语项通常被用来表达内部项,如‘乌鸦’ 表达t1978,但这个表达关系是多对多的,即不同的词语项可以被用来表达同一个内部项,而同一个词语项也可以被用来表达不同的内部项。

“意思”是什么意思?

综上所述,一个项和其它项的关系(或者说它所标识的概念和其它概念的关系)体现在它的外延(它所概括的那些项)和内涵(那些概括它的项)之上,而其总和就构成了这个项(或者说它所标识的概念)在此刻对此系统的意义。如果它是个词语项,那么它的外延和内涵就是该词语的意义。

尽管纳思模型不排除系统可能有先天概念和信念,其中概念的意义仍主要来源于经验。如果一个系统对苹果毫无经验,那这个词对它就完全没有意义。在得知苹果是一种水果后,这个词以及相应的概念就开始有意义,包括是一种水果和通过推理从其中导出的信念,比如是植物和可以吃等。随着对苹果了解的增加,它的意义还可能包括其形状、颜色、味道、手感等等,以至于其栽培技术,甚至和某些历史人物的关系。简而言之,苹果的意义就是系统对其经验的总和,包括直接经验和间接经验,言语表达的和感知运动性的,表示成一组以苹果为主项或谓项的概括关系。

当系统运用一个概念去解决当前问题的时候,由于时间的限制它一般不可能使用这个概念的全部意义(除非这个概念极其简单),而只能其中的一部分,这就造成了当前意义和一般意义的区别。前者通常仅是后者的很小部分,而其内容选择受很多因素影响,包括有关信念的确定程度,简单程度,以往的有用程度,和当前情景的相关程度等等。由于这些因素在不断变化,同一个概念在不同时刻常常在系统中有不同的当前意义。在经验足够丰富之后,有些概念中会形成相对稳定的基本意义或本质,从中可以推出此概念意义中的其它部分,而在其它一些概念中可能就找不到这种内核,以至于不能为系统提供太大效用。由此可见,不同的概念对系统的价值是不一样的。

在这个模型中,新概念可能以下列方式出现:

●经验中出现以前没见过的词语或感知觉模式,如初次听到或见到鸸鹋。

●生成复合项以对经验进行压缩表示,如把停止信号是红的和停止信号是灯合并成停止信号是红灯。如果这种组合以前没被系统考虑过,那么红灯就是一个系统生成的新概念。

●如果一个概念的意义在一段时间中发生了不可逆转的重大变化,比如说某个非基本意义变成了基本意义,可以说它已经演变成一个新概念了。比如说短信的意义在当下和二十年前就很不一样。

后面两种方式常常使得复合项在反复出现或发挥重要作用后逐渐被作为一个整体来使用,以至于其意义越来越无法还原为其成分的意义。比如说在某些情景中说红灯可能与红和灯均无关系了。这可以被看作对前文《计算机能有创造性吗?》的补充:计算机不仅能创造新方法,也能创造新概念。

由于概念和语词的意义均由相关的经验决定,而不同的系统总是有不同的经验,所以意义从根本上说是私人的和主观的。尽管有相似经验的系统会有相似的概念,达到完全相同一般是不可能的。意义的客观性成分主要是通讯和社会化的产物,因为这些过程为不同系统提供了相似的言语经验和社会经验,并促使它们按照约定和习俗使用语词。你要想别人明白你的意思,你最好按大家所能接受的方式使用语言,尽管你的独特经历会使你对词语的使用方式产生新想法。比如说,在《人工智能:何为智?》中,我一方面挑战了智能这个词的常见用法,另一方面又试图为这个词提出一个新的工作定义,并为此在原词义的深处寻找根据。社会范围的语义变化正是由此类相互冲突的差异化和规范化的努力所共同造成的。一方面,大部分个人的语义出轨被矫正或漠视了,但总有一些新奇的语词使用方式引起越来越多的共鸣,以至于或远或近地流传开来,甚至最终成为标准语义的一部分。在这种过程中,墨守成规和标新立异都是有理由的,因为前者维护了语言的存在,后者推动了语言的发展。在一个具体例子上的角力结果则要看双方的力量对比了。

前面提到的各种概念理论其实都是试图用关系刻画概念,只是原型理论用内涵关系,范例理论用外延关系,而理论理论主要用信念体系中的关系(尤其是因果关系)。因为纳思模型考虑所有概念关系,前述理论均可看成其特殊情况。对一个特定概念来说,其意义的确可能主要由某一类关系来确定,但更常见的情况是各类关系均有贡献。

其实把意义看作全部关系的总和远不是个新想法。以往哲学、心理学、人工智能中都有过类似的思路,但因为其中的一些弱点,没有成为意义理论的主流。纳思模型是建立在对这些弱点的解决之上的。一种常见的批评意见就是把这种确定意义的方式看作系统内的循环定义,而与外部世界无关。纳思模型中的概念不是被其它概念所定义,而是被经验到的概念关系刻画。比如知识苹果是一种水果既没有用苹果定义水果,也没有用水果定义苹果,而是用二者的关系同时贡献于它们的意义,而这个关系来自于外部世界。把意义说成全部关系的总和的另一个问题是太笼统,不足以解决具体问题。对此纳思模型的对策是将各种概念关系统一表示和处理为概括关系及其变种。最后一种意见是质疑我们在用一个概念时怎么可能把所有其它概念都牵扯进来。在这一点上,纳思模型的不同之处在于它指出系统在使用一个概念时一般只涉及其部分意义,而这又同时解释了意义的情景相关性。

纳思模型的计算机实现已经展示了这个模型的可行性,尽管仍有很多细节问题有待解决。据此模型,概念和语词在一个人工智能系统中是有意义的,而其意义是由系统的相关经验确定的。由于经验上的差别,计算机对一个语词的理解不会完全和人一样,但这种差别并不妨碍计算机用自然语言和人交流,并完成越来越复杂的语言处理工作。那些仍以图灵测试作为人工智能定义的人可能认为上述结论说明真正的人工智能是不可能的,但他们往往忘了人与人之间由文化、性别、年龄等差异造成的不解和误解比比皆是,而在各个领域中对于什么是某个词语的真正意义的辩论也从来没停止过。当年阿Q以为城里人把长凳叫成条凳是错得可笑,而类似的想法至今仍未断绝。

参考资料:

[1] Stephen Laurence and Eric Margolis, Concepts and cognitive science, in Concepts: Core Readings,

Eric Margolis and Stephen Laurence (Editors), Cambridge, Massachusetts: MIT Press, 1999

[2] Pei Wang and Douglas Hofstadter, A logic of categorization, Journal of Experimental & Theoretical Artificial Intelligence, 18(2):193-213, 2006

本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 89655099@qq.com 举报,一经查实,本站将立刻删除。如若转载,请注明出处:https://www.152668.com/1020.html

首页
微信
电话