人工智能能比我们更好地与外星人交流吗?

人工智能能比我们更好地与外星人交流吗?

如果我们接收到来自外星文明的信号,人工智能能比我们更好地与之交流吗?(图片鸣谢:Getty Images)

(蜘蛛网eeook.com)据美国太空网(基思·库珀):如果搜寻地外智慧生物(SETI)成功,我们可能需要人工智能(AI)的帮助来理解外星人在说什么,或许还能和他们对话。

在流行文化中,我们已经习惯了外星人说英语,或者在一个看似神奇的通用翻译器的帮助下立即被理解。在现实生活中,可能没那么容易。

考虑潜在的问题。首先,我们遇到的任何潜在的外星人都不会说人类的语言。第二个是缺乏关于外星人文化或社会学的知识——即使我们能翻译,我们也可能不明白这与他们的文化标准有什么关系。

Eamonn Kerins是来自英国曼彻斯特大学Jodrell Bank天体物理中心的天体物理学家,他认为外星人自己可能会认识到这些局限性,并选择通过尽可能简单地传递信息来为我们做一些繁重的工作。

“人们可能希望想要建立联系的外星人可能会试图让他们的信号尽可能普遍理解,”Kerins在Zoom采访中说。“也许这是一些像数学序列一样基本的东西,并且已经传达了一个信息,也许他们希望首先传递的信息是,我们在这里,你并不孤单。”

事实上,几十年来,SETI一直在考虑接收可识别的数学信息的可能性——圆周率,一系列素数(如卡尔·萨根的小说《接触》中的情况)——但这不是我们可能接收的唯一可能的信息。其他信号的设计可能更复杂,试图传达更复杂的概念,这就是我们遇到第三个问题的地方:外星语言可能比人类交流复杂几个数量级。

这就是我们需要人工智能帮助的地方,但要理解如何帮助,首先我们必须深入研究语言结构背后的细节。

信息论

当我们谈论一个复杂的信号或信息时,我们并不意味着外星人一定会谈论复杂的事情。相反,它指的是他们的信息结构,他们的语言背后的复杂性。语言学家称之为“信息论”,它是由20世纪40年代在新泽西州贝尔实验室工作的密码学家和数学家克劳德·香农提出的,并由哈佛大学的语言学家乔治·齐夫加以扩展。

信息论是一种提取任何给定通信的信息内容的方法。香农意识到,任何类型的信息传递——无论是人类语言,还是吸引捕食者吃树叶上的毛虫的植物化学散发物,或者是通过光缆传输的数据——都可以分解为离散的单元或比特。这些就像交流的“量子”,如字母表的字母或海豚的口哨声。

在语言中,这些位不能以任何顺序排列。还有语法,它描述了语法规则,这些规则规定了比特如何排序。比如:英语中,单词开头的一个‘q’后面总是跟着一个‘u’,然后这个‘u’后面可以跟着有限的几个字母,以此类推。现在假设有一个缺口——“qu——k”。从语法上我们知道,只有几种字母组合可以填补这个空白——“AC”(嘎嘎)、“ar”(夸克)、“IC”(quick)和ir (quirk)。但是,如果这个单词是句子的一部分——‘鸭子去了——k ’,那么通过上下文我们知道丢失的字母是‘AC’。

通过了解规则或语法,我们可以填补空白。仍然允许我们完成句子单词的缺失量被称为“香农熵”,由于其复杂性,人类语言在地球上任何已知的自然交流形式中具有最高的香农熵。

同时,Zipf能够量化香农信息论的这些基本原则。在任何交流中,一些小单位,这些基本的比特,会比其他的出现得更频繁。例如,在人类语言中,字母e、o、t和r出现的频率远远高于q或z。当首先用最常见的单位(在x轴上,它们在y轴上的出现率)绘制图表时,所有人类语言都会产生一个梯度为–1的斜率。在另一个极端,婴儿的随机牙牙学语会在图上造成一条水平线,所有的声音都是同样可能的。交流越复杂——例如,当婴儿长到蹒跚学步并开始说话时——斜率就越趋向于-1的梯度。

例如,现在传输圆周率的数字时,斜率为–1。因此,一些研究人员认为SETI应该专门寻找斜率为-1的信号,而不是寻找技术签名,即技术生成的信号,这些信号可以标记其他高级地外文明,不管它们是否看起来是人工的,并且仔细筛选射电望远镜收集的每一个数据片段的机器学习算法可以配置为分析每个潜在信号,以确定信号是否符合Zipf定律。

除此之外,外星交流可能比人类语言具有更高的香农熵,如果它高得多,可能会使他们的语言对人类来说太难掌握。

但对人工智能来说可能不是。人工智能已经在接受测试,试图理解来自非人类物种的交流。如果它能通过这个测试,也许人工智能将在未来准备好处理任何外星信息。

人工智能能比我们更好地与外星人交流吗?

ChatGPT等人工智能系统已经擅长理解和产生自然的人类语言。(图片鸣谢:iStock/Getty Images)

解读海豚交流

丹尼斯·赫金是佛罗里达州朱庇特野生海豚项目的研究主任,她是世界上试图理解海豚之间交流的最权威的专家之一。Herzing四十年来一直与海豚一起游泳,研究它们的交流,现在他将人工智能引入其中。

“我们有两种方式来看待海豚的交流,它们都使用人工智能,”Herzing告诉Space.com。

一种方法是听组成海豚自身交流的各种口哨声和叫声的录音。特别是,正如Shannon和Zipf所描述的那样,机器学习算法能够提取海豚聊天的片段,并在声谱图(一种按频率组织的声音图)上将其分解为离散的单元,然后用字母标记每个独特的单元。这些变得类似于单词或字母,Herzing正在研究它们组合的不同方式,或者换句话说,它们的有序度和结构。

“现在我们已经确定了24个小单元的声音在声谱图中重新组合,”Herzing说。"所以你可能有向上的哨声' A ',然后是向下的哨声' B ',等等,这就为一系列的声音创造了一个符号代码。"

然后,机器学习算法能够深度分析录音,搜索符号代码重复的实例。

“我们正在寻找有趣的重复序列,”Herzing说。“然后算法在序列中寻找替换和删除,所以你可能有相同的符号代码,但一个小哨子是不同的。这是一个非常重要的学习算法。”

这种微小的差异可能是因为它包含了海豚的标志性哨声(每只海豚都有自己独特的标志性哨声,一种类似人类名字的标识符),或者是因为上下文不同。

这完全符合香农的信息论,Herzing也对Zipf定律感兴趣,并对海豚的交流如何复制该-1斜率感兴趣。

“我们正在寻找类似语言的结构,因为每种语言都有遵循规则的结构和语法,”Herzing说。“我们正在专门寻找重组数据的可能性——我们的小声音单元是单独存在,还是与另一种声音重组?”

Herzing的团队一直在寻找二元词——两个单位频繁出现在一起的情况,这可能意味着一个特定的短语。最近,他们还一直在寻找三元组——其中三个单元按顺序有规律地出现——这意味着更大的复杂性。

人工智能能比我们更好地与外星人交流吗?

语言学家几十年来一直在研究海豚的交流,这项研究可能是与外星人交流的一个很好的类比。(图片鸣谢:iStock/Getty Images)

寻找意义

这正是人工智能开始分析SETI信号中嵌入的真实信息的方式。如果外星人的交流在结构和句法上比人类语言更复杂,那么这就告诉了我们一些关于他们的事情;也许他们的物种比我们的更古老,这给了他们足够的时间来进化他们的交流。

然而,我们仍然不知道他们在信息中对我们说的上下文。这是目前理解海豚交流的挑战之一。Herzing有海豚豆荚的视频片段,每当AI检测到符号代码的重复发声时,就可以看到它们在做什么,这允许Herzing尝试并推断声音的背景。

“但如果你处理的是无线电信号,你怎么才能弄清楚信息的上下文呢?”Herzing问道,他也对SETI感兴趣。“观察动物的声音类似于观察外星信号,可能是为了建立分类和分析(信号)的工具。但是对于解读部分呢?天哪,我不知道。”

一旦我们收到外星人的信号,我们可能会想对他们说些什么。理解上下文的困难在这里也再次出现。正如斯波克在电影《星际迷航4:回家的旅程》中讨论回应外星人探测器时说的,“我们可以复制声音,但不能复制意义。我们会胡言乱语。”

Herzing试图通过与海豚共同商定如何称呼事物来规避这个语境问题。这是CHAT(鲸类听觉和遥测)的本质,这是研究人员使用AI尝试与海豚交流的第二种方式。

在它的第一个版本中,CHAT是一个绑在用户胸部的大型设备,通过水听器(水下麦克风)接收声音,然后通过扬声器发出声音。现代版是智能手机大小,戴在手腕上。这个想法不是用“海豚语”交谈,而是在海豚想玩的某些玩具的预编程声音上与海豚达成一致。例如,如果他们想玩呼啦圈,他们会按约定吹口哨叫“呼啦圈”。如果戴着聊天设备的潜水员想让海豚带给他们一个铁环,水下扬声器可以吹口哨发出“铁环”人工智能的工作是从海豚发出的所有其他声音中识别出商定的哨声,这些声音来自水下的各种音频干扰源,如气泡和船只螺旋桨。

Herzing观察到海豚使用了约定的口哨声,但是在大多数不同的情况下。Herzing说,问题是花足够的时间与任何一只特定的海豚相处,让它们完全学会一致同意的声音。

对于外星人,他们的信息将会传播许多光年;任何双向交流都可能需要几十年、几个世纪、几千年,如果有可能的话。所以无论我们有什么关于外星人的信息都会被浓缩到他们的原始传输中。如果像Kerins猜测的那样,他们发送一些数学上的东西只是作为一个信号,告诉我们他们在那里,我们并不孤单,那么我们就不必担心破译它。

然而,如果他们确实发送了一个更复杂的信息,那么正如Herzing在海豚身上发现的那样,数据集的大小是至关重要的,所以让我们希望外星人将他们的信息打包,给我们和AI一个最好的机会,至少评估一些信息。




上一篇 下一篇 TAG: 人工智能 外星人