DishBrain
盘中之脑
DishBrain,可姑且译为“盘中之脑”或“培养皿大脑“,科学家制造的体外神经网络。它其实就是培养皿内盛有的80万-100万个活的脑细胞,这个规模接近于蟑螂的脑部。脑细胞下面排列着密密麻麻的微电极,负责刺激它们,教它们玩雅达利乒乓球游戏《Pong》。它们学会游戏规则比AI快得多,但等到它和AI都经过充分训练,脑细胞们的游戏成绩还是远远不及AI。发表于2021年。
中文命名
“盘中之脑”的命名是考虑到一个思想实验缸中之脑,所谓的“盘”就是培养皿。缸中之脑的内容是:如果把人脑取出体外放进缸里,用营养液维持它的生理活性,并且在脑部发出信号时,给它一如往常的信号反馈,打造一个虚拟现实,它能不能意识到自己处在虚拟现实中?或者说,若“缸中之脑”发出和收到的信号都和日常走路时一样,它会不会相信自己真的在走路?
实验内容
有的“盘中之脑”,是小鼠胚胎的脑部取出的细胞;另外一些“盘中之脑”,则是人类干细胞诱导分化而成的脑细胞。当然,这是人们从外部视角描绘的景象,而那些脑细胞本身,大概不会知道自己活在培养皿里。
“盘中之脑”对这个世界的体验,几乎完全来自科学家给的神经刺激:脑细胞下面排列着密密麻麻的微电极,负责刺激它们。这些刺激并不随机,而是根据雅达利乒乓球游戏《Pong》生成的。乒乓球与球拍的相对位置,决定了“盘中之脑”的8个刺激位点中,哪一处要被刺激。
自此,这些迷你大脑的游戏训练就开始了。
脑细胞收到刺激后,也会发出信号来移动球拍,而负责读取信号的依然是那些电极。科学家给“盘中之脑”划定了两片游戏操作区,1区代表左,2区代表右,像操纵杆一样。对比两个区域的脑细胞发出的信号,1区更活跃便左移球拍,2区更活跃便右移球拍。
既然是训练,就要有奖惩机制,帮玩家了解规则,并促使玩家朝着更多的奖励进发。假如玩家是人类,那么接到球后,游戏继续就是奖励,没接到球时,游戏结束就是惩罚。可如果玩家只是一群脑细胞,还不理解游戏里的逻辑关系,怎样的奖惩才能对它们起效?
一种“自由能原理”(Free Energy Principle)认为,大脑喜欢事物往自己预测的方向发展,不喜欢意外或惊喜。所以,科学家设定的奖惩机制是,接到球时向迷你大脑发出可预测的信号反馈,作为奖励;没接到球时发出不可预测的随机刺激,作为惩罚。
至于迷你大脑是不是真的“讨厌”惊喜,会不会努力减少意外的发生,看训练成果就知道了。
起初,每个迷你大脑都不容易接到球。但随着训练进行,“玩家”的游戏技能在明显提升,不论盘中是小鼠的脑细胞,还是人脑细胞,都能坚持更多回合了。虽然科学家也发现,人脑细胞比小鼠脑细胞表现好得多。
在研究团队看来,这意味着连“盘中之脑”也会为外面的世界建立一个模型,用来预测将会发生什么,它们不喜欢意料之外的事。这些迷你大脑并不是自己想打游戏,只是要避免收到那些不可预测的随机刺激,才被动接受了游戏训练。
看上去不情不愿,训练过程却惊人地高效。“盘中之脑”只需经历5分钟训练,游玩10-15次,就学会了规则。相比之下,DeepMind有一款能打败真实人类玩家的AI,花了90分钟,游玩大约5000次,才达到类似的程度。
当然,掌握规则不等于成为高手。等到“盘中之脑”和AI都经过充分训练,脑细胞们的游戏成绩还是远远不及AI。
毕竟,脑细胞发出信号后,要靠电脑来分析这些脑电活动,再转化成游戏里移动球拍的操作。像这样由脑细胞与计算机组合而成的“赛博格”,在游戏熟练程度上,可能还很难与纯硅基的AI相匹敌。
意义
如果有一天,人们知道了为什么脑细胞比AI学得快,也可能让机器学习的速度突飞猛进。
科学家说,从前也有不少团队研究培养皿里的神经元,把它们培养成类脑器官。不过这场乒乓球游戏训练,应该是第一次有迷你大脑学会了目标导向的任务。
这个新成果也表示,迷你大脑拥有感觉能力(sentience),知道自己的内在状态和外部环境是如何互相影响的,还能从目前的状态推断出要采取什么行动。要问迷你大脑为何有这样的能力,培养皿里的每个脑细胞都不是孤立的个体,在培养过程中,它们之间已经建立起复杂的神经连接。
虽然如今“盘中之脑”表现出的智能,远不如人类智能或人工智能那样复杂,但仿佛还是让我们看到了某种不可思议的未来。
最新修订时间:2023-07-30 23:45
目录
概述
中文命名
实验内容
参考资料