教机器遗忘或许比学习更重要:让AI健忘的三种方式
![]() |
编译:臻臻、Shan LIU、龙牧雪
大部分人不会喜欢遗忘的感觉。
回到家顺手把钥匙丢在一个角落就再也想不起来放在哪儿了,街角偶遇一个同事却怎么拍脑袋也叫不出他的名字……我们害怕遗忘,讨厌遗忘。
然而,生而为人,健忘其实是种关键能力。
对于人类而言,遗忘绝不仅仅是“想不起来”,而是一个帮助大脑吸收新信息并锻炼有效决策的积极过程。
现在,数据科学家们正在尝试应用神经科学原理来改进机器学习,并且坚信人类大脑能够解锁图灵完备的人工智能。
人脑为什么需要遗忘
我们的大脑被普遍认作为信息过滤器。先放入一大堆乱七八糟的数据,筛选有用的信息,然后清理任何不相关的细节,用以陈述故事或作出决策。清除没用的细节是为了给新数据腾出储存空间,类似在计算机上运行磁盘清理。
![]() |
对于人类来说,遗忘有两个好处:
通过减少过时信息对我们决策的影响来增强灵活性
防止过度拟合过去的特定事件和促进概括能力
为了有效地适应环境,人类需要有策略性遗忘的能力。
计算机也需要遗忘?
计算机的遗忘与人类的不同,这是人工智能面临的一大挑战。深度神经网络在完成机器学习任务方面非常成功,但它们的遗忘方式也与我们不一样。
举一个简单的例子,如果你教一个讲英语的孩子学习西班牙语,这个孩子会在学习过程中应用英语学习的技巧,比如名词、动词动态、句子建立方法等。同时他会忘记那些不相关的部分,比如口音、嘟囔、语调等。如此,这个孩子可以在策略性遗忘的同时逐渐学习和建立新的思维方式。
![]() |
虽然这还是一个新领域,最近科学家们已经在探索克服这种限制的潜在理论,并取得了长足的进步。
3个方法教AI学会遗忘
长短期记忆网络(LSTM)
LSTM是一种循环神经网络,它使用特定的学习机制来决定在任意一个节点哪些信息需要记住,哪些需要更新,哪些需要关注。[page]分页标题[/page]
LSTM工作机制如何?一个简单的解释是拿电影来做类比:假设一个计算机正在尝试通过分析先前的场景来预测电影中接下来会发生的事。一个场景是一个女人拿着一把刀,计算机会猜测她是一个厨师还是凶手呢?另一个场景中,一个女人和一个男人在金色拱门下吃寿司:计算机会猜他们是在日本还是麦当劳呢?或者其实他们是在圣路易斯?
![]() |
LSTM通过以下3步提升神经网络:
遗忘/记忆
“当场景结束,模型应该忘记当前场景的位置,所处时间,并重置任何特定场景的信息;然而,如果场景中的一个角色死亡了,机器则应该继续记住他不再活着的事实。因此,我们希望机器能学习掌握一个相互独立的遗忘/记忆机制,这样当新信息进来时,它知道什么观念该保留什么该丢弃。”
——Edwin Chen
保存
当模型看到一张新图像,它需要了解这个图像是否有什么信息值得被使用和保存。如果一个女人在某个场景中路过广告牌,机器应该记住这个广告牌还是将其视作噪声数据忽略掉呢?
划重点
我们可能需要记住电影中的这个女人是个母亲这一信息点,因为我们稍后会看见她的孩子们,但是这个信息在她不出现的场景里可能并不重要,所以在那些场景里我们不需要重点关注。同样,并非所有存储在神经网络的长期记忆中的内容都是立即相关的,所以LSTM所做的就是在安全保存所有信息备用的同时,帮助决定哪一部分在哪一时刻被重点关注。
弹性权重固化(EWC)
EWC是由谷歌旗下DeepMind的研究人员于2017年3月创建的一种算法,旨在模拟一种被称为突触整合的神经科学过程。在突触整合过程中,我们的大脑评估一项任务,计算许多用于执行任务的神经元的重要性,同时权衡哪些神经元对正确执行任务更为重要。
这些关键的神经元被编译为重要的,并且在随后的任务中相对不可能被覆盖。同样,在神经网络中,多个连接(如神经元)被用于执行任务。EWC将一些连接编译为至关重要的,从而保护他们不被覆盖/遗忘。
在下面的图表中,你可以看到研究人员将EWC应用于Atari游戏时发生了什么。蓝线表示标准的深度学习过程,红线及棕线则由EWC提供以显示改进后的结果:
![]() |
瓶颈理论由耶路撒冷希伯来大学的计算机科学家和神经科学家Naftali Tishby在2017年秋提出。这个构想是,网络摆脱了嘈杂的无关细节的输入数据,就好比用瓶颈将信息挤压,只保留与基本概念最相关的特征。
Tishby解释说,神经网络经历了两个阶段的学习——拟合与压缩。在拟合过程中,网络标记其训练数据;而在更漫长的压缩过程中,它“丢弃关于数据的信息,只跟踪最强大的特征”,也即是那些最能帮助它泛化的特征。通过这种方式,压缩成为策略性遗忘的一种方式,掌控这一瓶颈也可能成为AI研究人员用于构建未来更强大神经网络的新目标和体系的一个工具。
正如Tishby所说:“遗忘才是学习过程中最重要的一部分。”
人类大脑和遗忘的过程中,有可能藏着通往强AI的密码。但科学家们仍在上下求索。[page]分页标题[/page] 本文首发于微信公众号:大数据文摘。文章内容属作者个人观点,不代表和讯网立场。投资者据此操作,风险请自担。

- AMD助力微软Windows 11 为用户带来强大、可靠的计算能力2021-10-09 16:20
- 游戏玩家为之疯狂!Chinajoy2021 AMD展台那些火爆的瞬间2021-08-02 15:39
- 全场最佳 AMD Chinajoy2021展台圆满收官2021-08-02 15:38
- AMD 锐龙5000G系列处理器正式亮相Chinajoy20212021-08-02 11:50
- 极速制胜 制霸游戏 AMD携多款游戏神器扬威Chinajoy2021-08-02 11:44
- 央视《新闻联播》头条聚焦铁建重工,聚力攻克“卡脖子”技术难题2021-03-22 11:08
- 刚刚!我又上央视新闻联播头条了!2021-03-22 11:04
- 中国电科(3月1日-3月7日)要闻回顾 | 资讯轻阅读2021-03-22 10:47
- 我国将建第一个国家公园:为何是三江源2021-03-22 10:43
- 美国硅谷上演“大逃亡”:郊区成科技精英避难所2021-03-22 10:41

- 14:59广东康力医药有限公司:以创新为核心驱动力,迈向全球大健康领航者新征程
- 14:24广州易萃享:数智赋能羊城家庭,打造全家健康守护新选择
- 10:47广州易萃享:扎根羊城铸精品,树立华南精准营养新标杆
- 15:24广东康力医药有限公司:荣誉加身实至名归,标杆力量铸就行业典范
- 17:04易萃享健康:数智驱动破壁垒,让健康管理实现零门槛
- 16:58广东康力医药:以使命铸魂,以价值观引领企业高质量发展
- 16:56广东康力医药:以使命铸魂,以价值观引领企业高质量发展
- 18:26易萃享健康:全周期健康守护,化身家庭健康管理超级管家
- 18:02广东康力医药:从深圳走向世界,绘就大健康国际化发展蓝图
- 20:48易萃享:AI科技赋能,让精准养生走进日常
- 20:41康力药业:以用户需求为核心,打造全链条健康服务生态体系
- 11:14未来产业50人论坛在沪隆重启幕 量子专场汇聚顶尖智慧共话未来
- 12:15易萃享:千日磨一剑,解锁精准营养个性化新范式
- 11:32康力药业:30载初心如磐,深耕大健康产业步履不停
- 17:18从单品智能到场景智能,方太智慧烟灶登陆AWE 2026引领厨居生活变革
- 14:14外资垄断75%!海上风电变压器受制于人,国家能源安全底线不容失守
- 22:11全球第一海风装机 核心设备国产化率不足25% 75%市场被外资掌控
- 14:59恩捷李晓明:协同减碳 打造产业生态与经济效益共生样本
- 15:21初高中生成绩不理想考不上理想的学校怎么办、如何根据自身优势择校?
- 11:52东方药林百店齐燃启新程 水润万家汇暖流
- 11:44智启社区 共享美好生活——东方药林2026社区战略发布会(沈阳站)圆满举
- 15:21东方药林:守正创新护权益,合规前行启新程?
- 13:52直击MWC2026,浩鲸科技提出AI正在重写通信软件的价值坐标
- 13:51MWC 2026|浩鲸科技周勇:构建智能生产力,在AI时代重塑运营商角色
- 13:53助推产业链高质量发展·创投实录|致瞻科技:以“学霸”思维,立“身位”优势
- 15:13坚守初心,逐光而行——全美世界的深耕与绽放
- 14:26皙之密:精准护肤时代,让素颜美肌自带底气
- 21:19荣誉见证实力:广东康力医药有限公司的标杆成长之路
- 17:21创新为翼:广东康力医药有限公司迈向全球大健康领航者
- 17:03使命如炬:广东康力医药以价值观引领行业前行








