世界热点!大语言模型中的涌现现象是不是伪科学?
时间:2023-04-05 20:52:28 来源:程序员客栈
Datawhale干货
作者:平凡@知乎,诺桑比亚大学,在读博士
(资料图片仅供参考)
今天晚上,花了一点儿时间看了两篇文章:
《Emergent Abilities of Large Language Models》[1]
《PROGRESS MEASURES FOR GROKKING VIA MECHANISTIC INTERPRETABILITY》[2]
这两篇讲的都是emergent behavior,即涌现现象。
大规模神经网络下的涌现现象在机器学习中使用大规模神经网络时,由于增加了参数数量、训练数据或训练步骤等因素,出现了定性上的新能力和性质,这些能力和性质在小规模神经网络中往往是不存在的。
第一篇文章举了这个例子,每个图都可以理解为一个任务,横轴是神经网络的规模,而纵轴是准确率,可以理解为模型的性能。
我们拿图一来看,在10的22次方前,这些模型基本上的性能基本上都很稳定在0附近,而在10的22以后,突然在10的24次方上获得了很大的性能提升,在其他的几个任务上都表现出类似的特征。
意想不到的效果第二篇文章更是有趣,我直接把推特一位博主的评论引用在这里:
作者发现,当我们训练用网络计算同余加法 a+b = ? (mod c) 时,网络在某个时间突然获得了 100% 准确率。分析发现,神经网络实际上“顿悟”了使用傅立叶变换来计算同余加法!这个算法可以证明是正确的, 反人类直觉的。
从这俩例子里面我的感受是,只要数据量足够且真实,且模型没有硬错误的前提下,不断的训练说不定真的能够产生一些意想不到的效果。
还有就是我觉得人类现在积累的知识并不少,但是系统的少,零星的多,如果类似ChatGPT这样的大模型可以拿所有的人类已有知识进行不断学习的话,我觉得有很大概率会让它涌现出意想不到的能力。
甚至可能把人类的生产力解放提前很多。
参考
1.https://arxiv.org/pdf/2206.07682.pdf2.https://arxiv.org/pdf/2301.05217.pdf标签:
最新文章推荐
- 市值超500亿元 兴发集团二季度净利预增10%-16%
- 提前结募!首单清洁能源公募REITs鹏华深圳能源REIT正式发行
- 郑州:多措并举促消费、扩投资、活出口 全力以赴夺取首季开门红
- 中央一号文件再聚焦乡村振兴:农村物流“最后一公里”要来了
- 券业“入门考试”迎规则修订拟调整成绩管理模式
- 郑州:多措并举促消费、扩投资、活出口 全力以赴夺取首季开门红
- 2025年 濮阳将建成数字经济和信息化发展新高地
- “一张蓝图”打造高校智慧校园“样板间” 中央民族大学这样做
- 江西财经大学“映山红”研究生支教团获第25届江西青年五四奖章
- “职等你来就业同行” 百日千万网络招聘行动启动
X 关闭
资讯中心
2022-08-29
2022-08-15
2022-05-20
2021-10-18
X 关闭
热点资讯
-
1
世界热点!大语言模型中的涌现现象是不是伪科学?
-
2
4月05日18时广东湛江轮疫情累计确诊及湛江疫情最新确诊数感染人数_全球实时
-
3
天天微头条丨TA:尽管目前选帅迫在眉睫,但是热刺方面没有联系波切蒂诺
-
4
诸葛亮的著名故事名称_诸葛亮的著名故事
-
5
天天百事通!细数德约阳光双冠三连冠:多次阻费纳,送蛋是常事!
-
6
东西问丨王娟:“双春闰二不上坟”的老话可信吗?-实时
-
7
焦点智答丨国际油价又要涨了?
-
8
有抑郁症的人,一般会有这3个异常!别硬扛,早治疗可以摆脱痛苦_视点
-
9
世界微速讯:经济师(中级)《金融专业知识与实务》阶段测试卷(十二)
-
10
举人相当于现在的什么官位_举人相当于现在的什么
-
11
法媒:梅西和家人怀念在巴塞罗那的生活,巴萨对梅西回归保持乐观
-
12
创始人周鸿祎离婚 360:周鸿祎拟将6.25%公司股份分割至胡欢名下-天天观点
-
13
【全球新要闻】“这个时候,真是没想其他的!”
-
14
[路演]森泰股份:将把公司打造为全球主要生物质复合材料生产基地及资源循环利用基地|当前头条
-
15
季报逻辑驱动行情 四板块业绩预计高增
-
16
白给白给_白给什么意思_速看
-
17
老百姓(603883.SH):财务总监文杰锋辞职
-
18
日系两厢被打回原形 比亚迪海豚月销破3万辆 上市累销超30万辆-精选
-
19
当前视讯!业界:探索“数智交通”融合创新路径 赋能交通行业高质量发展
-
20
华特迪士尼:计划未来十年向美国佛州迪士尼世界投资约170亿美元-全球时讯