过早客
  • 首页
  • 节点
  • 成员
  • 广告投放
  • 登录
  • 注册

一个处理语言的大模型,为啥会有推理能力?

IT技术 • qinyubin55 • 发表于 6 月前 • 最后回复来自 irving2016 • 6 月前

我至今还是无法理解,为什么纯粹的通过语言训练的模型,能发展出通用大模型机制。这中间靠所谓的“涌现”机制,是没法解释的。

加入收藏 新浪微博 分享到微信 ❤赞 1961 次点击 0 人赞 0 人收藏

打开微信“扫一扫”,打开网页后点击屏幕右上角分享按钮

共收到7条回复
PKBK 6 月前 湖北省 #1 赞 0

预训练的时候LLM看到了的许多相似的例子,这些例子给出了相似的过程或者流程。LLM学到了这些过程,再次看到相似的输入,就能做推理。

leftear99 6 月前 湖北省 #2 赞 0

简单来说,语言模型通过统计语言中的模式、学习语言表达的逻辑结构,加上高效的网络结构,展现出强大的推理能力。虽然本质上仍是一种复杂的概率计算,但足以模拟很多真实的推理过程。

现在模型还继续是复杂的概率计算

swift 6 月前 湖北省 #3 赞 0

大模型的推理能力并非真正的“理解”或“逻辑分析”,而更像是“对语言中推理模式的高度拟合”。从某种意义上说,模型的推理能力更接近于一种高度复杂的统计预测。

leon9527111 6 月前 北京市 #4 赞 0

概率论

pf1234321 6 月前 浙江省 #5 赞 0

大模型学习了很多知识,知道内部的相互逻辑。你提问的时候会基于之前的知识进行推理

find_right 6 月前 湖北省 #6 赞 0

因为你把人的智能想的太高级,实际上很多都是重复的模式

irving2016 6 月前 湖北省 #7 赞 0

大语言模型是基于神经网络理论做出来的。

神经网络本质是个仿真函数y=f(x)。即给出任意输入条件x,通过函数计算,都能给出仿真结果y。只不过这个仿真函数 f(x)巨复杂无比,没任何人能看懂和解释这个函数。它本身不具备任何推理能力,只是对人类语言符号的一个模拟。它只是把提问的人类语言符号,用固定编码规则替换数字,因而方便转换成数字 x,然后对函数计算结果数字 y ,根据前面提到的固定规则,反逆转成文字。一问一答就完成了。

请绑定手机号后,再发言,点击此处
Guozaoke.com—源自武汉的高端交流分享社区
相关主题
最近时间少了, 隔了这么久, 才做了一个网站
现在工作越来越难做了
求推荐一个AI智能体客服
请问大家都是通过哪些好用的链接访问GPT
请教机器学习人工智能的一个技术问题
搞了个AI 生图的网站,不需要登录,永久免费
[第二波送码]动动嘴皮,AI秒出图!2025最炸裂图标神器:免费生成+手机实时预览
开发了一个管理 Linux 服务器的桌面可视化管理工具,求蹂躏
服务器可视化采用纯前端渲染,这个技术实现难度如何
做了一款摸鱼软件,有人要试用吗?

过早客微信公众号:guozaoke • 过早客新浪微博:@过早客 • 广告投放合作微信:fullygroup50 鄂ICP备2021016276号-2 • 鄂公网安备42018502001446号