引言
我之前帮助很多同学检查他们用AI写作的质量问题,我发现有很多问题的根本是对大语言模型的基本原理不理解,导致使用AI的时候犯一些低级错误。
如果你只是把AI当一个聊天机器人,那可以随便聊。但如果要把它当成是强大的生产力工具,那就必须得了解清楚其原理,这样才能把它的能力发挥到极致。
最主要的是,了解原理能够让你明白AI的能力边界,避免让AI做出超出它能力的事情,从而避免犯低级错误。这很重要。
大语言模型原理
什么是大语言模型
我们写作用的AI属于大语言模型(LLM,Large Language Model),它是AI的一种类型。AI也就是人工智能,它的类型有很多:下围棋的AlphaGo是AI,人脸识别是AI,抖音推荐算法是AI,AI画图也是AI。这些AI都不属于大语言模型。我们写作用的ChatGPT、Claude、Kimi、通义千问这些属于大语言模型。
大语言模型,顾名思义,它是处理自然语言的(自然语言指的是人类从自然界演化出来的语言,也就是我们平时说的语言,它是相对机器语言、形式逻辑语言这些人类发明出来的语言的)。它是使用海量的文字,准确地说是互联网上能搜集到的所有文字,训练出来的,所以叫大模型(准确地说这个“大”是指参数多,但这里就不展开说什么叫参数了)。
GPT(Generative Pretrained Transformer)是一种大语言模型的算法,由于ChatGPT的成功,现在的大语言模型99%都是用的这个算法。其实大语言模型还有别的算法,比如BERT,只是效果不太好,所以没有普及。
大语言模型是怎么输出的
大语言模型能够写出来文字,本质上不是因为它真的会思考,而是因为它会“猜”。它的工作原理其实非常简单,就是用全互联网上所有能搜集到的文字把它训练一遍,然后当你跟它说话的时候,它就能猜出来下一个字要说啥。也就是说,它的底层本质是概率和统计。
本站收集的资源仅供内部学习研究软件设计思想和原理使用,学习研究后请自觉删除,请勿传播,因未及时删除所造成的任何后果责任自负。
如果用于其他用途,请购买正版支持作者,谢谢!若您认为「LPWK168.COM」发布的内容若侵犯到您的权益,请联系站长邮箱:1352181545@qq.com 进行删除处理。
本站资源大多存储在云盘,如发现链接失效,请联系我们,我们会第一时间更新。
暂无评论内容