专栏名称: Python人工智能前沿
关注花哥!一个数据挖掘算法砖家。分享Python大数据分析、数据挖掘算法等技术干货!
今天看啥  ›  专栏  ›  Python人工智能前沿

通俗易懂,大模型原理及缺陷!

Python人工智能前沿  · 公众号  ·  · 2024-11-25 21:55
    

文章预览

自从ChatGPT发布以来,用户的搜索方式以及人机交互模式都经历了显著的变革。在诸如问题回答、文本总结和交流对话等简单的应用场景中,体验质量得到了极大的提升,有时甚至超越了人类的预期表现。 大模型能够生成如此全面且连贯的文本,主要归功于Transformer模型架构以及海量预训练和微调数据集的支撑。 大模型原理 从本质上讲,大模型通过在大量数据上建立共现词概率模型来生成文本(说得精简点他的原理就是基于 “ 数据共识 ”来预测)。因此“下一个词是什么”与“它在真实世界中的语义含义或真实性”无关,而是与训练数据集中所有单词及其出现位置的统计概率最有可能的情况有关。 例如,“草是绿色的”这一表述之所以被认为是真实的,是因为在真实世界中草是绿色的。大模型之所以告诉用户草是绿色的,是因为“草是”这个 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览