文章预览
自ChatGPT模型问世后,在全球范围内掀起了AI新浪潮。 有很多企业和高校也随之开源了一些效果优异的大模型,例如: Qwen系列模型、MiniCPM序列模型、Yi系列模型、ChatGLM系列模型、Llama系列模型、Baichuan系列模型、Deepseek系列模型、Moss模型等。 图片来自:A Survey of Large Language Models 并且在去年的一整年中,大多数人都在做底座通用大模型的搭建、垂直领域大模型预训练或微调等工作。虽然大模型基础能力得到了很大程度的提升,但是大模型距离真正地落地,其实还有一段艰难的路要走。 图片来自:A Survey of Large Language Models 那么如何让大模型更好地进行场景落地,变得尤为重要。例如:如何优化通用大模型在领域上的效果,如何在某些场景中合理运用大模型,如何确保生成内容的稳定性和安全性,如何确保大模型可以在生产环境下稳定使用等。 《大型
………………………………