文章预览
因为可能出现“幻觉”或“偏见”,大模型其内在机制带来的“安全性”问题和“稳定性”问题一直被视为应用落地中的“阿喀琉斯之踵”,也在一定程度上影响了许多曾被寄予厚望的新一代应用的爆发。 在GPT-4o发布后的短短的五分钟内,社交媒体平台已经曝出通过提示词攻击诱导其返回“不合规”内容的方法和过程截图 ;最近,国内市场上一些搭载了大模型问答功能的儿童智能手表产品在回答问题时则表现出了明显的偏见性观点,这些案例不仅揭示了大模型技术的在日常应用中表现出的“脆弱性”,也对如何使人工智能产品在符合社会公正与道德伦理的前提下提供有效价值,提出了严峻的考验。 本次讲座将邀请国际知名高校学者和行业专家,以具体案例为切入点,分析 大模型面临的主要安全威胁 ,并探讨 如何在应用中建立完善的机制,有效
………………………………