专栏名称: AI前线
InfoQ十年沉淀,为千万技术人打造的专属AI公众号。追踪技术新趋势,跟踪头部科技企业发展和传统产业技术升级落地案例。囊括网站和近万人的机器学习知识交流社群。
今天看啥  ›  专栏  ›  AI前线

百度冯景辉:从数据清洗到安全围栏,深度解析大模型原生安全构建

AI前线  · 公众号  · AI  · 2024-08-17 13:30

文章预览

采访嘉宾 | 冯景辉 策划 | 李忠良   随着大模型的逐步发展,内容安全问题受到了前所未有的关注。为此,InfoQ 特别邀请百度安全副总经理冯景辉在 8 月 18-19 日的 AICon 全球人工智能大会(上海站)上,分享《百度大模型原生安全构建之路》的主题演讲。本文是对冯景辉的会前采访对谈。 在对谈中,冯景辉提到,大模型的智能性、不确定性和不可解释性为内容安全带来了重大挑战,这迫使开发者在模型设计阶段就必须深入考虑安全性问题。百度在这一领域进行了多项创新实践,包括数据清洗、安全对齐、内生安全技术以及安全围栏等措施,形成了一套完整的全流程安全解决方案。 特别值得一提的是,百度采用了四步法进行数据清洗,并引入代答模型,以提高内容审核的自动化和智能化水平。冯景辉还强调了构建原生安全的重要性,指出通过有监督 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览