2024-09-30 05:16
本条微博链接
本文白盒评估发现当前机器遗忘方法主要是隐藏而非删除有害知识,其效果与传统安全训练类似,仍需改进。
[LG]《An Adversarial Perspective on Machine Unlearning for AI Safety》J Łucki, B Wei, Y Huang, P Henderson… [ETH Zurich Princeton University] (2024) 网页链接 #机器学习# #人工智能# #论文#
………………………………