文章预览
文/李文斌 摘 要: 当前机器学习方法往往依赖大规模标注数据,无法像人类那样从少量样本和标记中进行高效的学习和泛化。本文针对开放场景下存在的样本稀缺、标记稀缺和计算资源稀缺等挑战,提出局部表征与度量的小样本学习方法体系、基于亲和矩阵的自监督对比学习框架和基于类中心化约束的数据集蒸馏技术,增强了开放场景下机器学习技术应用能力。此外,简要介绍以上研究所取得的代表性成果。 关键词: 新型机器学习;小样本学习;对比学习;数据集蒸馏 近年来,随着计算设备计算能力的增强,大型标注数据的出现,以及深度学习的迅猛发展,机器学习特别是深度学习,在计算机视觉和自然语言处理等领域取得了显著的进步和成功。机器学习算法已经在不少领域远远超越了人类,例如,残差网络ResNet 在 ImageNet 数据集上的分类准确
………………………………