专栏名称: 微软亚洲研究院
专注科研18年,盛产黑科技
今天看啥  ›  专栏  ›  微软亚洲研究院

图像解码器;多头混合专家网络;视觉模型美学对齐;医学视觉任务适应基准

微软亚洲研究院  · 公众号  · AI  · 2024-07-30 17:06

文章预览

(本文阅读时间:10分钟) 编者按:欢迎阅读“科研上新”栏目!“科研上新”汇聚了微软亚洲研究院最新的创新成果与科研动态。在这里,你可以快速浏览研究院的亮点资讯,保持对前沿领域的敏锐嗅觉,同时也能找到先进实用的开源工具。 「 本期内容速览 」 01 MedVTAB:大规模医学视觉任务适应基准 02 对齐视觉模型与人类美学:算法与评估 03 GLC:基于生成式特征编码的极低码率图像编解码器 04 MH-MoE:多头混合专家网络 MedVTAB:大规模医学视觉任务适应基准 论文链接: https://arxiv.org/abs/2404.12876 近年来,深度学习的显著进步极大地推动了计算机视觉领域的发展,尤其是视觉 Transformer(ViT) 的引入。经过大规模数据集预训练后,这些模型在各种视觉任务上表现出了卓越的性能。通过引入专门的可学习层或标记,ViT 在特定下游任务中的适应性(称 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览