今天看啥  ›  专栏  ›  晓飞的算法工程笔记

最新顶刊速递 [2024-09-13]

晓飞的算法工程笔记  · 公众号  ·  · 2024-09-13 12:15

文章预览

今日更新17篇: 计算机视觉 15篇 自然语言处理 2篇 计算机视觉: 15篇 [0] Multi-Modal Instruction-Tuning Small-Scale Language-and-Vision Assistant for Semiconductor Electron Micrograph Analysis[cs.CV] 标题:多模态指令调整小型语言和视觉助手用于半导体电子显微镜图像分析 作者:Sakhinana Sagar Srinivas, Geethan Sannidhi, Venkataramana Runkana 链接:http://arxiv.org/abs/2409.07463 摘要 :我们提出了一种利用视觉-语言指令调优分析并解释半导体制造中使用电子显微镜图像的新型框架。该框架采用独特的师生方法,利用预训练的多模态大型语言模型如GPT-4生成指令遵循数据,用于零样本视觉问答(VQA)和分类任务,并针对显微镜图像分析定制较小的多模态模型(SMM),从而实现指令调优的语言-视觉辅助工具。我们的框架将知识工程与机器学习相结合,将这一专业领域中的领域特定专业知识从大型多模 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览