今天看啥  ›  专栏  ›  机器之心SOTA模型

今日开源(2024-12-20):Lyra多模态大模型:3B、9B、74B参数需求全覆盖,语音、视觉、语言交互新突破,全模态认知

机器之心SOTA模型  · 公众号  · 互联网安全 科技自媒体  · 2024-12-20 18:19
    

主要观点总结

文章介绍了多个项目、工具和模型,包括基座模型Lyra、Agent开发相关项目、必备工具以及今日可用的大模型等。每个项目都有详细的描述和链接。

关键观点总结

关键观点1: 基座模型Lyra

Lyra是一个高效多模态大型语言模型,包含三个版本,基于开源大型模型和多模态技术,用于提升语音、视觉和语言模态的交互能力。

关键观点2: Agent开发相关项目

介绍了AutoPatent和OS-Agent-Survey两个项目。AutoPatent旨在自动生成完整专利文档,利用大型语言模型的智能体框架生成高质量的专利文档。OS-Agent-Survey旨在整合OS智能体研究的现状,提供全面的知识指导。

关键观点3: 必备工具介绍

包括BrushEdit、ComfyUI-FaceChain和Synthetic Data Generator等工具。它们分别用于图像修复编辑、人脸检测和合成数据创建等任务。

关键观点4: 今日可用大模型的详细介绍

提供了多个大模型的详细信息,包括多模态模型、中文大模型和推理用时等。这些模型可通过API调用,并提供了相应的API调用地址和秘钥获取方式。


文章预览

🏆基座模型 ①项目:Lyra ★ Lyra是由香港多所高校联合推出的高效多模态大型语言模型(MLLM),专注于提升语音、视觉和语言模态的交互能力。包含3B、9B、74B三个版本。 Lyra基于开源大型模型、多模态LoRA模块和潜在的多模态正则化器,减少训练成本和数据需求。 Lyra构建大规模的多模态数据集,包括长语音样本,处理复杂的长语音输入,实现强大的全模态认知能力。 ☆一键收藏: https://sota.jiqizhixin.com/project/lyra 🤖 Agent开发 ①项目:AutoPatent ★ AutoPatent是一个多智能体框架,旨在自动生成完整的专利文档。该项目引入了一个名为Draft2Patent的新任务及其对应的D2P基准,挑战大型语言模型(LLM)生成平均长度为17K标记的完整专利。 专利因其专业性、标准化术语和篇幅长而对LLM构成重大挑战。AutoPatent利用基于LLM的规划智能体、撰写智 能体和审查智能体 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览