专栏名称: AI for Research
每天分享最新最热的Arxiv论文、一起来关注大模型、AIGC、AGI
今天看啥  ›  专栏  ›  AI for Research

阿里发布FunAudioLLM:语音理解与生成基础模型!Anthropic发布最新研究:语言模型迭代自优化过程的“奖励欺骗”现象

AI for Research  · 公众号  ·  · 2024-07-08 20:17

文章预览

前言: 平淡无奇的一天又来了,今天要分享的内容主要是关于大模型、模型评估、大语言模型的,喜欢的小伙伴赶紧去阅读相关论文吧。 1. FunAudioLLM:语音理解与生成基础模型   标题: FunAudioLLM: Voice Understanding and Generation Foundation Models for Natural Interaction Between Humans and LLMs   机构: 阿里巴巴集团   关键词: 语音理解、生成基础模型、大型语言模型、自然交互   作者: Tongyi SpeechTeam   分析: 本报告介绍了FunAudioLLM,一种旨在增强人类与大型语言模型(LLMs)之间自然语音交互的模型家族。其核心包括两个创新模型:SenseVoice,负责多语种语音识别、情感识别和音频事件检测;CosyVoice,有助于以控制多种语言、音色、说话风格和说话者身份进行自然语音生成。SenseVoice-Small为5种语言提供极低延迟的自动语音识别,而SenseVoice-Large支持超过50种语言的高精确度 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览