xAI大模型Grok-2上线，支持文生图；Sakana AI推出首个AI科学家，已经发了10篇论文...

新皮层NewNewThing · 公众号 · 科技自媒体 · 2024-08-16 23:49

主要观点总结

本周科技动态涉及应用与模型、AI音乐、投融资、大公司动态等方面。包括xAI大模型Grok-2上线支持文生图功能；昆仑万维发布全球首个AI流媒体音乐平台Melodio；讯飞智文2.0支持PPT一键生成；Sakana AI推出首个AI科学家；Google DeepMind训练的机器人乒乓球比赛与人类选手有来有回等应用与模型方面的新闻。同时，还有阿里云开源音频语言模型Qwen2-Audio的发布以及各大公司的最新融资和大公司动态等。

关键观点总结

关键观点1: xAI大模型Grok-2上线，支持文生图功能。

Grok-2模型融合了图像模型FLUX.1，具备聊天、编码和推理能力，可以生成包括政治人物图片在内的多种图像。

关键观点2: 昆仑万维发布全球首个AI流媒体音乐平台Melodio。

Melodio能根据用户输入的风格、情绪等参数生成音乐，并同步推出AI音乐商用创作平台Mureka。

关键观点3: 讯飞智文2.0支持PPT一键生成。

基于讯飞星火V4.0大模型，用户只需输入主题或上传文本、文档，即可快速生成PPT。

关键观点4: Sakana AI推出首个AI科学家。

该AI科学家已经生成了10篇完整的学术论文，每篇论文的成本约为15美元。

关键观点5: Google DeepMind训练的机器人在乒乓球比赛中与人类选手有来有回。

该机器人由ABB开发的工业机器人手臂和DeepMind的AI智能体组成，能够在与人类业余选手的比赛中进行有来有回的对抗。

关键观点6: 阿里通义开源音频语言模型Qwen2-Audio的发布。

Qwen2-Audio是一款大型音频语言模型（LALM)，具备语音聊天和音频分析两种使用模式，支持超过8种语言和方言。

文章预览

撰文：杨秋秋、王小淳、徐弢编辑：王杰夫 Key Points 本周应用与模型 xAI大模型Grok-2上线，支持文生图；昆仑万维发布全球首个AI流媒体音乐平台Melodio，想听什么歌AI生成；讯飞智文2.0正式上线，强化PPT生成能力； Sakana AI推出首个AI科学家，已经发了10篇论文； Google DeepMind训练的机器人在乒乓球比赛中与人类选手有来有回；阿里通义开源音频语言模型Qwen2-Audio。本周应用 xAI大模型Grok-2上线，支持文生图 8月15日，xAI宣布推出Grok-2和Grok-2 mini测试版，在聊天、编码和推理能力上有所提升。两款模型目前可供社交平台X上的Premium和Premium+付费用户使用。两款模型还融合了图像模型FLUX.1，所以支持文生图功能。据用户反馈，该产品的人为限制较少，例如它可以直接创建政治人物图片。在回答问题时，Grok-2还会搜索并结合X的用户发布的内容来回复用户的问 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博