专栏名称: 互联网er的早读课
专注互联网产品、用研、交互、设计、运营领域精选内容。信息爆炸的社会,每天用心的去读一篇文章,也许胜过你的走马观花。每早八点,我们等你。
今天看啥  ›  专栏  ›  互联网er的早读课

AI早知道|Kimi开源音频基础模型;阶跃星辰开源图像编辑模型

互联网er的早读课  · 公众号  · 科技媒体  · 2025-04-29 08:03
    

文章预览

1.Moonshot AI最近推出的Kimi-Audio是一款 开源音频基础模型 ,旨在推动音频理解、生成和交互技术的发展。该模型基于Qwen2.5-7B架构,结合Whisper技术,支持多种音频任务,如语音识别和音频问答。 2.百度发布 文心快码Coding智能体Zulu ,是 国内首个多模态Al程序员 。Zulu支持多模态交互,可上传图片一键生成代码,具备自动搭建开发环境、启动服务等功能,适配主流IDE,能实现代码效果实时预览。 3.阶跃星辰正式 开源图像编辑大模型Step1X-Edit ,总参数量达19B,融合了7B多模态大语言模型(MLLM)和12B扩散模型(DiT),具备语义精准解析、身份一致性保持和高精度区域级控制三大核心能力。 4.清华系 智谱与生数科技宣布达成战略合作 ,聚焦大模型联合创新。双方将在联合研发、产品联动、解决方案整合及行业协同等多方面合作,重点聚焦政企服务、泛互联网 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览