专栏名称: 互联网er的早读课
专注互联网产品、用研、交互、设计、运营领域精选内容。信息爆炸的社会,每天用心的去读一篇文章,也许胜过你的走马观花。每早八点,我们等你。
今天看啥  ›  专栏  ›  互联网er的早读课

AI早知道|智源发布多模态模型Emu3;阿里巴巴达摩院开源文档处理模型

互联网er的早读课  · 公众号  · 科技媒体  · 2024-10-22 08:03
    

文章预览

1.智源研究院发布了 多模态模型Emu3 ,它基于下一个token预测训练,在图像、文本和视频的生成和感知任务上达到先进性能。Emu3能生成高保真视频,简化了多模态模型设计,释放了扩展潜力,并已开源关键技术。 2.人工智能搜索初创公司 Perplexity计划进行新一轮融资,目标是筹集约5亿美元资金 ,以将其估值提升至80亿美元或更高。该公司在一年内完成了三轮重要融资,年初估值为5.2亿美元,夏季飙升至30亿美元。 3.阿里巴巴达摩院与中国人民大学近日联合开源了一款名为 mPLUG-DocOwl1.5的文档处理模型 ,该模型主打无需 OCR 识别即可理解文档内容,并在多个视觉文档理解基准测试中取得了领先的性能。 4.新加坡卫生部最近宣布将投资2亿新元(约合1.5亿美元), 计划在未来五年内在全国的医疗系统中大力推行新型人工智能技术 。 5.索尼集团和本田的合 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览