专栏名称: 歸藏的AI工具箱
互联网科技博主 产品设计师、模型设计师、 不会代码的独立开发者。 关注人工智能、LLM 、 Stable Diffusion 和设计。
今天看啥  ›  专栏  ›  歸藏的AI工具箱

DeepSeek 开始搞多模态了。#ai# 开源了一个多模态理解-20241018170456

歸藏的AI工具箱  · 微博  ·  · 2024-10-18 17:04
    

文章预览

2024-10-18 17:04 本条微博链接 DeepSeek 开始搞多模态了。 #ai# 开源了一个多模态理解和生成一体的模型 Janus,既可以理解图片内容又可以生成图片。 Janus的核心创新是将视觉编码分为两个独立的部分:一个用于多模态理解,一个用于图像生成。 这种解耦设计可以缓解理解和生成任务对视觉编码器的不同需求所带来的冲突,从而在两种任务上都实现更好的性能。 它采用统一的自回归变换器架构来处理不同模态的输入。 模型下载: ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览