文章预览
AI的新领域是多模态模型,比如CLIP和Stable Diffusion。由于人类通过视觉和语言与世界互动,AI研究人员们认为机器也需要多模态通道。像LLaVA这样的东西能否培育出一种“通用助手”,有效地遵循符合人类意图的多模态视觉和语言指令?如果可以,代价是什么? 我们生活在一个不确定的时代。 在科学界取得突破性进展之后,记者们往往要立即对商业和技术进步进行追踪。在AI领域尤其如此。 记者们几乎没有时间进行思考或研究,只能听信科学家对“Next Big Thing”的一面之词,从而使AI新闻报道沦为速记。 被AI裹挟的公司现在也面临着类似的困境。就像淘金热一样,公司的首要任务是抢占先机,之后才会担心其在特定领域的AI投资是否真的是金矿。 Nvidia的指数级增长进一步搅乱了人们的判断。有钱能使鬼推磨。 Nvidia的总营收成倍增长,截至4月28日的
………………………………