专栏名称: 我不是Hacker
漏洞情报,漏洞靶场,漏洞复现,安全技术分享,开发技术交流。安全,开发两手抓!
今天看啥  ›  专栏  ›  我不是Hacker

AI前沿日报--2023.08.27

我不是Hacker  · 公众号  ·  · 2023-08-27 21:29
cckuailong读完需要2分钟速读仅需 1 分钟1   Text2Listen:让大语言模型能听懂人话,并做出合适的面部表情和动作简单来说,就是当你和聊天机器人聊天时,它能根据你说的话来做出相应的笑脸、皱眉等反应,让对话更加自然和真实。该项目提出了一个框架,用于根据说话者的话生成适当的面部反应。它使用一系列听众的面部手势,通过 VQ-VAE 进行量化,并将这些手势作为额外的语言标记输入到基于变换器的大型语言模型中。生成的听众动作是流畅的,并反映了语言语义。项目演示:https://people.eecs.berkeley.edu/~evonne_ng/projects/text2listen/论文:https://arxiv.org/abs/2308.10897源码:https://github.com/sanjayss34/lm-listener2   好文推荐:33 年前和 33 年后的深度神经网络Karpathy 在 2022 年写的一篇博客,他闲暇时候复现了 33 年前的一篇关于手写数字识别的经典论文。里面有些 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照