|
矢量量化(VQ)的旋转技巧:梯度直通估计的一般推广 PaperWeekly · 公众号 · 科研 · 3 周前 · 访问文章快照 |
|
课程升级、资源加码!万人共学的书生大模型实战营第4期正式起航! PaperWeekly · 公众号 · 科研 · 3 周前 · 访问文章快照 |
|
IEEE TNNLS期刊:面向跨网络边分类的域自适应图注意力监督网络 PaperWeekly · 公众号 · 科研 · 3 周前 · 访问文章快照 |
|
审核失败 PaperWeekly · 公众号 · 科研 · 3 周前 · 访问文章快照 |
|
审核中 PaperWeekly · 公众号 · 科研 · 3 周前 · 访问文章快照 |
|
审核中 PaperWeekly · 公众号 · 科研 · 3 周前 · 访问文章快照 |
|
审核中 PaperWeekly · 公众号 · 科研 · 3 周前 · 访问文章快照 |
|
审核中 PaperWeekly · 公众号 · 科研 · 3 周前 · 访问文章快照 |
|
审核中 PaperWeekly · 公众号 · 科研 · 3 周前 · 访问文章快照 |
|
审核中 PaperWeekly · 公众号 · 科研 · 3 周前 · 访问文章快照 |
|
审核中 PaperWeekly · 公众号 · 科研 · 3 周前 · 访问文章快照 |
|
审核中 PaperWeekly · 公众号 · 科研 · 3 周前 · 访问文章快照 |
|
审核中 PaperWeekly · 公众号 · 科研 · 3 周前 · 访问文章快照 |
|
审核中 PaperWeekly · 公众号 · 科研 · 3 周前 · 访问文章快照 |
|
审核中 PaperWeekly · 公众号 · 科研 · 3 周前 · 访问文章快照 |
|
审核中 PaperWeekly · 公众号 · 科研 · 3 周前 · 访问文章快照 |
|
一个Agent拿下15款Atari游戏,RL也能实现Pretraining、Scaling和Few-shots微调 PaperWeekly · 公众号 · 科研 · 4 周前 · 访问文章快照 |
|
MIT韩松团队提出DuoAttention框架:单GPU实现330万Token上下文推理 PaperWeekly · 公众号 · 科研 · 4 周前 · 访问文章快照 |
|
北京内推 | 微软亚洲研究院通用人工智能组招聘多模态方向实习生 PaperWeekly · 公众号 · 科研 · 4 周前 · 访问文章快照 |
|
NeurIPS 2024 | 字节联合华师提出统一的多模态文字理解与生成大模型 PaperWeekly · 公众号 · 科研 · 4 周前 · 访问文章快照 |