注册
登录
专栏名称:
爱可可-爱生活
知名互联网资讯博主 北邮PRIS模式识别实验室陈老师
今天看啥
微信公众号rss订阅, 微信rss, 稳定的RSS源
微信公众号RSS订阅方法
B站投稿RSS订阅方法
雪球动态RSS订阅方法
微博RSS订阅方法
微博搜索关键词订阅方法
豆瓣日记 RSS订阅方法
目录
相关文章推荐
爱可可-爱生活
·
【[5星]VolumetricSMPL:让3 ...
·
2 天前
爱可可-爱生活
·
【[39星]DIEF_BTS:为建筑数据分析 ...
·
2 天前
爱可可-爱生活
·
本文提出了一种反直觉但高效的批判微调 ...
·
4 天前
爱可可-爱生活
·
晚安~ #晚安# -20250130225448
·
4 天前
爱可可-爱生活
·
【[396星]DeepClaude:高性能L ...
·
5 天前
今天看啥
›
专栏
›
爱可可-爱生活
通过两阶段选择性压缩和适配技术,显著提升了Mamba在长文本语境-20240830053637
爱可可-爱生活
·
微博
·
AI
· 2024-08-30 05:36
文章预览
2024-08-30 05:36 本条微博链接 通过两阶段选择性压缩和适配技术,显著提升了Mamba在长文本语境下的建模能力,性能接近同等规模的Transformer模型。 [CL]《ReMamba: Equip Mamba with Effective Long-Sequence Modeling》D Yuan, J Liu, B Li, H Zhang... [Peking University Meituan] (2024) 网页链接 #机器学习# #人工智能# #论文# ………………………………
原文地址:
访问原文地址
快照地址:
访问文章快照
总结与预览地址:
访问总结与预览
分享到微博
推荐文章
爱可可-爱生活
·
【[5星]VolumetricSMPL:让3D人体模型与场景无缝-20250201130524
2 天前
爱可可-爱生活
·
【[39星]DIEF_BTS:为建筑数据分析提供超大规模时间序列-20250201130720
2 天前
爱可可-爱生活
·
本文提出了一种反直觉但高效的批判微调 (CFT) 框架,通过训练-20250131053154
4 天前
爱可可-爱生活
·
晚安~ #晚安# -20250130225448
4 天前
爱可可-爱生活
·
【[396星]DeepClaude:高性能LLM推理API和聊天-20250129194532
5 天前
DT商业观察
·
华为Mate70真来了,苹果慌吗?
2 月前