|
Bio-xLSTM 是一种高效的基于 xLSTM 的生物和化学序-20241109054956 爱可可-爱生活 · 微博 · AI · 1 周前 · 访问文章快照 |
|
[CL]《BitNet a4.8: 4-bit Activati-20241109054337 爱可可-爱生活 · 微博 · AI · 1 周前 · 访问文章快照 |
|
BitNet a4.8 提出了一种创新的混合量化和稀疏化策略,成-20241109054347 爱可可-爱生活 · 微博 · AI · 1 周前 · 访问文章快照 |
|
本文通过提出新的评估指标并进行实验,揭示了基于梯度上升的遗忘学习-20241109053529 爱可可-爱生活 · 微博 · AI · 1 周前 · 访问文章快照 |
|
晚安~ #晚安# -20241108223155 爱可可-爱生活 · 微博 · AI · 2 周前 · 访问文章快照 |
|
《爱可可微博热门分享(11.8)》 爱可可微博热门分享(11.-20241108223017 爱可可-爱生活 · 微博 · AI · 2 周前 · 访问文章快照 |
|
恭喜@尽至天明 等10名用户获得【有道VIP月卡】。微博官方唯一-20241108120225 爱可可-爱生活 · 微博 · AI · 2 周前 · 访问文章快照 |
|
【[TAI快报]从逻辑推理到安全防护】本期节目,从Transfo-20241108101727 爱可可-爱生活 · 微博 · AI · 2 周前 · 访问文章快照 |
|
#抽奖# 携手@图灵文化 @图灵新知 送出3本《MySQL必知必-20241108101444 爱可可-爱生活 · 微博 · AI · 2 周前 · 访问文章快照 |
|
//@爱可可-爱生活:欢迎参与抽奖~-20241108080625 爱可可-爱生活 · 微博 · AI · 2 周前 · 访问文章快照 |
|
今日推介(第1583期):Transformer如何解决命题逻辑-20241108061304 爱可可-爱生活 · 微博 · AI · 2 周前 · 访问文章快照 |
|
[CL] A Comprehensive Survey of S-20241108055901 爱可可-爱生活 · 微博 · AI · 2 周前 · 访问文章快照 |
|
[LG]《Long Context RAG Performanc-20241108055443 爱可可-爱生活 · 微博 · AI · 2 周前 · 访问文章快照 |
|
该论文通过对20个大型语言模型在不同上下文长度下的RAG性能进行-20241108055447 爱可可-爱生活 · 微博 · AI · 2 周前 · 访问文章快照 |
|
[LG]《What Features in Prompts Ja-20241108054832 爱可可-爱生活 · 微博 · AI · 2 周前 · 访问文章快照 |
|
本文通过构建大型越狱数据集并利用线性与非线性探测器分析提示特征,-20241108054837 爱可可-爱生活 · 微博 · AI · 2 周前 · 访问文章快照 |
|
[LG]《LASER: Attention with Expon-20241108054141 爱可可-爱生活 · 微博 · AI · 2 周前 · 访问文章快照 |
|
本文提出LASER注意力机制,通过指数变换值矩阵并结合对数加权求-20241108054146 爱可可-爱生活 · 微博 · AI · 2 周前 · 访问文章快照 |
|
[LG]《Non-Stationary Learning of -20241108053440 爱可可-爱生活 · 微博 · AI · 2 周前 · 访问文章快照 |
|
本文提出一种新的“软参数重置”方法,通过在线学习自适应漂移参数来-20241108053445 爱可可-爱生活 · 微博 · AI · 2 周前 · 访问文章快照 |