|
[LG]《ZipNN: Lossless Compression-20241112055951 爱可可-爱生活 · 微博 · AI · 2 周前 · 访问文章快照 |
|
ZipNN算法通过巧妙地利用AI模型参数中指数部分的偏态分布特性-20241112055957 爱可可-爱生活 · 微博 · AI · 2 周前 · 访问文章快照 |
|
[CL]《Recycled Attention: Efficie-20241112055238 爱可可-爱生活 · 微博 · AI · 2 周前 · 访问文章快照 |
|
循环注意力通过巧妙地复用先前注意力模式构建动态的、较小的 KV -20241112055242 爱可可-爱生活 · 微博 · AI · 2 周前 · 访问文章快照 |
|
本文通过提出“记忆注入”和“注意力透镜”两种新的可解释性方法,有-20241112054704 爱可可-爱生活 · 微博 · AI · 2 周前 · 访问文章快照 |
|
[CL]《Towards Interpreting Langua-20241112054658 爱可可-爱生活 · 微博 · AI · 2 周前 · 访问文章快照 |
|
[LG]《FrontierMath: A Benchmark f-20241112053610 爱可可-爱生活 · 微博 · AI · 2 周前 · 访问文章快照 |
|
FrontierMath 基准通过数百个原创、极具挑战性的未公开-20241112053621 爱可可-爱生活 · 微博 · AI · 2 周前 · 访问文章快照 |
|
本文通过巧妙的测试时训练方法和增强的推理策略,显著提升了大型语言-20241112053515 爱可可-爱生活 · 微博 · AI · 2 周前 · 访问文章快照 |
|
晚安~ #晚安# -20241111222139 爱可可-爱生活 · 微博 · AI · 2 周前 · 访问文章快照 |
|
《爱可可微博热门分享(11.11)》 爱可可微博热门分享(11-20241111222005 爱可可-爱生活 · 微博 · AI · 2 周前 · 访问文章快照 |
|
几篇论文实现代码:《Video Diffusion Models-20241111205136 爱可可-爱生活 · 微博 · AI · 2 周前 · 访问文章快照 |
|
【CYBER:一个通用的机器人操作系统,旨在通过模拟人类学习方式-20241111205027 爱可可-爱生活 · 微博 · AI · 2 周前 · 访问文章快照 |
|
【EquiTriton:高性能神经网络核工具,专为等变神经网络设-20241111204909 爱可可-爱生活 · 微博 · AI · 2 周前 · 访问文章快照 |
|
【Immich-Go:一款无需Node.js安装的命令行工具,专-20241111204221 爱可可-爱生活 · 微博 · AI · 2 周前 · 访问文章快照 |
|
【Kiroku:多智能体系统,帮你组织和撰写文档,就像有一个智能-20241111204056 爱可可-爱生活 · 微博 · AI · 2 周前 · 访问文章快照 |
|
【Twitter到Bluesky迁移工具:一键将你的Twitte-20241111203811 爱可可-爱生活 · 微博 · AI · 2 周前 · 访问文章快照 |
|
【ComfyUI InstantIR Wrapper:一款在Co-20241111140535 爱可可-爱生活 · 微博 · AI · 2 周前 · 访问文章快照 |
|
【ComfyUI Slider Sidebar:为 ComfyU-20241111140432 爱可可-爱生活 · 微博 · AI · 2 周前 · 访问文章快照 |
|
【[TAI快报]多模态模型与数学新突破】本期节目,我们将带你深入-20241111095808 爱可可-爱生活 · 微博 · AI · 2 周前 · 访问文章快照 |