|
“带爷奶在北京日均两万步”,今年最火“铁人三项旅游”看傻网友 普象工业设计小站 · 公众号 · 创意 · 5 分钟前 · 访问文章快照 |
|
科技重组||未来有重组预期的科技类名单(惠存收藏 随时查询) 超前一步午后一股 · 公众号 · · 15 分钟前 · 访问文章快照 |
|
审核失败 365资讯简报 · 公众号 · · 24 分钟前 · |
|
看ASML 的财报销售区域与产品划分,韩国与记忆体的占比崩盘 。-20241016060704 手机晶片达人 · 微博 · · 26 分钟前 · 访问文章快照 |
|
//@爱可可-爱生活:欢迎参与~-20241016060546 爱可可-爱生活 · 微博 · AI · 28 分钟前 · 访问文章快照 |
|
//@爱可可-爱生活:欢迎参与~-20241016060542 爱可可-爱生活 · 微博 · AI · 28 分钟前 · 访问文章快照 |
|
今日推介(第1560期):大型语言模型的低秩线性化、基于思考生成-20241016060501 爱可可-爱生活 · 微博 · AI · 28 分钟前 · 访问文章快照 |
|
全球最大稀土原料生产基地投运;AG600飞机开始全机疲劳试验丨科技早新闻 科技日报 · 公众号 · · 33 分钟前 · 访问文章快照 |
|
本文提出了一个统一的预测不确定性度量框架,基于交叉熵并涵盖九种不-20241016055318 爱可可-爱生活 · 微博 · AI · 40 分钟前 · 访问文章快照 |
|
[LG]《On Information-Theoretic Me-20241016055311 爱可可-爱生活 · 微博 · AI · 40 分钟前 · 访问文章快照 |
|
本文通过实证研究揭示了大型语言模型中普遍存在的注意力汇聚现象,并-20241016053734 爱可可-爱生活 · 微博 · AI · 56 分钟前 · 访问文章快照 |
|
[CL]《When Attention Sink Emerges-20241016053715 爱可可-爱生活 · 微博 · AI · 56 分钟前 · 访问文章快照 |
|
本文发现大型语言模型中混合专家架构的路由权重可以作为一种无需额外-20241016053105 爱可可-爱生活 · 微博 · AI · 1小时前 · 访问文章快照 |
|
[CL]《Your Mixture-of-Experts LLM-20241016053059 爱可可-爱生活 · 微博 · AI · 1小时前 · 访问文章快照 |
|
本文提出了一种无需额外数据即可训练大型语言模型进行“思考”的思考-20241016052111 爱可可-爱生活 · 微博 · AI · 1小时前 · 访问文章快照 |
|
今晚我觉得特别有意思的一个瞬间是看 Tim 给奥迪的灯光设计负责-20241016052157 常岩CY · 微博 · · 1小时前 · 访问文章快照 |
|
审核失败 重回阳光 · 公众号 · · 1小时前 · |
|
9月金融数据继续走弱,如无结构性经济改革,一揽子措施作用有限 火星宏观 · 公众号 · · 1小时前 · 访问文章快照 |
|
iPad Mini 6 与 iPad Mini 7 的详细配置对-20241016045027 常岩CY · 微博 · · 1小时前 · 访问文章快照 |
|
特斯拉开始在欧洲市场销售 7 座版 Model Y。我挺好奇啥样-20241016042453 常岩CY · 微博 · · 2 小时前 · 访问文章快照 |
|
转发微博-20241016022529 宝玉xp · 微博 · AI · 4 小时前 · 访问文章快照 |
|
转发微博-20241016022524 宝玉xp · 微博 · AI · 4 小时前 · 访问文章快照 |
|
朝鲜骂人的风格用ai学习一下,拿去写段子肯定很带劲,研究了一下,-20241016014612 神嘛事儿 · 微博 · 财经 · 4 小时前 · 访问文章快照 |
|
“公元前100年,马略黯然离开罗马,这一年恰好恺撒出生。恺撒出身-20241016013319 深圳ZKH · 微博 · · 5 小时前 · 访问文章快照 |
|
转发微博-20241016012803 宝玉xp · 微博 · AI · 5 小时前 · 访问文章快照 |