|
梯度累积的隐藏陷阱:Transformer库中梯度累积机制的缺陷与修正 数据派THU · 公众号 · 大数据 · 1 月前 · 访问文章快照 |
|
时序异常检测新进展!华为诺亚方舟实验室&华东师大提出首个时序异常检测通用模型 数据派THU · 公众号 · 大数据 · 1 月前 · 访问文章快照 |
|
【牛津大学博士论文】用于本体工程的语言模型 数据派THU · 公众号 · 大数据 · 1 月前 · 访问文章快照 |
|
lintsampler:高效从任意概率分布生成随机样本的新方法 数据派THU · 公众号 · 大数据 · 1 月前 · 访问文章快照 |
|
KDD 2024 | 数据驱动的分布偏移检测与自适应 数据派THU · 公众号 · 大数据 · 1 月前 · 访问文章快照 |
|
【NeurIPS2024】IPO: 面向视觉-语言模型的可解释提示优化 数据派THU · 公众号 · 大数据 · 1 月前 · 访问文章快照 |
|
深入滴滴出行中心,解密智能出行的创新密码——清华大学《数智安全与标准化》课程专题参访 数据派THU · 公众号 · 大数据 · 1 月前 · 访问文章快照 |
|
【牛津大学博士论文】改进单智能体和多智能体深度强化学习方法 数据派THU · 公众号 · 大数据 · 1 月前 · 访问文章快照 |
|
闭源与开源嵌入模型比较以及提升语义搜索效果的技术探讨 数据派THU · 公众号 · 大数据 · 1 月前 · 访问文章快照 |
|
独家 | 用AI打造你的竞争优势 数据派THU · 公众号 · 大数据 · 1 月前 · 访问文章快照 |
|
独家 | 花8小时学习Parquet的发现 数据派THU · 公众号 · 大数据 · 1 月前 · 访问文章快照 |
|
【NeurIPS2024】GDeR: 通过原型图剪枝保障效率、平衡性与鲁棒性 数据派THU · 公众号 · 大数据 · 1 月前 · 访问文章快照 |
|
如果你的PyTorch优化器效果欠佳,试试这4种深度学习中的高级优化技术吧 数据派THU · 公众号 · 大数据 · 1 月前 · 访问文章快照 |
|
“全国数标委”正式成立! 数据派THU · 公众号 · 大数据 · 1 月前 · 访问文章快照 |
|
机器学习中空间和时间自相关的分析:从理论基础到实践应用 数据派THU · 公众号 · 大数据 · 1 月前 · 访问文章快照 |
|
活动预告丨Python科研应用分享会——Python数据科学应用 数据派THU · 公众号 · 大数据 · 1 月前 · 访问文章快照 |
|
【博士论文】高效且有效的基础大型多模态模型学习 数据派THU · 公众号 · 大数据 · 1 月前 · 访问文章快照 |
|
独家 | 花8小时学习Parquet的发现 数据派THU · 公众号 · 大数据 · 1 月前 · 访问文章快照 |
|
信息论、机器学习的核心概念:熵、KL散度、JS散度和Renyi散度的深度解析及应用 数据派THU · 公众号 · 大数据 · 1 月前 · 访问文章快照 |
|
【MIT博士论文】稀疏和低秩矩阵优化在机器学习应用中的进展 数据派THU · 公众号 · 大数据 · 1 月前 · 访问文章快照 |