|
小红书推荐系统全解析:去中心化内容分发 NewBeeNLP · 公众号 · · 8 月前 · 访问文章快照 |
|
八问八答搞懂Transformer内部运作原理 NewBeeNLP · 公众号 · · 8 月前 · 访问文章快照 |
|
SFT、RLHF、DPO、IFT —— LLM 微调的进化之路 NewBeeNLP · 公众号 · · 8 月前 · 访问文章快照 |
|
从大数据到大模型:搜索推荐技术的前沿探索 NewBeeNLP · 公众号 · · 8 月前 · 访问文章快照 |
|
全网独一份!AI大模型学习训练资源...(限时免费领) NewBeeNLP · 公众号 · · 9 月前 · 访问文章快照 |
|
长文本模型近期研究工作梳理 NewBeeNLP · 公众号 · · 9 月前 · 访问文章快照 |
|
Llama-3-SynE:实现有效且高效的大语言模型继续预训练 NewBeeNLP · 公众号 · · 9 月前 · 访问文章快照 |
|
为什么说大模型训练很难?聊聊预训练的一些经验 NewBeeNLP · 公众号 · · 9 月前 · 访问文章快照 |
|
多模态召回模型:混合模态专家模型 NewBeeNLP · 公众号 · 广告 · 9 月前 · 访问文章快照 |
|
Llama 405B背后的训练、对齐技术演变路径 NewBeeNLP · 公众号 · · 9 月前 · 访问文章快照 |
|
在国外大厂当leader的真实体验! NewBeeNLP · 公众号 · · 9 月前 · 访问文章快照 |
|
Llama 3.1 源模型泄露背后:失手的 GitHub,破碎的 Meta,好在最小参数都能打脸GPT-4o! NewBeeNLP · 公众号 · · 9 月前 · 访问文章快照 |
|
分水岭时刻!Llama3.1发布,405B超越闭源GPT-4o NewBeeNLP · 公众号 · · 9 月前 · 访问文章快照 |
|
大模型Infra这些年,从黑铁时代到黄金时代再到白银时代 NewBeeNLP · 公众号 · · 9 月前 · 访问文章快照 |
|
2024 META新作:SUM技术进行大规模在线用户表示,提升广告个性化效果 NewBeeNLP · 公众号 · · 9 月前 · 访问文章快照 |
|
智慧教育+大模型:技术与应用 NewBeeNLP · 公众号 · · 9 月前 · 访问文章快照 |
|
与全参数微调相比,Lora微调的性能到底如何? NewBeeNLP · 公众号 · · 9 月前 · 访问文章快照 |
|
谷歌 | 物品-语言大模型推荐系统 NewBeeNLP · 公众号 · · 9 月前 · 访问文章快照 |
|
从零训练的 1B 以下小模型汇总 NewBeeNLP · 公众号 · · 9 月前 · 访问文章快照 |
|
【文末赠书】清华汪玉教授团队:首部高效模型压缩与设计专著重磅上市 NewBeeNLP · 公众号 · 科技自媒体 · 9 月前 · 访问文章快照 |