|
自适应视图增强的谣言检测图对比学习方法 酷酷的群 · 公众号 · · 2 月前 · 访问文章快照 |
|
书摘|陀思妥耶夫斯基《罪与罚》 酷酷的群 · 公众号 · · 6 月前 · 访问文章快照 |
|
生成式大模型的RLHF技术(一):基础 酷酷的群 · 公众号 · · 7 月前 · 访问文章快照 |
|
LoRA:大模型下游任务的低秩适应 酷酷的群 · 公众号 · · 11 月前 · 访问文章快照 |
|
Megatron-LM:Transformer模型专用分布式张量模型并行方法 酷酷的群 · 公众号 · · 11 月前 · 访问文章快照 |
|
思维树:大模型的复杂推理技术 酷酷的群 · 公众号 · · 11 月前 · 访问文章快照 |
|
LIMA:小规模监督数据指令微调 酷酷的群 · 公众号 · · 11 月前 · 访问文章快照 |
|
语言模型的自洽性思维链推理技术 酷酷的群 · 公众号 · · 11 月前 · 访问文章快照 |
|
GPipe:微批量流水线并行 酷酷的群 · 公众号 · · 12 月前 · 访问文章快照 |
|
InstructGPT:语言模型的人类反馈指令对齐 酷酷的群 · 公众号 · · 12 月前 · 访问文章快照 |
|
高效底座模型LLaMA 酷酷的群 · 公众号 · · 1 年前 · 访问文章快照 |
|
TokenGT:Transformer是强大的图学习器 酷酷的群 · 公众号 · · 1 年前 · 访问文章快照 |