|
知识链=知识图谱+大模型+推理-幻觉 AINLP · 公众号 · · 1 月前 · 访问文章快照 |
|
什么!SFT完全没用! AINLP · 公众号 · · 1 月前 · 访问文章快照 |
|
Qwen招聘:让我们一起点燃这支大火箭! AINLP · 公众号 · · 1 月前 · 访问文章快照 |
|
搭建 RAG 系统的技巧和策略 AINLP · 公众号 · · 1 月前 · 访问文章快照 |
|
避开复数推导,我们还可以怎么理解RoPE? AINLP · 公众号 · · 1 月前 · 访问文章快照 |
|
Qwen2 源码解析 AINLP · 公众号 · · 1 月前 · 访问文章快照 |
|
大模型位置编码概览及在图像视频领域应用 AINLP · 公众号 · · 1 月前 · 访问文章快照 |
|
希望这篇是最清晰好懂的 Layernorm 原理解析 AINLP · 公众号 · · 1 月前 · 访问文章快照 |
|
Qwen2.5-Coder 技术报告详细解读 AINLP · 公众号 · · 1 月前 · 访问文章快照 |
|
技术上,如何复现 o1? AINLP · 公众号 · · 1 月前 · 访问文章快照 |
|
普林斯顿大学提出首个基于MoE的稀疏时序预测大模型,参数量扩展到2.4billion AINLP · 公众号 · · 1 月前 · 访问文章快照 |
|
Bge-en-icl: 当in-context learning遇上了text embedding... AINLP · 公众号 · · 1 月前 · 访问文章快照 |
|
有想入坑RL-LLM的同学吗?这个开源项目一个GPU够了,完成后欢迎来月之暗面~ AINLP · 公众号 · · 1 月前 · 访问文章快照 |
|
tokenizer简述 AINLP · 公众号 · · 1 月前 · 访问文章快照 |
|
【LLM开源项目】LLMs-微调框架-LLaMA-Factory微调量化部署v4.0 AINLP · 公众号 · · 1 月前 · 访问文章快照 |
|
MatchTime | 当LLM开始做足球解说:关于多模态模型在体育领域的应用 -- NICE29期 AINLP · 公众号 · · 1 月前 · 访问文章快照 |
|
O1技术路线猜想-动作空间选择 AINLP · 公众号 · · 1 月前 · 访问文章快照 |
|
Llama3.2开源:Meta发布1B和3B端侧模型、11B和90B多模态模型 AINLP · 公众号 · · 1 月前 · 访问文章快照 |
|
开源大模型技术路线及趋势 AINLP · 公众号 · · 1 月前 · 访问文章快照 |