|
人人都能看懂的DPO数学原理 AINLP · 公众号 · · 2 月前 · 访问文章快照 |
|
如何获取高质量数据进行代码指令调优? AINLP · 公众号 · · 2 月前 · 访问文章快照 |
|
浅谈Role Play:从当红炸子鸡到无人问津 AINLP · 公众号 · · 2 月前 · 访问文章快照 |
|
【LLM模型幻觉】LLMs-模型幻觉-哈工大LLM幻觉综述-v4.0 AINLP · 公众号 · · 2 月前 · 访问文章快照 |
|
快手海外商业化广告算法工程师 AINLP · 公众号 · · 2 月前 · 访问文章快照 |
|
2024年大模型Alignment偏好优化技术PPO,DPO, SimPO,KTO,Step-DPO, MCTS-DPO,SPO AINLP · 公众号 · · 2 月前 · 访问文章快照 |
|
关于GPT5训练失败的思考 AINLP · 公众号 · · 2 月前 · 访问文章快照 |
|
五分钟内白板解释所有机器学习模型:机器学习模型类型的基础知识 AINLP · 公众号 · · 2 月前 · 访问文章快照 |
|
【RAG】面向实时智能客服场景的RAG问答系统应用 AINLP · 公众号 · · 2 月前 · 访问文章快照 |
|
全网被Reflection 70b狠狠耍了,竟是LLama 70B的Lora微调 AINLP · 公众号 · · 2 月前 · 访问文章快照 |
|
地表最强模型GPT4o-latest模型重夺第一,力压谷歌! AINLP · 公众号 · · 2 月前 · 访问文章快照 |
|
用AI察觉AI生成的文本(4)验证检测能力的不同场景(Out-of-Distribution Settings) AINLP · 公众号 · · 2 月前 · 访问文章快照 |
|
多模态大模型: 盘点&Highlights part2——Qwen-VL系列 AINLP · 公众号 · · 2 月前 · 访问文章快照 |
|
LLM预训练数据策略(一) AINLP · 公众号 · · 2 月前 · 访问文章快照 |
|
将 MOE 塞到 LoRA: 一篇文章的诞生 AINLP · 公众号 · · 2 月前 · 访问文章快照 |
|
情境化逻辑:LLMs推理能力的真正试金石 AINLP · 公众号 · · 2 月前 · 访问文章快照 |
|
Transformer上的旋转魔法与应用 AINLP · 公众号 · · 2 月前 · 访问文章快照 |
|
实战!利用多模态大模型生成绘本【文末送书】 AINLP · 公众号 · · 2 月前 · 访问文章快照 |
|
有了大语言模型后,知识图谱该何去何从? AINLP · 公众号 · · 2 月前 · 访问文章快照 |