|
DeepSeek SFT 微调:基于法律问答的模型优化实践 AINLP · 公众号 · · 2 天前 · 访问文章快照 |
|
prompt压缩,还能这么干 AINLP · 公众号 · · 2 天前 · 访问文章快照 |
|
【校招&实习】同花顺AIME计划 寻找AI领域最顶尖的你 AINLP · 公众号 · · 3 天前 · 访问文章快照 |
|
大语言模型真的擅长逻辑推理吗 AINLP · 公众号 · · 3 天前 · 访问文章快照 |
|
prompt那么长,能不能压缩一下? AINLP · 公众号 · · 3 天前 · 访问文章快照 |
|
【search-o1】大模型的推理 AINLP · 公众号 · · 6 天前 · 访问文章快照 |
|
结合代码聊聊FlashAttentionV3前向过程的原理 AINLP · 公众号 · · 6 天前 · 访问文章快照 |
|
全景解读 LLM Posting-Train(后训练)技术 AINLP · 公众号 · · 6 天前 · 访问文章快照 |
|
吃瓜DeepSeek推理成本需要的相关概念:Throughput、TPOT、TTFT AINLP · 公众号 · · 1 周前 · 访问文章快照 |
|
【实习】AI算法实习生-字节番茄-筋斗云人才计划 AINLP · 公众号 · · 1 周前 · 访问文章快照 |