专栏名称: 老刘说NLP
老刘,NLP开源爱好者与践行者。主页:https://liuhuanyong.github.io。老刘说NLP,将定期发布语言资源、工程实践、技术总结等内容,欢迎关注。
今天看啥  ›  专栏  ›  老刘说NLP

值得一看的小模型技术全面总结及RAG文档处理及切分小模型工具

老刘说NLP  · 公众号  ·  · 2024-11-09 11:34
    

文章预览

今天是2024年11月09日,星期六,北京,天气晴, 本文还是来看看RAG,不过是从另一个角度,从小模型( 其实这个小不太好说,7B或者以下? )角度; 因此,讲两件事,一个是回顾下小模型,推荐一个写的很好的小模型进展技术总结综述,里面提到的几个关键点都值得索引;再看小模型用于RAG文本切分的一些小模型工具,包括文档处理、文档切分等。 仔细读,会有收获,供大家一起参考。 一、特别直接推荐的小模型进展技术总结 关于小模型综述,我们之前其实有说过,例如 《What is the Role of Small Models in the LLM Era: A Survey》(https://github.com/tigerchen52/role_of_small_models, https://arxiv.org/pdf/2409.06857) ,而进一步的, 老刘说NLP技术社区在11月07日早报中提到了另一个小模型综述, 《A Comprehensive Survey of Small Language Models in the Era of Large Language Models: Techniques, Enhancements, A ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览