专栏名称: 老刘说NLP
老刘,NLP开源爱好者与践行者。主页:https://liuhuanyong.github.io。老刘说NLP,将定期发布语言资源、工程实践、技术总结等内容,欢迎关注。
今天看啥  ›  专栏  ›  老刘说NLP

多模态大模型数据处理策略总结:兼看RAG增强编程语言翻译任务的简单方案

老刘说NLP  · 公众号  ·  · 2024-07-31 11:40
    

文章预览

今天是2024年7月31日,星期三,北京,晴。 今天是2024年7月份的最后一天,时间过的真的太快了! 我们来继续看看两个话题: 一个是融合RAG增强不同编程语言之间的翻译效果,关于代码之间翻译的进展,刚好社区有人在提,所以特此来说说,流 程很类似,也没太多新意,有点套领域的感觉。但可以看看在这个任务上,那种嵌入模型好一些,以及都有哪些好的代码模型效果更佳 。 一个是关于多模态的数据处理的一些维度和思路,这些在多模态领域的模型建模中十分重要,可以看看一些具体的总结。 供大家一起参考并思考。 一、融合RAG增强不同编程语言之间的翻译效果 可以看看,主要是利用检索增强大模型的代码翻译能力: 《Enhancing Code Translation in Language Models with Few-Shot Learning via Retrieval-Augmented Generation》:https://arxiv.org/pdf/2407.19619 。 这个工作很 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览