注册
登录
专栏名称:
老刘说NLP
老刘,NLP开源爱好者与践行者。主页:https://liuhuanyong.github.io。老刘说NLP,将定期发布语言资源、工程实践、技术总结等内容,欢迎关注。
我也要提交微信公众号
今天看啥
微信公众号rss订阅, 微信rss, 稳定的RSS源
微信公众号RSS订阅方法
B站投稿RSS订阅方法
雪球动态RSS订阅方法
微博RSS订阅方法
微博搜索关键词订阅方法
豆瓣日记 RSS订阅方法
目录
相关文章推荐
InfoQ 架构头条
·
DeepSeek爆降AI成本,但算力资源可能 ...
·
3 天前
今天看啥
›
专栏
›
老刘说NLP
大模型数据质量评估及优化工具整理:兼看用多模态模型处理表格理解的数据集及任务设计
老刘说NLP
·
公众号
· · 2024-07-02 11:40
文章预览
今天是2024年7月2日,星期二,北京,天气晴。 今天,我们来看看文档智能与数据方面的相关进展。看2个问题, 一个是大模型数据质量评估工具的一个整理;一个用多模态模型处理表格理解,其中涉及到的数据增强和任务数据很有趣。 供大家一起参考并思考。 一、问题1:大模型数据质量评估工具的一个整理 数据的质量评估一直是当前机器学习/深度学习所关注的焦点,如何从不同的维度出发对数据进行评估,并针对特定的任务进行迭代优化十分重要。 尤其是最近出现的评估工具,而关于大模型数据质量评估,可以看看大模型的数据质量评估工具综述: 《A Survey on Data Quality Dimensions and Tools for Machine Learning》(https://arxiv.org/pdf/2406.19614) , 研究和总结了过去五年中的17种数据质量评估和改进工具,通过介绍这些工具中嵌入的DQ维度、指标和主要功能, ………………………………
原文地址:
访问原文地址
快照地址:
访问文章快照
总结与预览地址:
访问总结与预览
分享到微博
推荐文章
InfoQ 架构头条
·
DeepSeek爆降AI成本,但算力资源可能“越省越费”?
3 天前
医药笔记
·
国内首款:博安生物度拉糖肽生物类似药申报上市
9 月前
智猩猩Auto
·
直播预告:加速向「AI定义的汽车」的转变与进化 | NVIDIA 自动驾驶汽车技术公开课
8 月前
小蒜苗长
·
你不知道我赛力斯股票赚了一台M9+一台R7么?//@劲夫劲夫东亚-20240902164431
6 月前
山东高法
·
支付宝“花呗”借款,如何认定?
6 月前
严道医声网
·
挽救花季生命,让爱传递:安贞医院心儿科戴辰程教授团队成功开展AVEIR™ 新型无导线起搏器植入手术
5 月前