专栏名称: PaperWeekly

PaperWeekly是一个推荐、解读、讨论和报道人工智能前沿论文成果的学术平台，致力于让国内外优秀科研工作得到更为广泛的传播和认可。社区：http://paperweek.ly | 微博：@PaperWeekly

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

ACL 2024 | 开创行业新标准！阿里云与苏大联合发布首个权威金融NLP基准

PaperWeekly · 公众号 · 科研 · 2024-08-03 13:02

文章预览

©PaperWeekly 原创 · 作者 | 朱杰单位 | 阿里云研究方向 | NLP、LLM应用背景随着大型语言模型（LLMs）在自然语言处理（NLP）领域的突破性进展，对于评估这些模型的新基准测试的需求变得迫切。特别是在中文金融领域，现有数据集在规模和多样性上的限制，使得对 LLMs 进行全面评估面临挑战。为了解决这一问题，本文提出了 CFLUE（Chinese Financial Language Understanding Evaluation），一个针对中文金融语言理解评估的基准测试，也是目前中文金融领域数量最多、最全面、并且被国际顶会认可的 Benchmark。论文标题： Benchmarking Large Language Models on CFLUE: A Chinese Financial Language Understanding Evaluation Dataset 收录会议： ACL 2024 论文链接： https://arxiv.org/abs/2405.10542 代码链接： https://github.com/aliyun/cflue 相关工作在英文金融领域，已经存在多个评估数据集，如 FINQA、TAT-QA ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

研之成理 · 黑龙江大学Chemical Science：机器学习辅助高通量筛选OLED阳极材料

昨天

弗雷赛斯 · 终于有出版社出手了！先预审，确定送审了再投稿！

2 天前

PaperWeekly · 让CLIP更加精简！字节豆包大模型团队首创无文本编码器方法，高效提速不掉点

2 天前

研之成理 · 中科院深圳先进院，Nature Chemistry！

3 天前

弗雷赛斯 · SCI查重，你可能已经被坑了...

3 天前

36氪财经 · 权重股逆势拉升！多只银行股创年内新高；消费电子板块盘中活跃；光刻胶概念震荡下挫；家电、医药双双回调丨市场日报

4 月前

sukii说 · 练习 65 | 用“大小结合” 写一个有张力的画面

5 月前

父母志 · 视频号 | 青春期所谓的叛逆是怎么回事？

1 月前