专栏名称: 老刘说NLP
老刘,NLP开源爱好者与践行者。主页:https://liuhuanyong.github.io。老刘说NLP,将定期发布语言资源、工程实践、技术总结等内容,欢迎关注。
今天看啥  ›  专栏  ›  老刘说NLP

大模型Text2SQL主流数据集及可用实践项目:兼看利用大模型进行5W1H新闻要素提取

老刘说NLP  · 公众号  ·  · 2024-05-29 11:40
    

文章预览

今天是2024年5月29日,星期三,北京,天气晴。 我们来看看2个问题,一个是关于利用大模型进行新闻要素提取,是舆情领域的一个工作,另一个是关于Text2sql当前的可用项目及数据集,可以增强大家对text2sql的理解。 会有一些思路,供大家一起参考。 问题1:关于利用大模型进行新闻要素提取 关于舆情分析进展,我们先来看看一个5W1H大模型的关键信息提取的进展,最近的工作 《5W1H Extraction With Large Language Models》(https://arxiv.org/pdf/2405.16150) ,通过5W1H框架(什么、何时、哪里、为什么、谁、如何)提取重要新闻要素的方法,这个有点意思。 通过5W1H框架(What、When、Where、Why、Who和How)提取基本新闻要素对于事件提取和文本摘要至关重要。 但现有大模型在处理较长的新闻文本和分析上下文中的特定属性时遇到了挑战,尤其是在回答“是什么”(what)、“ ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览