专栏名称: 老刘说NLP
老刘,NLP开源爱好者与践行者。主页:https://liuhuanyong.github.io。老刘说NLP,将定期发布语言资源、工程实践、技术总结等内容,欢迎关注。
今天看啥  ›  专栏  ›  老刘说NLP

文本挖掘实践再回顾:基于游记的事件演化序列抽取与图谱可视化展示

老刘说NLP  · 公众号  ·  · 2024-09-15 10:54
    

文章预览

叙事性文本中,隐藏着十分丰富的事件先后演化知识,而对这个知识进行结构化的挖掘,可以形成一些很有意思的结论。 例如,我们学生时代写记叙文,比如去外婆家,整篇读下来,我们就能知道去外婆家这次活动都经历了哪些事情。 而具备典型代表性的游记,也成为了众多旅游爱好十分热衷写的一种题材,这为我们进行游记的挖掘提供了很好的素材。 进一步的, 如果我们将游记文本挖掘和图谱进行结合,将游记中的一些关键步骤形式化成一个图节点,并连成线,做成有向图,也能得到十分有趣的信息 。 本文围绕游记文本结构化这一主题,介绍一个基于游记的结构化挖掘实现,通过借助句法依存分析,将文本中的信息表示为主谓宾、主谓或者动宾的形式,调用vis插件,进行可视化展示。 实现代码地址: https://github.com/liuhuanyong/SequentialEventExtrati ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览