专栏名称: 生信宝典
生物信息分析入门、晋级和经验分享。Linux、R、Python学习教程;高通量测序数据分析学习教程;生信软件安装教程。所有内容均为原创分享,致力于从基础学习到提高整个过程。
今天看啥  ›  专栏  ›  生信宝典

Genome Biology | Wing Hung Wong/江瑞/刘桥团队合作提出表观基因组学预训练语言模型EpiGePT

生信宝典  · 公众号  · 生物  · 2025-01-08 21:00
    

文章预览

人类基因组中非编码区域的信息解码一直是基因组学领域的基础性难题, 调控元件如何在不同细胞类型中调控基因表达机制的问题至今仍未得到充分解决 ,非编码变异如何破坏DNA序列底层的调控语法也尚未完全阐明。随着表观基因组测序技术的发展,积累了大量可供研究这些问题的数据,包括染色质可及性、DNA甲基化、组蛋白修饰和三维染色质互作等,研究人员可以对基因组非编码区域的信息进行系统化解读。 与此同时,自然语言与生物序列之间的内在相似性启发了在基因组学中使用大型语言模型的尝试。大型语言模型的开发是近年来人工智能突破的主要推动力,并在生物信息学中得到了广泛应用。然而,目前的主流基因组语言模型往往仅DNA序列作为模型输入,在预测未知细胞类型中的表观基因组信号方面仍然存在局限。 亟需发展具有细胞类型 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览