今天看啥  ›  专栏  ›  生信石头

CPC2 插件 | 我有序列,想知道他Coding还是Non-Coding?

生信石头  · 公众号  ·  · 2024-09-23 16:01

文章预览

写在前面 最近做一些基因结构注释方面工作,遇到一个小问题就是当我们知道一个染色体区域他转录了,有转录本,那么他到底是编码蛋白?还是编码蛋白?简单来说,就是蛋白质编码基因?还是非编码RNA?如果是后者,那咱们拿到序列就差不多了,下游功能验证就按照非编码的走,不小心还要做个靶向预测。如果是前者,那就要看是否得到的CDS,我们得预测好ORF,定义好CDS,这样才能克隆基因,做对应的如蛋白质序列分析,和下游功能实验。 为此,要么我们自己想个方法,要么就用现在最为广泛应用的软件,其中之一即北大高歌老师课题组开发的 CPC 软件。 简单学习后,软件主程序用 python 写,核心实现其实是SVM。我犹豫了下,到底是重新用 Java 造个轮子然后用一下模型,还是直接做一个插件,理智战胜了感性,造轮子没啥必要,直接调用,解 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览