主要观点总结
文章主要介绍了如何加速大规模基因结构注释人工校正工作的问题。作者提到,虽然一直在寻找解决办法,但由于人工参与的精细性,这个问题仍然难以解决。为了解决效率问题,作者提出了通过自动化工具GSAman进行“过夜培养”的方法,并介绍了新推出的功能“Batch Screenshot”,该功能可以自动提取基因区间并进行截图,以便快速判断哪些基因需要矫正。同时,作者也强调了人工评判的重要性,并指出需要懂行的人来评判才能确保准确性。
关键观点总结
关键观点1: 大规模基因结构注释人工校正工作的难点和挑战
人工参与是精细活,难以快速完成;需要判断基因结构注释是否需矫正或正确。
关键观点2: 解决效率问题的办法:自动化工具GSAman的“过夜培养”功能
通过自动化工具GSAman进行基因区间的自动跳转和保存截图,提高判断效率。
关键观点3: 新功能“Batch Screenshot”的介绍和使用方法
使用简单,只要准备数据或BED/GFF3文件,GSAman会自动提取基因区间进行截图;截图完成后,可在输出目录中看到批量生成的图片。
关键观点4: 人工评判的重要性及局限性
人工评判最准,但需要懂行的人来评判才能确保准确性。
文章预览
写在前面 事实上,我一直在想办法,如何加速大规模基因结构注释人工校正工作。当然,仍然没有找到合适的办法。至于原因,就是人工参与,本身就不会快。这个是一个精细活,甚至是一个「有难度」的活。难度在于,如何判断一个基因结构注释,到底是否需要矫正?甚至说,是否正确。 我们完全可以设想这样一个场景: 你现在得到了一个基因集合,因为这个基因集合是要发表的,所以他的结构注释必须是对的,于是你最好就是确认一下他们的注释没有问题; 你现在在进行全基因组基因结构注释,需要一个一个拖拽滑动窗口,进而确认注释是否有问题。 当然,我们不考虑没有被注释出来的区域。那么上述场景,其实都需要慢慢拖拽,等待数据加载,渲染等等。有时候我们由于我们在笔记本上做事情,还会因为数据装载缓慢而浪费许多等待时
………………………………