GSAman | 批量导出基因结构与支持证据截图，超快速大规模筛选成为可能！

生信石头 · 公众号 · · 2024-08-24 22:56

主要观点总结

文章主要介绍了如何加速大规模基因结构注释人工校正工作的问题。作者提到，虽然一直在寻找解决办法，但由于人工参与的精细性，这个问题仍然难以解决。为了解决效率问题，作者提出了通过自动化工具GSAman进行“过夜培养”的方法，并介绍了新推出的功能“Batch Screenshot”，该功能可以自动提取基因区间并进行截图，以便快速判断哪些基因需要矫正。同时，作者也强调了人工评判的重要性，并指出需要懂行的人来评判才能确保准确性。

关键观点总结

关键观点1: 大规模基因结构注释人工校正工作的难点和挑战

人工参与是精细活，难以快速完成；需要判断基因结构注释是否需矫正或正确。

关键观点2: 解决效率问题的办法：自动化工具GSAman的“过夜培养”功能

通过自动化工具GSAman进行基因区间的自动跳转和保存截图，提高判断效率。

关键观点3: 新功能“Batch Screenshot”的介绍和使用方法

使用简单，只要准备数据或BED/GFF3文件，GSAman会自动提取基因区间进行截图；截图完成后，可在输出目录中看到批量生成的图片。

关键观点4: 人工评判的重要性及局限性

人工评判最准，但需要懂行的人来评判才能确保准确性。

文章预览

写在前面事实上，我一直在想办法，如何加速大规模基因结构注释人工校正工作。当然，仍然没有找到合适的办法。至于原因，就是人工参与，本身就不会快。这个是一个精细活，甚至是一个「有难度」的活。难度在于，如何判断一个基因结构注释，到底是否需要矫正？甚至说，是否正确。我们完全可以设想这样一个场景：你现在得到了一个基因集合，因为这个基因集合是要发表的，所以他的结构注释必须是对的，于是你最好就是确认一下他们的注释没有问题；你现在在进行全基因组基因结构注释，需要一个一个拖拽滑动窗口，进而确认注释是否有问题。当然，我们不考虑没有被注释出来的区域。那么上述场景，其实都需要慢慢拖拽，等待数据加载，渲染等等。有时候我们由于我们在笔记本上做事情，还会因为数据装载缓慢而浪费许多等待时 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博