专栏名称: 生信技能树
生物信息学学习资料分析,常见数据格式及公共数据库资料分享。常见分析软件及流程,基因检测及癌症相关动态。
今天看啥  ›  专栏  ›  生信技能树

在R编程环节有所限制未必不是好事

生信技能树  · 公众号  ·  · 2024-11-10 08:59

文章预览

在前面的笔记中: 扎克伯格背刺基于R语言的Seurat单细胞生态 我提到了这个 CELLxGENE 在线平台 ,它上面有很多单细胞数据集,而且大部分提供了 .h5ad 格式文件,里面有单细胞表达量矩阵。但有一些却没有对应的Seurat体系的文件,比如:https://cellxgene.cziscience.com/collections/4796c91c-9d8f-4692-be43-347b1727f9d8 是 929,686 cells derived from 156 fresh clinical samples obtained from 41 HGSOC patients ,我们可以很容易的根据前面的笔记中: 扎克伯格背刺基于R语言的Seurat单细胞生态 进行python单细胞处理: import  scipy.sparse  as  sparse import  scipy.io  as  sio import  scipy.stats  as  stats import  numpy  as  np import  scanpy  as  sc import  os all_data=sc.read_h5ad( "./fdff1375-aafc-48ef-b5b1-b1ff8466d92c.h5ad" ) cellinfo=all_data.obs geneinfo=all_data.var #mtx=all_data.X.T  raw_data = all_data.raw.X mtx = raw_data.T cellinfo.to_csv( "cellinfo.cs ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览