看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于RefSeq数据库的人类标准转录数据集的构建 收藏
基于RefSeq数据库的人类标准转录数据集的构建

基于RefSeq数据库的人类标准转录数据集的构建

作     者:李稚锋 李玉鉴 赵东升 杭兴宜 王正志 骆志刚 张成岗 LI Zhi-Feng;LI Yu-Jian;ZHAO Dong-Sheng;HANG Xing-Yi;WANG Zheng-Zhi;LUO Zhi-Gang;ZHANG Cheng-Gang

作者机构:军事医学科学院放射与辐射医学研究所北京100850 北京工业大学计算机学院北京100822 军事医学科学院卫生勤务与医学情报研究所北京100850 国防科技大学机电工程与自动化学院长沙410073 国防科技大学并行与分布处理国防科技重点实验室长沙410073 

基  金:国家重点基础研究发展计划(973计划)(编号:2003CB715900) 国家高技术研究发展计划(863计划)(编号:2002AA234021) 并行与分布处理国防科技重点实验室基金(编号:51484050304JB4401) 中国教育网格(ChinaGrid)生物信息学网格项目资助~~ 

出 版 物:《遗传》 (Hereditas(Beijing))

年 卷 期:2006年第28卷第3期

页      码:329-333页

摘      要:美国国家生物信息技术中心(NCBI)提供了具有生物意义上的非冗余的基因和蛋白质序列的RefSeq参考序列数据库。然而,由于基因普遍存在的多态性以及不同实验室对于序列测定的质量控制存在差异等原因,已发现RefSeq数据库可能存在部分质量问题。文章基于“中心法则”提出“标准转录数据集”的概念,以人类基因和基因组序列为例,利用BLAT、Sim4和自行设计的EIparser等基因结构解析程序分析了RefSeq人类基因转录数据(2005-4-18)与目前所公布的人类标准基因组(2005-4-20)的对应关系。对于有实验证据支持的标记为NM_和NR_的记录,多种程序分析结果表明,其与标准基因组完全相对应的记录为9 771个;符合多个程序修订标准的记录有10 943个;而与标准基因组有较大差异的记录为203个,多种程序分析结果不一致的记录为2 676个,提示研究人员在使用此非标准转录组数据时,必须考虑到其存在非标准转录的原因甚至存在错误的可能性。此文为基于标准、高质量转录数据集的生物信息学数据分析、分子生物学实验设计、基因多样性和遗传变异分析等提供了重要的参考标准。相关结果可通过http://***/transcriptome/***访问。

主 题 词:RefSeq数据库 转录组 质量控制 人类标准转录数据集 

学科分类:1002[医学-临床医学类] 081203[081203] 08[工学] 0835[0835] 0812[工学-测绘类] 

核心收录:

D O I:10.3321/j.issn:0253-9772.2006.03.014

馆 藏 号:203137770...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分