看过本文的还看了

相关文献

该作者的其他文献

文献详情 >真核模式生物蛋白质数据库统计规律研究 收藏
真核模式生物蛋白质数据库统计规律研究

真核模式生物蛋白质数据库统计规律研究

作     者:冯立芹 李宏 FENG Li-qin;LI Hong

作者机构:内蒙古民族大学物理与电子信息学院内蒙古通辽028000 内蒙古大学物理科学与技术学院内蒙古呼和浩特010021 

基  金:国家自然科学基金项目(11362015) 内蒙古民族大学科科研项目(NMD1220) 内蒙古民族大学研创新团队建设计划资助课题 

出 版 物:《中国医学物理学杂志》 (Chinese Journal of Medical Physics)

年 卷 期:2014年第31卷第6期

页      码:5318-5321,5332页

摘      要:目的:根据NCBI Refseq基因集的蛋白质序列数据,构建包含11种真核模式生物在内的基因、蛋白质信息数据库(EPD),探讨各种模式生物的蛋白质序列长度频率分布,并以此来探讨在生物进化过程中,蛋白质序列长度的变化趋势。方法:通过计算机编程软件提取不同种类生物基因总数、有实验数据支撑的蛋白质序列(标记为NP_的序列)数、理论预测的蛋白质序列(标记为XP_的序列)数等相关信息进行统计。结果:对该数据库数据统计规律的研究表明:数据库共有347042个基因,469887个蛋白质,平均每个基因可翻译有1.35个蛋白质;蛋白质序列长度为300-350个氨基酸的最多;长度小于100个氨基酸和大于2500个氨基酸的蛋白质序列很少。结论:模式生物蛋白质序列长度频率分布具有一定规律性;人和爪蛙的蛋白质长度频率分布曲线形状最相似;从蛋白质长度频率分布曲线的靠近程度上看,人与小鼠更接近;生物偏好使用中等长度的蛋白质序列。

主 题 词:真核生物 数据库 频率分布 

学科分类:071011[071011] 0710[理学-生物科学类] 07[理学] 

D O I:10.3969/j.issn.1005-202X.2014.06.022

馆 藏 号:203843546...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分