序列数据库的注释信息包括两部分,一部分由计算机程序经过序列分析由
计算机程序生成,另一部分则依靠生物学家通过查阅文献资料而获得。
序列数据库早期的数据主要由数据录入人员通过查阅文献杂志搜集,或者由科研人员用磁盘、电子邮件方式向国际生物信息数据库中心递交。数据中心对搜集到的序列数据进行整理、维护,并定期通过磁盘、磁带和光盘方式向全世界发布。
序列数据库的序列数据来自核酸和
蛋白质序列测定,随着
基因组大规模测序计划的迅速开展,序列数据库特别是核酸序列数据库的数据量迅速增长,数据来源主要集中于国际上几大著名的测序中心,如位于
英国剑桥南郊基因组园区的Sanger Centre,
华盛顿大学基因组研究中心等。