自1985年多基因座DNA检验技术(MLP)开始应用于法庭科学,英国就试图用DNA技术建库,并且以此技术为基础建立了DNA数据库BIOTRAC系统,但由于这项技术重复性差,技术路线复杂,无法满足建库的要求。相比之下,单基因座DNA分析技术(SLP),不同个体仅为1或2条带,重复性相对较好,对其进行标准化规定后,接近建库要求。90年代初英国FSS建立的DNA数据库及美国FBI建立的DNA联合索引系统,采用的技术就是SLP遗传标记系统,但SLP技术对建库这一高标准的系统仍存在严重缺陷,如等位基因片段长度呈连续分布,片段长度、测量误差等实际问题无法解决,不同实验室者、不同实验室结果难以比对,甚至同一检材出现不同结果。该技术操作复杂,自动化程度低,对检材要求较高、灵敏度低,无法适应建库的需要。正因为如此,早期的DNA检验分型结果不能以标准的、可重复的数码形式记录,难以进行数据建档。90年代中期建立的PCR-STR分型使建库有了新的希望,STR基因座具有等位基因片段长度短、通过聚丙烯酰胺凝胶可以精确测定等位基因片段长度、等位基因频率分布呈离散型,可对等位基因用标准统一的命名方法等优点,实现了结果比对的数字化,确保了检验结果的准确性与重复性;同事STR检验结果灵敏度极高,对微量、陈旧、腐败检材均可有效地扩增分型。在同一反应体系中可以对多个STR基因座进行复合扩增,而后进行同步分型,极大地降低了工作强度,节约了检材,这些优点对建立高质量的DNA数据库极其重要,使建立法医DNA数据库成为现实。
英国FSS为世界上首先建库的国家,1987年用多为点探针(MLP)指纹技术建库,1990年用单位点探针分析技术建库,形成了一定数量的数据库,并串并了100多宗案件,证明了不同地点案件之间的关联性。但由于技术本身难以建立标准化、数字化的质量控制体系,故一直未能进行大规模建库。自90年代初FSS就开始寻找更有利于建库的有效方法,吸收更有利于建库的遗传标记,如cetus公司推出的DQa杂交系统。90年代中期,FSS研究推出了4个STR位点即:HUM vWF31/A、HUM THO1、HUM F13A01及HUM FES/FPS,TDP值可达1/10000。在此基础是昂,于1995年研制了第二代荧光标记复合扩增系统(SGM),包括HUM THO1、D21S11、D18S51、D8S1179、HUM vWF31/A 、HUM FGA基因座及性别基因座,这一遗传标记系统的建立时真正开始DNA建库的基础,鉴别力可达5*10-8,结合研究的第三代复合扩增系统(TGM),总体鉴别力可达10-15以上。
美国的CODIS系统最初建库选用的遗传标记系统也是单位点RFLP技术,正式建库选用的复合扩增体系是有PE公司的Amp FLSTR Profiler与cofiler,profiler kit包括vWA,FGA,D8S1179,D21S11,D18S51,D5S818,D13S317,D3S1358,D7S820九个位点,Cofiler Kit包括D3S1358,D7S820,D16S539,THO1,TPOX,CSF1P0六个位点,并分别包括性别位点。Profiler Kit鉴别力可达10-16,Cofiler Kit鉴别力大10-6.两个Kit中有2个位点相同,起到内对照作用,故codis系统选用的遗传标记系统含13个STR位点。目前几乎所有建库的国家及地区都以英国和美国建库选用的遗传标记系统为首选方案。
从英美等国家建立DNA数据库对遗传标记的选择经验来看,必须选择多态性高、分型稳定、重复性好、结果可数字化、易于标准化及质量控制的系统。在筛选STR基因座时,应遵循以下一些基本原则:(1)DP值大于0.9(或观察杂合度大于0.7),(2)等位基因片段在90-500bp范围,(3)染色体定位明确,所选系统内各位点不存在连锁关系,(4)结果可靠,分型明确,重复性好,(5)复杂性STR位点如ACTB2,因重复单位有1-4bp多种形式,存在着长度相同,而基因型可能不同的问题,数据不呈离散性,一般不做建库首选位点。(6)遗传变异率低,其变异率应小于0.2%。