为实现STR遗传标记的分析,须确定重复区域两侧序列恒定的侧翼区域。知道侧翼序列后就可设计引物,扩增分析重复区域。识别新的STR遗传标记有下列两种方法:①在GeneBank等DNA序列数据库中寻找重复6次或更多的连续重复单元(Weber及May,1989; Collins et a1.,2003;Subramanian et a1.,2003);②通过分子生物学分离法寻找(Edwards et a1., 1991; Chambers及MacAvoy,2000).
STR重复序列以重复单位的长度命名。二核苷酸重复具有两个核苷酸一个接一个的重复。三核苷酸的重复单位有3个核苷酸,四核苷酸的有4个,五核苷酸的有5个,六核苷酸的有6个。理论上讲,一、二、三、四、五、六核苷酸的重复分别会有4、16、64、256、1024、4096种可能的核心序列排列方式(Jin et al.,1994)。
STR序列不仅在重复单位的长度和重复次数上不同,而且其重复次数增加的模式严格讲也是不一致的。按照重复模式的不同,STR被分成几类。简单重复中重复单位的长度和序列一致,复合重复由两种或两种以上的简单重复连接而成,复杂重复则可能包含几种不同长度的重复单元,并且重复单元之间可能含有不同长度的插入序列( Urquhart et a1., 1994)U。高变复杂重复具有大量长度和序列不一致的等位基因,因此给基鼠分型带来函难(urquhart etal.1993 ,Gill et al. 1994)。最后一种分类方法在法医实验室并不常用,因为实验室间等位基因的命名和检测存在差异。目前有两种包含高变复杂STR基因座SE33(有时称ACTBP2)的商业试剂盒(Urquhart et a1.,1993;Promega Corporati仰,2002;Applied Bio-systems,2002)。
对一个STR基因座而言,并非所有的等位基因都包含完整的重复单位。即使是简单重复也可能在完整重TH01之间插入不一致的等位基因。微变异即指含有不完全重复单位的等位基因。比如THol的等位基因9.3,它包含9个四核苷酸完全重复和一个不完整的三核苷酸重复,因为第7个重复的AATG重复中缺失了一个A('Puers et a1.,1993)。