Matrix Generator(MG):一个基于DNA片段的0/1矩阵生成程序

来源 :植物学报 | 被引量 : 0次 | 上传用户:gf_lucky
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
分子群体遗传学研究的特点是取样量大--存在于群体样本中的遗传变异必须要充分代表该群体和该物种的遗传变异量及分析的位点数多--位点样本必须恰当代表基因组.大样本的群体取样和位点取样产生大量的原始数据,使原始数据人工处理非常困难甚至不可能,从而迫切需要原始数据处理的自动化.目前一些大公司提供的凝胶图像收集仪器和配套的软件已经使原始数据的获取基本上自动化或半自动化.获得DNA片段分子量数据后,必须把这些分子量数据转变成可反映操作单位(样本)之间关系的数据矩阵,原来用于计算分子量的那些软件已不实用或派不上用场.目前,除了用于fAFLP的Binthere弥补了部分不足外,还没有此类软件.Binthere存在固定栏宽(Bin)的缺陷,也就是将分子量最大值与最小值之间等分的方法来归纳不同操作单位(OUT)之间的异同,使得分子量绝对值差很小的数据可能被归入不同的栏,导致结果不正确.为了解决这类问题,我们设计编写了一个新的软件,取名为Matrix Generator(MG).与同类软件相比,MG具有两个主要优点:(1)采用动态栏宽和智能归并算法,克服了固定栏宽可能造成的错误;(2)可用于非荧光标记的分子标记技术.MG的基本思路是:分子量差异越小的片段,越可能是同缘片段,越应该处于相同的栏内.为此,我们采用绝对对应的动态过程.也就是说,从最小分子量到最大分子量之间的栏目数不是事先确定,而是由所分析的所有样品的特点和所使用的凝胶的分辨率(用户根据凝胶的特点给出数值)决定的.当两片段的差异小于凝胶所能达到的分辨率时,两片段被认为是同缘片段而归入相同的栏内.归并的过程从差异最小值开始,直至任意两片段的差异都大于凝胶的分辨率为止.这样就排除了同缘片段被隔离或者非同缘片段被合并的错误,从而使最可能同缘的片段归结在同一位点.MG第一版(V1.0,DOS版)集中体现了实用和易用的优点而没有包含同类软件所具有的一些功能,所以MG必须与其他软件结合使用.对于非荧光标记的分子标记技术,如RAPD、RFLP、AFLP等,可用Quantity One等软件得到分子量,用Excel生成样品与(分子量数据代表的)DNA片段矩阵,然后用MG处理.对于荧光标记的分子标记技术,如fAFLP、fSSR等,除可以用Excel生成矩阵外,可直接用Binthere和Genotyper等生成分子量矩阵,然后用MG处理.MG输出的矩阵经过适当编辑后,就可用后续的软件如Paup、Ntsys、Philip等运算.为了检验MG的有效性,我们用六道木属(Abelia)的AFLP分析数据进行检验,14个样品的DNA片段分别用Binthere和MG进行处理.前者得到295个含信息的位点,后者得到210个含信息的位点.用Nei and Li(1979)的算法分别计算距离矩阵并对两距离矩阵作Mantel检验.结果,两矩阵之间存在一定的差别,但相似性系数高达0.941 63,说明两种方法总体上会得到相似的结果,但局部会有所不同.用Paup对两矩阵作进一步分析,生成两个Neighbor-joining(NJ)树.结果表明,MG生成的数据更符合实际情况,而且分辨率高.
其他文献
目的 研制冻干人尿中汞成分分析标准物质.方法 冻干尿由正常人尿经过滤、加标、混匀、分装、冷冻干燥、辐射灭菌制备而成,使用原子荧光测定方法 对其均匀性和稳定性进行检验,
由19头杂种公猪[皮特兰×(皮特兰×汉普夏)]、52头杂种母猪[Leicoma×(大约克×长白)]及其332头后代组成的商品群作为参考系,选择172个微卫星标记和3个Ⅰ类标记(RYR1、PIT1、
研究了失效锂离子电池焙烧物料中有价金属的浸出行为.首先以LiCoO2,Co3O4为实验原料,与Na2SO4,K2SO4,(NH4)2SO4和浓硫酸调成浆料,在不同温度下焙烧转化,然后用热水浸出.在不
对于高钙质湖泊来说,水体中钙离子对沉积物磷吸附特征影响非常重要.文章选取北方典型湖泊沉积物进行了吸附实验并通过Langmuir等温吸附模型线性拟合,研究了沉积物的等温吸附
分别于出生当天、3、20、30、45、90、120、180日龄随机屠宰二花脸公、母猪各4头(30日龄仅有公猪),于20、30、90、120、180日龄随机屠宰大白猪公猪4头,采集背部皮下脂肪组织.
随着对端粒和端粒酶在衰老和肿瘤中重要性认识的不断深入,端粒酶的激活途径已日益成为这一研究领域的热点.已发现,MYC原癌蛋白(myelocytomatosis virus oncoprotein,MYC)在端
根据生物复眼几何结构及其处理信息方式,提出了一类新的数据处理方法--方向量子化方法,用以描述集合的外部轮廓.理论分析表明:这一方法具有表述简洁、易于编程、半动态维护方
为提高热带假丝酵母转化烷烃生产长链二元酸的能力,建立了通过两步浓缩和双重影印技术筛选获得α、ω-氧化增强、β-氧化减弱的热带假丝酵母诱变菌株的筛选体系.热带假丝酵母
某染料中间体生产企业排放的废水污染物浓度高、盐度高、色度高、毒性大,废水量为240 m3/d,采用预处理/UASB/MBR工艺对其进行处理。调试结果表明:在进水硫酸盐≤7 500mg/L、COD≤3 500 mg/L的条件下,出水水质可达到《山东省海河流域水污染物综合排放标准》(DB 37/675—2007)的二级标准。
大豆液泡膜V型H+ ATPase是ATPases中的一种 ,它在植物细胞的生长发育中有重要的作用 .利用竹红菌乙素 (HB)和KI这两种分别猝灭蛋白质疏水区域内源荧光和亲水区域内源荧光的荧