全基因组育种技术流程

菠萝头 1个月前 已收到2个回答 举报

我好想爱你 1星

共回答了199个问题采纳率:98.2% 评论

全基因组育种是一种以全基因组信息为基础的育种技术,其流程包括以下几个步骤:
1. 基因组测序:使用高通量测序技术对育种目标物种的全基因组进行测序,获取基因组中所有的DNA序列信息。
2. 基因组比对和分析:将测序获得的DNA序列与已知的基因组序列进行比对和对齐,以确定测序结果的准确性,并找到基因组中的基因和其他功能元件。
3. 基因组变异检测:通过比对与已知基因组序列的差异,检测出基因组变异,包括单核苷酸多态性(SNP)、插入/缺失等。
4. 基因功能预测:利用生物信息学方法对基因组中的序列进行注释和功能预测,找出与目标性状相关的基因候选区域。
5. 基因组选择和标记辅助选择:根据基因组数据和目标性状选择遗传背景优良的个体或种群,同时利用已经开发的分子标记(例如SNP标记)进行辅助选择。
6. 基因组选择后交配:根据基因组选择的结果进行后交配,以获取带有所需基因组组合的新个体。
7. 生物学验证和田间试验:对基因组选择获得的新个体进行生物学验证和田间试验,确定其表现性状是否符合预期。
8. 基因组选择迭代:根据个体表现性状的结果进行基因组选择的迭代,直至获得理想的育种材料。
9. 高通量基因组分析和功能验证:对基因组选择获得的个体进行高通量基因组分析和功能验证,从而更好地理解和解释目标性状的基因功能机制。
10. 高通量育种:利用全基因组信息辅助育种,通过选择携带特定基因组组合的个体进行育种,加速新品种的培育进程。
这是一个简化的全基因组育种技术流程,具体步骤可能会因不同的物种和育种目标而有所不同。

3小时前

1

你都有她 1星

共回答了154个问题 评论

在选择育种历史中,经历了从经验育种到育种理论和方法的探索,有选择学说,纯系学说,回交育种、轮回育种、诱变育种、单粒传、理想株型;再到标记辅助选择育种,探索了各种各样的标记,比如扩增片段长度多态性标记辅助选择(aflp)、微卫星标记辅助选择(ssr)和单核苷酸多态性标记辅助选择(snp)。随着测序技术的发展,测序的通量越来越高,成本越来越低,加之计算机运算能力不断提升,这为全新育种技术的发展创造了技术条件,兴起了基因组选择(genomicselection,gs)育种浪潮。

基因组选择育种能有效的解决难测量性状、运气成分大,耗时长、技术难度高等因素的限制,加快育种的步伐。基因组选择育种是利用覆盖全基因组的高密度分子遗传标记进行的标记辅助选择的一种育种方式。

目前比较出名的基因组选择(gs)分析功能软件是ipat软件,ipat软件界面比较友好,但是ipat只有三种gs模型,分别为基因组最佳线性无偏估计(gblup)、岭回归最佳线性无偏估计(rrblup)、贝叶斯岭回归(brr)。

然而,对于有快速育种需求的公司来说,现有的基因组选择分析的效率低,分析结果的准确性也相对较低,无法满足需求。

技术实现要素:

本发明的主要目的在于提供一种全基因组选择育种的方法和装置,以解决现有技术中的分析结果准确性低的问题。

为了实现上述目的,根据本发明的一个方面,提供了一种全基因组选择育种的方法,该方法包括:获取训练群体中与目标表型显著关联的标记;根据训练群体及标记,利用多种全基因组选择预测模型计算育种群体中每个个体的基因组估计育种值;按照基因组估计育种值从高到低的顺序,选择在多个全基因组选择预测模型中均排在前预定数量的个体作为育种材料。

进一步地,多种全基因组选择预测模型包括:基因组最佳线性无偏预测模型、岭回归最佳线型无偏估计模型、贝叶斯套索模型、贝叶斯a模型、贝叶斯b模型、贝叶斯c模型及贝叶斯岭回归模型中的至少4种。

进一步地,多种全基因组选择预测模型包括岭回归最佳线型无偏估计模型、贝叶斯套索模型、贝叶斯a模型、贝叶斯b模型、贝叶斯c模型及贝叶斯岭回归模型中的至少3种时,利用多种全基因组选择预测模型计算育种群体中每个个体的基因组估计育种值包括:利用训练群体中的目标表型与标记之间的显著关联性,对多种全基因组选择预测模型进行精确度评估,得到满足精确度要求的一个或多个全基因组选择预测模型;利用满足精确度要求的一个或多个全基因组选择预测模型,计算得到各标记的效应值;利用各标记的效应值计算得到育种群体中每个个体的基因组估计育种值。

进一步地,获取训练群体中与目标表型显著关联的标记包括:对训练群体来源于基因芯片或基因组重测序的测序数据进行全基因组关联分析,从而获得与目标表型显著关联的标记。

进一步地,从测序数据进行全基因组关联分析从而获得与目标表型显著关联的标记包括:对测序数据进行综合分析,综合分析表型分布分析、群体结构分析、连锁不平衡分析以及亲缘关系分析;根据综合分析的结果进行全基因组关联分析,从而获得与目标表型显著关联的标记。

进一步地,对测序数据进行综合分析,并根据综合分析的结果进行全基因组关联分析,从而获得与目标表型显著关联的标记包括:检测测序数据中数量性状的表型是否符合正态分布或者偏态分布,并剔除偏离杠杆值的极端表型;通过主成分分析或者群体结构分析计算训练群体中群体结构,并将群体结构作为固定效应加入全基因组关联分析模型中;通过衰减距离对全基因组的标记进行连锁不平衡过滤,去除存在多重共线性的效应的标记;通过计算训练群体中各个体间的亲缘距离,并将亲缘距离作为随机效应加入全基因组关联分析模型;利用全基因组关联分析模型计算数量性状的表型中与全基因组的标记之间的关联性,从而选择得到与目标表型存在显著关联的标记;优选地,全基因组关联分析模型为混合线性模型。

为了实现上述目的,根据本发明的一个方面,提供了一种全基因组选择育种的装置,该装置包括:获取模块、育种值估计模块及选择模块,获取模块用于获取训练群体中与目标表型显著关联的标记;育种值估计模块用于根据训练群体及标记,利用多种全基因组选择预测模型计算育种群体中每个个体的基因组估计育种值;选择模块用于按照基因组估计育种值从高到低的顺序,选择在多个全基因组选择预测模型中均排在前预定数量的个体作为育种材料。

进一步地,多种全基因组选择预测模型包括:基因组最佳线性无偏预测模型、岭回归最佳线型无偏估计模型、贝叶斯套索模型、贝叶斯a模型、贝叶斯b模型、贝叶斯c模型及贝叶斯岭回归模型中的至少4种。

进一步地,多种全基因组选择预测模型包括岭回归最佳线型无偏估计模型、贝叶斯套索模型、贝叶斯a模型、贝叶斯b模型、贝叶斯c模型及贝叶斯岭回归模型中的至少3种时,育种值估计模块包括:模型精确度评估模块,用于利用训练群体中的目标表型与标记之间的显著关联性,对多种全基因组选择预测模型进行精确度评估,得到满足精确度要求的一个或多个全基因组选择预测模型;效应值计算模块,用于利用满足精确度要求的一个或多个全基因组选择预测模型,计算得到各标记的效应值;育种值估计子模块,用于利用各标记的效应值计算得到育种群体中每个个体的基因组估计育种值。

进一步地,获取模块包括:全基因组关联分析模块,用于对训练群体来源于基因芯片或基因组重测序的测序数据进行全基因组关联分析,从而获得与目标表型显著关联的标记。

进一步地,全基因组关联分析模块包括:综合分析模块,用于对测序数据进行综合分析,综合分析表型分布分析、群体结构分析、连锁不平衡分析以及亲缘关系分析;全基因组关联分析子模块,用于根据综合分析的结果进行全基因组关联分析,从而获得与目标表型显著关联的标记。

进一步地,全基因组关联分析模块包括:表型分布分析模块,用于检测测序数据中数量性状的表型是否符合正态分布或者偏态分布,并剔除偏离杠杆值的极端表型;群体结构分析模块,用于通过主成分分析或者群体结构分析计算训练群体中群体结构,并将群体结构作为固定效应加入全基因组关联分析子模块中;连锁不平衡分析模块,用于通过衰减距离对全基因组的标记进行连锁不平衡过滤,去除存在多重共线性的效应的标记;亲缘关系分析模块,用于通过计算训练群体中各个体间的亲缘距离,并将亲缘距离作为随机效应加入全基因组关联分析子模块;全基因组关联分析子模块,用于计算数量性状的表型中与全基因组的标记之间的关联性,从而选择得到与目标表型存在显著关联的标记;优选地,全基因组关联分析分析子模块为混合线性模块。

为了实现上述目的,根据本发明的一个方面,提供了一种存储介质,存储介质包括存储的程序,其中,在程序运行时控制存储介质所在设备执行上述任一种全基因组选择育种的方法。

为了实现上述目的,根据本发明的一个方面,提供了一种处理器,处理器用于运行程序,其中,程序运行时执行任一种全基因组选择育种的方法。

应用本发明的技术方案,本发明综合多个模型进行基因组估计育种值计算,并利用多个模型结果共定位,并选择出在所有的模型中都具有高育种值的个体作为育种材料,大大提高结果的精确性。此外,本申请的方法可以从多种模型中寻找出最佳模型预测最佳育种材料,从而提高了基因组选择育种结果的准确性。本发明的方法能适应大部分的材料背景,填补了在超级计算机中基因组选择分析上的空白,提高育种选择的效应,促进育种的进展。

1小时前

50
可能相似的问题

猜你喜欢的问题

热门问题推荐

Copyright © 2024 微短问答 All rights reserved. 粤ICP备2021119249号 站务邮箱 service@wdace.com