24小时热门版块排行榜    

CyRhmU.jpeg
查看: 4866  |  回复: 33
本帖产生 2 个 MolEPI ,点击这里进行查看
当前只显示满足指定条件的回帖,点击这里查看本话题的所有回帖

wanhscn

木虫 (职业作家)

哲学@草根

[交流] 【Journal Club】第3讲 水稻全基因组基因网络生物信息学平台的建立已有13人参与


Abstract:
Rice is a staple food for one-half the world’s population and a model for other monocotyledonous species. Thus, efficient approaches for identifying key genes controlling simple or complex traits in rice have important biological, agricultural, and economic consequences. Here, we report on the construction of RiceNet, an
experimentally tested genome-scale gene network for a monocotyledonous species. Many different datasets, derived from five different organisms including plants, animals, yeast, and humans, were evaluated, and 24 of the most useful were integrated into a statistical framework that allowed for the prediction of functional linkages between pairs of genes. Genes could be linked to traits by using guilt-by-association, predicting gene attributes on the basis of network neighbors. We applied RiceNet to an important agronomic trait, the biotic stress response. Using network guilt-by-association followed by focused protein–protein interaction
assays, we identified and validated, in planta, two positive regulators, LOC_Os01g70580 (now Regulator of XA21; ROX1) and LOC_Os02g21510 (ROX2), and one negative regulator, LOC_ Os06g12530 (ROX3). These proteins control resistance mediated by rice XA21, a pattern recognition receptor. We also showed that RiceNet can accurately predict gene function in another major monocotyledonous crop species, maize. RiceNet thus enables the identification of genes regulating important crop traits, facilitating engineering of pathways critical to crop productivity.
摘要:
        本研究以水稻的生物信息学方面的数据库为原料建立了一个研究单子叶植物基因网络的生物信息学平台;之前在2010年作者曾以拟南芥的生物信息学数据库为模板建立了一个研究双子叶植物基因网络的生物信息学平台,结果发表在2010年 Nat Biotech上!
     作者利用来自五个不同生物体的大量的生物信息学数据库,在经过筛选后最终保留了24个最有用的数据库,并以此为统计学计算的框架,对一对基因之间是否存在联系进行计算预测!
    在建成这一平台之后,作者选择了水稻生物胁迫中Xa-1基因介导的免疫反应这一过程,预测出了该过程中的3个新的基因,并通过转基因的功能验证证明其中两个为该过程的正调控因子,另外一个为负调控因子!
    最后,作者将这一系统用在对另一单子叶植物玉米上,并初步证明其有效性!

[ Last edited by wanhscn on 2012-1-2 at 20:54 ]
回复此楼
真相是最大的奢侈品
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

wanhscn

木虫 (职业作家)

哲学@草根


西瓜(金币+1): 主持人辛苦哈 2012-01-09 19:29:56
引用回帖:
24楼: Originally posted by 青菜小虫 at 2012-01-08 19:01:38:
支持版主,顶一个。这个基因网络能解释一下吗?

Gene networks that provide the regulation of physiological processes are the basic feature of organisms.
真相是最大的奢侈品
25楼2012-01-08 19:17:44
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
查看全部 34 个回答

wanhscn

木虫 (职业作家)

哲学@草根


注解:
利用水稻作为一个模型建立这样一个平台去研究单子叶植物生理发育农艺性状以及基因组。基于以下考虑
1 基因组大小较小,遗传转化体系建立得比较完善
2 高密度遗传图谱以及全基因组Microarrays数据能够获得
3 全基因组序列已知
4 与其它作物的关系较近

注解
1 之前,作者建立了基于拟南芥的双子叶植物gene network,其结果发表在2010年Nat Biotech上,为什么作者不直接用它来研究水稻?主要原因:单子叶植物与双子叶植物分化在160-200 百万年之前,因此这两类显花植物的基因网络系统还是有明显的差别的。
2 而建立一个单子叶的基因网络系统需要对生物途径有一个非常完整的特征性了解。像水稻在这个方面还有具有优势的。
3 要形成这样一个完整特征性的了解,离不开大量的基因组学以及蛋白质组学的数据及其相互的整合。

注解
当然,利用水稻去建立单子叶植物的基因网络平台,也是具有挑战性的。
1 拟南芥大约有2.7万个基因,而水稻有4.1万个基因(除转座元件)
2 与拟南芥相比,目前的参考知识以及可用的原始基因组信息比较稀疏
3 水稻的生长周期较长、植株较大、基因敲除株系较之不易获得、转化效率较低,这些为后续的实验验证带来困难。

[ Last edited by wanhscn on 2012-1-2 at 20:32 ]
真相是最大的奢侈品
2楼2012-01-02 20:31:52
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

wanhscn

木虫 (职业作家)

哲学@草根

材料与方法

注解
1 收集同一个生物过程的多样的功能基因组、蛋白质组和比较基因组学数据库。
2 利用 rice Gene Ontology Biological Processes 作为参考给上面收集的数据库在重建基因在功能上联系的贡献进行贝叶斯似然对数的方法打分。
3 利用这个打分系统,我们对两个基因存在于一个生物过程在每个数据库中的可能性进行估计其似然对数值,最后将这些值进行合并,从而形成一个整合的基因网络系统。

注解
1 公式1 似然对数计算方法如下:P(L|E) 和 P(¬L|E) 分别代表在同一生物过程中实际观察到得两个注解基因之间存在联系的频率和不同生物过程中。P(L) 和 P(¬L) 分别代表先验期望概率。
2 对于这个LLS值来说,高的分值表明对两个基因参与同一生物过程这一估计具有很大的支持,同时利用0.632的bootstrapping对所有估计的LLS值进行排列置换测试,对这个模型进行过度训练。
3 在得到这些最初的LLS值后,于是将对于同一基因对在不同数据库中得到的LLS值进行整合到一个基因网络系统中去,即将这些证据进行整合得到最后的结论。
4 但是由于不同数据库的贡献不同,所以在整合这个LLS值的时候,作者利用了一个权重加和得方法,见公式2:L0 代表对给定的一对基因来说,它得到的最大LSS值,D值为一个自由参数决定第二证据权重的衰减率;i 表示LLS值由大到小排列后的加和系数,这个系数从第二大的LLS计算开始。

注解
下面是在基因网络系统中每个数据库的设置以及分析方面的细节,宝库以下几个方面
1 基因网络系统建立估计的参考以及基准数据库的设置
2 从mRNA表达数据库中来推测两个基因间的功能上的联系
3 利用同源蛋白在基因组背景下的功能注解来推测两个基因在功能上的联系
4 通过其他的可用的参考联系来分析两个基因在功能上的联系
5 利用拟南芥基因网络和水稻基因网络系统来建立玉米基因网络系统。
真相是最大的奢侈品
3楼2012-01-02 20:35:55
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

wanhscn

木虫 (职业作家)

哲学@草根


注解:
参考以及基准的设置
1 TIGR水稻基因组注解版本5上的 Gene Ontology 生物过程注解作为主要参考依据以及基准来训练和规范该基因网络系统
2 在进行训练该基因网络系统时,为了最小化在训练模型上产生的功能偏差,去除了一些生物过程:防卫反应、蛋白质的磷酸化等等
3 这样的话就产生8716个基因662936个基因对的参考注解数据库对模型进行建立训练
4 为了避免参考数据库的单一化,还用了KEGG途径手工数据库,至少有2%与上面用的参考数据库重合。

注解:
1 水稻基因的DNA microarray数据库下载后,先抛去无用的信息,主要是通过基因在同一生物过程中与一对基因的表达情况之间是否存在显著的相关性(用的是皮尔森相关性系数)
2具体如下:确立两个基因之间的共表达的关系是以99%的置信区间进行t检验,在得到的这些显著的共表达基因对后,我们去除了比对区域同源性达70%的cDNA基因对以减少DNA microarray数据库中的交叉杂交产生的假阳性。
3 这样的话,就筛选得到11个数据包括274次实验,这些实验中一对基因属于同一个生物过程是和其共表达是显著相关的。
4 从这11个芯片数据库中得到的基因之间的联系仍然是通过上面加权的方法进行整合

注解:
1 作者还通过比较基因组学的分析来推测基因直接功能上的联系,之前在Nat Biotech 2010上的拟南芥基因网络已证明并用上,拟南芥同源基因处于同一系统发育树支点上以及同源基因位于原核生物基因组邻近的位置上(操纵子)时,能够反应这两个基因处于同一生物过程中。
2 用了184个细菌等原核生物,这些细菌的在水稻蛋白质组中BLASTP得到最大数目的同源蛋白
3 一对基因在系统发育模式上的位置以及是否在原核基因组上处于相连位置之间的交互信息后再根据回归模型得到LSS值。
真相是最大的奢侈品
4楼2012-01-02 20:40:07
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
普通表情 高级回复(可上传附件)
信息提示
请填处理意见