基于计算机的启动子识别技术

基于计算机的启动子识别技术

一、基于计算机的启动子识别技术(论文文献综述)

苏畅[1](2021)在《功能角蛋白制备用酶在Bacillus subtilis中的高效表达与改造》文中研究表明角蛋白(Keratin)作为一种天然生物材料,具有良好的生物相容性与生物可降解性,在组织工程材料领域表现出广阔的应用前景。角蛋白酶(Keratinase)因具备独特的高效降解角蛋白纤维的特性,可有效提取毛发中的可溶性功能角蛋白,在角蛋白质资源的生物降解与角蛋白生物材料制备方面具有重要的研究价值与应用潜力。鉴于角蛋白酶的产量低和稳定性差是限制其工业化应用的主要原因,本研究以高效生产角蛋白酶及改善其热稳定性为目标,首先通过前导肽工程和启动子工程改造策略实现角蛋白酶的高效表达,进而应用计算机辅助设计与分子进化相结合的方法提高角蛋白酶的热稳定性;并以该角蛋白酶为催化剂,探索羊毛角蛋白的生物制备工艺,主要研究结果如下:(1)利用前导肽工程改造提高角蛋白酶的活性前导肽作为分子内伴侣,能够有效指导成熟酶的正确折叠以及活性构象的形成。本研究通过对重组Bacillus subtilis角蛋白酶Ker Bp的前导肽区域进行逐段截短,证明前导肽全长对成熟酶的表达具有至关重要的作用。通过对前导肽切割位点(P1)的氨基酸进行替换,发现芳香族疏水氨基酸苯丙氨酸有利于前导肽的切割,突变体Y(P1)F使角蛋白酶活性提升了1.7倍。另外,基于同源序列比对,对前导肽序列中非保守位点进行定点突变,获得6个酶活性显着提升的突变体,其中I(62)K突变体使角蛋白酶活性提高约2.2倍。进一步对上述6个位点构建饱和突变体文库,经过3轮有效筛选获得15个活性超过800 U·m L-1的突变体,其中突变体M7的酶活可达到1114 U·m L-1,较野生型提高6倍。(2)通过启动子元件改造调控宿主细胞生长与产酶过程研究发现随着活性和产量的提升,角蛋白酶对菌体内源性蛋白表现出降解能力,影响了B.subtilis宿主细胞正常的生长过程,导致菌体及产酶量的减少。本研究采用启动子元件改造调控宿主细胞生长与产酶过程,发现通过菌体密度依赖型启动子Papr E代替组成型启动子PHpa II,使产酶生物量获得提升,最高菌浓(OD600 nm)从8提高到10;酶活最高可达到2300 U·m L-1,是使用组成型启动子的2倍。通过对启动子的拷贝数进行优化,获得了重组菌角蛋白酶活性最高的二串联体启动子Papr E-Papr E,酶活可达3080U·m L-1。将启动子的-10区和-35区序列突变为σ因子识别的保守序列,进一步使酶活提高到3500 U·m L-1。另外,对培养基的碳源进行优化,促进了菌体的生长与积累,结果表明添加2%的葡萄糖能够延长菌体的生长时间,最大菌浓可达到15.6。同时产酶量也随着菌体生长时间的延长而增加,培养84 h后达到峰值4200 U·m L-1。(3)借助计算机辅助策略改造关键Loop区域提高角蛋白酶热稳定性角蛋白酶的热稳定性是其在高温下高效降解羊毛纤维等角蛋白质资源的先决条件,本研究基于计算机辅助设计与蛋白质工程改造相结合,提升角蛋白酶Ker Bp的热稳定性。通过计算机辅助计算与分析,预测了角蛋白酶Ker Bp的3段高柔性Loop以及一个与钙离子结合相关的Loop,并定位了其中对稳定性贡献较小的氨基酸残基。另外,基于同源序列比对分析,将Ker Bp序列中出现的“低频氨基酸”残基替换为同源序列中该位点的“高频氨基酸”。共构建了65个单点突变体,采取虚实结合的筛选策略,在保持酶活的基础上,获得了6个热稳定性提升的突变体,进一步通过组合突变构建获得6个位点的协同改造突变体,使角蛋白酶在60℃下的失活半衰期从17.3 min提高至66.1 min,并且最适反应温度从40℃提高至60℃。(4)利用角蛋白酶对羊毛纤维的可控降解制备大分子功能角蛋白角蛋白是性能卓越、极具应用潜力的生物材料,但由于天然的角蛋白结构紧密、可溶性差,难以直接作为生物材料进行应用。而采用化学法制备角蛋白通常会破坏分子上的活性基团,因此探索大分子、可溶性角蛋白的酶法制备具有重要意义。本研究利用自主开发的角蛋白酶水解废弃羊毛,制备出主要分子量约为45 k Da和28 k Da的可溶性角蛋白,其羊毛溶解率达68.1%,角蛋白提取率为33.7%。详细考察了羊毛的酶解过程,发现角蛋白酶能够从羊毛纤维的鳞片层进行逐层水解,最终实现羊毛复杂结构的破坏及溶解,通过对过程条件的控制,能够提取获得大片段可溶性羊毛角蛋白。体外评价结果显示,该角蛋白提取物具有良好的生物相容性,表现出明显的促细胞增殖和迁移的作用,并且具有较强的抗氧化性。为探索角蛋白提取物在生物组织材料领域的应用,研究利用角蛋白自组装特性制备获得水凝胶;小鼠成纤维细胞的体外培养实验结果表明该角蛋白凝胶具有良好的生物相容性,可作为细胞生长的支架材料。小鼠体内伤口促愈实验探究表明其能够通过促进成纤维细胞的增长和迁移以及加速形成新生血管和胶原沉积达到促进伤口修复的效果,证明该角蛋白水凝胶是一种优良的伤口敷料。

郭东华[2](2020)在《基于序列和结构信息识别大肠杆菌与人类启动子》文中指出启动子是能够与RNA聚合酶(RNA polymerase)结合并起始基因转录的一段DNA序列,通过与转录因子(transcription factor,TF)结合从而调控基因的表达。因此,识别和分析启动子有助于表观遗传研究、通路分析以及基因组的功能注释等。大肠杆菌(E.coli)是人类基因组计划中的模式生物之一,这种模式生物的基因结构与人类基因组相比较为简单,在认识基因功能等方面能够为人类基因组的研究提供帮助,进一步推动人类基因组计划的发展。因此研究人员通过实验方法和生物信息学方法来识别大肠杆菌和人类启动子,然而实验的方法需要耗费大量的时间和财力,因此,更多的研究是通过生物信息学方法来预测启动子。这些预测方法中,较多的是对于大肠杆菌σ54及σ70启动子的预测,预测σ38启动子的工作较少。由于σ38因子参与细菌的一般应激反应,对细胞所处的环境变化极为敏感,所以识别大肠杆菌σ38启动子有助于了解细胞为了克服环境变化而做出的响应。因此,本文提出预测模式生物大肠杆菌σ38启动子的方法,同时将该方法应用到预测人类基因启动子的数据集中,均取得较好的预测效果。本文中,我们构建了大肠杆菌σ38启动子的数据集,并下载了人类启动子数据集。由于DNA的结构性质在基因发挥功能时起着至关重要的作用,选择合适的结构特征对启动子的识别也有很大的帮助。因此,本文首先基于位置关联概率矩阵与DNA六种结构参数相结合构造位置关联打分函数(PCSF),通过分数差值来识别启动子序列,取得了较好的预测效果。进一步将分数差值作为特征参数输入到支持向量机(SVM)中实现了算法融合,使预测效果有明显提升。文中还提取了启动子的k-mer组分信息、GC含量信息、CG+GC二联体信息、碱基距离信息等序列特征,基于SVM算法,采用5倍交叉检验对启动子进行了预测。最后详细分析了各种特征参数融合后对启动子预测效果的影响,计算结果发现,对大肠杆菌σ38启动子序列,采用Rise(上升)结构信息与GC含量信息的融合,基于jackknife检验,预测成功率达到96.07%;对于人类启动子序列,采用Slide(滑动)结构信息与4-mer组分信息及CG+GC二联体信息的融合,基于Jackknife检验,预测成功率为94.56%。分析结果表明,DNA六种结构参数所体现的碱基二联体之间相互作用能量能够较好的识别大肠杆菌σ38启动子和人类启动子。

章天骄[3](2019)在《基于高通量数据的增强子及其作用位点预测方法》文中研究表明对于多细胞真核生物来说,细胞的特异性功能是十分重要的。这就要求在相同遗传物质的基础上,细胞能够通过不同的基因表达模式来适应环境的变化。基因表达调控的因素有很多,近年来随着对基因组非编码区的研究,发现了一些非编码的DNA序列对于基因表达调控具有重要意义。增强子是对基因表达调控具有重要作用的非编码序列元件之一。一些增强子能够通过转录产生具有调控功能的RNA,也被称为增强子RNA(enhancerRNA,简称eRNA)。因此对于增强子的序列特征、作用位点以及在特定时间和特定组织中表达模式的研究成为了基因表达调控领域的一个重要问题。然而由于增强子的调控模式会受到时空特异性等因素的影响,因此对于组织特异性增强子的研究,尤其是与疾病相关的研究一直是近年来增强子相关研究的重点问题。随着高通量测序技术的发展,生物学数据实现了爆发式的增长,同时也使得通过计算学方法应用这些数据大规模分析增强子的功能成为可能。而已有的生物信息学研究对于现有的数据利用不足或者无法满足预测精度的需求。针对现有的增强子预测及分析方法中存在的问题,本文首先对增强子进行了生物特征分析,在此基础上提出了增强子的预测方法。进一步地,通过对全基因组SNPs数据进行分析,提出了基于SNPs数据的肝癌相关增强子的预测方法。最后,提出了基于随机森林的增强子作用位点预测方法。本文的主要内容包括以下四个部分:(1)使用生物特征来预测增强子一直是一个热点问题,已有的生物信息学方法只应用了一种或几种特征来预测增强子,忽视了其它特征对于表征增强子的作用。本文则充分考虑与增强子相关的多种生物特征,包括:序列特征,转录特征和表观遗传特征。通过对每种特征进行量化处理来分析不同特征在增强子预测中的重要程度。最后说明了分析结果的合理性。(2)已有的研究对于预测增强子的方法主要集中在实验手段和分析表达量差异的方式,这种方法难以实现高通量的预测或者预测精度较低。本文从与增强子相关的生物特征出发,基于后验概率贝叶斯分类模型对增强子进行预测。通过人类肝癌和正常组织中的表达数据,本文预测了人类基因组上与肝癌相关的增强子lncRNA。与其它预测增强子的方法相比,该模型具有更高的预测准确度。(3)与增强子相关的单核苷酸多态性(Single Nucleotide Polymorphism,简称SNP)等遗传突变在疾病的产生和发展过程中起了重要作用。这些遗传突变通过影响转录因子与增强子的结合程度对增强子的功能进行调控。因此可以应用SNPs数据对疾病相关的增强子进行预测。本文通过量化不同SNPs与增强子内部转录因子结合位点序列的结合程度,转化为SNPs对于增强子转录调控功能强弱的度量,构建与疾病相关增强子的预测模型。通过人类肝癌组织数据,本文对该模型进行了测试,验证了结果的合理性。(4)增强子对基因表达起调控作用主要体现在其与基因启动子区的相互作用上,因此有效的预测增强子与启动子的关联关系对于分析增强子的功能是十分重要的。目前应用计算学方法对增强子调控位点的预测正确率有限。因此,本文提出基于随机森林方法综合使用增强子区、启动子区和增强子与启动子间基因组区域的多种生物特征来预测增强子与启动子的关联关系。通过与其他预测方法相比,该模型具有更高的预测精度。

吕成伟[4](2019)在《基于集成学习的σ54启动子及RNA修饰位点的预测》文中指出机器学习在生物信息学中的应用越来越广泛,它对我们探索生命起源、生物进化以及细胞病变起到了巨大的推进作用。相比较传统的生物化学实验方法,机器学习的方法成本低,耗时短,在启动子的预测以及RNA修饰位点的预测等方面都取得了重大突破。近年来,集成学习受到越来越多的人的关注,它是通过一定的规则将多个学习器组合起来获得更好的学习效果的一种机器学习方法。本文针对集成学习在生物信息学中的应用进行了深入的研究,主要研究内容如下:(1)在原核生物的转录中,σ54启动子发挥着重要的作用。为了快速、准确地预测出原核生物中的σ54启动子,本文以集成学习思想为核心,采用支持向量机(support vector machine,SVM)作为基学习器,自主设计了SVM-AdaBoost算法,并在此方法的基础上构建了SVM-AdaBoost预测模型:http://112.74.38.96:8080/SVMAdaboost,在严格交叉验证下其准确率达到了96.06%,明显比现有的预测模型iPro54-PseKNC的准确率要高。(2)RNA修饰在生命体中普遍存在并且发挥着重要的作用,准确识别并预测出这些RNA修饰的发生位点对于人类探究其生物学功能和机制有着极其重要的意义。为了应对能够实现用一种方法更准确地识别几种不同类型的RNA修饰位点这一挑战,本文提出了一种融合位置特异性单核苷酸及双核苷酸偏好特征的k-元组核苷酸组成(pseudo k-tuple nucleotide composition,PseKNC)编码方式,构建了一个基于XGBoost(eXtreme gradient boosting,XGBoost)集成算法的RNA修饰位点的预测模型。我们采用了交叉验证的方法对最终的预测模型进行了测试,测试结果表明其预测准确率比现有的预测模型要高。这些研究成果对于探索人类基因奥秘、疾病的发生和治疗具有重要的意义。

李凯[5](2018)在《基于序列信息的增强子和启动子类型识别研究》文中进行了进一步梳理如今越来越多的行业进入数据驱动的时代,生物学同样如此。在过去的十几年间,生物序列数据实现了巨幅的增长,进而促进了生物学中多个领域的蓬勃发展。在这些领域的发展中,许多生物学问题如增强子识别,蛋白质远同源性检测,启动子识别等有待研究者们深入地进行探索研究。因此,通过从海量的生物序列中挖掘生物基因的隐含特征,进而研究生物基因的结构以及功能,是一个绝佳的探索途径。传统对增强子和启动子的识别使用的是生物实验等方法,这些方法耗时耗力,在庞大的生物序列条件下,无法满足研究的需要。因此,本文通过研究增强子和启动子的序列信息,使用特征向量提取方法挖掘序列信息,并结合机器学习算法构建模型进行研究分析。本文主要内容包括:本文基于序列信息以及集成学习策略提出了识别增强子及其强度的方法iEnhancer-EL。其中通过使用不同的特征提取方法提取特征向量,然后通过支持向量机算法构建模型。之后对模型进行聚类,并从中选择关键模型,最后使用线性加权集成的方法进行集成操作构建集成模型。得到最终模型之后,通过使用多项测量指标,对比该方法和其他方法之间的性能,方法iEnhancer-EL对增强子及其类型的识别性能优于目前最优预测方法。本文提出了基于平滑策略的启动子及其类型识别方法iPromoter-Kmer和iPromoter-PseKNC。这两种方法利用了基准数据集中的序列之间保守性值的差异性,将DNA序列划分为几个子序列,然后分别在每个子序列上提取特征向量并线性合并。其中使用了两种特征提取方法,Kmer方法和伪k元核苷酸组成方法。通过调整每一个特征提取方法的超参数,得到不同的特征向量,然后结合支持向量机算法构建模型,最终选择出预测性能最优的模型。这两种方法的预测性能均优于现有预测方法。对于启动子及其类型的识别,本文进一步提出基于集成学习的启动子及其类型识别方法iPromoter-2L2.0。本方法在基于平滑策略划分得到的子序列上,使用滑动窗口进一步挖掘序列的局部信息,然后使用Kmer方法和伪k元核苷酸组成方法结合支持向量机构建多个模型。然后使用改进的度量规则将模型聚类,最后选择关键模型用于集成学习。iPromoter-2L2.0方法对于启动子及其类型的识别,实现了比iPromoter-Kmer和iPromoter-PseKNC更好的预测性能。

王鹏[6](2018)在《深度学习框架下DNA位点的预测研究》文中认为随着高通量检测技术的涌现,分子生物数据库几乎以几何倍数进行扩容,这促使了生物学家使用机器学习方法去解决分子生物信息学领域的一系列研究问题。本文主要基于深度稀疏自动编码算法研究剪切位点与启动子及其强弱类型的识别问题,工作包括以下几个方面:1)介绍了几种常用的特征提取方法,概述了近年来机器学习方法在DNA位点预测的研究进展,归纳了几种常用的传统机器学习方法,如支持向量机、随机森林、libD3C及现今比较流行的深度稀疏自编码器,并对分类算法的评价指标进行了系统分析。2)DNA剪切位点的分析和预测。基因剪切是真核生物基因表达中最重要的生物学过程之一。因此,DNA/RNA序列剪切位点的识别对于生物医学研究和新型药物发现具有重要意义。为了快速而准确识别剪切供体与受体位点,本文结合十二种DNA的二联核苷酸的物理化学属性通过一系列的自协方差与互协方差转换去表示给定的序列样本,基于最小化误差法构建了一个具有两个隐含层的深度稀疏自动编码模型,称之为iSS-PC。本研究中,基于同一基准数据集上的五折交叉验证结果显示新的预测器明显优于现有预测方法。为使广大生物学者研究方便,本文建立了一个易操作的网络预测器去识别剪切供体与受体位点,可通过网址http://www.jci-bioinfo.cn/iSS-PC免费访问。3)启动子及其强弱类型的预测研究。根据转录激活和表达水平,启动子可划分成两类:强启动子和弱启动子。通常,强启动子控制转录调节或蛋白代谢的相关功能,进而能增加转录频率和增强外源基因的表达水平。因此,预测已识别的启动子属于其强度类型的哪一种是非常有必要的。本文首先利用三联核苷酸的7种物理化学属性,采用混合特征(移动平均法、伪三联核苷酸成分法及核苷酸密度)对序列进行特征提取,然后,基于不同的分类算法如支持向量机、随机森林和深度稀疏自动编码器构建了几个预测模型。其次,利用核苷酸的理化性质和密度分布提取特征,采用支持向量机构建预测模型。通过将两种方案所得的5折交叉验证结果进行比较,发现第二种方案的结果明显优于第一种方案的所有结果。4)对本文的研究工作进行总结,并对今后的研究工作进行了展望,包括其他深度学习模型的使用、DNA其他修饰位点的进一步分析与探讨、DNA的结构信息的提取、本文研究方法在RNA位点预测研究领域的推广应用等。

徐文轩,张莉[7](2015)在《基于单核苷酸统计和支持向量机集成的人类基因启动子识别》文中进行了进一步梳理为高效地判别人类基因启动子,提出了一种基于单核苷酸统计和支持向量机集成的人类基因启动子识别算法。首先通过基因单核苷酸统计,从而将一个基因数据集分为C偏好和G偏好两个子集;然后分别对这两个子集提取DNA刚性特征、词频统计特征和Cp G岛特征;最后采用多个支持向量机(SVM)集成的方式来学习这三种特征,并讨论了三种集成方式,包括单层SVM集成、双层SVM集成和级联SVM集成。实验结果表明所提算法能够提高人类基因启动子识别的敏感性和特异性,其中双层SVM集成的敏感性达到79.51%,且级联SVM集成的特异性高达84.58%。

寇秋波[8](2012)在《植物启动子识别算法研究》文中指出随着人类基因草图的绘制完成,基因组学研究已进入了“功能基因组学"时代,如何在海量的序列数据中确定基因及它们的调控网络已经成为目前最具挑战性的任务。启动子作为控制基因转录起始和转录频率的重要元件,在基因表达调控机制中具有非常重要的作用。启动子识别是确定基因的关键问题之一。由于真核启动子与人类及人类的生产生活密切相关,真核启动子识别已成为一个热点研究领域。在真核启动子识别技术中,哺乳动物(人类和小鼠)启动子识别取得了许多重要成果,而对于真核启动子中的另一个重要分类——植物启动子识别的研究还处于起步阶段,关于植物启动子识别方法的研究论文较少,其中缺乏实验证实的启动子数据是制约其快速发展的原因之一。近年来随着植物数据库的完善,植物启动子识别逐渐成为生物信息学的一个研究热点,其中,特异性较低是有待解决的难题之一。在阅读了大量国内外文献的基础上,对植物启动子识别算法进行了深入分析与研究,并针对现有植物启动子识别算法中假阳性高的问题,提出了两种新的植物启动子识别算法。提出了基于GC偏好和支持向量机(SVM)的植物启动子识别算法。其特点是充分利用了植物启动子的GC偏好特性和SVM分类器的优秀分类性能。该算法首先通过对GC含量的分析将DNA序列分类为GC偏好序列和非GC偏好序列,然后进行结构特征和信号特征的提取,最后通过SVM分类器进行植物启动子识别。SVM分类器由四个SVM子分类器组成,每个子分类器专门针对启动子和四种非启动子中的一类进行区分。四个子分类器分别是启动子——3’UTR子分类器,启动子—5’UTR子分类器,启动子—Intergenic子分类器和启动子—CDS子分类器,综合四个子分类器的结果来识别植物启动子序列。提出了基于GC偏好和DNA双链特征的植物启动子识别算法。该算法的系统结构与第一个算法基本相同,其特点在于,将GC偏好特征和DNA双链特征相结合,提取的特征更具有分辩力。实验结果表明,所提出的两种植物启动子识别算法是有效的,具有较高的特异性。

徐友强,马翠卿,陶飞,许平[9](2010)在《细菌启动子识别及应用研究进展》文中研究表明细菌启动子是细菌中基因表达的必需调控元件,决定了细菌基因表达的强度和时机。通过启动子的插入或缺失,可以改变细菌基因的表达,实现对菌体生长发育以及代谢调控的研究。启动子也是构建各种表达系统、实现异源基因表达的基础。启动子的识别和应用研究,对于实现异源基因的可控表达、有效获得目的产物、促进生物催化和代谢工程研究具有重要的意义。以下对细菌启动子进行了简单的介绍,总结了细菌启动子的识别方法,并对细菌启动子的研究进展和具体应用进行了概述。

梅丽[10](2010)在《人类启动子识别算法研究》文中认为人类基因草图完成后,确定基因和它们的调控网络成为一个具有挑战性的任务。启动子是基因表达调控的重要元件,在基因识别中具有关键作用。人类启动子识别技术已成为目前的热点研究领域,具有十分重要的理论意义与应用价值。在阅读大量文献的基础上,本文对人类启动子识别技术进行了研究,提出了两种新的人类启动子识别算法。提出了基于KL散度和BP神经网络的人类启动子识别算法。该算法首先应用KL散度提取分辨力最强的六联体,将其出现频率作为组成成分特征;然后提取CpG岛特征,并将其与组成成分特征相结合作为区分启动子和非启动子区域的特征向量;最后应用BP神经网络技术设计启动子分类器。该分类器由启动子-外显子分类器,启动子-内含子分类器和启动子-3’-UTR分类器组成,每个分类器都是一个BP神经网络,综合三个分类器的结果来识别启动子序列。提出了基于两级SVM分类器的人类启动子识别算法。该算法应用支持向量机技术设计一个两级SVM分类器。第一级SVM分类器根据CpG岛特征对DNA序列进行分类,判别为非启动子的序列则送入第二级SVM分类器作进一步识别。第二级SVM分类器由三个SVM子分类器组成,即启动子-外显子SVM子分类器,启动子-内含子SVM子分类器和启动子-3’-UTR SVM子分类器,各子分类器根据组成成分特征识别启动子,通过三个子分类器的结果来综合预测启动子序列。最后将两级SVM分类器识别出的所有启动子序列作为最终的实验结果。实验结果表明,本文提出的上述算法是有效的,具有较高的敏感性和特异性。

二、基于计算机的启动子识别技术(论文开题报告)

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

三、基于计算机的启动子识别技术(论文提纲范文)

(1)功能角蛋白制备用酶在Bacillus subtilis中的高效表达与改造(论文提纲范文)

摘要
Abstract
第一章 绪论
    1.1 角蛋白概述
        1.1.1 角蛋白的结构
        1.1.2 角蛋白的性质
        1.1.3 角蛋白的应用
        1.1.4 角蛋白的提取
    1.2 角蛋白酶概述
        1.2.1 角蛋白酶的来源和理化性质
        1.2.2 角蛋白酶的降解机制和水解特异性
    1.3 角蛋白酶的应用
        1.3.1 角蛋白的生物降解
        1.3.2 化妆品和药品
        1.3.3 其他应用
    1.4 角蛋白酶的克隆表达
        1.4.1 角蛋白酶序列
        1.4.2 异源表达体系
    1.5 角蛋白酶的分子改造
        1.5.1 角蛋白酶结构
        1.5.2 分子改造策略
    1.6 立项依据和研究意义
    1.7 主要研究内容
第二章 前导肽改造提升角蛋白酶活性
    2.1 前言
    2.2 材料与方法
        2.2.1 基因、菌株和质粒
        2.2.2 主要试剂和仪器
        2.2.3 培养基和培养条件
        2.2.4 引物
        2.2.5 角蛋白酶活性的测定
        2.2.6 同源模型的构建
        2.2.7 前导肽工程改造
    2.3 结果与讨论
        2.3.1 截短突变验证前导肽的功能
        2.3.2 前导肽切割位点氨基酸替换对角蛋白酶表达的影响
        2.3.3 前导肽区域定点突变
        2.3.4 多位点组合饱和突变
    2.4 本章小结
第三章 启动子元件改造调控宿主细胞生长与产酶
    3.1 前言
    3.2 材料与方法
        3.2.1 菌株和质粒
        3.2.2 主要试剂和仪器
        3.2.3 培养基和培养条件
        3.2.4 引物
        3.2.5 角蛋白酶对菌体生长的影响探究
        3.2.6 启动子工程改造策略与方法
        3.2.7 角蛋白酶活性的测定
        3.2.8 碳源补充优化
    3.3 结果与讨论
        3.3.1 角蛋白酶的表达对宿主细胞生长的影响
        3.3.2 菌体密度依赖型启动子替换组成型启动子
        3.3.3 利用串联apr E启动子提高角蛋白酶产量
        3.3.4 启动子核心区域序列优化提高启动子活性
        3.3.5 补充碳源提高菌体前期积累
    3.4 本章小结
第四章 基于Loop结构的设计与改造提升角蛋白酶热稳定性
    4.1 前言
    4.2 材料与方法
        4.2.1 菌株和质粒
        4.2.2 主要试剂和仪器
        4.2.3 培养基和培养条件
        4.2.4 引物
        4.2.5 不稳定Loop区域的预测与分析
        4.2.6 突变位点的选择与分析
        4.2.7 钙离子结合位点的预测与分析
        4.2.8 序列趋同性突变位点及突变类型的确定
        4.2.9 突变体重组质粒构建及转化
        4.2.10 角蛋白酶活性测定
        4.2.11 突变体筛选及热稳定性评价
    4.3 结果与讨论
        4.3.1 基于计算机辅助分析的不稳定Loop区域预测
        4.3.2 基于B-Factor与 RMSF的突变位点选择
        4.3.3 基于ΔΔG的突变氨基酸选择
        4.3.4 突变体重组菌的活性测定与筛选
        4.3.5 钙离子结合相关Loop改造策略的热稳定性提升
        4.3.6 基于序列一致性突变策略的热稳定性提升
        4.3.7 优势位点的组合突变
    4.4 本章小结
第五章 角蛋白酶对羊毛的可控降解及功能角蛋白的表征与应用
    5.1 前言
    5.2 材料与方法
        5.2.1 样品
        5.2.2 主要试剂和仪器
        5.2.3 可溶性角蛋白的酶法制备
        5.2.4 可溶性角蛋白生物相容性评价
        5.2.5 角蛋白自组装凝胶的制备
        5.2.6 角蛋白凝胶用于细胞的体外培养
        5.2.7 角蛋白凝胶促创伤愈合的小鼠体内评价
    5.3 结果与讨论
        5.3.1 角蛋白酶提取羊毛角蛋白
        5.3.2 可溶性羊毛角蛋白提取物的结构表征
        5.3.3 .可溶性羊毛角蛋白提取物的性能表征
        5.3.4 角蛋白自组装凝胶的制备
        5.3.5 角蛋白凝胶冻干海绵用于细胞体外培养
        5.3.6 角蛋白凝胶促进小鼠创伤愈合
    5.4 本章小结
主要结论与展望
    主要结论
    展望
论文主要创新点
致谢
参考文献
附录:作者在攻读博士学位期间发表的论文

(2)基于序列和结构信息识别大肠杆菌与人类启动子(论文提纲范文)

摘要
ABSTRACT
第一章 绪论
    1.1 研究背景与意义
    1.2 启动子预测的研究现状
    1.3 论文结构及内容
第二章 特征提取与分类预测算法
    2.1 引言
    2.2 特征参数的提取
        2.2.1 k-mer组分信息
        2.2.2 GC含量与CG+GC二联体
        2.2.3 碱基距离
        2.2.4 DNA六种结构信息
    2.3 分类算法
        2.3.1 位置关联打分函数
        2.3.2 支持向量机
    2.4 检验方法
    2.5 评价指标
    2.6 小结
第三章 启动子预测结果的分析与讨论
    3.1 引言
    3.2 数据库的构建
        3.2.1 大肠杆菌σ~(38)启动子与非启动子数据集
        3.2.2 人类启动子与非启动子数据集
    3.3 特征参数对大肠杆菌σ~(38)启动子预测结果的分析
        3.3.1 位置关联打分函数对大肠杆菌σ~(38)启动子预测结果的影响
        3.3.2 位置关联打分函数与SVM算法融合对大肠杆菌σ~(38)启动子预测结果的影响
        3.3.3 k-mer组分信息对大肠杆菌σ~(38)启动子预测结果的影响
        3.3.4 GC含量及CG+GC二联体对大肠杆菌σ~(38)启动子预测结果的影响
        3.3.5 碱基距离对大肠杆菌σ~(38)启动子预测结果的影响
    3.4 特征参数对人类启动子预测结果的分析
        3.4.1 位置关联打分函数对人类启动子预测结果的影响
        3.4.2 位置关联打分函数与SVM算法融合对人类启动子预测结果的影响
        3.4.3 k-mer组分信息对人类启动子预测结果的影响
        3.4.4 GC含量及CG+GC二联体对人类启动子预测结果的影响
        3.4.5 碱基距离对人类启动子预测结果的影响
    3.5 结果讨论
        3.5.1 位置关联打分函数预测大肠杆菌σ~(38)和人类启动子结果的分析
        3.5.2 最优特征融合预测大肠杆菌σ~(38)和人类启动子结果的分析
        3.5.3 与他人结果的比较
    3.6 小结
第四章 总结与展望
    4.1 工作总结
    4.2 工作展望
参考文献
致谢
作者攻读硕士学位期间发表和完成的论文目录

(3)基于高通量数据的增强子及其作用位点预测方法(论文提纲范文)

摘要
ABSTRACT
第1章 绪论
    1.1 课题研究的背景及意义
        1.1.1 研究背景
        1.1.2 研究的目的与意义
    1.2 生物学相关背景知识
        1.2.1 基因的转录调控
        1.2.2 增强子
        1.2.3 单核苷酸多态性
        1.2.4 高通量生物数据
    1.3 研究现状
        1.3.1 增强子预测的研究现状
        1.3.2 增强子作用位点预测的研究现状
    1.4 存在的主要问题
    1.5 本文的主要内容
第2章 增强子生物特征分析方法
    2.1 引言
    2.2 增强子生物特征分析方法设计
        2.2.1 增强子的生物特征分析
        2.2.2 增强子生物特征量化方法
        2.2.3 增强子生物特征显着性判别方法
        2.2.4 增强子生物特征重要性评估
    2.3 增强子生物特征分析实验结果与验证
        2.3.1 增强子相关生物特征数据来源及预处理
        2.3.2 基于信息增益的方法对特征进行重要性评估结果
        2.3.3 基于单一特征预测准确度对特征进行重要性评估结果
        2.3.4 增强子生物特征重要性评估实验结果合理性分析
    2.4 本章小结
第3章 基于生物特征的增强子预测方法
    3.1 引言
    3.2 基于生物特征增强子预测的模型设计
        3.2.1 增强子相关生物特征集合的选取
        3.2.2 增强子RNA在正常和肝癌组织中的表达数据整理
        3.2.3 后验概率贝叶斯分类模型设计
        3.2.4 在人类基因组上预测肝癌相关增强子的位置
    3.3 基于生物特征增强子预测的结果与验证
        3.3.1 增强子相关生物特征数据来源及数据参考集的构建
        3.3.2 后验概率贝叶斯分类模型的预测性能及评价
        3.3.3 人类基因组上肝癌相关增强子的预测结果及评价
    3.4 本章小结
第4章 基于SNPs数据的肝癌相关增强子预测方法
    4.1 引言
    4.2 基于SNPs数据的肝癌相关增强子预测模型设计
        4.2.1 肝癌相关SNPs集合的构建
        4.2.2 基于PWM的SNPs调控增强子转录模型设计
        4.2.3 肝癌相关致病风险增强子的预测
    4.3 基于SNPs数据的肝癌相关增强子预测结果与验证
        4.3.1 增强子、转录因子和与肝癌相关SNPs的数据来源及预处理
        4.3.2 肝癌相关增强子预测结果及评价
    4.4 本章小结
第5章 基于随机森林的增强子作用位点预测方法
    5.1 引言
    5.2 基于随机森林的增强子作用位点预测模型设计
        5.2.1 增强子-启动子关联关系数据集的构建
        5.2.2 与增强子-启动子关联关系相关的生物特征分析
        5.2.3 基于随机森林的增强子-启动子关联关系预测模型设计
    5.3 基于随机森林的增强子作用位点预测结果与验证
        5.3.1 与增强子作用位点预测相关的数据来源及基本分析
        5.3.2 基于信息增益的方法对特征进行重要性评估结果
        5.3.3 增强子-启动子关联关系预测结果及评价
        5.3.4 肝癌数据集上预测增强子调控的基因
    5.4 本章小结
结论
参考文献
攻读博士学位期间发表的论文及其它成果
致谢
个人简历

(4)基于集成学习的σ54启动子及RNA修饰位点的预测(论文提纲范文)

摘要
Abstract
第一章 绪论
    §1.1 研究背景及意义
    §1.2 国内外研究现状
        §1.2.1 σ~(54)启动子预测的研究现状
        §1.2.2 RNA修饰位点识别的研究现状
        §1.2.3 集成学习的研究现状
    §1.3 本文的研究内容
    §1.4 本文的组织结构
第二章 相关技术知识概述
    §2.1 集成学习概述
        §2.1.1 Boosting
        §2.1.2 Bagging与随机森林
        §2.1.3 结合策略
    §2.2 启动子概述
    §2.3 RNA修饰概述
    §2.4 预测性能评价指标
        §2.4.1 灵敏度、特异性、准确率、马修斯相关系数
        §2.4.2 ROC曲线
    §2.5 本章小结
第三章 基于SVM-Ada Boost原核生物中 σ~(54)启动子的预测
    §3.1 基准数据集的构建
    §3.2 特征提取
        §3.2.1 编码方式
        §3.2.2 DNA序列的局部结构性质
    §3.3 特征选择
    §3.4 预测模型的构建
        §3.4.1 支持向量机
        §3.4.2 Ada Boost
        §3.4.3 构建SVM-Ada Boost模型
        §3.4.4 Web端在线预测服务器
    §3.5 结果与分析
        §3.5.1 参数优化
        §3.5.2 特征选择的必要性
        §3.5.3 不同编码方式的对比
        §3.5.4 预测模型性能的对比
        §3.5.5 案列研究
    §3.6 本章小结
第四章 基于XGBoost的RNA修饰位点的识别
    §4.1 基准数据集
    §4.2 编码方式
        §4.2.1 位置特异性单核苷酸偏好特征
        §4.2.2 位置特异性双核苷酸偏好特征
    §4.3 XGBOOSt模型
    §4.4 结果与分析
        §4.4.1 Pse KNC编码方式中最优k值的确定
        §4.4.2 基于网格搜索的XGBoost模型参数寻优
        §4.4.3 不同方法的识别结果对比
    §4.5 本章小结
第五章 总结与展望
    §5.1 文本工作总结
    §5.2 工作展望
参考文献
致谢
作者在攻读硕士期间主要研究成果

(5)基于序列信息的增强子和启动子类型识别研究(论文提纲范文)

摘要
ABSTRACT
第1章 绪论
    1.1 课题背景
    1.2 研究目的及意义
    1.3 国内外相关技术发展现状
        1.3.1 DNA增强子识别及其强度识别研究现状
        1.3.2 DNA启动子识别及其类型识别研究现状
    1.4 本文的主要研究内容和组织结构
        1.4.1 DNA增强子识别及其强度识别研究内容
        1.4.2 DNA启动子识别及其类型识别研究内容
        1.4.3 本文内容安排
第2章 基于序列信息的增强子及其强度识别
    2.1 引言
    2.2 增强子数据集构建
    2.3 基于序列信息的特征向量组成
        2.3.1 Kmer方法提取序列特征向量
        2.3.2 子序列谱方法提取序列特征向量
        2.3.3 伪k元核苷酸组成方法提取序列特征向量
    2.4 增强子及其强度识别基分类器组成
    2.5 增强子及其强度识别集成学习策略
    2.6 评价指标
    2.7 结果与分析
    2.8 增强子及其强度识别在线服务系统
    2.9 本章小结
第3章 基于平滑策略的启动子及其类型识别
    3.1 引言
    3.2 启动子数据集构建
    3.3 特征向量组成
        3.3.1 基于平滑策略的切割窗口算法
        3.3.2 Kmer方法以及伪k元核苷酸组成方法提取序列特征向量
    3.4 分类器的构建
    3.5 启动子及其类型识别结果分析
        3.5.1 模型性能评价指标
        3.5.2 预测结果分析
    3.6 本章小结
第4章 基于集成学习的启动子及其类型识别
    4.1 引言
    4.2 启动子数据集的构建与特征向量组成
        4.2.1 滑动窗口策略
        4.2.2 Kmer方法以及伪k元核苷酸组成方法提取序列特征向量
    4.3 启动子及其类型识别基分类器组成
    4.4 启动子及其类型识别集成学习策略
    4.5 启动子及其类型识别模型评价指标和结果分析
    4.6 启动子及其类型识别在线服务系统
    4.7 本章小结
结论
参考文献
攻读硕士学位期间发表的论文及其它成果
致谢

(6)深度学习框架下DNA位点的预测研究(论文提纲范文)

摘要
Abstract
1 绪论
    1.1 剪切位点与启动子的概念
    1.2 剪切位点研究背景及研究意义
    1.3 启动子研究背景及研究意义
    1.4 论文的工作内容及结构安排
2 常用DNA序列特征提取方法
    2.1 核苷酸成份法
    2.2 伪K联核苷酸成份法(PseKNC)
    2.3 基于核苷酸理化性质及密度分布的融合特征
    2.4 基于多窗口的伪K联伪核苷酸成分法
    2.5 自-互相关函数法(DACC)
    2.6 移动平均法(Moving average method或 MA)
    2.7 本章小结
3 机器学习分类算法及评价
    3.1 传统机器学习分类算法
    3.2 深度学习
    3.3 分类算法评价
    3.4 本章小结
4 剪切位点的预测研究
    4.1 数据集的构建
    4.2 特征提取
    4.3 深度稀疏自动编码器(DSAE)
    4.4 分类方法及评价标准
    4.5 结果与讨论
    4.6 在线系统的构建
    4.7 本章小结
5 启动子及其强弱类别的预测研究
    5.1 数据集的构建
    5.2 方案一
    5.3 方案二
    5.4 方案一与方案二结果的比较
    5.5 在线系统的构建
    5.6 本章小结
总结与展望
    1 总结
    2 展望
致谢
参考文献
攻读硕士学位期间参加的项目和所发表的论文

(7)基于单核苷酸统计和支持向量机集成的人类基因启动子识别(论文提纲范文)

0 引言
1 工作基础
    1.1 特征提取
        1.1.1 DNA刚性
        1.1.2 基于KL散度的词频统计特征
        1.1.3 Cp G岛
2 基于单核苷酸统计和支持向量机集成的方法
    2.1 单核苷酸统计
    2.2 SVM集成模型
3 实验结果分析
    3.1 数据集
    3.2 评价方法
    3.3 单个SVM模型
    3.4 SVM集成模型
4 结语

(8)植物启动子识别算法研究(论文提纲范文)

摘要
Abstract
1 绪论
    1.1 课题的背景及意义
    1.2 植物启动子识别算法的发展现状
        1.2.1 植物启动子识别的难点
        1.2.2 植物启动子识别的研究进展
    1.3 本文的主要工作和组织结构
2 生物学理论基础
    2.1 DNA
        2.1.1 核酸
        2.1.2 DNA的结构
    2.2 分子生物学中心法则
    2.3 基因组结构
        2.3.1 基因
        2.3.2 真核生物基因组
    2.4 真核基因表达调控
    2.5 真核启动子
        2.5.1 真核启动子的结构
        2.5.2 真核启动子的功能
3 生物信息数据库
    3.1 生物信息数据库
    3.2 FASTA数据格式
    3.3 植物启动子数据库
4 基于GC偏好和SVM的植物启动子识别算法
    4.1 系统结构与工作原理
    4.2 特征提取
        4.2.1 GC偏好特征
        4.2.2 结构特征
        4.2.3 信号特征
    4.3 SVM分类器设计
        4.3.1 SVM工作原理
        4.3.2 SVM分类器设计
    4.4 实验结果及性能分析
        4.4.1 评价指标
        4.4.2 数据集的选取
        4.4.3 实验结果及分析
    4.5 本章小结
5 基于GC偏好和DNA双链特征的植物启动子识别算法
    5.1 系统结构与工作原理
    5.2 DNA双链特征
    5.3 实验结果及性能分析
    5.4 本章小结
6 结论
    6.1 研究工作总结
    6.2 未来工作展望
参考文献
攻读硕士学位期间发表学术论文情况
致谢

(9)细菌启动子识别及应用研究进展(论文提纲范文)

1 细菌启动子简介
2 细菌启动子识别方法
    2.1 基于结构特征进行的细菌启动子识别
    2.2 基于细菌启动子在基因组中的分布特征进行的启动子识别
    2.3 计算机建模方法进行的细菌启动子识别
    2.4 利用RNA聚合酶的特殊亚基进行细菌启动子的预测
3 细菌启动子研究和应用进展
    3.1 细菌常用诱导型启动子研究进展
        3.1.1 lac启动子
        3.1.2 tac和trc启动子
        3.1.3 T7噬菌体启动子
        3.1.4 L-阿拉伯糖诱导的PBAD启动子
        3.1.5 L-鼠李糖诱导的rha PBAD启动子
    3.2 细菌诱导型启动子应用进展
        3.2.1 细菌启动子在蛋白质生产中的应用
        3.2.2 细菌启动子在化合物降解中的应用
        3.2.3 细菌启动子在物质检测中的应用
        3.2.4 细菌启动子在代谢通路研究中的应用
4 总结与展望

(10)人类启动子识别算法研究(论文提纲范文)

摘要
Abstract
1. 绪论
    1.1 生物信息学概述
        1.1.1 生物信息学的产生背景
        1.1.2 生物信息学的发展历史
        1.1.3 生物信息学的定义
        1.1.4 生物信息学的研究目标和任务
        1.1.5 生物信息学的主要研究对象
        1.1.6 生物信息学的研究意义
        1.1.7 生物信息学目前的发展状况
    1.2 课题的背景与意义
    1.3 人类启动子识别算法的发展现状
    1.4 本文的主要工作
    1.5 本文的内容组织
2 生物学基础
    2.1 核酸与基因
        2.1.1 碱基
        2.1.2 核苷
        2.1.3 核苷酸
        2.1.4 DNA的结构
        2.1.5 基因
    2.2 基因的结构和表达调控
        2.2.1 原核基因
        2.2.2 真核基因
        2.2.3 中心法则
        2.2.4 基因的表达调控
    2.3 启动子的结构和功能
3 生物信息数据库
    3.1 核酸序列数据库
    3.2 启动子数据库
4 基于KL散度和BP神经网络的人类启动子识别算法
    4.1 BP神经网络技术介绍
    4.2 特征提取
        4.2.1 组成成分特征
        4.2.2 CpG岛特征
    4.3 分类器设计
    4.4 实验结果
    4.5 本章小结
5 基于两级SVM分类器的人类启动子识别算法
    5.1 支持向量机
        5.1.1 线性支持向量机
        5.1.2 非线性支持向量机
        5.1.3 核函数
        5.1.4 K-折交叉验证法
    5.2 特征提取
        5.2.1 CpG岛特征
        5.2.2 组成成分特征
    5.3 分类器设计
    5.4 实验结果
    5.5 本章小结
6 结论
    6.1 研究工作总结
    6.2 未来工作展望
参考文献
攻读硕士学位期间发表学术论文情况
致谢

四、基于计算机的启动子识别技术(论文参考文献)

  • [1]功能角蛋白制备用酶在Bacillus subtilis中的高效表达与改造[D]. 苏畅. 江南大学, 2021(01)
  • [2]基于序列和结构信息识别大肠杆菌与人类启动子[D]. 郭东华. 内蒙古大学, 2020(01)
  • [3]基于高通量数据的增强子及其作用位点预测方法[D]. 章天骄. 哈尔滨工业大学, 2019(01)
  • [4]基于集成学习的σ54启动子及RNA修饰位点的预测[D]. 吕成伟. 桂林电子科技大学, 2019(01)
  • [5]基于序列信息的增强子和启动子类型识别研究[D]. 李凯. 哈尔滨工业大学, 2018(02)
  • [6]深度学习框架下DNA位点的预测研究[D]. 王鹏. 景德镇陶瓷大学, 2018(01)
  • [7]基于单核苷酸统计和支持向量机集成的人类基因启动子识别[J]. 徐文轩,张莉. 计算机应用, 2015(10)
  • [8]植物启动子识别算法研究[D]. 寇秋波. 辽宁师范大学, 2012(08)
  • [9]细菌启动子识别及应用研究进展[J]. 徐友强,马翠卿,陶飞,许平. 生物工程学报, 2010(10)
  • [10]人类启动子识别算法研究[D]. 梅丽. 辽宁师范大学, 2010(05)

标签:;  ;  ;  ;  ;  

基于计算机的启动子识别技术
下载Doc文档

猜你喜欢