多功能酶的分类技术与应用ClassificationTechnologyandApplicationofMultifunctionalEnzymes

收稿日期:2021年2月8日;录用日期:2021年3月3日;发布日期:2021年3月12日

摘要

酶是由活细胞产生的、对其底物具有高度特异性和高度催化效能的蛋白质或RNA,具有多种催化功能的酶被称为多功能酶。细胞是高度精细的复杂有机网络,多功能酶是常见的重要代谢反应的参与者,参与多个细胞代谢网络。在数据挖掘和机器学习领域,对酶的研究可以看作是一项预测任务。本文从机器学习的角度对关于多功能酶的研究作了一个深入的回顾。从方法和应用的角度,讨论的建模方法包括数据预处理、分类算法和模型评估等技术。对于应用方面,对现有的多功能酶应用领域提供了一个全面的分类,然后对各类别的应用进行了详细说明。最后,结合经验和判断,总结了一些建议,为多功能酶领域的进一步研究提供了方向。

关键词

生物信息学,多功能酶,多标签,机器学习

ClassificationTechnologyandApplicationofMultifunctionalEnzymes

PengliBi

SchoolofInformationScienceandEngineering,YunnanUniversity,KunmingYunnan

Received:Feb.8th,2021;accepted:Mar.3rd,2021;published:Mar.12th,2021

ABSTRACT

EnzymesareproteinsorRNAsproducedbylivingcells,whicharehighlyspecificandhighlycatalyticfortheirsubstrates.Enzymeswithmultiplecatalyticfunctionsarecalledmultifunctionalenzymes.Cellsarehighlysophisticatedandcomplexorganicnetworks,andmultifunctionalenzymesarecommonparticipantsinimportantmetabolicreactionsandparticipateinmultiplecellularmetabolicnetworks.Inthefieldofdataminingandmachinelearning,theresearchofenzymescanberegardedasapredictiontask.Thearticleprovidesanin-depthreviewoftheresearchonenzymesfromtheperspectiveofmachinelearning.Fromtheperspectiveofmethodsandapplications,themodelingmethodsdiscussedincludedatapreprocessing,classificationalgorithms,andmodelevaluation.Forapplication,acomprehensiveclassificationisprovidedfortheexistingmultifunctionalenzymeapplicationfields,andthentheapplicationofeachcategoryisdescribedindetail.Finally,combinedwithexperienceandjudgment,somesuggestionsinthepaperaresummarized,whichprovidesadirectionforfurtherresearchinthefieldofmultifunctionalenzymes.

Keywords:Bioinformatics,MultifunctionalEnzyme,Multi-Label,MachineLearning

ThisworkislicensedundertheCreativeCommonsAttributionInternationalLicense(CCBY4.0).

1.引言

1999年Jeffery将一类同时具有两种或两种以上功能的蛋白质称为兼职蛋白质[1],还对兼职蛋白质的概念进行了严格的限定。经过研究表明,功能明确的兼职蛋白质大部分是酶蛋白,即除了已经具备的催化功能外还具有其他的生物学功能,这些功能涵盖了两种情况:一是产生催化混杂的现象[2],二是与调节作用有关的功能。这类具有多种功能的酶被称为多功能酶。在数据挖掘领域,关于多功能酶的研究是一个预测问题,通常是一个数据分类问题。虽然数据挖掘方法已被广泛应用于建立分类模型来指导预测任务,但对多功能酶这类多标签的分类模型构成了重大的挑战。多标签分类与传统的分类问题相比较,主要难点有以下两个:

1)类标签的数量不确定,有的样本可能只有一个类标签,而有的样本的类标签可能高达几十个;

2)类标签之间存在依赖,怎样解决类标签之间的依赖性也是一个难点。

为了解决多功能酶分类问题,在过去人们已经开发了机器学习方法,其中大部分是基于样本技术和集成方法等[3]。尽管已经发表了一些与多功能酶分类有关的研究[4][5][6],但大都集中于技术方面,而忽略了应用方面的探索,关于多功能酶这个大类的应用研究综述少之又少。对于生物学等领域的研究人员来说,使用先进的学习技术和成熟有效的方法解决多功能酶分类预测的问题可能比使用复杂的算法更为重要。

本文目的是提供一个关于多功能酶研究的全面概述,包括方法和应用两方面。在方法层面,介绍了研究多功能酶的常用方法,包括预处理、分类和评价。在应用方面,回顾了多功能酶在不同研究领域的应用。最后我们从方法和应用两方面讨论了未来对于多功能酶研究方向的思考,并在第5节进行了全文总结。

2.研究方法和初步统计

2.1.研究方法

Figure1.Two-stagekeywordstreestructure

2.2.初步统计

Figure2.Publicationtrendofmultifunctionalenzymeresearch

Figure3.Top13journals/conferencesonwhichmostmultifunctionalenzymeresearch

Figure4.Wordcloudofthetitlewordsfromthecollectedpaper

3.解决多功能酶分类问题的基本策略

3.1.预处理

步骤1:仅收集关键词为“多功能酶”的序列;

步骤2:删除标注“fragment”的序列;

步骤3:根据实验需要,去除长度小于N的氨基酸残基的序列,因为这些序列可能属于片段;

步骤4:为了减少冗余性和同源性的影响,我们通常使用CD-HIT程序排除这些酶与同一亚群中任何其他酶在成对序列相似度超过m%的酶(m根据实验需求设定,最小为40)。

3.2.多功能酶样本的表示

3.2.1.氨基酸组成(AAC)

蛋白质序列由20种常见的氨基酸组成,氨基酸组成的特征表达就是计算各种氨基酸在待测蛋白质序列中出现的频率[9]。虽然用AAC可以预测很多蛋白质属性[10][11],但是存在一个致命缺点,即如果使用AAC作为唯一的特征提取方法来提取蛋白质信息,则其所有的序列顺序和序列长度信息将丢失。因此为了避免这样的情况发生,Chou[12]提出了伪氨基酸组成(PseAAC)来代替氨基酸组成(AAC)。

3.2.2.伪氨基酸组成(PseAAC)

伪氨基酸组成最早是由Chou在2001年提出来的,随后PseAAC的思想广泛应用于蛋白质组学、生物信息学和系统生物学[13],比如预测蛋白质亚细胞定位[14],预测DNA结合蛋白质[15],氨基酸的分类[16],预测酶家族分类[17],预测蛋白质四级结构属性[18],鉴别外膜蛋白[19]。目前,PseAAC被用来处理DNA领域的问题,例如识别核小体[20]和预测重组点[21]。

3.2.3.SAAC(SplitAminoAcidComposition)

Table1.Summaryofarticlesemployingfeatureselectionorextractionmethods

3.3.分类算法

针对多功能酶研究的多标签学习系统,一个良好的多标签分类算法对预测效果有着至关重要的作用。多标签数据学习方法依据问题解决的角度,主要分为两种。

Table2.Commonmethodsinproblemconversionmethods

Figure5.Commonmulti-labelclassificationmodels

Table3.Representativearticleonclassificationalgorithm

3.4.评价指标

模型选择和模型评价是机器学习中的两个关键过程。因此,性能度量是评价分类器有效性和指导分类器学习的关键指标。多标签学习系统的性能评价不同于传统的单标签学习系统。在单标签系统中常用的评价指标包括:精确率、正确率、召回率和F-Score等[39],但对于多标签学习系统这些评价指标要

4.多功能酶的应用

4.1.应用领域的分类

Table4.Applicationdomaincategories

4.2.各个领域的详细介绍

(一)多功能酶在疾病领域的研究热点主要包括:预后治疗和控制影响某种疾病的激素,如通过控制胰岛素对糖尿病人进行治疗;

(三)在病毒这一领域的应用,近年来主要讨论了多功能酶与登革病毒的关系;

Table5.Applicationsinvariousfields

5.总结与展望

(一)方法方面:可以尝试其他的特征选择方法获得我们所需要的实验数据,然后经过特征融合的方法将特征进行融合使我们的实验数据能够更好的表达它的意义;此外作为一种提高弱学习者分类性能的好方法,基于集成的算法目前已被广泛用于解决一些多分类学习任务。WangandYao[89]认为集成模型的性能取决于单个分类器的准确性和所有分类器之间的多样性,未来可以尝试将多标签学习算法中的分类器进行集成,以获得更好的性能。往后可以将重心放在多标签学习两大难点上,开发新的算法去解决标签依赖性以及类标不平衡的问题。

(二)应用方面:回顾第3节的应用分布,只有2篇文献讨论了多功能酶在病毒研究领域方面的应用,由于新药研发已经进入到了以生物靶标为核心的时代,特别是以计算机模拟结构来设计药物的出现使得药物设计理念得到了进一步的完善,未来可以在这个方面做更多的工作;另一个有价值的研究方向是在其他应用领域中,多功能酶的应用较广,从生物合成到畜牧水产都有涉猎,尤其近年来多功能酶在畜牧、水产、养蜂方面有很大的应用成果。现在人们更加注重健康与营养,怎样提高产品的产量与质量也是一个需要继续攻克的难题。

THE END
1.轻松兼职?小心犯罪陷阱!辟谣经查,崔某等人以给各类APP“拉新冲量”为由,在网上发布招聘广告,以每日保底100元的工资招聘兼职员工。招聘人员需使用自己的身份证、银行卡、手机号、社交账号以及人脸等,为该犯罪团伙注册网络商铺等虚拟账号。该犯罪团伙再以每个账号30元到140元不等的价格出售获利。这些虚拟账号大部分被用于网络水军、网络诈骗http://m.sjnews.cn/py/853.html
2.大家来讨论一下E68海纳团队是不是骗人的?骗你交了钱就消失的是诈骗,e68是真的传销,里面单也确实有,不过少,放单的主持每天都在朋友圈里发https://www.zhihu.com/question/300752129/answer/547334930
3.大学生课余可以做的兼职汇总也是一个不错的兼职。注意事项 要注意辨别兼职的真假,不要轻易相信,在做兼职前最好上网了解一下风险。网赚这样的兼职一般来说收益都会比较低,如果出现高收益的必须得注意了,不要贪小便宜、因少失大。在做校园代理的时候需要注意,一般是不需要先垫付资金的,垫付资金的就需要警惕是否骗子公司了。https://jingyan.baidu.com/article/f79b7cb301df149145023e68.html
4.2024年正规的手机兼职赚钱平台app排行榜前十名近年来,随着互联网的快速发展和普及,越来越多人开始利用手机进行兼职,以增加额外收入。如今,各种手机兼职赚钱软件层出不穷,帮助用户在闲暇时赚取一定的收益。这类软件大多采用一单一结的方式,只需要一部手机即可轻松参与。以下是2024年正规的手机兼职赚钱平台app排行榜前十名,让你随时随地都可以用手机做兼职,一天能赚https://www.jianshu.com/p/ae05e68ba9a2
5.河北省秦皇岛市海港区残联兼职副理事长栾志学——“我只是做了“我能理解他们的心情,因为我也是这样过来的。”如今担任河北省秦皇岛市肢体残疾人协会副主席、秦皇岛市海港区残联兼职副理事长的栾志学,向记者回忆起34年前自己受伤的事情:16岁那年,面对歹徒,他勇敢地挺身而出,后来头部受伤,昏迷了10多天,在床上躺了2个多月。 https://www.gzstv.com/a/7dd0da1e68f7457da803fd19dcc37fd2
6.领导干部违规兼职清查承诺书.docxPAGE PAGE 1 领导干部违规兼职清查承诺书 1. 领导干部企业兼职检讨书 敬重的___(公司领导): 您好!首先特别感激您在百忙之中抽出空看我写的这份千字检讨书! 我不想再一次为本人的错误找任何借口,那只能让我愈加惭愧与惭愧。这份检讨书,次要是向您表示我对这种错误行为的深痛恶绝,我下定决心,不再犯类似错误。https://m.book118.com/html/2022/0724/6051222133004214.shtm
7.铁路运输生产重大事故隐患是指铁路运输生产组织过程中的安全关键【单选题】关于泪器的说法不合适的是( )。 查看完整题目与答案 【单选题】竞争的实质是( )和知识的竞争。 查看完整题目与答案 【单选题】泪器排出部由( )构成。 查看完整题目与答案 【单选题】竞争的实质是是人才和( )的竞争。 查看完整题目与答案 【单选题】属于泪器分泌部的是( )。 查看完整题https://www.shuashuati.com/ti/c82e68c63e374d8da0d1531b5df68c34.html?fm=bd81db2e1dfba844d1201b39472cc5efc4
8.?豪客首选?媒体人:日本全队对比赛的观察思考处理能力比2,新蒲京网上娱乐网址,91y账号出售平台,半岛平台不出款,bob综合体育登录平台网站3,ww99.69mt.com,大发pg电子,755sy手游平台,89598.cc导航大全4,麻将胡了爆奖视频合集,w66国际下载,银河国际bb,pg独角兽多少钱5,赢多多app官方版赚钱方法,真葡京娱乐,炸金花网站,亚美体育的上市情况6,qp985棋牌,lol外围购买网站,dearhttp://zcn.shoulvlianhe.com/
9.商政通发文机关 重庆市涪陵区人民政府 发文字号涪陵府发〔2021〕43号 发布时间2021-12-06 政策类型政策文件 发文主题“十四五”规划农业农村现代化十四五 展开全部内容 心得体会 0/300 保存 上级政策 序号 政策标题 发文机关 发文时间 1 中华人民共和国合同法 山东省泰安市财政局 2011-02-15 2 中华人民共和国物http://zc.vipisall.com/policy/99492F90MPD88JL0MPC7SJL1MPBO7JHVMDR
10.SSM房屋租赁管理平台房屋租赁系统国内外研究现状线上管理房屋租赁管理平台提供了良好的发展空间,随着人们生活质量的提高,人们对计算机技术的要求越来越严格。人们希望拥有更好的线上管理体验。而且,房屋租赁管理有着传统线下管理比不了的便捷高效简单等优势。房屋租赁管理平台就是为广大用户提供这样一个方便的系统,以满足人们的需求。 https://blog.csdn.net/m0_73268882/article/details/140389822
11.入口app安卓官网登录8、52-60级,就非常效率,单飞的话建议去西瘟疫坐标50 77 悔恨岭去刷,刷新怪,没有远程能刷声望很效率联盟路过的比较多,但PVP没开很少有主动打架的,如果觉得你的手法好,去西瘟疫达尔松之泪农场也是更加效率的,怪物有恐惧怪,冰坏之后,远离就不会被恐惧,可以直接刷到60级掉落也比较值钱。 法师到55之后也可以直接去http://www.zc2020.fun/
12.吸收塔密计新闻施工部分的项目管理机构人员只需按照《黑龙江省房屋建筑和市政基础设施工程施工现场管理人员配备管理办法》(黑建规〔2023〕2号)文件,填报施工部分项目管理人员配置表,投标文件中施工部分的其他项目管理机构人员可以不上传相关证件。②设计部分人员符合兼职条件的可以兼任施工部分项目管理人员配置表中的可兼职岗位,可兼职岗位https://www.instrument.com.cn/zhuti/94308/news.html