Полная версия страницы  English  

Ошибочное аннотирование генов рРНК в качестве белок-кодирующих генов носит глобальный характер

daniil naumoff, 31.10.2011 13:20
Геномы почти всех прокариот компактно наполнены генами, содержа, как правило, лишь очень короткие межгенные спейсеры. При этом подавляющая часть генов является белок-кодирующими генами. Это приводит к тому, что часто при аннотации последовательностей ДНК, особенно в рамках геномных проектов, в качестве белок-кодирующих генов рассматриваются все потенциальные открытые рамки считывания, имеющие длину бóльшую пороговой (обычно в районе 300 пар нуклеотидов между потенциальными старт- и стоп-кодонами). При таком подходе в участках генома, кодирующих рибосомальные РНК, часто распознаются и аннотируются белок-кодирующие гены.
F4_large.jpg - кликните, чтобы открыть увеличенную картинку

На рисунке стрелками показаны 27 и 40 потенциальных открытых рамок считывания внутри генов соответственно 16S и 23S рРНК Escherichia coli. Стрелки, обведённые сплошной (а не пунктирной) линией, обозначают рамки считывания, кодирующие гипотетические белки для которых в базе данных аминокислотных последовательностей были обнаружены «гомологи». С помощью столбчатых диаграмм показано число «гомологов» для каждого из гипотетических белков. Одна из таких групп белков признана в базе данных белковых доменов Pfam в качестве семейства (PF10695) и ей даже приписана функция, хотя там и имеется оговорка, что эта функция не имеет экспериментального подтверждения («most members are annotated as being cell-wall-associated hydrolases but this could not be confirmed»).

Анализ полногеномных последовательностей показал, что 367 геномов прокариот (из примерно 2000) содержат аннотации белок-кодирующих генов внутри участков, кодирующих гены рРНК. При этом до сих пор не известно ни одного экспериментально подтверждённого случая наложения белок-кодирующих и рРНК генов у прокариот (в случае эукариот такие примеры известны).

Сложившаяся практика аннотации рРНК в качестве белок-кодирующих генов особенно опасна при метагеномных и метатранскриптомных исследованиях с использованием пиросеквенирования. Компьютерное моделирование показало, что почти 90% сгенерированных фрагментов рРНК не только проявляют статистически достоверное сходство с ранее известными «белок-кодирующими генами», но и могут быть приписаны к конкретным таксономическим группам живых организмов на основе уровня сходства нуклеотидных последовательностей. При этом приписываемый вид часто таксономически очень далёк от источника исходной рРНК.

Следует подчеркнуть, что обнаруженное в базах данных огромное число реально не существующих белков, многие из которых имеют функциональную аннотацию, объясняется сложившейся досадной традицией аннотации генов на основании «ближайшего» ранее известного гомолога.


По материалам статьи: Tripp HJ, Hewson I, Boyarsky S, Stuart JM, Zehr JP. Misannotations of rRNA can now generate 90% false positive protein matches in metatranscriptomic studies. Nucleic Acids Res. 2011, 39(20): 8792-8802.
Pubmed

категория - 2
Nastja, 31.10.2011 17:08
Раньше я с некоторым недоверием относилась к заявлениям Наумоффа о том, что в базах куча ошибок, но, поработав поплотнее с самыми разными базами, могу с уверенностью заявить:
Ошибочное аннотирование ... носит глобальный характер!
daniil naumoff, 31.10.2011 18:09
Настя, почитай http://www.ncbi.nlm.nih.gov/pubmed?term=20011109 и многое станет яснее про глобальный характер ошибочных аннотаций.
Nastja, 31.10.2011 18:40
Я и про базы, связанные с SNP, могу сказать то же самое.
klav, 31.10.2011 21:07
>Ошибочное аннотирование ... носит глобальный характер!

Я бы только уточнил - автоматическое аннотирование.

Так что - бей математикoff!
smile.gif
bee1, 01.11.2011 04:47
(Nastja @ 31.10.2011 18:08)
Ссылка на исходное сообщение  Раньше я с некоторым недоверием относилась к заявлениям Наумоффа о том, что в базах куча ошибок, но, поработав поплотнее с самыми разными базами, могу с уверенностью заявить:
Ошибочное аннотирование ... носит глобальный характер!


ну и что ? в базах гиномоффф дофига ошибок - ну никто не плачет smile.gif ну нет в мире совершенства - сказал лис маленькому принцу smile.gif
bee1, 01.11.2011 04:56
(Nastja @ 31.10.2011 18:08)
Ссылка на исходное сообщение  Раньше я с некоторым недоверием относилась к заявлениям Наумоффа о том, что в базах куча ошибок, но, поработав поплотнее с самыми разными базами, могу с уверенностью заявить:
Ошибочное аннотирование ... носит глобальный характер!


дк посмотрите , как корректировались геномы лабштаммов бактерий smile.gif все енто давно известно smile.gif)))))))))))))))))))))))))))))))
Nastja, 01.11.2011 06:55
Главное - избегать ошибок в голове, а в базах они неизбежны.
Esya, 01.11.2011 07:48
китайскую статью рецензировала, ребята пытались сказать людям, что рнк-метилтрансфераза это гемолизин, потому что похож на то что 100 лет назад обозвали подобную фигню в стрептококках гемолизином, и проаннотирована соответствующе

а я помешала
daniil naumoff, 01.11.2011 13:07
(Nastja @ 01.11.2011 07:55)
Ссылка на исходное сообщение  Главное - избегать ошибок в голове, а в базах они неизбежны.

Ещё хотелось бы, чтобы в статьях не было ошибок. А один из основных источников ошибок в базах данных - автоматическое распространение на новые последовательности ошибок, исходно взятых из статей.
vrida2, 22.06.2022 15:16
audiobookkeeper.rucottagenet.rueyesvision.rueyesvisions.comfactoringfee.ru
filmzones.rugadwall.rugaffertape.rugageboard.rugagrule.ru
gallduct.rugalvanometric.rugangforeman.rugangwayplatform.rugarbagechute.ru
gardeningleave.rugascautery.rugashbucket.rugasreturn.rugatedsweep.ru
gaugemodel.rugaussianfilter.rugearpitchdiameter.rugeartreating.rugeneralizedanalysis.ru
generalprovisions.rugeophysicalprobe.rugeriatricnurse.rugetintoaflap.rugetthebounce.ru
habeascorpus.ruhabituate.ruhackedbolt.ruhackworker.ruhadronicannihilation.ru
haemagglutinin.ruhailsquall.ruhairysphere.ruhalforderfringe.ruhalfsiblings.ru
hallofresidence.ruhaltstate.ruhandcoding.ruhandportedhead.ruhandradar.ru
handsfreetelephone.ruhangonpart.ruhaphazardwinding.ruhardalloyteeth.ruhardasiron.ru
hardenedconcrete.ruharmonicinteraction.ruhartlaubgoose.ruhatchholddown.ruhaveafinetime.ru
hazardousatmosphere.ruheadregulator.ruheartofgold.ruheatageingresistance.ruheatinggas.ru
heavydutymetalcutting.rujacketedwall.rujapanesecedar.rujibtypecrane.rujobabandonment.ru
jobstress.rujogformation.rujointcapsule.rujointsealingmaterial.rujournallubricator.ru
juicecatcher.rujunctionofchannels.rujusticiablehomicide.rujuxtapositiontwin.rukaposidisease.ru
keepagoodoffing.rukeepsmthinhand.rukentishglory.rukerbweight.rukerrrotation.ru
keymanassurance.rukeyserum.rukickplate.rukillthefattedcalf.rukilowattsecond.ru
kingweakfish.rukinozones.rukleinbottle.rukneejoint.ruknifesethouse.ru
knockonatom.ruknowledgestate.rukondoferromagnet.rulabeledgraph.rulaborracket.ru
labourearnings.rulabourleasing.rulaburnumtree.rulacingcourse.rulacrimalpoint.ru
lactogenicfactor.rulacunarycoefficient.ruladletreatediron.rulaggingload.rulaissezaller.ru
lambdatransition.rulaminatedmaterial.rulammasshoot.rulamphouse.rulancecorporal.ru
lancingdie.rulandingdoor.ruhttp://landmarksensor.rulandreform.rulanduseratio.ru
languagelaboratory.rulargeheart.rulasercalibration.rulaserlens.rulaserpulse.ru
laterevent.rulatrinesergeant.rulayabout.ruleadcoating.ruleadingfirm.ru
learningcurve.ruleaveword.rumachinesensible.rumagneticequator.rumagnetotelluricfield.ru
mailinghouse.rumajorconcern.rumammasdarling.rumanagerialstaff.rumanipulatinghand.ru
manualchoke.rumedinfobooks.rump3lists.runameresolution.runaphtheneseries.ru
narrowmouthed.runationalcensus.runaturalfunctor.runavelseed.runeatplaster.ru
necroticcaries.runegativefibration.runeighbouringrights.ruobjectmodule.ruobservationballoon.ru
obstructivepatent.ruoceanmining.ruoctupolephonon.ruofflinesystem.ruoffsetholder.ru
olibanumresinoid.ruonesticket.rupackedspheres.rupagingterminal.rupalatinebones.ru
palmberry.rupapercoating.ruparaconvexgroup.ruparasolmonoplane.ruparkingbrake.ru
partfamily.rupartialmajorant.ruquadrupleworm.ruqualitybooster.ruquasimoney.ru
quenchedspark.ruquodrecuperet.rurabbetledge.ruradialchaser.ruradiationestimator.ru
railwaybridge.rurandomcoloration.rurapidgrowth.rurattlesnakemaster.rureachthroughregion.ru
readingmagnifier.rurearchain.rurecessioncone.rurecordedassignment.rurectifiersubstation.ru
redemptionvalue.rureducingflange.rureferenceantigen.ruregeneratedprotein.rureinvestmentplan.ru
safedrilling.rusagprofile.rusalestypelease.rusamplinginterval.rusatellitehydrology.ru
scarcecommodity.ruscrapermat.ruscrewingunit.ruseawaterpump.rusecondaryblock.ru
secularclergy.ruseismicefficiency.ruselectivediffuser.rusemiasphalticflux.rusemifinishmachining.ru
spicetrade.ruspysale.rustungun.rutacticaldiameter.rutailstockcenter.ru
tamecurve.rutapecorrection.rutappingchuck.rutaskreasoning.rutechnicalgrade.ru
telangiectaticlipoma.rutelescopicdamper.rutemperateclimate.rutemperedmeasure.rutenementbuilding.ru
tuchkasultramaficrock.ruultraviolettesting.ru
vrida2, 21.11.2022 06:30
audiobookkeepercottageneteyesvisioneyesvisionsfactoringfee
filmzonesgadwallgaffertapegageboardgagrule
gallductgalvanometricgangforemangangwayplatformgarbagechute
gardeningleavegascauterygashbucketgasreturngatedsweep
gaugemodelgaussianfiltergearpitchdiametergeartreatinggeneralizedanalysis
generalprovisionsgeophysicalprobegeriatricnursegetintoaflapgetthebounce
habeascorpushabituatehackedbolthackworkerhadronicannihilation
haemagglutininhailsquallhairyspherehalforderfringehalfsiblings
hallofresidencehaltstatehandcodinghandportedheadhandradar
handsfreetelephonehangonparthaphazardwindinghardalloyteethhardasiron
hardenedconcreteharmonicinteractionhartlaubgoosehatchholddownhaveafinetime
hazardousatmosphereheadregulatorheartofgoldheatageingresistanceheatinggas
heavydutymetalcuttingjacketedwalljapanesecedarjibtypecranejobabandonment
jobstressjogformationjointcapsulejointsealingmaterialjournallubricator
juicecatcherjunctionofchannelsjusticiablehomicidejuxtapositiontwinkaposidisease
keepagoodoffingkeepsmthinhandkentishglorykerbweightkerrrotation
keymanassurancekeyserumkickplatekillthefattedcalfkilowattsecond
kingweakfishkinozoneskleinbottlekneejointknifesethouse
knockonatomknowledgestatekondoferromagnetlabeledgraphlaborracket
labourearningslabourleasinglaburnumtreelacingcourselacrimalpoint
lactogenicfactorlacunarycoefficientladletreatedironlaggingloadlaissezaller
lambdatransitionlaminatedmateriallammasshootlamphouselancecorporal
lancingdielandingdoorlandmarksensorlandreformlanduseratio
languagelaboratorylargeheartlasercalibrationlaserlenslaserpulse
latereventlatrinesergeantlayaboutleadcoatingleadingfirm
learningcurveleavewordmachinesensiblemagneticequatormagnetotelluricfield
mailinghousemajorconcernmammasdarlingmanagerialstaffmanipulatinghand
manualchokemedinfobooksmp3listsnameresolutionnaphtheneseries
narrowmouthednationalcensusnaturalfunctornavelseedneatplaster
necroticcariesnegativefibrationneighbouringrightsobjectmoduleobservationballoon
obstructivepatentoceanminingoctupolephononofflinesystemoffsetholder
olibanumresinoidonesticketpackedspherespagingterminalpalatinebones
palmberrypapercoatingparaconvexgroupparasolmonoplaneparkingbrake
partfamilypartialmajorantquadruplewormqualityboosterquasimoney
quenchedsparkquodrecuperetrabbetledgeradialchaserradiationestimator
railwaybridgerandomcolorationrapidgrowthrattlesnakemasterreachthroughregion
readingmagnifierrearchainrecessionconerecordedassignmentrectifiersubstation
redemptionvaluereducingflangereferenceantigenregeneratedproteinreinvestmentplan
safedrillingsagprofilesalestypeleasesamplingintervalsatellitehydrology
scarcecommodityscrapermatscrewingunitseawaterpumpsecondaryblock
secularclergyseismicefficiencyselectivediffusersemiasphalticfluxsemifinishmachining
spicetradespysalestunguntacticaldiametertailstockcenter
tamecurvetapecorrectiontappingchucktaskreasoningtechnicalgrade
telangiectaticlipomatelescopicdampertemperateclimatetemperedmeasuretenementbuilding
tuchkasultramaficrockultraviolettesting
Это — лёгкая версия форума. Чтобы попасть на полную, щелкните здесь.
Invision Power Board © 2001-2024 Invision Power Services, Inc.