Project 1000 plantengenomen



Alle kennis die de mens in de loop der eeuwen over Project 1000 plantengenomen heeft vergaard, is nu op het internet beschikbaar, en wij hebben die voor u op een zo toegankelijk mogelijke manier gebundeld en geordend. Wij willen dat u snel en efficiënt toegang krijgt tot alles wat u over Project 1000 plantengenomen wilt weten; dat uw ervaring plezierig is en dat u het gevoel hebt dat u echt de informatie over Project 1000 plantengenomen hebt gevonden waarnaar u op zoek was.

Om onze doelstellingen te bereiken hebben wij ons niet alleen ingespannen om de meest actuele, begrijpelijke en waarheidsgetrouwe informatie over Project 1000 plantengenomen te verkrijgen, maar wij hebben er ook voor gezorgd dat het ontwerp, de leesbaarheid, de laadsnelheid en de bruikbaarheid van de pagina zo aangenaam mogelijk zijn, zodat u zich kunt concentreren op het wezenlijke, het kennen van alle beschikbare gegevens en informatie over Project 1000 plantengenomen, zonder dat u zich zorgen hoeft te maken over iets anders, wij hebben het al voor u geregeld. Wij hopen dat wij ons doel hebben bereikt en dat u de informatie heeft gevonden die u zocht over Project 1000 plantengenomen. We heten u dus van harte welkom en moedigen u aan om te blijven genieten van de ervaring van het gebruik van scientianl.com .

Project 1000 plantengenomen
Financieringsbureau
Looptijd 2008 2019
Website www .onekp .com

Het 1000 Plant Transcriptomes Initiative (1KP) was een internationale onderzoeksinspanning om de meest gedetailleerde catalogus van genetische variatie in planten op te stellen. Het werd aangekondigd in 2008 en werd geleid door Dr. Gane Ka-Shu Wong en Dr. Michael Deyholos van de Universiteit van Alberta . Het project heeft in 2014 met succes de transcriptomen (genen tot expressie gebracht) van 1000 verschillende plantensoorten gesequenced ; de definitieve sluitsteenproducten werden in 2019 gepubliceerd.

1KP was een van de grootschalige (waarbij veel organismen betrokken waren) sequencing-projecten die waren ontworpen om te profiteren van de bredere beschikbaarheid van high-throughput ("next-generation") DNA-sequencing-technologieën . Het vergelijkbare 1000 Genomes Project heeft bijvoorbeeld tussen 2008 en 2015 genoomsequenties met een hoge dekking van 1000 individuele mensen verkregen om de menselijke genetische variatie beter te begrijpen . Dit project biedt een sjabloon voor verdere genoomprojecten op planetaire schaal, waaronder het 10KP-project dat de volledige genomen van 10.000 planten sequentiëert, en het Earth BioGenome Project , met als doel de genomen van alle eukaryote biodiversiteit van de aarde te sequensen, catalogiseren en karakteriseren .

doelen

Met ingang van 2002 werd het aantal geclassificeerde groene plantensoorten geschat op ongeveer 370.000, maar er zijn waarschijnlijk vele duizenden meer nog niet-geclassificeerde. Ondanks dit aantal hebben zeer weinig van deze soorten tot op heden gedetailleerde DNA-sequentie- informatie; 125.426 soorten in GenBank , op 11 april 2012, maar de meeste (> 95%) hebben een DNA-sequentie voor slechts één of twee genen. "... bijna geen van de ruwweg een half miljoen plantensoorten die de mensheid kent, is op welk niveau dan ook door genomica geraakt". Het 1000 Plant Genomes Project was gericht op het produceren van een ongeveer 100x toename van het aantal plantensoorten met een beschikbare brede genoomsequentie.

Evolutionaire relaties

Er zijn pogingen gedaan om de evolutionaire relaties tussen de bekende plantensoorten te bepalen, maar fylogenieën (of fylogenetische bomen) die uitsluitend zijn gemaakt met behulp van morfologische gegevens, cellulaire structuren, enkele enzymen of op slechts een paar sequenties (zoals rRNA ) kunnen gevoelig zijn voor fouten; morfologische kenmerken zijn bijzonder kwetsbaar wanneer twee soorten er fysiek hetzelfde uitzien, hoewel ze niet nauw verwant zijn (bijvoorbeeld als gevolg van convergente evolutie ) of homologie , of wanneer twee soorten die nauw verwant zijn er heel anders uitzien omdat ze bijvoorbeeld in staat zijn om te veranderen in reageren heel goed op hun omgeving. Deze situaties komen veel voor in het plantenrijk. Een alternatieve methode voor het construeren van evolutionaire relaties is door middel van veranderingen in de DNA-sequentie van veel genen tussen de verschillende soorten, wat vaak robuuster is voor problemen van gelijkaardige soorten. Met de hoeveelheid genomische sequentie die door dit project wordt geproduceerd, zouden veel voorspelde evolutionaire relaties beter kunnen worden getest door sequentie-uitlijning om hun zekerheid te verbeteren. Met 383.679 nucleaire genfamilie-fylogenieën en 2.306 gen-leeftijdsverdelingen met Ks- plots gebruikt in de uiteindelijke analyse en gedeeld in GigaDB naast het sluitstukpapier.

Biotechnologische toepassingen

De lijst met plantengenomen waarvan de sequentie in het project werd bepaald, was niet willekeurig; in plaats daarvan werd gefocust op planten die waardevolle chemicaliën of andere producten produceren ( in veel gevallen secundaire metabolieten ) in de hoop dat het karakteriseren van de betrokken genen het mogelijk zou maken om de onderliggende biosynthetische processen te gebruiken of aan te passen. Er zijn bijvoorbeeld veel planten waarvan bekend is dat ze oliën produceren (zoals olijven) en sommige oliën van bepaalde planten vertonen een sterke chemische gelijkenis met aardolieproducten zoals de oliepalm en koolwaterstofproducerende soorten. Als deze fabrieksmechanismen kunnen worden gebruikt om massale hoeveelheden industrieel bruikbare olie te produceren, of zodanig kunnen worden gewijzigd dat ze dat doen, dan zouden ze van grote waarde zijn. Hier is het kennen van de volgorde van de genen van de plant die betrokken zijn bij de metabolische route die de olie produceert, een grote eerste stap om een dergelijk gebruik mogelijk te maken. Een recent voorbeeld van hoe natuurlijke biochemische routes worden gemanipuleerd, is Gouden rijst, waarbij de route genetisch is gewijzigd, zodat een voorloper van vitamine A in grote hoeveelheden wordt geproduceerd, waardoor de bruingekleurde rijst een mogelijke oplossing is voor vitamine A-tekort. Dit concept van het manipuleren van fabrieken om "werk" te doen is populair en het potentieel ervan zou dramatisch toenemen als gevolg van geninformatie over deze 1000 plantensoorten. Biosynthetische routes kunnen ook worden gebruikt voor massaproductie van medicinale verbindingen met behulp van planten in plaats van handmatige organische chemische reacties, zoals de meeste momenteel worden gecreëerd.

Een van de meest onverwachte resultaten van het project was de ontdekking van meerdere nieuwe lichtgevoelige ionkanalen die op grote schaal worden gebruikt voor optogenetische controle van neuronen die zijn ontdekt door middel van sequencing en fysiologische karakterisering van opsins van meer dan 100 soorten algensoorten door het project. De karakterisering van deze nieuwe channelrhodopsine- sequenties biedt bronnen voor eiwitingenieurs die normaal gesproken geen interesse zouden hebben in of het vermogen zouden hebben om sequentiegegevens van deze vele plantensoorten te genereren. Een aantal biotechbedrijven ontwikkelt deze channelrhodopsine- eiwitten voor medische doeleinden, waarbij veel van deze kandidaten voor optogenetische therapie klinisch worden getest om het gezichtsvermogen voor netvliesblindheid te herstellen . De eerste gepubliceerde resultaten van deze behandeling van retinitis pigmentosa komen uit in juli 2021.

Projectbenadering

Sequencing werd aanvankelijk gedaan op het Illumina Genome Analyzer GAII next-generation DNA-sequencing-platform bij het Beijing Genomics Institute (BGI Shenzhen, China), maar later werden monsters uitgevoerd op het snellere Illumina HiSeq 2000- platform. Beginnend met de 28 Illumina Genome Analyzer -DNA-sequencingmachines van de volgende generatie, werden deze uiteindelijk opgewaardeerd tot 100 HiSeq 2000-sequencers bij het Beijing Genomics Institute . De initiële capaciteit van 3 Gb/run (3 miljard basenparen per experiment) van elk van deze machines maakte een snelle en nauwkeurige sequentiebepaling van de plantmonsters mogelijk.

Soort selectie

De selectie van plantensoorten waarvan de sequentie moet worden bepaald, is tot stand gekomen door een internationale samenwerking van de verschillende financiers en onderzoeksgroepen die hun interesse in bepaalde planten kenbaar hebben gemaakt. Er was een focus op die plantensoorten waarvan bekend is dat ze een bruikbare biosynthetische capaciteit hebben om de biotechnologische doelen van het project te vergemakkelijken, en selectie van andere soorten om hiaten op te vullen en enkele onbekende evolutionaire relaties van de huidige plantenfylogenie te verklaren. Naast de biosynthetische capaciteit van industriële verbindingen, kregen plantensoorten waarvan bekend is of vermoed wordt dat ze medisch actieve chemicaliën produceren (zoals papavers die opiaten produceren ) een hoge prioriteit om het syntheseproces beter te begrijpen, het commerciële productiepotentieel te verkennen en nieuwe farmaceutische opties te ontdekken. Uit de traditionele Chinese geneeskunde (TCM) is een groot aantal plantensoorten met geneeskrachtige eigenschappen geselecteerd . De volledige lijst van geselecteerde soorten kan openbaar worden bekeken op de website, en methodologische details en details over de toegang tot gegevens zijn in detail gepubliceerd.

Transcriptoom versus genoomsequencing

In plaats van het hele genoom (alle DNA-sequenties) van de verschillende plantensoorten te sequensen, sequeneerde het project alleen die gebieden van het genoom die een eiwitproduct produceren ( coderende genen ); het transcriptoom . Deze benadering wordt gerechtvaardigd door de focus op biochemische routes waarbij alleen de genen die de betrokken eiwitten produceren nodig zijn om het synthetische mechanisme te begrijpen, en omdat deze duizenden sequenties voldoende sequentiedetail zouden vertegenwoordigen om zeer robuuste evolutionaire relaties te construeren door middel van sequentievergelijking. Het aantal coderende genen in plantensoorten kan aanzienlijk variëren, maar ze hebben er allemaal tienduizenden of meer, waardoor het transcriptoom een grote verzameling informatie is. De niet-coderende sequentie vormt echter het grootste deel (> 90%) van het genoomgehalte. Hoewel deze benadering conceptueel vergelijkbaar is met Expressed Sequence Tags (EST's), is het fundamenteel anders omdat de volledige sequentie van elk gen met een hoge dekking zal worden verkregen in plaats van slechts een klein deel van de gensequentie met een EST. Om de twee te onderscheiden, staat de niet-EST-methode bekend als "shotgun transcriptome sequencing".

Transcriptoom shotgun-sequencing

mRNA ( messenger-RNA ) wordt verzameld uit een monster, omgezet in cDNA door een reverse transcriptase-enzym en vervolgens gefragmenteerd zodat het kan worden gesequenced. Anders dan transcriptome shotgun sequencing , wordt deze techniek RNA-seq en whole transcriptome shotgun sequencing (WTSS) genoemd. Zodra de cDNA-fragmenten zijn gesequenced, worden ze de novo geassembleerd (zonder uitlijning met een referentiegenoomsequentie ) terug in de volledige gensequentie door alle fragmenten van dat gen te combineren tijdens de data-analysefase. Voor dit project werd een nieuwe a de novo transcriptoom-assembler geproduceerd die speciaal is ontworpen voor RNA-Seq. SOAPdenovo-Trans maakt deel uit van de SOAP-suite van genoomassemblagetools van de BGI .

Bemonstering van plantenweefsel

De monsters kwamen van over de hele wereld, met een aantal bijzonder zeldzame soorten die werden geleverd door botanische tuinen zoals de Fairy Lake Botanical Garden (Shenzhen, China). Het type weefsel dat werd verzameld, werd bepaald door de verwachte locatie van biosynthetische activiteit; als bijvoorbeeld bekend is dat een interessant proces of chemische stof voornamelijk in de bladeren voorkomt, werd een bladmonster gebruikt. Een aantal RNA-sequencing-protocollen werden aangepast en getest voor verschillende weefseltypes, en deze werden openlijk gedeeld via het protocols.io-platform.

Potentiële beperkingen

Omdat alleen het transcriptoom werd gesequenced, onthulde het project geen informatie over genregulerende sequentie , niet-coderende RNA's , DNA-repetitieve elementen of andere genomische kenmerken die geen deel uitmaken van de coderende sequentie. Op basis van de weinige genomen van hele planten die tot nu toe zijn verzameld, zullen deze niet-coderende regio's in feite het grootste deel van het genoom uitmaken, en het niet-coderende DNA kan in feite de belangrijkste oorzaak zijn van de verschillen in eigenschappen die tussen soorten worden waargenomen.

Aangezien mRNA het uitgangsmateriaal was, is de hoeveelheid sequentierepresentatie voor een bepaald gen gebaseerd op het expressieniveau (hoeveel mRNA-moleculen het produceert). Dit betekent dat sterk tot expressie gebrachte genen een betere dekking krijgen omdat er meer sequentie is om vanuit te werken. Het resultaat is dan dat sommige belangrijke genen mogelijk niet betrouwbaar zijn gedetecteerd door het project als ze op een laag niveau tot expressie worden gebracht en toch belangrijke biochemische functies hebben.

Van veel plantensoorten (vooral door landbouw gemanipuleerde soorten) is bekend dat ze grote genoombrede veranderingen hebben ondergaan door duplicatie van het hele genoom. De rijst- en tarwegenomen kunnen bijvoorbeeld 4-6 kopieën van hele genomen hebben ( tarwe ), terwijl dieren er meestal maar 2 hebben ( diploïdie ). Deze gedupliceerde genen kunnen een probleem vormen voor de de novo assemblage van sequentiefragmenten, omdat herhaalde sequenties de computerprogramma's verwarren wanneer ze proberen de fragmenten samen te voegen, en ze kunnen moeilijk te volgen zijn door de evolutie heen.

Vergelijking met het 1000 Genomes-project

overeenkomsten

Net als het Beijing Genomics Institute in Shenzhen, is China een van de belangrijkste genomics-centra die betrokken zijn bij het 1000 Genomes Project , het instituut is de locatie van de sequencing voor het 1000 Plant Genomes Project. Beide projecten zijn grootschalige inspanningen om gedetailleerde DNA-sequentie-informatie te verkrijgen om ons begrip van de organismen te verbeteren, en beide projecten zullen gebruik maken van next-generation sequencing om een tijdige voltooiing te vergemakkelijken.

Verschillen

De doelstellingen van de twee projecten verschillen aanzienlijk. Terwijl het 1000 Genomes Project zich richt op genetische variatie in een enkele soort, kijkt het 1000 Plant Genomes Project naar de evolutionaire relaties en genen van 1000 verschillende plantensoorten.

Terwijl het 1000 Genomes Project naar schatting tot $ 50 miljoen USD zou kosten, was het 1000 Plant Genomes Project niet zo duur; het verschil in kosten afkomstig van de doelsequentie in de genomen. Aangezien het 1000 Plant Genomes Project alleen het transcriptoom heeft gesequenced, terwijl het menselijke project zoveel van het genoom heeft gesequenced als haalbaar is, is er een veel lagere hoeveelheid sequencing-inspanning nodig bij deze meer specifieke benadering. Hoewel dit betekent dat er minder totale sequentie-output was in vergelijking met het 1000 Genomes Project , waren de niet-coderende delen van de genomen die waren uitgesloten in het 1000 Plant Genomes Project niet zo belangrijk voor de doelen als voor het menselijke project. Dus de meer gerichte aanpak van het 1000 Plant Genomes Project heeft de kosten geminimaliseerd en toch zijn doelen bereikt.

Financiering

Het project werd gefinancierd door Alberta Innovates - Technology Futures (fusie van iCORE [1] ), Genome Alberta , de Universiteit van Alberta , het Beijing Genomics Institute (BGI) en Musea Ventures (een in de VS gevestigde particuliere investeringsmaatschappij). Tot op heden ontving het project $ 1,5 miljoen CAD van de regering van Alberta en nog eens $ 0,5 miljoen van Musea Ventures. In januari 2010 kondigde BGI aan dat het $ 100 miljoen zou bijdragen aan grootschalige sequencing-projecten van planten en dieren (inclusief het 1000 Plant Genomes Project en vervolgens het 10.000 Plant Genome Project).

Gerelateerde projecten

  • The 1000 Genomes Project - Een diepgaande catalogus van menselijke genetische variatie
  • The 1001 Genomes Project Sequencing van het hele genoom van 1001 Arabidopsis- stammen
  • Genoom 10K - Gehele genoomsequentie van 10.000 gewervelde soorten

Zie ook

Referenties

Externe links

Opiniones de nuestros usuarios

Marion Meijer

Eindelijk! Tegenwoordig schijnt het dat als ze je geen artikelen van tienduizend woorden schrijven, ze niet blij zijn. Heren content schrijvers, dit IS een goed artikel over Project 1000 plantengenomen

Anja Bosman

Eindelijk een artikel over Project 1000 plantengenomen dat makkelijk te lezen is., Bedankt voor deze post over Project 1000 plantengenomen