Eine Gründliche Charakterisierung der strukturelle Varianten im menschlichen Genom

Human Genome variieren ziemlich viel von Individuum zu Individuum. Diese Unterschiede sind Einzel-Nukleotid-änderungen, oder „Rechtschreibfehler“ in der DNA-Sequenz, aber noch mehr variation kommt von den strukturellen Varianten, zu denen auch Ergänzungen, Löschungen und Umstellungen von großen DNA-Segmente. Eine aktuelle Studie mehrfach verwendet fortschrittliche Technologien, um tiefer Tauchen als je zuvor umfassend zu charakterisieren, die strukturelle Varianten in drei Familien, und welche funktionellen Konsequenzen haben könnte.

Die Genom-Sequenzierung sehr viel schneller, genauer und weniger teuer im letzten Jahrzehnt. Als Ergebnis, mehr und mehr menschliche Genome sequenziert werden, und unser wissen, was diese Sequenzen eigentlich für die Funktion und Krankheiten wächst rasant.

Es ist auch deutlich geworden, dass je mehr wir lernen, desto mehr schätzen wir, wie wenig wir noch wissen über das menschliche Genom. Während eine lineare Abfolge von ATGCs sieht ordentlich, unsere Genome sind eigentlich dynamische Entitäten, die im Hafen erhebliche Unterschiede zwischen Personen—Unterschiede, die verändern können Merkmale einen Beitrag zur normalen Funktion und Krankheit.

Der genetische Unterschied zwischen Individuen trägt zu unserer Individualität. Diese Unterschiede sind Millionen von Einzel-Nukleotid-Varianten—wo, zum Beispiel, eine person kann Eine a -, eine C-zu einer gegebenen position. Es gibt auch Hunderte von tausenden von strukturellen Varianten (SVs). SVs gehören DNA-Segmente, die eingefügt oder gelöscht werden aus der Genom-Segmente, die dupliziert werden, und Segmente, die invertiert sind. SVs sind schwieriger zu identifizieren als Einzel-Nukleotid-Varianten und daher war nicht klar, wie viele SVs-wirklich existieren, die in einer gegebenen menschlichen Genoms.

Nun ein Papier mit dem Titel „Multi-Plattform-Entdeckung der haplotyp-gelöst strukturelle Variationen im menschlichen Genom“, veröffentlicht in Nature Communications, taucht noch tiefer in die einzelnen genomischen Unterschiede als je zuvor.

Die Arbeit an einem großen internationalen team von Forschern des Human Genome Structural Variation Consortium (HGSVC), geführt von Erster co-Autoren Mark Chaisson, Ph. D., Ashley Sanders, Ph. D., und Xuefang Zhao, Ph. D. Sie verwendet eine vollständige suite von genomischen Technologien umfassend zu analysieren, das Erbgut von drei Familien-trios (Eltern und Kind). Die verwendeten Technologien sind lange zu Lesen, kurz Lesen, und Strang-spezifischen-Sequenzierung-Technologien, optische Zuordnung und mehrere computer-algorithmen für die SV-Erkennung. Die Ergebnisse präsentieren die umfangreichen Katalog der SVs bisher in der Kinder-Genome, einschließlich Informationen über welche elterlichen Chromosomen jeder SV auf.

In Zusammenfassung, die Forscher identifizierten im Durchschnitt 818,054 kleine Insertionen und Deletionen (genomische Veränderungen, die jeder betroffene weniger als 50 Basen der DNA) und 27,622 SVs (genomische Veränderungen, die betroffenen 50 Basen oder mehr DNA) pro Genom. Bemerkenswert fanden Sie auch einen Durchschnitt von 156 Inversionen pro Genom, von denen viele durchschnitten mit genomischen Regionen, die im Zusammenhang mit der genetischen Krankheit-Syndrome. Die Forscher fanden heraus, dass mehr als 100.000 Varianten pro Individuum tatsächlich verpasste durch die routine-Sequenzierung Technologien und Häufig verwendeten computer-algorithmen. Zum Beispiel 83% der Insertionen identifiziert wurden vermisst, die von standard-short-read-Aufruf von algorithmen. In der Tat, die wahren zahlen der SVs in einer gegebenen menschlichen Genom erscheint drei – bis sieben-fache mehr, als die meisten Studien in der Regel identifizieren.