Begriff in der Genetik. Als Transkriptionseinheit wird die transkribierte Sequenz zusammen mit Promotor und Terminator bezeichnet.
Transkriptionseinheit
Definition
Allgemeine Information
Im menschlichen Genom befinden sich etwa 3 Milliarden Basenpaare, die die Information von ungefähr 23.000 Genen in sich tragen. Nur etwa 1% der DNA wird in mRNA transkribiert. Dabei sind die Gene, die transkribiert werden unterschiedlich groß, durchschnittlich etwa 3.000 Basenpaare lang. Das menschliche Genom verfügt jedoch auch über einige Riesengene. So das Gen das für die Muskeldystrophie Typ Duchenne verantwortlich gemacht wird und etwa 2,5 Millionen Basenpaare umfasst.
Bevor ein Gen transkribiert werden kann, muss es im Erbgut gefunden werden. Und weiterhin findet die Transkription nicht entlang des gesamten DNA-Strangs statt, sondern nur an einem bestimmten Abschnitt. Dieser wird durch die Initiations- und die Terminationstelle (Terminator) definiert. Zwischen diesen beiden Punkten befindet sich die transkribierte Sequenz.
Die RNA-Polymerase beginnt die Transkription an der Initiationsstelle, die sich in einem Promotor befindet. Der Promotor ist ein bestimmter Bereich im DNA-Strang, die von der Polymerase erkannt wird. Bei Eukaryoten ortet die RNA-Polymerase II den Promotor beispielsweise durch das Vorhandensein der sog. TATA-Box. Diese ist nach ihrer Basensequenz TATAAA benannt. Die TATA-Sequenz verrät dem Transkriptionsenzym, dass die zu transkribierende Sequenz nur noch etwa 30 Basenpaare, in 5´Richtung (häufig auch als stromabwärts bezeichnet) entfernt ist. Sequenzen wie die TATAAA-Sequenz in der TATA-Box, die in fast allen Lebewesen vorkommen, bezeichnet man auch als Consensus-Sequenzen. Diese Sequenzen haben stets dieselbe Bedeutung! Die TATA-Box gibt nicht nur die Position des Gens an, sondern auch auf welchem Strang die Informationen liegen. Tatsächlich können die Gene auf beiden strängen leigen, aber jedes Gen wird nur in 5`Richtung gelesen und die mRNA von 5`nach 3` synthetisiert.
Die sog. Transkriptionsfaktoren können der RNA-Polymerase helfen, die Initiationsstelle für die Transkription zu finden. Die DNA liegt stets als Doppelhelix vor. Die RNA-Polymerase spreizt die beiden Stränge des DNA-Moleküls und bewegt sich in der Richtung 3′ zu 5′ der DNA oder von 5′ zu 3′ auf der Prä-Messenger-RNA. Die Bezeichnung 5’ bzw. 3’ für die Enden eines DNA- oder RNA-Strangs stammen von den Nukleotiden, aus denen DNA und RNA aufgebaut sind: Alle Nukleotide haben eine Pentose, einen Zucker mit fünf Kohlenstoffatomen. Die Nukleotide sind an den Pentosen miteinander verbunden, und zwar immer das 5. Kohlenstoffatom des einen Nukleotids mit dem 3. Kohlenstoffatom des nächsten Nukleotids. Deshalb ist an einem Ende eines DNA- oder RNA-Stranges ein Nukleotid mit einem freien 5. Kohlenstoff und am anderen Ende ein Nukleotid mit einem freien 3. Kohlenstoff zu finden.
Gegenüber dem codierenden Strang der DNA verbindet die Polymerase Nukleotide, die sich mit denen der DNA paaren: die Nukleotide G (Guanin) und C (Cytosin) passen zusammen, ebenso das Nukleotid A (Adenin) mit T (Thymin) und U (Uracil). Die RNA hat im Gegensatz zur DNA keine Base T (Thymin), sondern stattdessen die Base U (Uracil).
Während der Elongation wird eine Prä-Messenger-RNA synthetisiert. Die RNA-Polymerase stoppt an der Terminationsstelle der Transkription. Anschließend reift die Prä-Messenger-RNA zur mRNA, die an Ribosomen im Zytoplasma in ein Protein übersetzt wird (Translation).