Bioinformatik

Grundlagen, Algorithmen, Anwendungen
 
 
Wiley-VCH (Verlag)
  • 4. Auflage
  • |
  • erschienen am 15. August 2022
  • |
  • 752 Seiten
 
E-Book | ePUB mit Adobe-DRM | Systemvoraussetzungen
978-3-527-83389-4 (ISBN)
 
Der Marktführer bei den Bioinformatiklehrbüchern in neuer Auflage und mit dem neuen Thema Molekulardynamik

Bioinformatik ist eine Kerndisziplin in den modernen Biowssenschaften, von der Biotechnologie über die Biochemie und Molekularbiologie bis zur Molekulargenetik und Molekularmedizin. Sie ist eine essenzielle Grundlage für alle "omics"-Technologien, für die Strukturbiologie, die Systembiologie sowie die synthetische Biologie.

Bioinformatik. Grundlagen, Algorithmen, Anwendungen bietet eine umfassende Einführung in die wichtigsten Methoden der Bioinformatik. Der Autor erklärt dabei sowohl die mathematischen und biologischen Grundlagen als auch die wichtigsten Software-Tools und deren Anwendungsbereiche. Schwerpunkte sind Methoden zum Sequenzvergleichs, Verfahren zur Charakterisierung von Proteinfamilien, Algorithmen zur Vorhersage von Protein- und RNA-Strukturen, Methoden des maschinellen Lernens und das Proteindesign.

Für die 4. Auflage wurde der Text durchgehend aktualisiert und um ein Kapitel zur Molekulardynamik erweitert. Neu aufgenommene Exkurse zu Meilensteinen der Bioinformatik und aktuellen Anwendungsgebieten lockern den Text auf. Auf der ebenfalls komplett überarbeiteten Begleit-Webseite werden interaktive Lernmodule bereitgestellt, einschließlich mehr als 120 Übungsaufgaben, zum Teil mit Lösungen.
Eine perfekte Einführung für alle Studenten der Lebenswissenschaften oder Informatik, die einen Einblick in die gängigen Methoden der Bioinformatik benötigen, sowie ein wertvoller Begleiter für alle, die bereits bioinformatische Werkzeuge nutzen und die zugrundeliegenden Konzepte verstehen möchten.
4. Auflage
  • Deutsch
  • Großbritannien
  • Überarbeitete Ausgabe
  • Reflowable
  • 120
  • |
  • 100 s/w Abbildungen, 30 s/w Tabellen, 120 farbige Abbildungen
  • 21,13 MB
978-3-527-83389-4 (9783527833894)
weitere Ausgaben werden ermittelt
Rainer Merkl war von 2004 bis zu seiner Emeritierung im Jahr 2020 Professor für Bioinformatik am Lehrstuhl Biochemie II der Universität Regensburg. Nach seiner Promotion in Göttingen im Fach Genetik habilitierte er sich in Regensburg für das Fach Bioinformatik. Rainer Merkl war am Max Planck Institut für Biochemie, Martinsried und der Universität Göttingen tätig. Neben seiner Lehrtätigkeit in Regensburg für Biologen und Biochemiker bildete er an der Fernuniversität Hagen viele Jahre lang Informatiker im Fach Bioinformatik aus.
GRUNDLAGEN - BIOLOGIE UND DATENBANKEN
Biologische Grundlagen
Sequenzen und ihre Funktion
Datenbanken
LERNEN, OPTIMIEREN UND ENTSCHEIDEN
Grundbegriffe der Stochastik
Bayessche Entscheidungstheorie und Klassifikatoren
Klassische Cluster- und Klassifikationsverfahren
Neuronale Netze
Genetische Algorithmen
ALGORITHMEN UND MODELLE DER BIOINFORMATIK
Paarweiser Sequenzvergleich
Sequenz-Motive
Scoring-Schemata
FASTA und die BLAST-Suite
Multiple Sequenzalignments und Anwendungen
Grundlagen phylogenetischer Analysen
Markov-Ketten und Hidden-Markov-Modelle
Profil-HMMs
Support-Vektor Maschinen
Molekulardynamik (NEU)
Vorhersage der Sekundärstruktur
Vergleich von Protein-3D-Strukturen
Vorhersage der Protein-3D-Struktur
Analyse integraler Membranproteine
Entschlüsselung von Genomen
Auswertung von Genexpressionsdaten
Analyse von Protein-Protein-Interaktionen
Big Data: Herausforderungen und Möglichkeiten

1
Biologische Grundlagen


In den folgenden Kapiteln beschäftigen wir uns meist mit Algorithmen, die Eigenschaften von Makromolekülen bewerten oder vergleichen. Für das Verständnis der Algorithmen und der zugrunde liegenden informatischen Methoden und Modellieransätze benötigen wir relativ wenige biologische Grundkenntnisse, die in diesem Kapitel eingeführt werden. Zu den wichtigsten molekularbiologischen Substanzklassen gehören DNA, RNA und Proteine. Dies sind Makromoleküle, die jeweils aus einer Abfolge kleinerer Bausteine bestehen. Die DNA ist beispielsweise aus Nukleotiden aufgebaut und deren lineare Anordnung kann in Form einer Zeichenkette (Sequenz) angegeben werden. Das Konzept der Sequenzen betrachten wir im nächsten Kapitel genauer, im Folgenden konzentrieren wir uns zunächst auf biochemische und biophysikalische Eigenschaften der genannten Molekülklassen.

Die DNA ist der wichtigste Datenträger in der Molekularbiologie; das Genom einer Spezies, das die komplette genetische Information enthält, ist in DNA-Molekülen codiert. In den letzten Jahrzehnten wurden Hochdurchsatzmethoden entwickelt, die es erlauben, DNA-Sequenzen mit geringem Aufwand und in kurzer Zeit zu ermitteln. Aus diesen Gründen werden bevorzugt Genomsequenzen bestimmt, da deren Kenntnis häufig ausreicht, die Komposition der anderen Makromoleküle (RNA und Proteine) abzuleiten. Die biologische Bedeutung der RNA hat durch neuere Erkenntnisse enorm zugenommen. Es ist klar geworden, dass RNA-Moleküle nicht nur an der Umsetzung der genetischen Information in Proteine beteiligt sind. Sie übernehmen in erheblichem Ausmaß auch Regulationsaufgaben, was lange unbekannt war. Proteine sind die wichtigsten Baustoffe aller biologischen Zellen. Sie geben den Zellen oft ihre Struktur und sind beispielsweise in Form von Enzymen essenzielle Komponenten der meisten Stoffwechselvorgänge.

Die In-vivo-Funktion von DNA, RNA und Proteinen kann nur anhand der dreidimensionalen Molekülstruktur verstanden werden. Im Vergleich zu den eher uniformen Raumstrukturen der DNA- und RNA-Moleküle bilden Proteine eine enorme Vielfalt unterschiedlichster Strukturen aus. Deswegen nimmt im Folgenden die Darstellung von Proteinarchitekturen einen breiteren Raum ein. Nach der Beschreibung typischer Protein-3-D-Strukturen beschäftigen wir uns mit Proteineigenschaften, die in bioinformatischen Algorithmen von Bedeutung sind.

Die in der Natur vorkommende Vielfalt von Lebewesen ist entstanden, weil sich vererbte organische Strukturen aufgrund von Evolutionsvorgängen in den biologischen Arten unterschiedlich entwickelt haben. Wir müssen uns daher auch mit dem Wesen von biologischen Evolutionsprozessen beschäftigen, da diese einen wesentlichen Teil der informatischen Modellbildung ausmachen. Das Kapitel schließt mit einer Definition wichtiger Fachbegriffe.

Abb. 1.1 Raumstruktur der DNA. In diesem DNA-Fragment ist die Doppelhelix gut zu erkennen. Die basischen Anteile der Nukleotide sind nach innen gerichtet und durch Wasserstoffbrücken verknüpft. Die Wasserstoffbrücken sind in dieser Abbildung nicht markiert. Außen verlaufen die Zucker-Phosphat-Anteile der polymerisierten Nukleotide; sie sind orange dargestellt. Die Raumstruktur dieses DNA-Fragments wurde mit experimentellen Methoden bestimmt, sodass die exakte Position aller DNA-Elemente bekannt ist und visualisiert werden kann.

1.1 DNA


Im bioinformatischen Kontext beschreiben Sequenzen in der Regel eine bestimmte Abfolge von Einzelbausteinen, die aus einer kleinen und definierten Menge stammen. So sind DNA-Sequenzen einfache Modelle für Makromoleküle der Desoxyribonucleinsäure (abgekürzt DNS oder DNA), die in der Natur als fädige Struktur vorliegt. Die Grundbausteine sind vier Nukleotide, diese bestehen jeweils aus

  • einem Zucker (in der DNA: Desoxyribose),
  • einer der zwei Purin-(Adenin, Guanin) oder zwei Pyrimidinbasen (Cytosin, Thymin),
  • einem Phosphatrest.

Abb. 1.2 Basenpaarungen in der DNA. In der als Doppelhelix bekannten DNA-Struktur liegen sich jeweils paarweise die Basen Adenin und Thymin oder Guanin und Cytosin gegenüber. Zwischen A:T-Paaren können zwei und zwischen G:C-Paaren drei Wasserstoffbrücken ausgebildet werden. Je höher der Anteil von G:C-Paaren ist, desto mehr Energie muss für das Trennen der beiden Stränge einer DNA-Doppelhelix aufgewendet werden.

Ein DNA-Strang ist aus einer Abfolge von Nukleotiden aufgebaut und in der Zelle kommt die DNA üblicherweise in doppelsträngiger Form vor, die eine Doppelhelix bildet. In der Helix stehen sich Nukleotide paarweise gegenüber, wobei nur zwei Paarungen zugelassen sind (siehe Abb. 1.1 und 1.2). In den Zellkernen höherer Arten ist die DNA um Nukleosomen gewickelt, die sich zu komplexeren Strukturen zusammenlagern. Dieser Befund ist für die bioinformatischen Kernalgorithmen ohne Belang.

Wasserstoffbrücken

Die Funktion und Struktur von Makromolekülen wird maßgeblich durch Wasserstoffbrücken determiniert. Eine Wasserstoffbrücke ist eine anziehende elektromagnetische Wechselwirkung zwischen einem kovalent in einem Molekül gebundenen Wasserstoff und einem elektronegativen Atom wie Stickstoff oder Sauerstoff. Diese Bindung kann im Gegensatz zu einer kovalenten Atombindung mit geringem Energieaufwand gelöst werden.

Reverses Komplement

Aufgrund des chemischen Aufbaus der Nukleotide hat jeder DNA-Strang beliebiger Länge eine eindeutige Orientierung mit jeweils einem freien 3´-OH- und einem 5´-OH-Ende. Sequenzen werden nach Übereinkunft stets so geschrieben, dass das 5´-OH-Ende links und das 3´-OH-Ende rechts steht. In vivo ist die DNA-Doppelhelix meist zu einem Ring geschlossen, z. B. in Chromosomen oder Plasmiden. Darin sind die beiden komplementären DNA-Stränge gegenläufig angeordnet. Die durch den Aufbau vorgegebene Orientierung bedingt die Richtung, in der Gene abgelesen werden. Da Gene auf beiden Strängen codiert sein können, in Datensammlungen jedoch nur die Sequenz eines Stranges abgelegt wird, muss zum Bestimmen der Sequenz des Gegenstranges das reverse Komplement gebildet werden.

1.2 Genetischer Code und Genomkomposition


Die Sequenzinformation eines jeden Proteins ist in Form eines Gens in der DNA-Sequenz codiert. Jeweils drei direkt aufeinanderfolgende Nukleotide, die nicht überlappend abgelesen werden, codieren für eine Aminosäure. Eine solche Nukleotidgruppe wird Triplett oder Codon genannt. Die Abbildung der 64 Tripletts auf die 20 Aminosäuren heißt genetischer Code, dieser ist in Tab. 1.1 dargestellt. Der Code ist quasi universell, abweichende Codonzuordnungen finden sich aber z. B. bei Mitochondrien, Mycoplasma und einigen Protozoen [1]. Stoppcodonen terminieren die für Proteine codierenden Gensequenzen.

Tab. 1.1 Der genetische Code. Die Zahlen geben die Nukleotidposition im Codon an. In einigen speziellen Fällen, wie in mitochondrialen Genomen, kann es Abweichungen von diesem kanonischen Code geben. Die Namen der Aminosäuren sind im Dreibuchstabencode angegeben (siehe Tab. 2.2 in Kap....

Dateiformat: ePUB
Kopierschutz: Adobe-DRM (Digital Rights Management)

Systemvoraussetzungen:

Computer (Windows; MacOS X; Linux): Installieren Sie bereits vor dem Download die kostenlose Software Adobe Digital Editions (siehe E-Book Hilfe).

Tablet/Smartphone (Android; iOS): Installieren Sie bereits vor dem Download die kostenlose App Adobe Digital Editions oder die App PocketBook (siehe E-Book Hilfe).

E-Book-Reader: Bookeen, Kobo, Pocketbook, Sony, Tolino u.v.a.m. (nicht Kindle)

Das Dateiformat ePUB ist sehr gut für Romane und Sachbücher geeignet - also für "fließenden" Text ohne komplexes Layout. Bei E-Readern oder Smartphones passt sich der Zeilen- und Seitenumbruch automatisch den kleinen Displays an. Mit Adobe-DRM wird hier ein "harter" Kopierschutz verwendet. Wenn die notwendigen Voraussetzungen nicht vorliegen, können Sie das E-Book leider nicht öffnen. Daher müssen Sie bereits vor dem Download Ihre Lese-Hardware vorbereiten.

Bitte beachten Sie bei der Verwendung der Lese-Software Adobe Digital Editions: wir empfehlen Ihnen unbedingt nach Installation der Lese-Software diese mit Ihrer persönlichen Adobe-ID zu autorisieren!

Weitere Informationen finden Sie in unserer E-Book Hilfe.


Als Download verfügbar

70,99 €
inkl. 7% MwSt.
E-Book Einzellizenz
ePUB mit Adobe-DRM
siehe Systemvoraussetzungen
E-Book bestellen