Grundlagen der Sequenzanalyse

Dr. Sven Rahmann, Dipl.-Bioinf. Katharina Jahn

Vorlesung 392011 und Übungen 392012 im Wintersemester 2006/2007
Donnerstag 8:30 bis 10:00 Uhr in H3


Aktuelles

Die {{:teaching:2006winter:sequenzanalyse:klausur1-aushang.pdf | Ergebnisse }} der Klausur vom 08.02.2007 stehen hier zum Download bereit und hängen auch vor U10-146 aus.

Wichtig für die Nachklausur: Bitte vor dem 1.3. in die Liste vor U10-146 eintragen, ggf. unmögliche Termine angeben. Geplant ist ein Termin Ende März. Aus rechtlichen Gründen muss die Nachklausur noch im Wintersemester stattfinden.

Kurzbeschreibung

Sequenzen sind allgegenwärtig. Texte und Programme, Gene und Proteine, Polygonzüge, Sprach- und Bildsignale und digitalisiertes Vogelzwitschern werden dargestellt als Zeichenfolgen über einem endlichen Alphabet. Entsprechend vielfältig sind die algorithmischen Fragestellungen. Oft ist dabei der Datenumfang sehr groß, so dass die algorithmische Komplexität von entscheidender praktischer Bedeutung ist.
In der Vorlesung werden Algorithmen zum effizienten Vergleich von Sequenzen und zur Suche exakter und approximativer Muster in Sequenzen behandelt. Viele dieser Algorithmen sind durch bioinformatische Fragestellungen motiviert. Sie finden jedoch auch Anwendungen in anderen Bereichen wie z.B. der Textverarbeitung und der Datenkompression.

Voraussetzungen

Literatur

Übungen

Einteilung in der ersten Vorlesung am 19.10. Nach- und Ummeldungen bitte an Katharina Jahn .

Zeitplan

Datum Vorlesung Übungsblatt Abgabe
19.10.2006 Organisatorisches; Metriken auf Sequenzen {{:teaching:2006winter:sequenzanalyse:blatt01.pdf | Blatt 1 }} 26.10.2006
26.10.2006 Edit-Operationen, Edit-Distanz und verwandte Distanzen {{:teaching:2006winter:sequenzanalyse:blatt02.pdf | Blatt 2 }} 02.11.2006
02.11.2006 Maximal matches Distanz {{:teaching:2006winter:sequenzanalyse:blatt03.pdf | Blatt 3 }} 09.11.2006
09.11.2006 q-gram Distanz {{:teaching:2006winter:sequenzanalyse:blatt04.pdf | Blatt 4 }} 16.11.2006
16.11.2006 Äquivalenz von Distanzen und Ähnlichkeiten {{:teaching:2006winter:sequenzanalyse:blatt05.pdf | Blatt 5 }} 23.11.2006
23.11.2006 Paarweises Sequenzalignment (global, lokal, Varianten) {{:teaching:2006winter:sequenzanalyse:blatt06.pdf | Blatt 6 }} 30.11.2006
30.11.2006 Affine Gapkosten, suboptimale Alignments, Sellers' Algorithmus {{:teaching:2006winter:sequenzanalyse:blatt07.pdf | Blatt 7 }} 07.12.2006
07.12.2006 Dotplots, BLAST, FASTA {{:teaching:2006winter:sequenzanalyse:blatt08.pdf | Blatt 8 }}
{{:teaching:2006winter:sequenzanalyse:gpcrs.fasta.txt | GPCRs.fasta }}
14.12.2006
14.12.2006 FASTA, SWIFT, q-gram Index {{:teaching:2006winter:sequenzanalyse:blatt09.pdf | Blatt 9 }} 21.12.2006
21.12.2006 Statistik von Matches und lokalen Alignments
Suffixbäume
{{:teaching:2006winter:sequenzanalyse:blatt10.pdf | Blatt 10 }} 11.01.2007
11.01.2007 Suffixbäume und Suffix-Arrays {{:teaching:2006winter:sequenzanalyse:blatt11.pdf | Blatt 11 }} 18.01.2007
18.01.2007 Konstruktion von Suffixbäumen und Suffix-Arrays {{:teaching:2006winter:sequenzanalyse:blatt12.pdf | Blatt 12 }} 25.01.2007
25.01.2007 {{:teaching:2006winter:sequenzanalyse:blatt13.pdf | Blatt 13 }} 01.02.2007
01.02.2007 PSSMs, Sequenzlogos. Wiederholung --- ---
08.02.2007 Klausur um 8:15 in H3. Beginn: 8:30 Uhr. --- ---

Scheinkriterien und Informationen zur Klausur