Sequenzanalyse, Sommersemester 2023


392105/06,06,06 Stoye, Schulz Sommer 2023 Di 10-12 und Do 10-12, T2-204

Kurzbeschreibung

Sequenzen sind allgegenwärtig. Texte und Programme, Gene und Proteine, Polygonzüge, Sprach- und Bildsignale und digitalisiertes Vogelzwitschern werden dargestellt als Zeichenfolgen über einem endlichen Alphabet. Entsprechend vielfältig sind die algorithmischen Fragestellungen. Oft ist dabei der Datenumfang sehr groß, so dass die algorithmische Komplexität von entscheidender praktischer Bedeutung ist.

In der Vorlesung werden Algorithmen zum effizienten Vergleich von Sequenzen und zur Suche exakter und approximativer Muster in Sequenzen behandelt. Viele dieser Algorithmen sind durch bioinformatische Fragestellungen motiviert. Sie finden jedoch auch Anwendungen in anderen Bereichen wie z.B. der Textverarbeitung und der Datenkompression.

Literatur

  • Das Skript zur Vorlesung: Sequenzanalyse-Skript
  • Gusfield, D.: Algorithms on Strings, Trees, and Sequences: Computer Science and Computational Biology. Cambridge University Press, New York, 1997.
  • Setubal, J. and Meidanis, J.: Introduction to Computational Biology. PWS Publishing, Boston, M.A., 1997.

Organisatorisches

  • Die Modulbeschreibung enthält einige Rahmenbedingungen der Veranstaltung.
  • Zur Teilnahme an der Vorlesung und Klausur sind diejenigen berechtigt, welche die A&D-Klausur bestanden haben oder im WS2022/23 zur A&D-Klausur zugelassen waren. Ansonsten bitte Rücksprache.
  • Erfolgreiches Lösen der Übungsaufgaben (Bestehensgrenze 50% der Punkte) und aktive Teilnahme in den Tutorien (mindestens zweimal Vorrechnen) ist Voraussetzung für die Teilnahme an der Abschlussklausur oder der abschließenden mündlichen Prüfung.

Übungen

Abgabeschluss der wöchentlichen Übungsaufgaben ist jeweils Donnerstag 12:00 Uhr. Gleichzeitig wird ein neuer Übungszettel auf dieser Seite veröffentlicht werden. Abgaben müssen direkt per E-mail an den*die jeweilige*n Tutor*in geschickt werden.

Termin Tutor*in eKVV
Di 16-18, V4-106 Tizian Schulz Übungen A
Mo 10-12, U10-146 Lennart Finke Übungen B
Di 16-18, U10-146 Leonie Brockmann Übungen C

Prüfungstermine

  1. Klausur: 20.07.2023 10-12 Uhr, Raum H6.
  2. Zweitprüfung (mündlich): im September 2023, U10-147. Termin bitte im Sekretariat bei Heike Samuel vereinbaren.

Übungszettel

Woche Datum Thema Abschnitt im Skript Übungszettel Präsenzübungszettel
14 04./06.04.2023 Di: Einleitung, Logistik
Do: Grundlagen
1
2

Blatt 01

Präsenzblatt 01
15 11./13.04.2023 Di: Metriken auf Sequenzen
Do: Berechnung der Edit-Distanz
3.1-3.5
3.6

Blatt 02

Präsenzblatt 02
16 18./20.04.2023 Di: q-Gramm-Distanz (TS)
Do: Maximal-Matches-Distanz
3.7
3.8-3.9

Blatt 03

Präsenzblatt 03
17 25./27.04.2023 Di: Paarweises Sequenzalignment
Do: Alignment-Varianten
4.1-4.4
4.5

Blatt 04

Präsenzblatt 04
18 02./04.05.2023 Di: Gapkosten, Suboptimale Lokale Alignments
Do: Approximative Textsuche, Hirschberg-Algorithmus (TS)
4.6-5.1
5.2-5.4

Blatt 05

Präsenzblatt 05
19 09./11.05.2023 Di: Paarweises Alignment in der Praxis
Do: Suffixbäume: Definition, WOTD-Algorithmus
6
7.1-7.6

Blatt 06

Präsenzblatt 06
20 16./18.05.2023 Di: Anwendungen von Suffixbäumen I
Do: –
7.7.1-7.7.2

Blatt 07

Präsenzblatt 07
21 23./25.05.2023 Di: Anwendungen von Suffixbäumen II
Do: –
7.7.3-7.7.4

Blatt 08

Präsenzblatt 08
22 30.05./01.06.2023 Di: Suffix-Arrays
Do: Burrows-Wheeler-Transformation
8
9

Blatt 09

Präsenzblatt 09
23 06./08.06.2023 Di: Multiples Sequenzanlignment: Definitionen 10.1-10.4

Blatt 10

Präsenzblatt 10
24 13./15.06.2023 Di: Komplexitätsanalyse
Do: Algorithmen für Multiples Alignment I (TS)
10.5
11.1-11.3

Blatt 11

Präsenzblatt 11
26 20./22.06.2023 Di: Algorithmen für Multiples Alignment II
Do: Baumalignment, Genomalignment
11.4-11.5
12-13

Blatt 12
29 18./20.07.2023 Di: Wiederholung/Fragestunde
Do: Klausur