Sequenzanalyse, Sommersemester 2021


392105/06,06,06 Stoye, Dias Vieira Braga Sommer 2021 Di 10-12 und Do 10-12 online, Di 16-18, Di 16-18, Mi 16-18

Kurzbeschreibung

Sequenzen sind allgegenwärtig. Texte und Programme, Gene und Proteine, Polygonzüge, Sprach- und Bildsignale und digitalisiertes Vogelzwitschern werden dargestellt als Zeichenfolgen über einem endlichen Alphabet. Entsprechend vielfältig sind die algorithmischen Fragestellungen. Oft ist dabei der Datenumfang sehr groß, so dass die algorithmische Komplexität von entscheidender praktischer Bedeutung ist.

In der Vorlesung werden Algorithmen zum effizienten Vergleich von Sequenzen und zur Suche exakter und approximativer Muster in Sequenzen behandelt. Viele dieser Algorithmen sind durch bioinformatische Fragestellungen motiviert. Sie finden jedoch auch Anwendungen in anderen Bereichen wie z.B. der Textverarbeitung und der Datenkompression.

Literatur

  • Das Skript zur Vorlesung: Sequenzanalyse-Skript
  • Gusfield, D.: Algorithms on Strings, Trees, and Sequences: Computer Science and Computational Biology. Cambridge University Press, New York, 1997.
  • Setubal, J. and Meidanis, J.: Introduction to Computational Biology. PWS Publishing, Boston, M.A., 1997.

Organisatorisches

  • Die Modulbeschreibung enthält einige Rahmenbedingungen der Veranstaltung.
  • Zur Teilnahme an der Vorlesung und Klausur sind diejenigen berechtigt, welche die A&D-Klausur bestanden haben oder im WS2020/21 zur A&D-Klausur zugelassen waren.
  • Erfolgreiches Lösen der Übungsaufgaben (Bestehensgrenze 50% der Punkte) und aktive Teilnahme in den Tutorien (mindestens zweimal Vorrechnen) ist Voraussetzung für die Teilnahme an der Abschlussklausur oder der abschließenden mündlichen Prüfung.
  • Die Übungszettel werden wöchentlich Donnerstag mittags auf dieser Seite online geschaltet. Gleichzeit endet dann auch die Abgabefrist der Übungszettel der vorangegangenen Woche. Die Lösungen müssen per E-mail an die jeweilige Tutorin geschickt werden.

:!: Achtung: Die Veranstaltung findet live per Videokonferenz statt. Informationen hierzu werden kurz vor Beginn am 13.4.2020 an alle eingetragenen Teilnehmer*innen verschickt.

Übungen

Abgabeschluss der wöchentlichen Übungsaufgaben ist jeweils Donnerstag 12:00 Uhr. Gleichzeitig wird ein neuer Übungszettel auf dieser Seite veröffentlicht werden. Abgaben müssen direkt per E-mail an die jeweilige Tutorin geschickt werden.

Termin Tutorin eKVV
Dienstag 16-18 Uhr Marilia Dias Vieira Braga Online-Tutorium 1
Dienstag 16-18 Uhr Rebecca K. Pfeil Online-Tutorium 2
Mittwoch 16-18 Uhr Leonie Brockmann Online-Tutorium 3

Prüfungstermine

  1. Klausur: 22. Juli 2021, 10:15 - 11:45 (Präsenzklausur, sofern möglich)
  2. Nachklausur: 16. September 2021, 10:15 - 11:45 (Präsenzklausur, sofern möglich)

Übungszettel

Woche Datum Thema Abschnitt im Skript Übungszettel
15 13./15.04.2021 Di: Einleitung, Logistik
Do: –
1

16 20./22.04.2021 Di: Grundlagen
Do: Def. Metriken auf Sequenzen
2
3.1-3.5

17 27./29.04.2021 Di: Berechnung der Edit-Distanz
Do: Die q-gram-Distanz
3.6
3.7

18 04./06.05.2021 Di: Die Maximal-Matches-Distanz, Filtern
Do: –
3.8, 3.9

19 11./13.05.2021 Di: Def. paarweises Alignment, Alignment-Score
Do: –
4.1, 4.2

20 18./20.05.2021 Di: Alignment-Graph und universeller Algorithmus
Do: Alignment-Typen, Gapkosten
4.3, 4.4
4.5, 4.6

21 25./27.05.2021 Di: Fortgeschrittene Alignment-Themen I
Do: Fortgeschrittene Alignment-Themen II
5.1, 5.2
5.3, 5.4

22 01./03.06.2021 Di: Paarweises Alignment in der Praxis
Do: –
6

23 08./10.06.2021 Di: Def. Suffixbäume, WOTD-Algorithmus
Do: –
7.1-7.6

24 15./17.06.2021 Di: Anwendungen von Suffixbäumen
Do: –
7.7

25 22./24.06.2021 Di: Suffixarrays
Do: Burrows-Wheeler-Transformation
8
9

26 29.06./01.07.2021 Di: Def. Multiples Alignment
Do: NP-Vollständigkeit
10.1-10.4
10.5

27 06./08.07.2021 Di: –
Do: Exakte Algorithmen für SP-Alignment

11.1-11.3

28 13./15.07.2021 Di: Heuristiken für SP-Alignment
Do: Baumalignment, Genomalignment
11.4, 11.5
12, 13

29 20./22.07.2021 Di: ggf. Wiederholung
Do: Klausur