UE LV324 : Biologie, Algorithmique et Mathématiques pour la BioInformatique Home

Description

------------------------------------------------------------------------------------------------

Module de niveau L3 (LV324) – 6 ECTS


Objectif : UE à caractère général permettant d’illustrer la diversité des approches informatiques en biologie (56h cours/TD-TME dans le ratio 1/2) + 1 projet en relation avec l’un des trois thèmes choisis (équivalent 4h TD).

Chapitres : Analyse de Séquences (application à la génomique), Modélisation des Systèmes Intégrés, Bases de la théorie de l'information.


Public visé : étudiants de L3 en Informatique.

Répartition horaire : 18h cours + 38h TD-TME (2h cours + 4h TD-TME par semaine sur le 2ème semestre)

Description: Le but de ce module est d'introduire les bases scientifiques nécessaires à une première approche de la culture des domaines pluridisciplinaires que sont la bioinformatique et les biomathématiques. L'enseignement portera sur l'étude approfondie et critique de quelques méthodes fondamentales appliquées à des exemples biologiques. Pour bien appréhender ces méthodes, les bases nécessaires en biologie, en modélisation mathématique (à biologie théorique) et en bioinformatique feront l'objet des cours. Cette UE peut être une introduction à un cursus de bioinformatique en Master.



L'informatique a pris, ces dernières années, une place de plus en plus importante dans les Sciences de la Vie. Inversement, les Sciences de la Vie sont à l'origine de nouveaux développements prometteurs en Informatique.
Le module proposé a pour but d'introduire les bases scientifiques nécessaires à une première approche de ce domaine pluridisciplinaire en expansion, aussi bien aux étudiants « biologistes » qu’aux « informaticiens ». Il dérive d’ailleurs d’une expérimentation de 3 ans d’un module en licence d’informatique (très largement remanié et plus « concentré » sur deux « thèmes »).
Plutôt qu’un catalogue exhaustif et superficiel de méthodes, l’enseignement se concentrera sur l’étude de quelques méthodes fondamentales de la bioinformatique et des biomathématiques, pour donner aux étudiants un début de culture aussi bien en bioinformatique au sens strict qu’en modélisation (appelée aussi « biologie théorique »).
Le module s'organise donc autour des thèmes suivants:
Pour chacun des thèmes, des enseignants de biologie, d’informatique et de mathématiques interviendront  pour introduire les bases scientifiques nécessaires à une bonne compréhension de la problématique du domaine. On décrira ensuite les modèles et les méthodes informatiques (bases et algorithmes) développés conjointement par les biologistes et les informaticiens pour apporter des solutions aux problèmes posés.

Contenu pédagogique de l'UE :


Objectif : UE à caractère général permettant d'illustrer l'approche informatique en biologie et la modélisation mathématique en biologie + 1 projet.
Plutôt qu'un catalogue exhaustif et superficiel de méthodes, l'enseignement se concentrera sur l'apport de la bioinformatique et des biomathématiques à la biologie par l'étude de quelques méthodes fondamentales.

Analyse de séquence et génomique

Le traitement de séquences biologiques a connu ces quinze dernières années un essor considérable avec l’apparition du séquençage systématique d’organismes de plus en plus nombreux. Ce cours présente donc un ensemble de méthodes utilisées pour ces analyses : automates déterministes, automates stochastiques, techniques d’alignement, programmation dynamique ainsi que les principales méthodes statistiques utilisées dans ces analyses. Ces méthodes seront illustrées sur des problèmes types comme la prédiction des zones codantes, la comparaison de séquences et l’analyse de génomes entiers. En effet, la connaissance de génomes entiers permet l'émergence de nouvelles approches, comme la génétique fonctionnelle, qui vise à comprendre le fonctionnement global d'un génome. L’accent sera mis sur les techniques permettant de comprendre la structure et l’organisation des génomes (zones codantes,similarités/homologies, biais de codage, composition et usage du code différentiel sur les brins précoce et tardif des génomes bactériens).

Principaux points du programme

Les algorithmes correspondant seront programmés en TD/TP et appliqués sur plusieurs génomes bactériens, et des comparaisons seront effectuées entre ceux-ci et un génome eucaryote (levure).

Systèmes dynamiques en biologie

La construction et l'étude de modèles basés sur des systèmes dynamiques jouent un rôle croissant en sciences de la vie, des cellules aux organismes et aux écosystèmes. De nos jours, les recherches dans des domaines aussi variés que l’étude du métabolisme et des voies de signalisation cellulaire, les neurosciences, l’imagerie biomédicale, la mise au point de médicaments intègrent la modélisation. La biologie moléculaire et la biologie cellulaire fournissent une masse énorme d'informations, qui nécessitent un effort de synthèse faisant appel à la modélisation.
L’enseignement de la modélisation est susceptible non seulement d’apporter un éclairage nouveau à de nombreux aspects des sciences de la vie, mais aussi d’étendre les capacités de l’étudiant à « poser et résoudre un problème », et donc de favoriser l’acquisition d’une certaine autonomie et d’une démarche critique.
L’enseignement mettra l’accent sur les différentes étapes de la modélisation : recueil de données issues de l’expérience, établissement du modèle, algorithmique et programmation, étude des propriétés du modèle et interprétation des résultats obtenus ; le but essentiel étant de montrer comment la démarche du modélisateur est impossible à séparer de la problématique biologique abordée.
Une attention particulière sera portée à la discussion de l’intérêt de la modélisation (explication, prédiction, planification de nouvelles expériences, estimation de paramètres non mesurables directement, acquisition de données conduite par la modélisation, etc.).
Cet enseignement est l'occasion de rappeler des éléments de mathématiques indispensables (algèbre linéaire, analyse…) dans un contexte orienté vers les applications.

Principaux points du programme

La variable temps en biologie. Notions d’échelle de temps, d’état stationnaire et d’état d’équilibre, de stabilité. Systèmes dynamiques : équations différentielles, équations aux récurrences.
Premières notions de modélisation par des systèmes dynamiques. Notions de bilan et de « loi constitutive », de compartiment, de flux. Paramètres et variables. Principes de base de l’étude des systèmes dynamiques.
Quelques modèles fondamentaux :

Bases de la théorie de l'information

La théorie de l'information intervient en biologie, aussi bien dans les méthodes d'analyse de séquences que dans certains modèles d'évolution. Le but de cet enseignement est de donner aux étudiants les notions de base qui leur seront nécessaires pour comprendre les différents textes et travaux où cette théorie est utilisée. Les connaissances requises sont du niveau du L2 de biologie, en mathématiques comme en informatique, au besoin certaines notions supplémentaires seront introduites.

Principaux points du programme

Principes de codage (information et longueur moyenne minimale des codes)
Entropie d'une distribution de probabilités (sur un ensemble fini)
Entropie conditionnelle, information mutuelle, gain d'information


liens bibliographiques