Archives

Les jeux dynamiques, du combat aérien à l’écologie comportementale

La théorie des jeux : sous ce titre se cache un vaste domaine de recherche à la frontière de l'économie et des mathématiques, qui n'a rien à voir avec les jeux vidéo. De quels jeux s'agit-il ici ? De toutes les situations où des acteurs, des joueurs, sont amenés à prendre « au mieux » des décisions dont les effets dépendent de ce que font les autres.

Il s'agit alors de déterminer ce qu’on va appeler « solution », ou « équilibre », qui dépend des circonstances, et de calculer cet équilibre. Lorsque le temps joue un rôle important dans l'évolution de la situation, et qu'en conséquence l’information disponible et les décisions à prendre évoluent, on parle de jeux dynamiques.

acces au film

À la croisée de la théorie des jeux, du calcul des variations, de la recherche opérationnelle et du calcul scientifique, la théorie des jeux dynamiques offre un bel exemple de rencontre entre disciplines, dont les applications vont du combat aérien à l'écologie comportementale, en passant par la commande robuste ou encore la négociation de traités internationaux.

Ce document est extrait de la conférence de Pierre Bernhard donnée le 4 octobre 2007 à Inria Rocquencourt, dans le cadre des exposés « Le modèle et l'algorithme ».

Une mise en forme en XML/SMIL a été réalisée par Pierre Jancène. Pour visionner ce document, RealPlayer était utilisé à l'origine, les évolutions logicielles ne permettent malheureusement plus de le lire.

La vidéo de l'orateur reste cependant accessible, au format Real, lisible avec RealPlayer ou VLC (durée : 44 min).

 

Un aperçu des jeux dynamiques

Dans le résumé ci-dessous, les liens permettaient d'accéder aux différentes parties du document XML/SMIL.

Les jeux dynamiques résultent d'une rencontre entre plusieurs courants de pensée : la théorie des jeux, issue de l’économie théorique, le calcul des variations, et la recherche opérationnelle.

Pour se faire une première idée de ce qu'est la théorie des jeux, rien de tel qu'un exemple. Ici, c'est Tintin qui en fournit le prétexte : les Bordures arriveront-ils à envahir la Syldavie ? Et si on modifie un peu les données du problème, comment le résultat en est-il modifié ? Un autre exemple très célèbre s'intitule le dilemme du prisonnier. Il ouvre vers la notion de jeux répétés, lorsqu'il ne s'agit plus de prendre une seule décision, mais une suite, en théorie jusqu'à l'infini. L'étude des suites de décisions peut prendre d’autres formes : arbres de décisions, systèmes dynamiques ou, dans le langage de la théorie économique, « jeux stochastiques ».

Si la situation et les décisions évoluent en temps continu, on parle de jeu différentiel. La théorie en a été créée par Rufus Isaacs dans les années cinquante. Mais ce domaine est l’héritier du calcul des variations, qui date de Newton, et plus spécifiquement de l’œuvre de Konstantin Carathéodory dans les années trente. Isaacs ignorait Carathéodory, ainsi d’ailleurs que Bellman qui sous le nom de programmation dynamique a développé des idées très voisines de celles d’Isaacs au même moment, dans le même Rand Institute of Advanced Studies, c’est-à-dire dans le monde de l’ingénierie mathématique.

C’est John V. Breakwell, dans les années soixante-dix, qui a repris l’œuvre d’Isaacs en y introduisant la puissance du calcul numérique au service de l’analyse mathématique.

Enfin, la recherche opérationnelle, avec l’apparition des ordinateurs électroniques, introduit l'idée qu'un algorithme de calcul de la solution est une solution. De ce point de vue, calculer une solution d'un jeu comme le cas des Syldaves et des Bordures se ramène à un « programme linéaire », pour lequel des algorithmes très puissants sont disponibles.

Ces divers courants se sont développés en parallèle dans la recherche en économie d'une part, en ingénierie d'autre part. Des équivalences existent à tous les niveaux, même si la convergence reste difficile.

Les applications de la théorie sont nombreuses, tout d'abord bien sûr dans le domaine de l'économie et de la gestion.

Un cas particulièrement intéressant à étudier est celui où tous les joueurs n'ont pas la même importance, mais où l'un a un pouvoir prééminent, et les autres suivent ; par exemple, un gouvernement et des citoyens dans le cadre des politiques publiques. Un exemple avec des conclusions étonnantes, emprunté à Christophe Deissenberg, est l'étude du mensonge d'État.

En politique internationale et dans le domaine militaire, les exemples sont légion. En particulier, le protocole de Kyoto, avec son marché des droits à polluer, doit nombre de ses dispositions à des analyses en termes de jeux, et ouvre la porte à d’innombrables autres problèmes pour cette théorie.

Dans le domaine de la commande en présence d’incertitude, ces techniques permettent de s'intéresser non pas à une valeur moyenne mais à une valeur garantie. C’est ce qu’on appelle la « commande robuste ».

Enfin, des applications plus inattendues se trouvent en biologie : en écologie comportementale, en théorie de l’évolution et en dynamique des populations. John Maynard Smith a ainsi montré comment l’évolution a dû sélectionner des espèces dont le comportement est proche d’une stratégie d’équilibre d’un jeu.

Les insectes parasitoïdes en offrent un exemple remarquable. Le problème étudié est le suivant : les cultures de maïs sont attaquées par un parasite, la pyrale. Mais un autre insecte, le trichogramme — une sorte de petite guêpe — vient pondre dans les œufs de la pyrale et protège ainsi les récoltes. Plusieurs questions se posent. Quelle proportion d'œufs restent non parasités ? Mais surtout, quel est le comportement (optimal) d'une guêpe sachant qu'elles sont plusieurs ? Quel est le comportement d'une guêpe seule sachant que d’autres pourraient arriver ? Peut-on le prédire grâce à la théorie des jeux dynamiques ? Dans une certaine mesure, oui.

Niveau de lecture

Aidez-nous à évaluer le niveau de lecture de ce document.

Il vous semble :

Si vous souhaitez expliquer votre choix, vous pouvez ajouter un commentaire (qui ne sera pas publié).