Héritage, mémoire collective et transmission dans les systèmes multi-agents
Résumé
Nous avons établi que les agents doivent pouvoir mourir (épisode 1), que leur cycle de vie doit être explicitement organisé (épisode 2), et que des méta-agents doivent gouverner ce processus (épisode 3). Une question reste ouverte : que se passe-t-il après la disparition d’un agent ? Cet article défend l’idée que la valeur d’un agent ne réside pas uniquement dans ses contributions actives, mais dans la trace qu’il laisse au collectif. Sans mécanisme d’héritage explicite, chaque disparition détruit de l’information utile. Avec un héritage mal conçu, le système hérite aussi des biais et des rigidités du passé. L’enjeu est de concevoir une transmission sélective : conserver ce qui enrichit le collectif, oublier ce qui le fige.
1. Le problème de la mort sans testament
Dans la plupart des systèmes multi-agents actuels, la disparition d’un agent est un événement binaire. L’agent est là, puis il ne l’est plus. Sa mémoire, ses hypothèses, ses heuristiques acquises au fil des interactions disparaissent avec lui.
Ce modèle est simple à implémenter, mais il est coûteux. Chaque agent qui meurt emporte avec lui une partie de l’apprentissage collectif. Le système ne capitalise pas sur l’expérience de ses anciens membres. Il recommence, partiellement, à chaque renouvellement.
C’est l’équivalent fonctionnel d’une civilisation sans écriture : chaque génération repart de presque zéro.
2. L’héritage total : le piège symétrique
La réponse naïve consiste à tout conserver. Lorsqu’un agent disparaît, on archive l’intégralité de sa mémoire, de ses poids, de ses traces d’interaction. Les agents suivants héritent de tout.
Ce modèle échoue pour les mêmes raisons que l’agent immortel décrit dans l’épisode 1. Il transforme la mémoire des morts en contrainte pour les vivants. Les hypothèses obsolètes, les biais accumulés, les stratégies adaptées à un environnement révolu continuent de peser sur le collectif.
L’héritage total n’est pas de la mémoire. C’est de l’embaumement.
3. La distinction entre trace et directive
Pour concevoir un héritage utile, il faut séparer deux types d’information qu’un agent peut transmettre.
Les traces sont des enregistrements factuels : quelles hypothèses l’agent a testées, quels résultats il a obtenus, dans quel contexte. Elles sont descriptives. Elles informent sans contraindre.
Les directives sont des règles, des poids, des orientations stratégiques. Elles sont prescriptives. Elles orientent le comportement des agents qui les reçoivent.
Un système robuste hérite des traces, mais pas des directives. Il permet aux nouveaux agents de consulter l’expérience passée sans être liés par les conclusions qu’en ont tirées leurs prédécesseurs.
4. L’analogie biologique : gènes, épigénétique et culture
En biologie, la transmission entre générations opère à plusieurs niveaux.
Les gènes transmettent une structure, pas un comportement. Ils définissent des capacités, pas des décisions. Les marques épigénétiques transmettent une modulation contextuelle : une adaptation récente, sensible aux conditions de l’environnement parental. La culture, chez les espèces qui la pratiquent, transmet des savoir-faire acquis, mais de manière non contraignante — chaque génération peut les modifier.
Ces trois niveaux coexistent parce qu’ils opèrent à des échelles temporelles différentes. Les gènes changent lentement. L’épigénétique change en une génération. La culture change en continu.
Un système multi-agents efficace devrait reproduire cette hiérarchie : une architecture stable (les gènes), des paramètres adaptatifs transmissibles (l’épigénétique), et une mémoire collective consultable mais révisable (la culture).
5. Architecture d’un système d’héritage sélectif
Un mécanisme d’héritage sélectif repose sur trois composants.
Le journal d’agent enregistre, tout au long de la vie de l’agent, ses décisions, leurs résultats, et le contexte dans lequel elles ont été prises. Ce journal est factuel et horodaté.
Le filtre de transmission intervient au moment de la disparition. Il sélectionne les entrées du journal qui sont pertinentes pour le collectif actuel. La pertinence peut être évaluée par les méta-agents (épisode 3), par des critères de récence, de diversité, ou de performance.
La mémoire collective est un réservoir partagé, accessible à tous les agents, mais sans autorité. Les agents peuvent la consulter, s’en inspirer, ou l’ignorer. Elle n’a pas de pouvoir décisionnel.
6. Le paradoxe de l’héritage utile
L’héritage le plus précieux n’est pas celui des agents les plus performants. C’est souvent celui des agents qui ont échoué de manière informative.
Un agent qui a testé une hypothèse prometteuse et l’a invalidée produit une information rare : il prouve qu’une direction ne fonctionne pas, dans un contexte précis. Cette information négative est extrêmement coûteuse à reproduire et se perd systématiquement lorsque l’héritage est basé uniquement sur la performance.
Concevoir un bon mécanisme d’héritage implique donc de valoriser les échecs documentés autant que les succès. Ce qui compte n’est pas le résultat, mais la qualité de la trace laissée.
7. La dégradation temporelle de l’héritage
Même sélectionnée, la mémoire héritée doit vieillir. Une trace pertinente aujourd’hui peut devenir trompeuse demain si l’environnement change.
La mémoire collective doit donc être soumise aux mêmes mécanismes de cycle de vie que les agents eux-mêmes. Les entrées anciennes perdent progressivement leur poids. Les traces qui ne sont jamais consultées s’effacent. Les méta-agents peuvent décider de purger des pans entiers de mémoire lorsque le contexte a fondamentalement changé.
Sans cette dégradation contrôlée, la mémoire collective devient un cimetière de stratégies obsolètes, consultable mais nuisible.
8. Héritage et diversité
L’héritage crée un risque de convergence. Si tous les nouveaux agents consultent la même mémoire collective, ils tendent à reproduire les mêmes stratégies. Le collectif perd en diversité ce qu’il gagne en efficacité apparente.
Pour contrer ce phénomène, le système peut introduire plusieurs mécanismes. L’héritage partiel consiste à ne transmettre qu’un sous-ensemble aléatoire de la mémoire à chaque nouvel agent. L’héritage contradictoire consiste à inclure dans la mémoire des traces qui se contredisent mutuellement, forçant l’agent à choisir. L’oubli volontaire consiste à créer périodiquement des agents sans héritage, qui explorent depuis zéro.
Ces mécanismes sont les équivalents fonctionnels de la mutation en biologie : des perturbations contrôlées qui empêchent la convergence prématurée.
9. Qui hérite de qui ?
La question de l’héritage est aussi une question de topologie. Dans un système multi-agents, les relations d’héritage peuvent être organisées de plusieurs manières.
L’héritage centralisé repose sur une mémoire collective unique. Tous les agents y contribuent et y puisent. C’est simple mais fragile : un seul point de corruption peut contaminer tout le système.
L’héritage lignager crée des lignes de filiation. Un agent hérite principalement de son prédécesseur direct. Cela préserve la diversité entre lignées mais limite la circulation de l’information.
L’héritage réseau permet des héritages croisés. Un agent peut hériter de plusieurs sources, pondérées selon leur pertinence contextuelle. C’est le modèle le plus riche mais aussi le plus complexe à gouverner.
Le choix de la topologie d’héritage est une décision architecturale fondamentale, au même titre que le nombre d’agents ou la profondeur de gouvernance.
10. Ce que les morts enseignent aux vivants
Dans les systèmes multi-agents les plus adaptatifs, la mort n’est pas une perte. C’est une transformation. L’agent cesse d’agir, mais son expérience continue d’informer le collectif — à condition que cette expérience soit correctement filtrée, transmise et, le moment venu, oubliée.
L’intelligence collective ne dépend pas seulement de la qualité des agents vivants. Elle dépend de la qualité de la relation que le système entretient avec ses morts.
Conclusion
Les trois épisodes précédents ont établi les conditions de la mort des agents : sa nécessité (épisode 1), son organisation (épisode 2), sa gouvernance (épisode 3). Cet épisode ferme la boucle en posant la question de ce qui survit à cette mort.
Un système qui tue ses agents sans rien conserver est amnésique. Un système qui conserve tout est sclérosé. Entre les deux, il existe un espace étroit mais décisif : celui de l’héritage sélectif, où les traces utiles sont transmises, les directives obsolètes sont oubliées, et la mémoire collective elle-même est soumise au temps.
Dans les systèmes multi-agents réellement adaptatifs, les agents ne meurent pas pour rien. Ils meurent pour que d’autres apprennent — non pas ce qu’il faut faire, mais ce qui a été tenté.