Théorie de la Persistance

Mathématique PT / identité maîtresse

Le principe fondamental de la persistance

La PT part d’une idée presque enfantine : lorsqu’un système possède un nombre fixé de possibilités, son budget de distinctions est fixé. Une partie de ce budget peut devenir structure, une autre peut rester incertitude, mais le total ne disparaît pas.

GFT est l’identité qui formalise ce budget. Pour toute distribution $P$ sur $m$ états, la capacité totale $\log_2 m$ se décompose exactement en information persistante et entropie résiduelle.

$\log_2 m = D_{\mathrm{KL}}(P\|U_m)+H(P)$
Intuition

Un budget, deux manières de l’habiter

Imagine un jeu avec plusieurs cases possibles. Plus il y a de cases, plus il faut de distinctions pour dire précisément où l’on se trouve. Ce nombre total de distinctions est le budget du système.

En mathématiques, on note ce budget $\log_2(m)$ parce qu’on le compte en questions oui/non, donc en bits. Mais l’idée derrière est simplement celle-ci : le système possède une quantité totale de distinction disponible.

Une partie devient une forme : elle distingue, contraint, sélectionne. C’est la persistance. L’autre partie reste ouverte, dispersée, indécise. C’est l’entropie.

Le principe fondamental dit que ces deux parts se compensent exactement. Quand une structure gagne un bit, l’entropie disponible perd un bit, et inversement. La PT met cette conservation au centre de tout le reste.

Budget d’information du crible

persistance entropie
0 2 4 6 8 bits m=2 1.00 m=6 2.58 m=30 4.91 m=210 7.71 chaque barre montre le même budget total : persistance + entropie
capacité

La capacité totale est fixée

Pour $m$ possibilités, il existe un budget total de distinctions. En langage technique, ce budget vaut $\log_2 m$ bits.

persistance

La structure est une distance à l’uniforme

$D_{\mathrm{KL}}$ mesure ce qui distingue la distribution réelle de l’état maximalement indifférencié.

entropie

Le reste demeure bruit ou incertitude

$H(P)$ mesure ce qui reste dispersé, non cristallisé, non sélectionné comme structure persistante.

Standard

Pourquoi c’est un principe fondamental

L’identité est une tautologie algébrique : elle est vraie pour n’importe quelle distribution. Sa force ne vient donc pas d’une difficulté technique, mais du fait qu’elle donne le langage de conservation dans lequel la PT lit le crible.

Dans le crible, $D_{\mathrm{KL}}$ devient la part structurée : ce qui a été sélectionné, contraint, rendu distinct. $H(P)$ devient la part encore dispersée. Leur somme reste le même cap informationnel.

$dD_{\mathrm{KL}}+dH=0,\quad \frac{dH}{dD_{\mathrm{KL}}}=-1$

Statut exact

  • GFT-ID. Identité algébrique exacte.
  • Flèche. Identité à $m$ fixé : les variations se compensent.
  • Bekenstein. Théorème immédiat : $D_{\mathrm{KL}}\le\log_2 m$.
  • Lecture physique. Pont interprétatif traité ailleurs dans la monographie.
Démonstration

Démonstration complète

Soit $P=(p_0,\ldots,p_{m-1})$ une distribution de probabilité et $U_m=(1/m,\ldots,1/m)$ la distribution uniforme. Par définition :

$D_{\mathrm{KL}}(P\|U_m)=\sum_r p_r\log_2\frac{p_r}{1/m}$

On distribue le logarithme, puis on utilise $\sum_r p_r=1$ :

$D_{\mathrm{KL}}=\sum_r p_r(\log_2 p_r+\log_2 m)=\log_2 m+\sum_r p_r\log_2 p_r$

Or $H(P)=-\sum_r p_r\log_2 p_r$. Donc :

$D_{\mathrm{KL}}=\log_2 m-H(P)\quad\Longleftrightarrow\quad \log_2 m=D_{\mathrm{KL}}+H(P)$

Ce que la page affirme

GFT est une identité universelle, puis un principe de lecture PT lorsqu’on applique ses deux termes au crible et aux distributions de résidus.

Ce qu’elle n’affirme pas

L’identité seule ne prouve pas une nouvelle loi sur les premiers. La profondeur vient de son rôle dans la chaîne PT, pas de l’algèbre.