Théorie de la Persistance
Identité

GFT — Théorème fondamental des écarts

$\log_2 m = D_\mathrm{KL} + H$ — principe fondamental de la persistance.

Énoncé

Pour toute distribution de probabilités P=(p1,,pm)P = (p_1, \ldots, p_m) sur les mm classes de Z/mZ\mathbb{Z}/m\mathbb{Z}, l’identité suivante est tautologique :

log2m=DKL(PUm)+H(P),\boxed{\log_2 m = D_{\mathrm{KL}}(P \,\|\, U_m) + H(P),}

où :

La capacité totale se conserve : tout ce qui n’est pas « information persistante » (DKLD_{\mathrm{KL}}) est « bruit » (HH), et réciproquement. Cette conservation est le principe fondamental de la persistance.

Identité

Lecture vulgarisée. Imaginez un budget total fixé à log2m\log_2 m bits (la « capacité informationnelle »). Chaque distribution divise ce budget en deux parts : ce qui est structuré (s’éloigne de l’aléatoire pur) et ce qui reste désordonné. La somme des deux est exactement le budget total. Pas plus, pas moins. C’est la version PT du principe fondamental : la capacité ne se crée pas et ne se détruit pas, elle se partage entre persistance et entropie.

Pourquoi ça compte

GFT est l’identité maîtresse de la PT, c’est-à-dire le principe fondamental de la persistance. Elle donne le cadre dans lequel toutes les conservations se formulent : à chaque pas du crible, l’information qui « se persiste » (DKLD_{\mathrm{KL}} qui croît) compense exactement l’entropie qui « se libère » (HH qui décroît). Pas de perte, pas de gain net.

Conséquences directes :

C’est aussi GFT qui justifie la sémantique « persistance » du nom de la théorie : ce qui « persiste » est précisément DKLD_{\mathrm{KL}}.

Démonstration — schéma

  1. Écrire DKL(PUm)=ipilog2(pi/(1/m))D_{\mathrm{KL}}(P \,\|\, U_m) = \sum_i p_i \log_2(p_i / (1/m)).
  2. Distribuer le logarithme : log2(pi/(1/m))=log2pi+log2m\log_2(p_i / (1/m)) = \log_2 p_i + \log_2 m.
  3. Sommer : ipilog2pi+ipilog2m\sum_i p_i \log_2 p_i + \sum_i p_i \log_2 m.
  4. Reconnaître : le premier terme est H(P)-H(P), le second est log2m\log_2 m.
  5. Réarranger : log2mH(P)=DKL\log_2 m - H(P) = D_{\mathrm{KL}}, soit log2m=DKL+H\log_2 m = D_{\mathrm{KL}} + H.

Démonstration détaillée

Étape 1 — Définition de DKLD_{\mathrm{KL}}

La divergence de Kullback–Leibler entre P=(p1,,pm)P = (p_1, \ldots, p_m) et la distribution uniforme Um=(1/m,,1/m)U_m = (1/m, \ldots, 1/m) est :

DKL(PUm)=i=1mpilog2pi1/m.D_{\mathrm{KL}}(P \,\|\, U_m) = \sum_{i=1}^m p_i \log_2 \frac{p_i}{1/m}.

Étape 2 — Distribution du logarithme

Par propriétés du logarithme :

log2pi1/m=log2pi+log2m.\log_2 \frac{p_i}{1/m} = \log_2 p_i + \log_2 m.

Substituons :

DKL=ipi(log2pi+log2m)=ipilog2pi+log2mipi.D_{\mathrm{KL}} = \sum_i p_i (\log_2 p_i + \log_2 m) = \sum_i p_i \log_2 p_i + \log_2 m \sum_i p_i.

Étape 3 — Normalisation et entropie

Comme PP est une distribution, ipi=1\sum_i p_i = 1, et par définition de l’entropie de Shannon, H(P)=ipilog2piH(P) = -\sum_i p_i \log_2 p_i.

Donc :

DKL=H(P)+log2m,D_{\mathrm{KL}} = -H(P) + \log_2 m,

soit, en réarrangeant :

log2m=DKL+H(P).\log_2 m = D_{\mathrm{KL}} + H(P).

CQFD

L’identité est purement algébrique. Elle ne dépend ni de la nature de PP (arbitraire), ni de l’origine physique des mm états, ni de quelconque hypothèse dynamique. C’est ce qui en fait une identité au sens fort, plus forte qu’un théorème : elle ne peut pas être falsifiée car elle est vraie par les seules règles de l’algèbre.

Conséquence — borne de Bekenstein

Comme H(P)0H(P) \geq 0 pour toute distribution (entropie positive), on a immédiatement :

DKL(PUm)log2m.D_{\mathrm{KL}}(P \,\|\, U_m) \leq \log_2 m.

C’est la borne de Bekenstein universelle : aucune distribution sur mm états ne peut avoir plus de log2m\log_2 m bits de structure persistante. La PT identifie cette borne au cap holographique de l’information dans une région finie.

Conséquence — flèche du temps

Si une évolution dynamique préserve log2m\log_2 m (cas du crible : mm fixe), alors :

dHdDKL=1.\frac{dH}{dD_{\mathrm{KL}}} = -1.

Toute augmentation de DKLD_{\mathrm{KL}} se paie par une diminution équivalente de HH, et inversement. C’est la flèche du temps PT : l’évolution naturelle fait croître HH (second principe), donc fait décroître DKLD_{\mathrm{KL}} (« décristallisation »). Le crible inverse cette flèche localement — DKLD_{\mathrm{KL}} croît à chaque étape, ce qui définit la « persistance ».

Conséquence — équivalence Ruelle

Pour la matrice de transfert TmT_m, la fonction de partition de Ruelle vaut :

ZRuelle=Tr(TmN)=λλN,Z_{\mathrm{Ruelle}} = \mathrm{Tr}(T_m^N) = \sum_\lambda \lambda^N,

où la somme porte sur les valeurs propres de TmT_m. À la limite NN \to \infty, cette fonction devient l’exponentielle de l’entropie topologique. GFT donne l’identité explicite avec log2m\log_2 m comme cap, et l’énergie libre FR=0F_R = 0 (au sens Ruelle pur).

Pour la dérivation complète et les conséquences (Bekenstein, flèche du temps, Ruelle), voir chapitre 4 de la monographie.

Voir aussi