Compression et GFT
Compare une chaîne redondante et une chaîne pseudo-aléatoire via entropie empirique.
Mathématique PT / GFT
Compresser comme extraire ce qui persiste et rejeter ce qui est entropique.
Compresser un fichier, c’est enlever ce qui se répète ou ce qui n’aide pas à reconstruire l’essentiel. En langage PT : on cherche ce qui persiste.
C’est une des meilleures portes d’entrée vers GFT : l’information structurée se garde, le bruit coûte cher, et le budget total impose une limite.
Une compression efficace augmente la part exploitable de structure relativement à une représentation brute. Elle ne crée pas d’information ; elle réorganise le budget.
La PT peut présenter la compression comme un cas concret de la partition $D_{KL}+H$ : la structure repérable contre l’uniforme d’un côté, l’entropie irréductible de l’autre.
Le projet pt-compress peut servir de laboratoire : mesurer entropie, redondance, divergence à l’uniforme, et coût de reconstruction.
Le point mathématique canonique reste GFT. Les performances d’un compresseur particulier relèvent d’une validation expérimentale.
Dépôt GitHub à publier : Igrekess/pt-compress ; monographie ch04_gft, ch_PM.
Les liens ci-dessous pointent vers des ressources publiques ou vers les dépôts GitHub prévus. Aucun chemin local de travail n’est exposé au lecteur.
Dépôt GitHub à publier avant de rendre ce lien téléchargeable.
Compare une chaîne redondante et une chaîne pseudo-aléatoire via entropie empirique.