Page d'accueil de
Christian Magnan

 

 

UN CONTE POUR COMPRENDRE LA RELATIVITÉ RESTREINTE



Découvrez l'histoire d'un roi, de deux équipes rivales d'arpenteurs et d'une étudiante qui va se révèler capable de résoudre une énigme séculaire et vous saurez tout sur la relativité restreinte.


Christian Magnan
Collège de France, Paris

Sur une idée de Edwin F. Taylor et John Archibald Wheeler (Spacetime Physics, Freeman, 1963, 1992)


  1. La parabole des arpenteurs géomètres
  2. Les arpenteurs de l'espace-temps
  3. Le nouvel invariant de la relativité
  4. Le ralentissement des horloges
  5. Bien qu'exprimés dans une même unité, le temps et l'espace diffèrent entre eux
  6. Le problème du changement de repère
  7. Un changement de variable astucieux
  8. Le paramètre angulaire de vitesse est additif
  9. La vitesse de la lumière est la même dans tous les repères
  10. La vitesse de la lumière : accessible ou inaccessible ?
  11. L'énergie comme composante d'un quadrivecteur
  12. E = m c 2 : enfin !
  13. Plus vite que la lumière ?

 

La parabole des arpenteurs géomètres

Il était une fois un roi si jaloux de l'étendue de son royaume qu'il exigeait de ses intendants de contrôler en permanence la mesure de ses terres. Des arpenteurs géomètres étaient chargés de repérer les différents lieux du pays. Ils devaient en préciser la position par rapport à un système de deux axes, l'un pointant vers le nord, l'autre vers l'est perpendiculairement au précédent. L'origine des coordonnées se situait au palais royal, au centre de la ville. Comme le souverain avait ordonné qu'elles se poursuivent vingt-quatre heures sur vingt-quatre, les mesures se partageaient en deux séries, celles de jour et celles de nuit.

Le géomètre de jour et ses acolytes déterminaient la direction du nord à l'aide d'une boussole. Le long de l'axe ouest-est, les distances étaient exprimées en mètres et désignées habituellement par la lettre « x ». L'axe nord étant sacré, les distances le long de ce dernier, désignées par la lettre « y », se comptaient dans une unité différente, la toise royale.

Une seconde équipe travaillait la nuit sous la direction d'un autre expert géomètre. Pour déterminer la direction du nord, ces arpenteurs se servaient de l'étoile polaire qui, comme chacun sait, indique le Nord géographique, distinct du Nord magnétique. Ils mesuraient également les distances vers l'est en mètres (x' en mètres) et vers le nord en toises royales (y' en toises).

Chacun des deux géomètres consignait le résultat de ses mesures dans de précieux dossiers, où était indiquée à côté du nom de chaque lieu (par exemple : la porte du Temple, le pont du Diable, etc.) la valeur des deux « coordonnées » x et y correspondantes. Comme la direction du nord n'était pas la même pour les deux équipes les mesures de jour différaient de celles de nuit.

Arriva un jour une brillante étudiante, particulièrement ouverte d'esprit, qui ne comprit pas la rivalité installée entre l'École de Jour et l'École de Nuit. Bravant les interdits religieux elle s'inscrivit aux deux établissements et y apprit l'art de l'arpentage. Au fil des jours et des nuits de travail elle fut de plus en plus troublée par l'antagonisme des deux méthodes opératoires et se demanda s'il n'existait pas quelque lien harmonieux entre les deux séries de données.

Table 1 : Deux jeux de coordonnées pour un même lieu
 
Lieu Arpenteur de Jour
(nord magnétique)
(x en mètres, y en toises)
Arpenteur de Nuit
(étoile polaire)
(x' en mètres, y' en toises)
Palais Royal 0   0 0   0
Porte A xA   yA x'A   y'A
Porte B xB   yB x'B   y'B
Autres lieux......   ... ...   ...

Elle plaça côte à côte sur un même tableau (Tableau 1) les mesures consignées dans les dossiers de jour et de nuit afin de les comparer. Tout d'abord, plus libérée que ses aîné-e-s par rapport à la tradition et au risque de paraître hérétique, l'étudiante osa convertir en mètres les mesures le long de l'axe nord, alors que les grands prêtres imposaient depuis toujours de les exprimer en toises. Il suffisait pour cela de multiplier toutes les quantités « y » correspondantes par un facteur k de conversion convenable : tous les « y » étaient remplacés par la valeur « ky ». En manipulant ces nombres elle fit par hasard une découverte. Prenant un point après l'autre dans le tableau, elle éleva au carré ses coordonnées « x » et « ky », les additionna et s'aperçut alors que la somme des carrés des quantités x et ky provenant des mesures de jour était égale à la même expression évaluée à partir des mesures de nuit x' et ky'. Elle vérifia soigneusement que cette propriété était vraie pour tous les lieux consignés et écrivit de façon générale :

[ (x)2 + (ky)2 ] = [ (x' )2 + (ky' )2 ].

Très excitée par sa découverte l'étudiante donna à la racine carrée de cette quantité le nom de « distance au centre de la ville » et nota :

[ (x)2 + (ky)2 ]½ = distance du lieu de coordonnées x et y au centre de la ville.

Puis elle énonça ce qu'elle venait de mettre en évidence sous le nom de principe d'invariance de la distance : la valeur de la « distance » est indépendante du choix du système de repérage. Autrement dit, bien que pour un même point repéré les deux jeux de données des métreurs de nuit et de jour se révèlent différents, la distance conserve, elle, la même valeur. Physiquement parlant, cela signifiait que cette distance représentait une propriété géométrique intrinsèque de sorte qu'on pouvait manipuler ce concept indépendamment des coordonnées.  

Les arpenteurs de l'espace-temps

Cette histoire veut servir à illustrer les concepts de la relativité restreinte, qui naquit sous l'impulsion de Poincaré (1854-1912), Lorentz (1853-1928) et Einstein (1879-1955), ce dernier la parachevant en 1905. Les physiciens du début du siècle étaient en effet un peu dans la situation des arpenteurs : comme pour ces derniers la découverte d'une vérité physique jusque-là ignorée allait bouleverser leur conception de l'espace et du temps héritée du passé.

Le premier lien de ressemblance entre arpenteurs et physiciens, c'est la vitesse de la lumière. Les arpenteurs de notre pays imaginaire mesuraient les distances le long de la direction du nord dans une unité sacrée, la toise royale, différente de celle (le mètre) utilisée dans la direction perpendiculaire. Se servir de la même unité pour les deux directions revenait chez eux à renier une croyance ancestrale. Or c'est un effort conceptuel du même ordre que réclame aux physiciens du début du vingtième siècle la théorie de la relativité restreinte. En effet l'idée d'unifier temps et espace et de combiner, comme nous allons le voir, des durées et des distances entraînait la nécessité d'exprimer ces quantités avec une même unité (car on ne peut pas ajouter des mètres à des secondes !). En ce début de troisième millénaire, la physique a complètement assimilé cette nouvelle façon de considérer l'espace et le temps puisque le fait de fixer la vitesse de la lumière « c » à la valeur arbitraire 299 792 458 mètres par seconde prouve que cette quantité « c » est traitée désormais comme un simple facteur de conversion entre mètre et seconde. Certes dans la vie courante nous continuons à nous servir des deux unités, le mètre et la seconde, mais en astronomie, à l'échelle du cosmos, il est bien plus normal de mesurer les distances en unités de temps. Les astronomes y sont habitués depuis longtemps avec l'emploi de leur année de lumière, qui représente, vous le savez bien, la distance parcourue par la lumière pendant une année. En bref la quantité « c » permet bien de passer d'un temps à une distance (c'est d'ailleurs la même conversion que fait naturellement un automobiliste en disant que Paris est à huit heures de Montpellier, rapportant le trajet à la vitesse de sa voiture et au temps qu'il met pour accomplir le voyage).

(Parenthèse : si on le compte en temps, malgré sa vastitude quasiment infinie et inconcevable à échelle humaine, notre Univers se laisse bien mesurer. Comme une année compte en gros trente millions de secondes (soit 3×107 s) on trouve que de la distance de la Lune, à une seconde 1/3 de lumière, jusqu'à l'horizon de notre partie visible d'univers, à une quinzaine de milliards d'années, s'insèrent environ dix-sept ordres de grandeur. Ainsi les planètes sont situées à des minutes ou dizaines de minutes de lumière, les étoiles les plus proches, à des années de lumière, puis on en trouve à toute distance jusqu'aux plus lointaines de notre Voie Lactée à une centaine de milliers d'années. Au-delà la distance des galaxies s'étage de quelques millions d'années à une quinzaine de milliards d'années. Ces nombres sont indiqués dans la Table 2. En passant, la petitesse de l'exposant « 17 », qui mesure le temps qu'a mis la lumière la plus lointaine pour nous parvenir, montre l'absurdité de penser que notre monde pourrait être réellement infini, mais cela est une autre histoire…)

Table 2 : la mesure de notre Univers en unité de temps
 
Objet Distance en unité de temps Distance en secondes
Lune 1 seconde 1/31,3
Soleil8 minutes500
Système solaire :
Saturne
Sonde spatiale Voyager 1
 
1 heure ¼
13 heures
 
5 000
47 500
Étoiles3 à 100 000 années108 à quelques 1012
Galaxie d'Andromède entre 2,4 et 2,9 millions d'années 1014
Galaxiesjusqu'à des milliardsde 1014 à 1016
Horizon de la partie pour
nous visible de l'Univers
environ 15 milliards d'années1017

Ainsi dans l'espace-temps, une seconde sera tout aussi bien une durée qu'une distance, à savoir les c mètres que la lumière parcourt pendant cette seconde. Concrètement, si nous choisissons de conserver des secondes dans les formules, il faudra passer des distances aux temps en remplaçant toute occurrence de longueur « x » exprimée en mètres par la quantité « x/c » qui, elle, s'exprimera en secondes. Autrement dit « x-exprimé en seconde » est égal à « x-exprimé en mètre » divisé par 299 792 458. C'est à cette convention que nous adhèrerons par la suite. Cette opération de conversion montre que la vitesse de la lumière intervient d'emblée comme un élément incontournable de la théorie relativiste.

Mais, pour revenir à notre conte, mis à part ce facteur de conversion entre longueurs et durées, quel est le rapport entre l'arpentage et la physique relativiste ? Eh bien, l'essence de la relativité restreinte tient dans l'existence en géométrie de l'espace-temps d'une quantité analogue à la distance spatiale (différente certes, mais bâtie comme elle sur les carrés des coordonnées) se révélant à son tour invariante dans un changement de système de repérage. Découvrons ensemble ce nouvel invariant.  

Le nouvel invariant de la relativité

Le travail des arpenteurs royaux consistait à repérer la position de différents lieux en les caractérisant par deux coordonnées spatiales. En relativité, ce ne sont plus seulement des « lieux » que l'on considère mais des « événements », ce qui exige qu'on précise, en plus du lieu où ils se produisent, l'instant auquel ils se produisent. Voici des exemples d'événements : telle explosion survient, telle fusée décolle, tel projecteur émet un éclair de lumière, le sursaut lumineux de telle étoile est détecté par tel télescope, etc. À chaque fois on a besoin de préciser « à tel endroit » et « à telle date » : à l'espace il faut maintenant adjoindre le temps. Pour repérer un événement spatio-temporel et le consigner dans un dossier il est indispensable de spécifier à la fois des coordonnées spatiales, trois dans le cas général, et une coordonnée temporelle. Ainsi le temps et l'espace sont réunis dans une structure, « l'espace-temps de Lorentz », constituant un « espace » (au sens formel du terme) généralisé à quatre dimensions.

Pour simplifier la présentation, sans rien perdre d'ailleurs de la physique du problème, on se limite souvent dans un premier stade à un espace-temps à deux dimensions, en se contentant d'une seule dimension spatiale (au lieu de trois) en plus de celle du temps. C'est ce que nous ferons ici. Cela revient à ne considérer que des événements se produisant le long d'une seule et même direction si bien qu'il suffit d'une seule coordonnée spatiale pour identifier le lieu où ils se produisent. Dans ce cadre simplifié chaque événement (par exemple le départ de telle fusée) survenant en tel lieu à telle heure sera repéré par deux nombres : une coordonnée de position « x » en mètres (ou mieux « x/c » en secondes) et une coordonnée de temps « t » en secondes.

Pour concrétiser les choses, qu'entendons-nous par « repère » ? Dans le cas des arpenteurs, les deux systèmes de repérage différaient par la direction des axes de coordonnées puisque le nord magnétique des relevés diurnes différait du nord géographique des relevés nocturnes. En physique relativiste, un repère différera d'un premier s'il possède par rapport à lui une certaine vitesse. Si nous choisissons comme premier repère celui d'un laboratoire terrestre, avec son attirail d'horloges et de chaînes d'arpenteur, le second repère le plus illustratif est celui d'une fusée filant à vive allure. Dans leur engin les astronautes ont leurs propres instruments de mesure, comme des horloges, et peuvent accomplir sur place leurs expériences. Nous avons deux repères en présence, celui du laboratoire, que nous désignerons encore par « repère au repos » (mais cette notion, on le sait bien, est relative), et celui de la fusée, animée de la vitesse « v » par rapport à la Terre, qui constituera le « repère en mouvement ».

Enregistrons donc la coordonnée spatiale et la coordonnée temporelle d'une série d'événements d'un côté dans le repère terrestre (soit x et t), de l'autre dans le repère de la fusée (soit x' et t'). Supposons en outre que nous ayons choisi par commodité un événement origine commun (x = 0, t = 0 ; x' = 0, t' = 0) et procédons comme dans la fable. En manipulant les données à la manière de notre étudiante, que trouvèrent Einstein et Poincaré en 1905 ? Comme elle, après les avoir convertis dans l'unité commune de la seconde, ils élevèrent au carré les nombres mesurés pour obtenir, en lieu et place des nombres (x)2 et (ky)2 des arpenteurs, les quantités (x/c)2 et (t) 2. Mais cette fois, au lieu de former la somme de ces termes, ils calculèrent la différence, et, miracle !, aboutirent à la conclusion que cette différence ne dépendait pas du repère choisi pour l'évaluer. Voilà la quantité invariante que nous cherchions.

Leur résultat constitue le théorème fondateur de la relativité restreinte : la quantité [ (x/c)2 - (t)2 ] a la même valeur dans le repère terrestre et dans le repère de la fusée. Elle est invariante dans un changement de système de référence. Algébriquement, les coordonnées (x, t) et (x', t' ) d'un même événement dans deux repères différents par rapport à un même événement choisi comme origine commune satisfont à la relation :

[ (x/c)2 - (t)2 ] = [ (x'/c)2 - (t' )2 ].
 

Le ralentissement des horloges

Une petite démonstration récompensera ceux et celles qui auront suivi mon exposé jusqu'ici et constituera une illustration de la formule écrite à l'instant : il s'agit du phénomène de « ralentissement des horloges » dans un repère en mouvement, consistant en ce que les durées comptées dans la fusée se révèlent plus courtes que les durées comptées sur Terre, comme si les montres des astronautes « ralentissaient ». Le calcul est enfantin, allons-y !

Imaginons une fusée quittant la Terre et effectuant un voyage vers la planète lointaine imaginaire Lontana. L'observateur terrestre décrit les choses comme suit. Si la fusée quitte la Terre à l'instant t = 0 et traverse l'espace à la vitesse « v » (par rapport à la Terre ; vitesse que nous supposerons constante par souci de simplicité) elle parcourt la distance « d = vt » (exprimée en mètres) pendant le temps « t », comme on l'apprend dans les petites classes. En particulier elle atteindra au bout du temps « T » la planète Lontana située à la distance D = vT. Par conséquent l'événement « départ de la fusée » est repéré par les coordonnées (respectivement spatiale et temporelle) (0, 0) et l'événement « atterrissage sur Lontana » par les coordonnées (D, T ) ou (vT, T ). Mais, de même que les géomètres de nuit procédaient différemment de ceux de jour, les astronautes ne voient pas les choses de la même façon. En effet, par rapport à la fusée ils ne se déplacent pas puisqu'ils y restent à l'intérieur. Comme ils restent au même point la coordonnée spatiale des événements « décollage de la Terre » et « atterrissage sur Lontana » reste pour eux égale à 0 ! Au moins les choses sont simples… Leurs horloges ont cependant tourné et leur indiquent qu'ils arrivent sur la planète inconnue au bout du temps « F » (F comme fusée). Le temps F est-il égal au temps T ? Nullement. Quand on change de système de repérage, les coordonnées changent, notre étudiante le sait bien.

Table 3 : description de la même histoire dans deux repères différents, celui du laboratoire et celui de la fusée
 
Événement Repérage pour un observateur terrestre
(position et date en secondes)
Repérage pour l'occupant de la fusée
(position et date en secondes)
La fusée quitte la Terre0     00     0
La fusée arrive sur Lontana(v/c) T     T         0     F

Les deux façons de consigner le voyage sont rassemblées dans le tableau 3. Empressons-nous d'appliquer à ces nombres notre théorème fondamental de la relativité restreinte, c'est-à-dire écrivons l'invariance de la quantité [(distance spatiale)2 - (intervalle temporel)2]. Cela nous fournit l'équation très simple

(v/c)2 T 2 - T 2 = - F 2   ou   [1 - (v/c)2] T 2 = F 2.

Par conséquent le rapport de la durée du voyage évaluée par les astronautes à celle évaluée par les observateurs restés à Terre est égal à

F/T = [1 - (v/c)2] ½,
fameux facteur que l'on voit apparaître au détour de toutes les formules de relativité restreinte (nous le retrouverons plus loin dans l'expression de l'énergie d'une particule). Nous constatons que la durée du voyage est plus courte pour les astronautes que pour les terriens (F/T est inférieur à l'unité).

Cet effet de relativité restreinte dit de « ralentissement des horloges » est à la base du fameux « paradoxe des jumeaux ». Mais je montre ailleurs que ce soi-disant paradoxe n'en est pas un. (L'effet « jumeaux d'âges différents » est vrai mais l'argument selon lequel il aboutirait à une incohérence - parce que en renversant les rôles Terre-fusée on devrait arriver au résultat contraire - ne tient pas, tout simplement parce que dans cette histoire des jumeaux le Terrien et l'astronaute ne jouent pas des rôles symétriques.)

Enfin il ne faudrait pas croire que ce ralentissement des horloges violerait le principe de symétrie entre deux repères animés d'un mouvement non accéléré l'un par rapport à l'autre. On ne peut pas dire de façon absolue que les horloges ralentissent dans l'un des repères (celui de la fusée), ce qui rendrait ce dernier reconnaissable. En vérité le phénomène est symétrique. Pour le montrer, décrivons un peu différemment le voyage des astronautes en imaginant qu'au cours de leur voyage ils regardent à travers les hublots les horloges des planètes qu'ils croisent, ces horloges étant supposées synchronisées avec celles de la Terre. Alors, ils constateraient que ces horloges tournent plus vite que les leurs et avancent de plus en plus (eux « vieilliraient » moins : c'est bien l'effet décrit plus haut). Il est facile alors d'inverser les rôles de la Terre et de la fusée, ou plutôt des fusées car un repère doit être vu non comme une fusée unique mais comme un ensemble de fusées se déplaçant à la queue leu leu. Réciproquement donc si restant à Terre nous regardions défiler un « train de fusées » avançant toutes à la même vitesse et que nous observions leurs horloges à travers leurs hublots, nous les verrions tourner plus vite que les horloges terrestres !

Comment puis-je affirmer dans un cas que ce sont les horloges de la fusée qui ralentissent et dans l'autre celles de la Terre ? N'est-ce pas contradictoire ? Nullement. Pour le comprendre, il faut d'abord éviter de prendre l'expression « les horloges ralentissent » dans un sens strict (absolu). Il faut ensuite décrire soigneusement l'expérience à laquelle on se réfère. Ce qui importe dans les deux expériences considérées c'est que dans la succession des événements considérés (à savoir l'observation des horloges à travers les hublots à intervalles réguliers, par exemple toutes les heures pour celui qui regarde), ces événements se produisent au même endroit dans l'un des repères, et dans des endroits différents dans l'autre. C'est là le point crucial. Or il est très facile de voir, à partir de l'équation d'invariance, que c'est dans le repère où la coordonnée spatiale des événements ne change pas que les temps mesurés sont les plus courts. C'est dans le repère où il est au repos que l'observateur compte les temps les plus courts. Algébriquement, le calcul est élémentaire: c'est celui que nous avons fait ci-dessus. On peut le ré-écrire de façon un peu plus générale. À partir d'un top horaire d'origine dont les coordonnées spatiales et temporelles seront prises nulles dans les deux repères, considérons l'événement « observation d'horloge à travers un hublot ». Dans le repère 1, l'observateur est au repos et le temps mesuré est (T 1). Dans le repère 2, l'horloge observée se trouve à la distance D (disons en secondes) et le temps mesuré est (T 2). Le théorème d'invariance nous dit que

(T 1) 2 = (T 2) 2 - D 2.
Par conséquent
(T 2) 2 = (T 1) 2 + (quelque chose de positif).
Le temps T 2 compté dans un repère quelconque est donc toujours supérieur au temps T 1 compté dans le repère où l'observateur est au repos (on parle de repère propre de l'observateur).

En conclusion, que ce soit l'occupant-e de la fusée qui voit défiler les horloges des planètes rencontrées en chemin (préalablement sychronisées, je le répète) ou un-e terrien-ne qui observe les horloges d'un cortège de fusées (elles aussi synchronisées), c'est toujours dans « l'autre » repère que les temps comptés sont les plus longs.

Terminons en notant que ce phénomène de « dilatation du temps » dans un repère extérieur à une particule permet d'expliquer comment telle particule produite dans la haute atmosphère terrestre sous l'effet des rayons cosmiques peut atteindre le sol terrestre alors que sa durée de vie, très brève, ne le lui permettrait pas dans le cadre classique. Dans le repère terrestre la particule peut facilement vivre en effet dix mille fois plus longtemps que dans son propre repère (c'est une façon de parler que le contexte permet de comprendre sans ambiguïté).  

Bien qu'exprimés dans une même unité, le temps et l'espace diffèrent entre eux

Si l'espace et le temps sont unifiés par la théorie de la relativité restreinte et inclus dans une même structure et si nous avons insisté sur le fait qu'on pouvait les exprimer dans une même unité, la seconde, le passage se faisant grâce à notre précieuse vitesse de la lumière, chacun des deux éléments conserve toutefois sa propre identité. Ce serait une erreur d'exagérer la similitude entre espace et temps au point de les confondre. Nous avons construit ci-dessus une quantité qui s'est révélée invariante par changement de repère, et que nous écrirons sous la forme [(Δx ) 2 - (Δt ) 2], laquelle constitue une généralisation au cas de deux événements quelconques A et B (maintenant A n'est plus forcément l'origine des coordonnées). Dans cette expression « Δx » représente la différence « (x B - x A) » entre les coordonnées spatiales des événements A et B, et « Δt » la différence « (t B - t A) » entre les dates de ces événements. Nous appellerons « carré de l'intervalle » (entre l'événement A et B) cette différence de carrés et nous noterons pour nous en souvenir :

(carré de l'intervalle) = (distance) 2 - (temps) 2.

Ce carré de l'intervalle entre A et B de la géométrie de l'espace-temps est le pendant direct de la distance (ou de son carré plus exactement) en géométrie euclidienne, la géométrie des arpenteurs. La différence essentielle entre le carré de la distance euclidienne et le carré de l'intervalle lorentzien (la géométrie de l'espace-temps porte le nom de géométrie de Lorentz, ou géométrie lorentzienne) est l'apparition d'un signe « - ». La présence de ce signe change radicalement les propriétés de l'intervalle de l'espace-temps par rapport à la distance « ordinaire » de l'espace. C'est ce signe qui marque la différence incontestable et irréductible entre espace et temps. Au sens propre et au sens figuré ce signe oppose le temps et l'espace.

Sous cet angle, c'est une mauvaise idée que d'adopter la convention proposée en son temps par Minkowski (1864-1909 ; mathématicien, autre grand nom de la théorie de la relativité) : celle d'introduire un temps imaginaire « w » égal à « it », où « i » est le symbole imaginaire égal à (-1)½ (ce qui fait que « w 2 » devient égal à « -t 2 » et qu'on peut conserver artificiellement un signe « + » devant le temps devenu imaginaire dans l'expression du carré de l'intervalle). En effet, une quantité physique ne peut pas être imaginaire et, dussé-je contredire le célèbre auteur du livre A brief history of time, un « temps imaginaire » n'a aucune signification physique et relève de l'affabulation, voire du fantasmatique. (Les symboles mathématiques, pour utiles et indispensables qu'ils soient en science, n'existent pas dans la réalité.)

Enfin, la présence du signe « - » dans l'expression du carré de l'intervalle fait apparaître une caractéristique d'une importance capitale, nouvelle et différente de toutes les propriétés connues de la géométrie euclidienne. D'abord la différence des carrés peut évidemment prendre des valeurs positives ou négatives, selon que la partie spatiale « (D / c) 2 » l'emporte ou non sur la partie temporelle « (T ) 2 ». Mais arrêtons-nous surtout à une seconde propriété. En géométrie « ordinaire » la distance entre A et B ne peut être nulle que si et seulement si les deux points sont confondus. Au contraire en géométrie de Lorentz (celle de l'espace-temps) l'intervalle entre les événements A et B peut très bien s'annuler même si les séparations de leurs coordonnées spatiales (la distance) et temporelles (la durée qui les sépare) ne sont pas nulles l'une et l'autre. Il suffit pour cela que « (D / c) 2 » soit égal à « (T ) 2 ». À quoi ce cas correspond-il ? Eh bien tout simplement à la situation dans laquelle on peut établir une connexion lumineuse entre les événements A et B, c'est-à-dire lorsqu'un signal lumineux émis au même lieu et à la même date que l'événement A atteindra le lieu où B se produit précisément au moment où il se produit. En effet, la partie spatiale « (D / c) 2 » représentant le temps qu'il faut à la lumière pour parcourir la distance D, dire que ce temps est aussi la partie temporelle « T » qui sépare les événements A et B revient bien à dire que la lumière partie de A au moment où A se produit atteindra B au moment où B se produit. (Autre exemple simple pour nous faire comprendre. Une supernova, située à la distance D explose : voilà l'événement A. Un astronome voit dans son télescope l'éclat de lumière correspondant : voilà l'événement B. Si T est le temps mis par la lumière pour parvenir à l'œil de l'astronome, on a T = D / c et donc (D / c) 2 - T 2 = 0.)

Il est évident que pendant la durée « T » tous les points C situés entre le point A et le point B seront atteints (et le seront à un temps t < T ) alors qu'au contraire les points situés plus loin que B ne le seront pas. Si nous appelons C l'événement « arrivée au point C du signal issu de A », comme C est situé entre A et B nous pourrons dire que l'événement C est postérieur à l'événement A et antérieur à l'événement B.

Il n'est pas toujours possible d'établir entre deux événements ce lien causal qui nous permet de les distinguer en qualifiant l'un d'antérieur à l'autre. Il se peut que deux événements se révèlent indépendants, sans que l'un soit à même d'exercer un quelconque effet sur l'autre. C'est à ce stade qu'intervient l'espace : celui qu'il faut franchir pour passer d'un lieu à l'autre. Et c'est ici que se révèle la portée physique de la définition de l'intervalle de Lorentz entre deux événements.

Imaginons d'une part un condamné à mort devant être exécuté en tel lieu (disons sur la planète Titan) à telle heure (que ceux et celles qui se mobilisent contre la peine de mort me pardonnent cet exemple !), et d'autre part le président sur Terre du pays de l'infortuné personnage, ayant pris à telle autre heure, antérieure de « T » secondes, la décision de gracier le coupable. Pour que la grâce accordée puisse être suivi de l'effet escompté, il est nécessaire que les signaux envoyés par le président, transmis par radio à la vitesse de la lumière, vitesse la plus rapide qu'il soit, aient le temps d'arriver avant l'heure fatidique. Ce qu'il faut comparer, c'est le temps nécessaire « (D / c) » pour parcourir la distance « D » séparant le bureau présidentiel de la prison et le temps disponible « T » entre l'heure d'émission du message et l'heure prévue pour l'exécution capitale. Deux cas se présentent. Si le temps nécessaire D/c est trop grand devant le temps disponible T, l'événement « grâce accordée » ne pourra pas agir sur l'événement « exécution ». Au contraire, si le temps disponible T est assez grand devant le temps minimum nécessaire D/c, la grâce agira sur l'exécution prévue pour la bonne fortune du condamné.

Pour être complet, dans le premier cas le carré de l'intervalle, soit [(distance) 2 - (temps) 2] est positif et l'intervalle est dit du genre « espace » car c'est l'espace qui « domine » ; dans le second, le carré de l'intervalle est négatif et ce dernier est dit du genre « temps ».  

Le problème du changement de repère

En découvrant que la distance d'un point au Palais royal était indépendante du choix du système de repérage, l'étudiante n'avait fait que la moitié du travail. Elle se fit alors aider d'une stagiaire et à deux elles achevèrent l'œuvre commencée en établissant les formules numériques permettant d'obtenir les coordonnées d'un point dans l'un des systèmes de repérage lorsqu'on les connaissait dans l'autre. Et elles enseignèrent à leur tour leur théorie aux géomètres. Dès lors le géomètre de jour, qui utilisait le nord donné par la boussole, sut transformer en coordonnées de jour les coordonnées mesurées par le géomètre de nuit, qui lui se servait du nord de l'étoile polaire. Et réciproquement.

On aura compris que les « formules de changement de repère » sont les formules « euclidiennes ». Les axes de repérage de jour se déduisant des axes de nuit par une rotation (le nord magnétique fait un certain angle avec le nord géographique) ces formules correspondent en vérité à une rotation des axes de coordonnées. (Ces expressions garantissent, on peut le vérifier, que la somme des carrés des coordonnées -  ou carré de la distance du point considéré à l'origine - conserve la même valeur lorsqu'on change de système de repérage, propriété que l'étudiante avait remarquée avant d'établir les formules.)

De même les physiciens, depuis l'avènement de la théorie de la relativité, savent passer des coordonnées d'un événement mesurées dans le repère de la fusée animée d'une vitesse « v » aux coordonnées du même événement mesurées sur Terre. Pour effectuer cette opération ils se servent des « formules de Lorentz ». On peut vérifier que ces formules de changement de repère « respectent l'intervalle » entre l'événement considéré et l'événement origine des coordonnées. Réciproquement d'ailleurs, si des formules garantissent l'invariance de l'intervalle, ce sont des formules de Lorentz.

Avec ces formules une nouveauté majeure surgit en relativité restreinte. Elle a déstabilisé plus d'un esprit, habitués que nous sommes à raisonner en terme de géométrie euclidienne. Il est un peu difficile de comprendre en effet ce qui se passe quand on compose deux changements de repère successifs, c'est-à-dire lorsqu'on « ajoute » deux vitesses. Voici le problème. Un boulet de canon est lancé depuis la fusée, vers l'avant, avec une vitesse « w ». Les observateurs restés à terre enregistrent et mesurent la trajectoire du boulet. Quelle vitesse mesurent-ils ? En géométrie euclidienne, nous dirions qu'ils mesurent « v + w ». (Rappelons que nous raisonnons avec une seule composante spatiale au lieu de trois de sorte que les vecteurs-vitesse sont remplacés par des nombres algébriques.) Or les formules de Lorentz indiquent un autre résultat : en géométrie de l'espace-temps la vitesse dans le repère terrestre (vitesse du boulet par rapport à la Terre) n'est pas la somme de la vitesse « w » (vitesse du boulet par rapport à la fusée) et de la vitesse « v » (vitesse de la fusée par rapport à la Terre).

En géométrie de l'espace-temps, lorsqu'on « ajoute » deux vitesses, les vitesses ne s'ajoutent pas.

La formule donnant la vitesse du boulet par rapport à la Terre peut paraître un peu compliquée à une personne non avertie mais un changement de variable va la simplifier considérablement et surtout nous fournir une interprétation nouvelle et profonde de la notion de vitesse. Nous allons montrer qu'à condition d'utiliser un certain « paramètre de vitesse » (lié à la vitesse par une formule très simple) la composition de deux vitesses se traduit effectivement par une pure addition. Nous en déduirons ensuite que dans ce cadre formel la vitesse de la lumière joue très exactement le rôle d'un infini et se révèle de ce fait impossible à dépasser.  

Un changement de variable astucieux

Retournons voir les arpenteurs euclidiens. Chez eux on passe d'un système de référence à un autre par une rotation des axes : ce qui change entre le repère de jour et celui de nuit c'est l'angle que fait la direction du nord magnétique avec celle du nord géographique. Les choses sont simples parce que l'angle de rotation est un paramètre additif. Si une rotation d'angle « α 1 » par rapport au repère « 0 » fournit le repère « 1 » et si celui-ci subit à son tour une rotation d'angle « α 2 » pour conduire au repère « 2 », alors le repère final « 2 » se déduit du repère initial « 0 » par une rotation d'angle « α 1 + α 2 ». Autrement dit en géométrie euclidienne, lorsqu'on ajoute deux rotations, la transformation résultante est une rotation dont l'angle est la somme des angles de rotation. En bref, les angles de rotation s'ajoutent.

Mais les vitesses, elles, ne s'ajoutent pas ! Que faire ? Est-il possible d'introduire une sorte d'angle ? La réponse est oui. Le tour de prestidigitation qui accomplit cette opération est décrit dans ce qui suit.

En géométrie de l'espace-temps le repère « en mouvement », celui de la fusée, est caractérisé par une vitesse. Et une vitesse, c'est le rapport d'une distance x à un temps t. Rappelons-nous alors que x et t sont les coordonnées d'un événement, respectivement le long de l'axe des distances et le long de celui des temps. Or que peut nous évoquer le rapport d'une coordonnée sur l'autre ? Revenons à la géométrie euclidienne.

Si un point A a pour coordonnées euclidiennes x et y on apprend dans les « petites classes » que la quantité « y/x » représente la pente de la droite OA, une droite caractérisée par l'angle qu'elle fait avec l'axe des x. Comment passe-t-on de la pente à l'angle ? La trigonométrie élémentaire nous le dit : la pente (y/x) est la tangente de l'angle (Ox, OA). Si nous disposons d'une petite calculette scientifique, nous savons trouver en sens inverse l'angle (ou l'arc) dont la tangente vaut telle quantité « p » (« p » pour « pente ») : c'est la touche qui calcule la fonction dite inverse de la tangente elle-même. Elle est notée par exemple « tan-1 » ou « atan » (qui veut dire « arc tangente »). Par exemple l'arc dont la tangente est 1 vaut 45° (entrer 1 dans la calculette mise en mode « degrés », appuyer sur la touche « atan », 45 doit s'afficher).

La géométrie de l'espace-temps, ce n'est certes pas pareil, mais l'idée de passer d'une pente à un angle reste bonne. Notre pente, c'est la vitesse « v = x/t », ou plutôt « (v/c) = (x/ct) » en transformant les distances en temps pour avoir un rapport sans dimension (cela revient à prendre c comme unité de vitesse). Allons-nous choisir l'arc dont la tangente est « v/c » ? Pas exactement mais presque. Le « truc » consiste à considérer non plus les fonctions trigonométriques habituelles (sinus, cosinus, tangente), celles qu'on appelle circulaires, mais les fonctions trigonométriques dites hyperboliques, celles notées (habituellement) « sinh », « cosh », « tanh » pour « sinus hyperbolique », « cosinus hyperbolique », « tangente hyperbolique ».

Et si nous utilisons ce « truc », le calcul montre que les formules de Lorentz ont exactement la même forme que les formules de rotation euclidiennes à condition de remplacer les fonctions trigonométriques circulaires (en particulier cosinus et sinus) par les fonctions hyperboliques correspondantes.

Le tour est joué.

Quelle est donc finalement la recette permettant de passer de la vitesse v/c à « l'angle de vitesse », que nous appellerons « paramètre de vitesse » ? Eh bien, c'est la règle que nous avons indiquée plus haut en géométrie euclidienne. De même que l'angle euclidien « α » était l'arc dont la tangente était égale à y/x [algébriquement : α = atan (y/x)], de même le paramètre de vitesse « θ » est l'argument dont la tangente, cette fois hyperbolique, est égale à « v/c » [algébriquement : θ = atanh (v/c)].

Vous avez du mal à suivre ? À vos calculettes !

Pour passer du paramètre de vitesse « θ » à la vitesse « v/c » elle-même, introduire « θ » puis appuyer sur la touche « tanh » (tangente hyperbolique). Pour passer à l'inverse de la vitesse « v/c » au paramètre de vitesse « θ », introduire « v/c » puis appuyer sur la touche « atanh » (ou « tanh-1 »). Et vérifiez les valeurs des deux tableaux 4 et 5 qui suivent.

Table 4 : passage du paramètre angulaire de vitesse à la vitesse. Formule : v/c = tanh(θ)
 
Paramètre angulaire
de vitesse
θ 0,1 0,2 0,5 0,8 1,0 2,0 3,0
Vitesse en unité de la
vitesse de la lumière
v/c 0,0997 0,197 0,462 0,664 0,762 0,964 0,995

Table 5 : passage de la vitesse au paramètre angulaire de vitesse. Formule : θ = atanh(v/c)
 
Vitesse en unité de la
vitesse de la lumière
v/c 0,1 0,3 0,5 0,7 0,9 0,95 1,0
Paramètre angulaire
de vitesse
θ 0,1003 0,3095 0,549 0,867 1,47 1,83
 

Le paramètre angulaire de vitesse est additif

Nous avons gagné notre pari. En introduisant le paramètre angulaire « θ », nous nous sommes donné le moyen de composer deux vitesses en ajoutant leurs paramètres correspondants. Le paramètre angulaire de vitesse est un paramètre additif. De même qu'en géométrie euclidienne de nos arpenteurs royaux la composition de deux rotations était une rotation dont l'angle était la somme des angles des deux rotations initiales, de même en géométrie lorentzienne de nos physiciens de l'espace-temps la vitesse résultant de la composition de deux vitesses a pour paramètre angulaire la somme des paramètres angulaires des deux vitesses combinées.

Un exemple illustratif est le bienvenu : celles et ceux qui auront suivi le raisonnement jusqu'ici même méritent bien leur récompense ! Calculons ensemble, je vous prends par la main.

Le boulet de canon est tiré de la fusée à la vitesse 0,5 c (à la moitié de la vitesse de la lumière, c'est déjà une belle vitesse !). La fusée elle-même voyage à 0,5 c par rapport à la Terre. Quelle est la vitesse (pour ainsi dire « résultante ») du boulet par rapport à la Terre ? « 0,5 + 0,5 » ferait-il « 1 » ? Non ! La vitesse résultante n'est pas la somme des vitesses. En revanche, nous venons d'apprendre que le paramètre angulaire de la vitesse résultante est la somme des paramètres angulaires des vitesses composées. En employant cette façon de procéder le calcul est élémentaire. Pour trouver le paramètre angulaire de vitesse correspondant à la vitesse v = 0,5 c, j'introduis 0,5 comme argument dans la calculette, j'appuie sur la touche « tanh-1 » (ou « atanh ») : résultat 0,549 (voir le tableau 5). J'ajoute les deux paramètres de vitesse, celui du boulet par rapport à la fusée et celui de la fusée par rapport à la Terre, soit 0,549 + 0,549 = 1,098. Je reviens ensuite à la vitesse elle-même en prenant la tangente hyperbolique (touche « tanh ») de ce dernier chiffre. Résultat : tanh (1,098) = 0,8. Par conséquent, nous trouvons que la vitesse du boulet par rapport à la Terre est de 0,8 c. Autrement dit, en composant la vitesse 0,5 c à la vitesse 0,5 c on obtient le résultat 0,8 c. En somme, avec la loi relativiste de composition des vitesses, « 0,5 + 0,5 = 0,8 » !  

La vitesse de la lumière est la même dans tous les repères

Maintenant que la relativité restreinte n'a plus de secret pour nous et que, en particulier, nous savons « additionner » les vitesses, nous allons comprendre pourquoi la vitesse de la lumière est « invariante » par changement de repère, c'est-à-dire prend la même valeur dans le repère de la fusée et dans le repère terrestre. En particulier cette vitesse ne dépend pas de la direction dans laquelle elle est mesurée (que ce soit «vers l'avant » ou « vers l'arrière ») : elle est isotrope. L'explication tient en quelques mots : dans notre formalisme la vitesse de la lumière se comporte comme un infini. Et l'infini plus quelque chose redonne l'infini.

Nous avons joué avec notre calculette. Mais avez-vous essayé de  calculer l'argument qui fournirait une tangente hyperbolique égale à « 1 » ? Introduisez « 1 » puis appuyer sur la touche « tanh-1 » ou « atanh ». Mauvaise surprise : la calculette signale une erreur en indiquant que le résultat est infini. Autrement dit, le paramètre angulaire d'une vitesse égale à la vitesse de la lumière ((v/c) = 1) est infini.

Dans ces conditions, comment cette vitesse c va-t-elle se composer avec une autre vitesse, celle de la fusée par exemple ? Nous savons répondre. Pour trouver la vitesse résultante il suffit de faire la somme des paramètres angulaires des vitesses à composer. Mais comme le paramètre angulaire de la vitesse de la lumière est infini, en lui ajoutant le paramètre angulaire de vitesse de la fusée, le paramètre angulaire résultant restera infini. Corrélativement la vitesse résultante restera égale à c.

Qu'on la mesure dans n'importe quel repère, la vitesse de la lumière est toujours égale à c.

Le fait que la vitesse de la lumière soit indépendante du système de coordonnées dans lequel on la mesure a eu, on le sait, une importance décisive dans l'invention de la théorie de la relativité. En montrant que cette vitesse de la lumière ne dépendait pas de la direction dans laquelle elle était mesurée, l'expérience de Michelson et Morley (l'article en décrivant le résultat date de 1887) a remis en cause toute la physique classique. Ces physiciens utilisèrent le vaisseau terrestre comme un repère en mouvement. La Terre tourne en effet autour du Soleil à la vitesse d'environ trente kilomètres par seconde. Selon la loi de composition des vitesses façon Galilée les vitesses devaient s'ajouter de sorte que la vitesse de la lumière, poussée en quelque sorte par la vitesse de la Terre, aurait dû être plus grande dans le sens où notre planète avance dans l'espace que dans le sens opposé ou dans le sens perpendiculaire. Mais en répétant les mesures tout au long de l'année, le long de l'orbite terrestre, Michelson et Morley ne détectèrent aucun effet de vitesse. Il fallait construire une théorie dans laquelle la valeur de la vitesse de la lumière s'avèrerait indépendante et de la direction et du repère choisi pour la mesurer.  

La vitesse de la lumière : accessible ou inaccessible ?

Cependant à ce point de notre raisonnement les choses sont-elles si claires ? En effet, l'infini n'ayant pas de signification physique, la vitesse de la lumière ne devrait pas « exister » en pratique. Pourtant la lumière se propage bien… à la vitesse de la lumière. Comment est-ce possible ? L'explication du paradoxe s'obtient en étudiant les nouvelles formes que prennent les notions d'énergie et d'impulsion (une quantité directement liée à la vitesse d'une particule, puisque égale au produit mv de sa masse m par sa vitesse v) dans la théorie relativiste.

Dire qu'on ne peut pas atteindre la vitesse de la lumière est à la fois vrai et faux.

Tout d'abord c'est vrai : une particule ne pourra jamais être accélérée jusqu'à la vitesse de la lumière. Les formules de Lorentz nous ont montré qu'augmenter la vitesse d'une particule revenait à faire une addition algébrique sur son paramètre angulaire « θ » de vitesse. Or il est clair qu'une telle opération additive ne pourra jamais donner l'infini, celui-ci étant par nature inaccessible.

C'est du point de vue dynamique qu'on voit le mieux les choses, car la théorie montre qu'il faudrait fournir à la particule une énergie et une impulsion infinies pour qu'elle se déplace à la vitesse de la lumière, même si sa masse était toute petite. Ce résultat est nouveau par rapport à la dynamique newtonienne. En effet dans un cadre pré-relativiste, l'énergie cinétique d'une masse m animée d'une vitesse c serait « ½ m c 2 ». Si cette formule était vraie, il suffirait d'accélérateurs de quelques centimètres de long pour communiquer à des électrons la vitesse c, et le fait qu'il faille construire des accélérateurs de particules gigantesques mesurant des kilomètres et coûtant des sommes astronomiques montre que cette formule n'est pas valable au royaume des vitesses approchant celle de la lumière. En dynamique relativiste, l'énergie d'une particule de masse m dans le repère où elle est animée d'une vitesse v est « m c 2 / [1 - (v/c) 2] (1/2) » (nous démontrerons ce résultat plus bas). Cette expression (dans laquelle nous retrouvons en dénominateur le facteur fameux de "ralentissement des horloges") tend vers l'infini quand v tend vers c. Cela prouve bien qu'il est impossible de communiquer à une particule une vitesse égale à c. (Dans les accélérateurs la vitesse des particules est si proche de c, n'en différant parfois que par moins de 10-10, qu'il est malcommode de l'écrire telle quelle, comme 0,999 999 999 12 c par exemple. De nouveau la vitesse même n'est pas le bon paramètre. On préfèrera caractériser la particule accélérée par son énergie, pour déclarer par exemple qu'un électron acquiert une énergie finale de quarante gigaélectronvolts, ou 40 GeV.)

Il est vrai maintenant que la lumière se propage à la vitesse c. Et quand nous disons cela, il ne s'agit pas d'une approximation, comme si cette vitesse était « pratiquement » égale à la limite ultime et ne l'atteignait pas rigoureusement. Comment cela se fait-il ? La réponse résiderait-elle dans le fait que la lumière est une onde et se comporterait différemment d'une particule ? Non, car la lumière est en même temps, sous un certain angle, constituée de particules, les photons, comme Planck (1858-1947) et Einstein en ont fait l'hypothèse.

En vérité, un photon se déplace à la vitesse de la lumière parce que sa masse est nulle. Inversement d'ailleurs, tout agent de transport d'énergie de masse nulle (le rayonnement électromagnétique, les ondes gravitationnelles et jusqu'à nouvel ordre les neutrinos) se propage nécessairement à la vitesse de la lumière.  

L'énergie comme composante d'un quadrivecteur

Revenons à la théorie. Quel est en géométrie de l'espace-temps l'équivalent du vecteur vitesse de la géométrie euclidienne ? C'est ce que nous allons voir maintenant. Incidemment, en poursuivant la généralisation des notions de mécanique newtonienne à l'espace-temps lorentzien de la relativité, nous allons tomber sur la formule proposée par Einstein devenue peut-être la plus connue du grand public : la célébrissime « E = m c 2 ».

Nous avons vu que la base de la géométrie relativiste consistait à considérer non plus des points mais des événements, ce qui avait pour conséquence de faire passer d'une géométrie à trois dimensions à une géométrie à quatre dimensions, une de temps et trois d'espace. En cinématique newtonienne classique, le mouvement d'un point P correspond au changement de sa position. Il s'analyse en étudiant la succession de déplacements élémentaires ΔP pendant des intervalles de temps Δt consécutifs. Et la dérivée « ΔPt » (limite du rapport du déplacement ΔP sur sa durée Δt quand Δt tend vers 0) est définie comme la vitesse du point P. (Algébriquement v = ΔPt.) Que devient ce formalisme dans le cadre de la relativité restreinte ? Nous savons que nous devons considérer ici des événements, en associant temps écoulé et espace parcouru. Là où en physique newtonienne nous étudiions le « mouvement d'un point », il s'agira maintenant de suivre une succession d'événements. Formellement on s'intéresse donc à l'évolution d'un vecteur à quatre dimensions dont la première composante est le temps t et les trois autres les coordonnées spatiales du point. Ce n'est plus « un point P à un instant t », c'est « un point P et un instant t ». Pourquoi la différence est-elle considérable ? Parce qu'en relativité un intervalle de temps dépend du repère choisi pour les mesurer. Le temps t n'a plus de sens absolu : on ne peut pas en parler comme s'il avait une valeur universelle, la même pour tous les observateurs. Il devient une simple coordonnée.

En d'autres termes, on ne suit plus une particule en fonction du temps (supposé implicitement absolu) mais on suit « l'historique des événements ». Techniquement parlant, la courbe décrite dans un espace à quatre dimensions par le « point-événement » {P cursif} s'appelle une « ligne d'univers ». Par souci de simplicité, nous considèrerons à nouveau (comme plus haut) une seule coordonnée spatiale x (au lieu de trois : x, y, z). Elle sera portée disons en abscisse, tandis que la coordonnée temporelle t sera portée en ordonnée. Une ligne d'univers se réduit alors à une courbe dans un système d'axes à deux dimensions.

Comment construire une vitesse à quatre dimensions (ou un « quadrivecteur » vitesse) ? Il suffit penserez-vous de considérer le taux de déplacement (à quatre dimensions) en fonction du temps du point représentant l'événement {P cursif}. Oui, parfaitement ! Mais une difficulté surgit : par rapport à quel temps allons-nous mesurer l'historique puisqu'il n'y a plus de temps absolu ? Il n'est pas question de dériver par rapport au temps du référentiel considéré car la quantité obtenue, qui dépendrait du choix de système de coordonnées, serait dénuée de signification physique. La solution est simple : pour obtenir une grandeur « vitesse » ayant une consistance intrinsèque, il suffit de dériver les déplacements du point-événement {P cursif} par rapport au temps propre de la particule repérée (nous en avons parlé plus haut ; il s'agit du temps dans un repère lié à cette particule, repère dans lequel elle est au repos). Si nous notons τ ce temps propre, le quadrivecteur vitesse sera formellement la quantité u = Δ{P cursif}/ Δτ .) À nouveau le tour est joué.

Démontrons immédiatement une première relation, extrêmement simple, relative à ce quadrivecteur vitesse. Pour simplifier l'écriture, nous comptons d'abord les longueurs en secondes et les vitesses en unités de c. Nous reviendrons à la fin aux unités "ordinaires". Nous avons appris plus haut que lorsque dans un changement de repère les composantes d'un quadrivecteur se transformaient selon les formules de Lorentz (ce qui est ici le cas) alors la différence des carrés de la partie spatiale et de la partie temporelle du quadrivecteur se révélait invariante. Que donne ici cette règle ? Appelons carré de la norme de u le carré de la quantité invariante (en référence à la norme, c'est-à-dire la longueur, euclidienne d'un vecteur). Pour évaluer cet invariant, regardez comme les choses sont simples. Plaçons nous dans le repère de la particule. La composante spatiale est évidemment nulle puisque dans son repère la particule ne bouge pas. Quand à la composante temporelle, puisqu'il s'agit par définition de la dérivée du temps propre t par rapport à ce temps propre t, elle est tout simplement égale à l'unité. Pour trouver le carré de la norme lorentzienne, nous prenons le carré de la partie spatiale, à savoir « 0 » et nous retranchons le carré de la partie temporelle, à savoir « 1 ». Le résultat est égal à -1 et il sera vrai dans tous les repères. Autrement dit, quel que soit le repère choisi pour en mesurer les composantes, on aura toujours

(partie spatiale de u) 2 - (partie temporelle de u) 2 = -1
 

(dans le repère propre : 0 - 1 = -1 !).

Poursuivons le raisonnement. De même que l'impulsion classique d'une particule était le produit « p = mv » de la masse par la vitesse, de même le produit « mu » du quadrivecteur vitesse « u » par la masse « m » de la particule devient un quadrivecteur impulsion. On l'appelle souvent vecteur « énergie-impulsion ». Pourquoi ce terme ?

Le quadrivecteur mu se décompose en deux parties, une partie temporelle E (quantité scalaire, c'est-à-dire se réduisant à un nombre) et une partie spatiale p (vecteur à trois dimensions). Or Einstein a eu d'excellentes raisons d'avancer (et l'histoire ultérieure de la science lui donnera amplement raison) que l'on pouvait identifier la partie temporelle E à l'énergie de la particule et la partie vectorielle p à son impulsion, l'ensemble formant donc le quadrivecteur énergie-impulsion (E, p).

Maintenant que ces bases sont établies, les résultats vont pleuvoir !

Premier résultat : empressons-nous d'appliquer le théorème relatif à l'invariance de la norme. Si le carré de la norme de u est égal à -1, le carré de la norme de mu est égal à -m 2. En écrivant explicitement ce carré comme la différence du carré de la composante spatiale p et du carré de la composante temporelle E, nous aboutissons au résultat capital :

p 2 - E 2 = - m 2   (ou E 2 - p 2 = m 2 ),

dont nous allons tirer plusieurs conséquences.  

E = m c 2 : enfin !

Appliquons cette formule dans le repère de la particule. Dans ce système de coordonnées la particule est au repos et par conséquent p = 0 (pas de mouvement !). Donc, on a E = m. L'énergie d'une particule au repos est égale à sa masse. Cette formule, telle quelle, ne vous dit peut-être rien, mais en revenant aux unités « ordinaires » (m en grammes ou kilogrammes, E en ergs ou en joules), cela s'écrit (car on sait par ailleurs qu'en unités courantes E a les dimensions de m v 2 , donc pour obtenir des unités d'énergie il faut bien multiplier la masse par le carré de la vitesse de la lumière)

E = m c 2,

et là vous ne pouvez que la reconnaître ! Donc maintenant, vous savez démontrer E = m c 2. Bravo, je vous en félicite ! Cette formule fameuse aura eu une importance historique fantastique puisqu'elle a permis au début du vingtième siècle de résoudre une énigme alors indéchiffrable en fournissant l'identification de la source d'énergie rendant les étoiles capables de briller pendant des milliards ou dizaines de milliards d'années.

Quelle est l'expression de E dans un repère autre que le repère propre de la particule ? C'est facile ! La composante temporelle du quadrivecteur u = Δ{P cursif} / Δτ est égale à Δtτt est le temps dans le repère disons terrestre et τ le temps propre. Or nous avons vu plus haut que ce rapport (durée T comptée à Terre divisée par durée F comptée dans la fusée) est égal à « 1 / [1 - (v/c) 2] ½ ». Par conséquent l'énergie d'une particule se déplaçant à la vitesse v dans un certain repère, énergie évaluée dans ce repère, est

E = m / [1 - (v/c) 2]½


en unités "relativistes". Comme annoncé, cette énergie tend vers l'infini lorsque la vitesse de la particule tend vers c, de sorte qu'il est impossible pour un corps d'atteindre cette valeur limite. De plus, grâce à cette expression explicite de E il est possible par simple manipulation (car en l'élevant au carré on a tout de suite E 2 [1 - (v/c) 2] = m 2, formule que l'on combinera avec E 2 - p 2 = m 2) d'aboutir à une autre formule utile, à savoir

p = (v/c) E (en unités « relativistes »)

ou
p = (v/c) (E/c)

en unités ordinaires. Vous savez tout !

Et le photon ? Nous sommes bien armés pour répondre à cette question. Bien entendu, puisque le photon se propage à la vitesse de la lumière, l'expression de l'énergie donnée plus haut ne convient plus (le dénominateur est nul). En revanche les dernières formules écrites fournissent une vision particulièrement claire du statut du photon en relativité restreinte. En effet, la relation entre p et E devient

p = E,
ou
p = E / c

en unités conventionnelles. Cette relation est valable pour toute énergie se propageant à la vitesse de la lumière. Pour un photon, Planck a été amené à écrire que l'énergie d'un photon de fréquence ν (« nu ») était , h représentant la constante de Planck. Par conséquent sa quantité de mouvement est le vecteur de longueur (hν / c) porté par la direction de propagation.

D'autre part, si p = E (en unités relativistes), la relation E 2 - p 2 = m 2 montre qu'alors la masse m est égal à zéro. L'ensemble est parfaitement cohérent : tout mécanisme de propagation d'énergie à la vitesse de la lumière correspond à une quantité de mouvement égale à l'énergie et à une « masse au repos » nulle. En sens inverse, une particule de masse nulle se déplace forcément à la vitesse de la lumière. (Si m = 0, p = E et donc v/c = 1.)

La boucle est bouclée. Les photons de masse nulle se propageant nécessairement à la vitesse de la lumière cohabitent avec les particules de masse non nulle se propageant nécessairement à des vitesses inférieures à celle de la lumière. La vitesse de la lumière a trouvé sa place ultime dans la théorie de la relativité restreinte alors même qu'elle en constituait le fondement initial.  

Plus vite que la lumière ?

Nous l'avons abondamment illustré : dans le cadre de la théorie de la relativité restreinte (que l'on me pardonne de le répéter) aucune particule possédant une masse ne peut se déplacer à la vitesse de la lumière. Comme je le disais plus haut, seuls les trois agents de transport d'énergie que sont le rayonnement électromagnétique, le rayonnement gravitationnel et les neutrinos (tant que nous n'avons pas confirmation du fait qu'ils possèderaient une masse) se propagent à la vitesse de la lumière. De toute façon aucune vitesse ne peut être supérieure à c. Et pourtant ! en relativité générale, la question se pose différemment. On sait que l'espace est en expansion. Cette expansion se traduit par une vitesse de récession apparente des galaxies. Je parle de vitesse « apparente » car il ne s'agit pas d'un déplacement sur un substrat mais d'une dilatation de l'espace lui-même. La situation est analogue à celle d'un élastique sur lequel se trouveraient des fourmis. Si on allonge l'élastique alors que les fourmis sont au repos, la distance entre deux fourmis augmente, bien qu'elles ne soient animées d'aucun mouvement.

Nous savons aussi que dans le cas d'une expansion uniforme, la vitesse apparente de fuite est proportionnelle à la distance (c'est la fameuse « loi de Hubble »). Cela est facile à comprendre. Si dans un certain laps de temps T  les longueurs augmentent toutes de la même proportion, disons 10%, la galaxie située à cent millions d'années de lumière se sera éloignée de dix millions d'années et celle située deux fois plus loin, à deux cents millions d'années, se sera éloignée d'une distance double : vingt millions d'années. Donc la galaxie deux fois plus lointaine a, dans le même temps, « parcouru une distance » (l'expression n'est pas vraiment correcte !) deux fois plus grande que la plus proche, et de ce fait sa vitesse apparente est deux fois plus grande. La situation est la même pour les raisins de tout cake honnête qui augmente de volume en cuisant.

Mais alors, pour des galaxies suffisamment lointaines, cette pseudo-vitesse de fuite peut-elle dépasser la vitesse de la lumière ? La réponse est « oui », rien ne s'oppose à cela. Mais il n'y a pas de contradiction avec la relativité restreinte, car il ne s'agit pas d'une vraie vitesse de déplacement dans l'espace. D'ailleurs pour décrire le déplacement de cette galaxie par rapport à nous, nous ne disposons pas d'un repère galiléen susceptible de contenir à la fois la galaxie lointaine et la nôtre. Le problème relève maintenant de la relativité générale, laquelle traite justement du raccordement de tous les repères de Lorentz successifs trouvés en chemin. C'est la gravitation qui fait qu'il n'existe plus de repère général. Elle interdit précisément l'existence d'un repère absolu universel de Lorentz. C'est l'objet de la relativité générale de décrire cette situation.


Questions de cosmologie
Page d'accueil de Christian Magnan



URL :  http://www.lacosmo.com/relativite.html