Nom provisoire

Aller au contenu | Aller au menu | Aller à la recherche

mercredi 24 février 2010

Théorèmes de Gödel

En 1787, dans Critique de la raison pure, Immanuel Kant affirmait que la logique formelle n'a pas pu faire un seul pas en avant, et qu'ainsi, selon toute apparence, elle semble close et achevée. Malgré tout, Gottlob Frege fait faire des progrès à la logique en introduisant le calcul des prédicats et avec Grundgesetze der Arithmetik (fondements de l'arithmétique), il tente de dériver l'arithmétique de la logique. Mais en 1902, Bertrand Russell montre que le système formel de Frege était incohérent. On pensait alors qu'un système formel pourrait être complété en ajoutant un nombre fini d'axiomes pour le rendre complet. En 1931, Kurt Gödel met fin à cet espoir en effectuant la démonstration des deux théorèmes d'incomplétude. Comme le fait remarquer Douglas Hofstadter dans Gödel Escher Bach : Les Brins d'une guirlande éternelle, la version originale était en allemand, et vous trouverez peut-être que vous auriez tout aussi bien compris en allemand. L'article de Gödel Über formal unentscheidbare Sätze der Principia Mathematica und verwandter Systeme (Sur les propositions formellement indécidables des Principia Mathematica et des systèmes apparentés, traduit en anglais par On Formally Undecidable Propositions of Principia Mathematica and Related Systems) commence par :

Le développement des mathématiques vers plus d'exactitude a conduit, comme nous le savons, à en formaliser de larges secteurs, de telle sorte que la démonstration puisse s'y effectuer uniquement au moyen de quelques règles mécaniques. Les systèmes formels les plus complets établis jusqu'à ce jour sont, d'un côté, le système des Principia Mathematica; et, de l'autre, le système axiomatique de la théorie des ensembles établi par Zermelo-Fraenkel (et développé par J. von Neumann). Ces deux systèmes sont tellement larges que toutes les méthodes de démonstration utilisées aujourd'hui en mathématiques y sont formalisées, c'est-à-dire ramenées à quelques axiomes et règles d'inférence. On pourrait par conséquent supposer que ces axiomes et règles d'inférence suffisent pour décider de toute question mathématique qui pourrait s'exprimer formellement dans ces systèmes. Dans ce qui suit, nous montrerons que tel n'est pas le cas et qu'il existe au contraire dans ces deux systèmes des problèmes relativement simples concernant la théorie des entiers que l'on ne saurait trancher sur la base de ces axiomes. Cette situation n'est pas due, comme on pourrait le croire, à la nature spécifique des systèmes établis mais touche une très large classe de systèmes formels, à laquelle appartiennent en particulier tous les systèmes qui résultent des deux systèmes cités plus haut par addition d'un nombre fini d'axiomes, pourvu que, par ces axiomes, aucune proposition fausse ne devienne démontrable.

Les théorèmes d'incomplétude s'énoncent de la façon suivante :
  • Dans tout système formel consistant contenant une théorie des nombres finitaires relativement développée, il existe des propositions indécidables.
  • La consistance d'un tel système ne saurait être démontrée à l'intérieur de ce système.
Avec ces deux théorèmes, Gödel répond au deuxième problème de Hilbert : Peut-on prouver la consistance de l'arithmétique ?  En d'autres termes, peut-on démontrer que les axiomes de l'arithmétique ne sont pas contradictoires ?

Pour démontrer le théorème d'incomplétude, Gödel reprend le paradoxe du menteur qui énonce cette phrase est fausse. Si cette phrase est fausse, elle est vraie. Inversement, si elle fausse, elle est vraie. Gödel réussi à formaliser ce type de paradoxe pour l'arithmétique en remplaçant la notion de vérité par celle de démonstration.

Gödel va utiliser une numérotation qui consiste à attribuer un nombre unique à chaque symbole du langage formel considéré. Par exemple, 1 est associé à la négation, 2 au ou logique, 3 à l'implication,... La numérotation de Gödel permet alors de définir une injection du système formel dans l'ensemble des entiers naturels .

Par exemple, l'assertion , qui signifie il existe x tel que x soit le successeur de y, sera transformée en la suite de nombres : 8 4 11 9   8 11 5 7 13 9. Cette suite de nombres est transformée en un entier grâce à la règle suivante : à partir de la suite de 10 nombres ci-dessus, on forme un nombre unique produit des 10 premiers nombres premiers où chacun est élevé à la puissance égale au nombre de Gödel de même rang de la suite :

.

De même, il est aussi possible d'associer un nombre de Gödel à une suite d'assertions. Considérons une suite formée de deux assertions. À chacune de ces deux assertions correspond un nombre. La suite d'assertions est alors associée au produit des deux premiers nombres premiers qui sont chacun élevés à la puissance égale au nombre de Gödel de l'assertion correspondante. Ainsi si m est le nombre de Gödel de la première asertion et n celui  de la deuxième, le nombre associé à cette suite d'assertions sera : .

À toute expression du système formel, que ce soit un signe, une suite de signes ou une suite de formules, il est donc possible d'associer un nombre unique. Inversement, par l'unicité de la décomposition d'un nombre en facteurs premiers, à un nombre de Gödel correspond une expression du système formel.

Gödel définit ensuite la relation entre les nombres x et z, notée Dem(x,z), qui veut dire que la suite de formules associée au nombre de Gödel x est une démonstration de la formule de nombre de Gödel z.

On considère alors la formule G : . Cette formule veut dire qu'il n'existe pas de démonstration ayant pour nombre de Gödel x de la formule de nombre de Gödel z, c'est-à-dire que l'assertion qui porte le nombre de Gödel z n'est pas démontrable.

Gödel considère un cas particulier de cette assertion. Pour cela, on note sub(m,p,q) le nombre de Gödel de la formule obtenue en substituant à la variable de nombre de Gödel p dans la formule de nombre de Gödel m le nombre q. Ainsi, sub(n,13,n) est le nombre de Gödel obtenu à partir de la formule qui porte le nombre de Gödel n et dans laquelle on substitue à la variable de nombre 13 la variable n. Par exemple, si l'assertion possède le nombre de Gödel n, la variable qui possède le nombre 13, qui est y, est remplacée par le nombre n. L'assertion devient alors : .

Le cas particulier de G considéré par Gödel est :
.
Cette assertion signifie : pour tout nombre de Gödel x, la suite de formules associée au nombre de Gödel x ne démontre pas la formule obtenue en substituant le nombre n à la variable de nombre 13 dans la formule de nombre de  Gödel n. Ce qui veut dire aussi que l'assertion qui possède le nombre de Gödel sub(n,13,n) n'est pas démontrable.

Cette assertion particulière porte elle-même un nombre de Gödel. Le nombre de Gödel de G est sub(n,13,n). En effet, sub(n,13,n) est le nombre de Gödel de la formule obtenue à partir de la formule qui porte le nombre de Gödel n en substituant le chiffre n à la variable qui porte le nombre de Gödel 13 (c'est-à-dire la variable y). Or, la formule a été obtenue à partir de la formule qui porte le nombre n en substituant à la variable y le chiffre n. Donc le nombre de Gödel de l'asserttion G est bien sub(n,13,n).

Or, l'assertion G affirme que l'assertion qui possède le nombre de Gödel sub(n,13,n) n'est pas démontrable. Donc, l'assertion G dit d'elle-même qu'elle n'est pas démontrable.

Gödel démontre ensuite que si G est démontrable alors ~ G est aussi démontrable. Si G est démontrable, il existe un nombre de Gödel k tel que . On peut prouver que si la relation Dem(x,z) existe entre deux nombres alors cette relation est démontrable. Donc est démontrable et est démontrable. Cette dernière formule correspond à ~ G. Réciproquement, Gödel montre que si ~ G est démontrable, G l'est aussi. Le système formel est dons inconsistant.

De plus, l'assertion G est vraie. En effet, on a montré que l'assertion G n'est pas démontrable. Or, c'est justement ce qu'énonce G.

On vient de montrer que la consistance d'un système implique qu'il est incomplet, c'est-à-dire qu'il existe une formule vraie qui est indémontrable et dont la négation n'est pas non plus démontrable. La validité de cette formule ne pourra pas être déterminée dans le cadre du système formel.

Le second théorème de Gödel énonce que la consistance (ou la non-contradiction) du système formel, c'est-à-dire qu'aucune contradiction ne peut être prouvée à partir de ses axiomes, ne peut être démontrée à l'intérieur de ce système.

Avec le premier théorème d'incomplétude, on montre qu'à partir d'un système formel cohérent on aboutit à G. La consistance entraîne donc la formule G. Si on pouvait démontrer dans le système formel, la consistance, alors il s'en suivrait que G serait démontrable dans ce système formel. Or, la démonstration précédente montre que ce n'est pas le cas. Par conséquent, c'est qu'il est impossible de démontrer dans le système formel la consistance.

Mark Dominus donne une brève explication du théorème de Gödel en reprenant une idée de Raymond Smullyan. Pour plus de compléments sur le théorème de Gödel, on pourra lire les livres Le théorème de Gödel de Ernest Nagel, James R. Newman et Jean-Yves Girard qui réussit à vulgariser la démonstration du théorème de Gödel, ainsi que Gödel Escher Bach : Les Brins d'une guirlande éternelle de Douglas Hofstadter qui établit des parallèles entre les œuvres de Gödel, de l'artiste Maurits Cornelis Escher et du compositeur Johann Sebastian Bach. Les résumés de cours de Jacques Bouveresse au Collège de France de 2003 à 2006 sur Gödel sont disponibles : Kurt Gödel, mathématiques, logique et philosophie.

mercredi 17 février 2010

Nombres réels et suites de Cauchy

Une fois les nombres rationnels construits, il manque les nombres irrationnels pour obtenir l'ensemble des réels. Le premier à utiliser le terme d'irrationnel est l'évêque de Lisieux Nicolas Oresme dans son Traité sur la sphère tout en s'excusant de transcrire du latin certains mots abstraits qu'il introduit dans la langue française. Cantor nomme les nombres réels en 1883 dans les fondements d'une théorie générale des ensembles afin de les distinguer des nombres imaginaires.

Il existe plusieurs constructions des nombres réels. L'une d'elles est due à Richard Dedekind. La méthode qu'il propose est géométrique : elle exprime que l'ensemble des réels est continu. Une deuxième est due à Charles Méray et Georg Cantor. Dans ce cas, les nombres réels sont vus comme limites de suites de rationnels.

Il fut longtemps difficile de savoir si les irrationnels étaient à considérer comme de véritables nombres. Michael Stifel dans Arithmetica Integra (1544) considère les irrationnels comme des nombres valides :

Il est à juste titre discuté si les nombres irrationnels sont de véritables nombres ou non. En étudiant les figures géométrques, où les nombres rationnels sont utilisés, les irrationnels trouvent leur place, et montrent de manière précise ce que les nombres rationnels sont incapables de montrer... Nous sommes contraint d'admettre qu'ils sont corrects.

Cependant, même s'ils sont corrects, il ne les considère pas comme de véritables nombres, car ils ne pas proportionnels aux nombres rationnels. Pour Simon Stevin, en 1585, une racine quelconque est nombre. Mais pour d'Alembert, en 1751, n'est point un nombre proprement dit, c'est une quantité qui n'existe point, qu'il est impossible de trouver.

Abraham Kästner en 1758 est le premier qui propose de définir les nombres réels de manière arithmétique en se rendant compte qu'un nombre irrationnel est proche d'un rationnel :

On peut considérer le nombre irrationnel comme étant composé de deux parties : l'une, le commencement, est rationnelle et peut être prolongée à volonté de telle sorte que l'autre partie, la fin, qui reste en toute rigueur toujours inconnue, devienne plus petite que toute grandeur donnée. (...) Si X est un nombre irrationnel, A son commencement rationnel, a sa fin inconnue, alors tout ce qui est vrai d'un nombre rationnel tel que A, doit être vrai de X, étant donné que cet A peut constituer une partie aussi considérable que X qu'on le désire, par rapport à laquelle a devient de plus en plus petit et peut donc, pour ainsi dire disparaître.

Pour Kästner, un nombre irrationnel X est la somme d'un nombre rationnel A et d'une partie irrationnel a rendue aussi petite que voulue : X = A + a.

Les nombres rationnels sont dits denses dans l'ensemble des nombres réels, c'est-à-dire que tout nombre réel peut être approché par un nombre rationnel de manière aussi précise qu'on le souhaite. Ainsi, le nombre peut être approché par un nombre rationnel de deux chiffres après la virgule : 3.14. Si cette approximation est insuffisante, on peut considérer 3.141 ou 3.1415 comme approximation rationnelle de .

De même, pour les fonctions, d'après le théorème de Stone-Weierstrass, les polynômes sont denses dans l'ensemble des fonctions continues, ce qui justifie l'utilisation des développements limités.

Kästner ne parle pas encore de limite qui sera définie plus tard par Augustin Cauchy dans son cours d'analyse à l'Ecole Polytechnique. Cauchy définit les infiniment petits qu'il considère comme des variables particulières. Ce sont des variables qui tendent vers 0, mais qui sont considérées comme des intermédiaires disparaissant dans le résultat final.

Méray en 1869 dans Remarques sur la nature des quantités définies par la condition de servir de limites à des variables données et Cantor en 1883 ou en 1872 formalisent les nombres réels en les considérant comme limite d'une suite de nombres rationnels. Par exemple, on peut définir le nombre réel comme la limite de la suite 1, 1.4, 1.41 , 1.414, ... où chaque nombre est rationnel. Cette suite se rapproche indéfiniment de sans jamais l'atteindre. Le nombre réel est ainsi obtenu par approximation successive. La suite construite est une suite de Cauchy, c'est-à-dire que les termes se rapprochent de plus en plus les uns des autres :
.
De telles suites convergent et leur limite est unique.

Pour construire , on considère les classes d'équivalence des suites de Cauchy où les suites de même limite sont équivalentes :
.
L'ensemble correspond alors à l'ensemble quotient des suites de Cauchy par cette relation d'équivalence. Un nombre réel est donc une classe d'équivalence de suite de Cauchy pour la relation .

L'addition et de la multiplication de nombre réels peuvent être définies à partir des suites. Ces opérations posaient problème en considérant le développement décimal d'un nombre réel. En effet, en posant une addition, on commence le calcul par la droite. Ce qui est impossible pour des nombres réels, puisque le développement décimal est infini.

L'addition et de la multiplication des nombres réels sont celles des suites :

.
Cela permet ainsi d'étendre aux nombres réels ces opérations qui sont bien définies pour les nombres rationnels.

Pour la construction des nombres, on pourra aller faire un tour sur le blog Choux romanesco, Vache qui rit et intégrales curvilignes qui est très complet.  D'après Wikipédia,

Une troisième construction s'appuie sur la méthode des segments emboîtés. Un emboîtement est une suite décroissante d'intervalles fermés de nombres rationnels dont la longueur tend vers 0. Un nombre réel est alors défini comme une classe d'emboîtements modulo une relation d'équivalence. Selon Mainzer, « la vérification des propriétés de corps ordonnée est relativement pénible », ce qui explique pourquoi cette approche apparaît moins avantageuse que les deux précédentes. Il existe aussi une autre méthode à partir des développements décimaux, cependant l'addition puis la multiplication ne sont pas des opérations simples à définir.

Xavier Caruso donne une autre construction peu connue des nombres réels à l'aide du groupe additif des entiers relatifs .
Enfin, on pourra aussi signaler que pour Jacques Lacan, le non-concept « réel » est tout simplement substantivé au titre d'une hypostase. Un antidote à ce dernier sera Impostures intellectuelles d'Alan Sokal et Jean Bricmont ou Prodiges et vertiges de l'analogie de Jacques Bouveresse.

lundi 15 février 2010

Nombres rationnels

Les nombres rationnels portent-ils ce nom parce qu'ils seraient plus raisonnables ou plus conformes à la raison que les autres nombres?

On raconte que le pythagoricien qui aurait découvert que la diagonale du carré de côté 1 valait , considéré comme incommensurable, a été jeté par-dessus bord au cours d'une pêche tragique ou encore qu'Hippase de Métaponte a été excommunié, coupable d'avoir découvert ces nombres irrationnels. Léon Brunschvicg, dans Le rôle du pythagorisme dans l'évolution des idées, évoque que cette harmonie entre l'intelligible et le réel sur laquelle reposait leur conception du monde et de la vie, voici qu'elle se rompt avec une évidence contraignante, avec un éclat douloureux et cruel de l'application scrupuleuse des méthodes qui avaient fait l'honneur de l'École.

Pourtant si ces nombres sont rationnels, c'est qu'il y deux sens du mot latin ratio : l'un qui renvoie bien à la raison et un autre qui signifie calcul, compte que l'on retrouve en français dans le mot ratio. C'est aussi par cette dernière étymologie que l'on parle de la raison d'une suite géométrique.

Muni des lois + et ., l'ensemble forme un anneau. Les entiers relatifs ne possèdent pas d'inverse pour la loi multiplicative. Pour former le corps des fractions , on considère l'ensemble des nombres rationnels :

.

Cet ensemble est noté comme quotient.

L'idée pour construire les nombres rationnels est proche de celle utilisée pour la construction des nombres relatifs. Il s'agit de poser une relation d'équivalence sur un espace produit : dans le cas des nombres relatifs, c'était sur l'ensemble des couples d'entiers naturels ; pour les nombres rationnels, ce sera l'ensemble des couples d'entiers relatifs où le second élément du couple est non nul.

Deux couples de seront équivalents si et seulement si leurs produits en croix sont égaux :

.

Sur , des couples étaient équivalents lorsque leurs sommes en croix étaient égales.

L'addition et la multiplication sont définies par :


et
.
Ce qui revient bien aux lois usuelles des fractions :

Les opérations sont alors bien définies si le résultat ne change pas lorsqu'un couple est remplacé par un autre qui lui est équivalent.

Georg Cantor a montré que l'ensemble des rationnels est dénombrable, c'est-à-dire que l'ensemble des nombres rationnels peut être mis en bijection avec l'ensemble des entiers naturels. Puisqu'il est possible d'associer un à un les entiers naturels avec les nombres rationnels, on peut dire qu'il y a le même nombre de rationnels que d'entiers naturels. Cantor nota ce nombre avec la première lettre de l'alphabet hébreu aleph : . Pour plus de détails sur Cantor et l'infini, on pourra lire l'article de Patrick Dehornoy : Cantor et les infinis. Jean-Paul Delahaye donne aussi une introduction à l'infini et ses paradoxes dans l'infini est-il paradoxal?

lundi 7 septembre 2009

L'invention des logarithmes ou la révolution du calcul

Aujourd'hui, il est difficile d'imaginer à quel point l'invention des logarithmes fut une révolution dans le domaine du calcul. Pourtant, le logarithme possède une propriété importante : il transforme un produit en une somme. Ainsi, log (xy) = log(x) + log(y). Plutôt que d'effectuer une multiplication, on pourra effectuer une addition en passant par la fonction logarithme.

La notion de logarithme est introduite par John Neper en 1614, à partir d’un exemple issu de la cinématique. Dans son article Mirifici Logarithmorum Canonis Descriptio, il compare le mouvement rectiligne de deux points M et M' dont le premier M a une vitesse qui augmente proportionnellement avec la distance qui le sépare d'un point fixe O et dont le second  M' se déplace de manière uniforme vers un point O'. La distance O'M' parcourue par le point M' est alors, selon Neper, le logarithme de la distance OM. Le logarithme a ainsi la propriété de transformer un  mouvement augmentant proportionnellement en un mouvement régulier.



Neper est le premier à calculer une table de logarithme en base e dans l'article Mirifici Logarithmorum Canonis constructio écrit en 1614 et publié en 1619. Il choisit d’appeler les nombres de cette table logarithmes, car il les considère comme des relations entre des nombres. Il utilise alors les racines grecques logos et arithmos et crée le mot logarithmus, puisqu’il écrit en latin. 

Soixante-dix ans avant Neper, en 1544, le moine et mathématicien allemand Michael Stifel (1486–1567) avait déjà publié à Nuremberg un traité de mathématique Arithmetica Integra, où il mettait en relation la suite des entiers avec celle des puissances de 2. Dans cet ouvrage, il montrait comment il est possible de transformer une multiplication en addition. 
Puisque le logarithme transforme un produit en une somme, les calculs s'en trouvent grandement facilités. Ainsi, si l'on veut multiplier 8 par 32, on va chercher pour chacun leur logarithme (en base 2) dans la table, qui se trouve sur la première ligne et dans la même colonne. Ainsi, le logarithme de 8 est 3 et celui de 32 est 5. On calcule la somme des logarithmes, qui dans ce cas est 8. Le résultat de la multiplication de 8 par 32 est alors le nombre admettant 8 pour logarithme, c'est-à-dire le nombre se trouvant sur la deuxième ligne et dans la même colonne que le chiffre 8, soit le nombre 256.

La formule utilisée ici est  :  .

Après la publication des travaux de Neper, le mathématicien anglais Henry Briggs (1561–1630) comprend aussitôt l’intérêt de cette relation entre les nombres et voit ainsi le moyen de faciliter les calculs en transformant les multiplications en additions. Pour simplifier encore plus ces calculs, il suggère à Neper de choisir 10 pour base. En 1615, Briggs calcula la table de ces nouveaux logarithmes décimaux, qu'il publia après une rencontre avec l'inventeur des logarithmes.

Indépendamment de Neper, un suisse, Bürgi, qui avait été assistant de Kepler à Prague, calcula entre 1603 et 1611 une table d'antilogarithme (il appelle ainsi la fonction inverse du logarithme). Cette table fut imprimée dans cette ville en 1620. Facilitant grandement les calculs, notamment ceux des astronomes, les tables de logarithmes connurent alors un succès immédiat.

En l'honneur de Néper, on parle désormais de logarithme néperien (noté ln). La définition moderne le définit à partir de l'intégrale de la fonction 1/x :



Ainsi, le logarithme néperien correspond à l'aire sous l'hyperbole entre 1 et x.


Le premier à mettre en évidence le comportement logarithmique de l'aire sous l'hyperbole est Grégoire de Saint-Vincent en 1647 dans son ouvrage Opus geometricum quadraturae circuli et sectionum coni decem libris comprehensum. Il écrit alors : 

Si les abscisses d'une hyperbole équilatère croissent en progression géométrique, les aires des surfaces découpées entre l'hyperbole et son asymptote par les lignes ordonnées correspondantes croissent en progression arithmétique.

C'est-à-dire que l'aire sous l'hyperbole de 1 à 2 ajoutée à l'aire de 1 à 3 donnera l'aire de 1 à 6 ( ln (6) = ln(2) + ln(3) ). Ainsi, si les abscisses suivent une suite géométrique, les surfaces suivront une suite arithmétique. 

Grégoire de Saint-Vincent ne relie pas encore son travail aux logarithmes. Un de ses lecteurs, le jésuite Sarassa mentionnera que les aires hyperboliques peuvent tenir lieu de logarithmes.

Il faudra attendre le milieu du 18e siècle, après l’invention de la notion de fonction et du calcul différentiel, pour que le logarithme soit défini par Euler comme fonction réciproque de la fonction exponentielle. 

La propriété des logarithmes a permis d'inventer la règle à calcul en 1859 par Amédée Mannheim. Les nombres inscrits sur la règle suivent alors une échelle logarithmique pour calculer aisément des produits.

Selon Pierre-Simon Laplace, mathématicien, physicien et astronome français : 

L’invention des logarithmes, en réduisant le temps passé aux calculs de quelques mois à quelques jours, double pour ainsi dire, la vie des astronomes.

jeudi 9 avril 2009

Nombres réels

L'ensemble des nombres réels forme une droite. La propriété importante de cet ensemble est d'être continu.

Au 15 ème siècle, Nicolas de Cues énonce le principe de continuité dans De mathematica perfectione : une grandeur continue qui évolue entre une grandeur A et une grandeur B prend au moins une fois toute valeur intermédiaire. Dans les Nouveaux essais de l'entendement humain publié en 1764, Leibniz reproche à Euclide de ne donner qu'une image sensible de la droite au lieu d'une définition. Pour le philosophe et mathématicien allemand, rien ne se fait dans la nature tout d'un coup, et c'est une de mes grandes maximes et des plus vérifiées, que la nature ne fait jamais de sauts. J'appelle cela la loi de la continuité.


La continuité sera d'abord définie pour les fonctions par Cauchy dans son cours d'analyse de 1821. Il démonte le théorème de la valeur intermédiaire, sans encore se rendre compte que c'est d'abord une propriété des nombres réels avant d'être une propriété des fonctions.

Une construction rigoureuse de est due à Dedekind en 1872 dans Stetigkeit und irrationale Zahlen (Continuité et nombres irrationnels). Il définit les nombres réels grâce aux coupures :

Si l'on répartie tous les points de la droite en deux classes telles que chaque point de la première soit situé à gauche de chaque point de la deuxième classe, alors il existe un point et un seul qui engendre cette partition de tous les points de la droite, cette découpe de la droite en deux parties.

Une coupure dans le corps des nombres rationnels est définie par deux sous-ensembles non vides et tels que :

  • pour tout  et , on a .
Un exemple de coupure est définie par l'ensemble des nombres rationnels inférieurs à 7 et par l'ensemble des nombres supérieurs ou égaux à 7. Cette coupure possède la propriété  suivante : soit il existe un plus grand élément dans C1, soit il existe un plus petit élément dans C2, qui est 7 dans cet exemple. Inversement, une coupure possédant cette propriété détermine un nombre rationnel.

Il existe des coupures n'ayant pas cette propriété. Ainsi, on peut considérer, l'ensemble des nombres rationnels négatifs plus les nombres rationnels positifs dont le carré est inférieur à 2 et les autres nombres rationnels. Un plus grand élément dans ou un plus petit élément dans devrait satisfaire , ce qui est impossible pour et il ne peut y avoir de plus grand élément dans ou de plus petit dans . Cette coupure crée un nombre irrationnel a tel que . À toute coupure correspond alors un nombre, rationnel  ou irrationnel.

Pour Dedekind,

Chaque fois que nous sommes en présence d'une coupure non produite par un nombre rationnel, nous créons un nombre nouveau, irrationnel x, que nous considérons comme parfaitement déterminé par cette coupure ou qu'il engendre cette coupure.

Une autre construction des nombres réels est due à Cantor et Méray. Dans cette construction, tout nombre réel est la limite d'une suite de Cauchy de nombres rationnels.

lundi 6 avril 2009

Nombres relatifs

Les entiers naturels désignent les nombres entiers positifs . A partir des entiers naturels, on peut construire les nombres relatifs en ajoutant les opposés. Ils sont notés pour le mot allemand die Zahl. La construction des entiers relatifs est due à Dedekind.

Les éléments de ne possèdent pas d'inverse pour la loi +. L'ensemble ajoute l'inverse pour la loi + de chaque élément et sera ainsi un groupe commutatif.


Pour définir les nombres relatifs, on considère l'ensemble des couples d'entiers. Le couple va correspondre au nombre   qui représente la distance entre n1 et n2 ou la longueur de l'intervalle .

Pour obtenir , une relation d'équivalence est ajoutée sur . Le couple est équivalent au couple si . Ainsi, (2;0) = (3;1), car 2 + 1 = 3 + 0. Deux couples sont équivalents si leur sommes en croix sont égales. On a peu l'habitude de parler de somme en croix alors qu'on parle usuellement de produit en croix. L'ensemble des entiers relatifs correspond alors à l'ensemble quotient . Un entier relatif correspond donc à la classe d'équivalence pour la relation.

Sur cet ensemble, les opérations usuelles de somme et produit peuvent être définies. Ainsi, la somme est naturellement définie par.

Le produit est défini par . Par exemple,.

Muni de ces lois, devient un anneau. Cependant, les éléments de ne possèdent pas d'inverse pour la multiplication. Pour cela, il faudra construire l'ensemble des nombres rationnels .

lundi 2 mars 2009

Algèbre


Le mot algèbre vient du livre écrit par le mathématicien d'origine perse Muhammad ibn Musa Al-Khawārizmī : Al-ĵabr wa'l-muqābalah qui veut dire en français la transposition et la réduction. Ce livre est dédié au calife Al-Ma'moun qui régna à Bagdad de 813 à 833 après son père, le célèbre calife, Haroun al-Rashid, qui régna de 786 à 809, et après une guerre de succession qui se termine par l'assassinat de son frère aîné en 813. 

Une grande partie du livre est consacrée à des problèmes de la vie quotidienne de l'époque, en particulier ceux des partages d'héritage que les droits de succession musulmans rendaient très ardus. Il traite de la résolution des équations du premier et du deuxième degré. Le mot jabr peut se traduire par restauration. Il indique dans ce cas le passage d'un terme d'une équation de l'autre côté du signe égal. Par exemple, on fait une jabr, quand on transforme y + 4 = x en y = x - 4. Le mot muqabalah est traduit par confrontation ou réduction. Il désigne l'opération consistant à réduire des termes semblables dans une équation. Par exemple, on fait une muqabalah, lorsqu'on transforme a + y - a = x en y = x.


Le livre d'Al-Khawārizmī ne contient aucun chiffre, ni aucun symbole. Toutes les équations sont exprimées avec des mots. Une constante est un dirham (du nom de l'unité monétaire grecque la drachme), l'inconnue est «la chose» ou shay ou jidhr, quand il représente la racine d'une équation, le carré de l'inconnue est nommé le mâl. Le mot shay se transcrit en xay en espagnol ancien et il est à l'origine de l'utilisation de x dans une équation pour désigner l'inconnue.

Les équations sont ramenées à 6 types :

Le titre du livre d'Al-Khawārizmī a été traduit en latin par Algoritmi de numero indorum. Algoritmi est la transformation de Al-Khawārizmī et deviendra plus tard algorithme. C'est sans doute par l'influence du mot arithmétique que l'on retrouve un t dans algorithme.

Au 16 ème, les tenants de l'abaque, les abaquistes, s'opposent aux algoristes, qui sont les tenants du calcul écrit avec les chiffres arabes. Les techniques du calcul indien avec les chiffres arabes et le zéro sont apparues en occident au 12 ème siècle avec le retour des croisades et à la suite de contacts avec les arabes d'Espagne et d'Afrique du nord. Les savants (Fibonacci est un des premiers) adaptent rapidement ce nouveau calcul écrit, alors que les commerçants continuent à utiliser l'abaque à jetons employé depuis l'époque romaine. Cette opposition se prolonge jusqu'à la révolution qui interdit officiellement l'abaque dans les écoles et les administrations. Aujourd'hui, nous sommes tous des algoristes.

vendredi 27 février 2009

Cardinal

Un cardinal désigne un ecclésiastique chargé d'élire et d'assister le pape dans le gouvernement de l'Église. Les cardinaux sont surtout connus pour se réunir en conclave pour élire le nouveau pape. Le mot conclave vient du latin clavis voulant dire clef, car pendant leur délibération les cardinaux sont enfermés à l'abri de tout contact extérieur. Existe-t-il un rapport entre ces cardinaux et les nombres cardinaux : un, deux, trois, quatre, cinq, ...?

Pour comprendre leur relation, il faut déjà comprendre l'étymologie du mot cardinal. En latin ecclésiastique, cardinal se dit cardinalis, qui vient lui même du mot cardo qui veut dire gond, pivot. Il représente donc quelque chose de fixe et d'important. Il est employé au sens figuré pour désigner les cardinaux de l'église qui sont une autorité morale sur laquelle s'appuyer.

Le mot cardinal a d'abord été employé comme adjectif pour désigner ce qui sert de référence. Ainsi, les points cardinaux (nord, sud, est et ouest) servent à désigner la position de tous les autres. Les vents cardinaux sont des vents qui soufflent des quatre points cardinaux. Les quatre vertus cardinales sont la justice, la prudence, la tempérance et la force. L'Église l'utilise ensuite au sens figuré pour désigner certains dignitaires ecclésiastique, comme pontifex cardinaliscardinalis veut dire principal, ou pour désigner un prêtre affecté d'une manière permanente à une église déterminée : cardinalis sacerdos, ou les évêques suburbicaires, c'est-à-dire soumis à l'autorité de Rome : episcopi cardinales.

À partir du 17 ème siècle, les nombres cardinaux servent à désigner une quantité précise : il y a 25 personnes dans la salle. Le mot cardinal devient un nom au début du 20 ème siècle avec le cardinal d'un ensemble qui correspond au nombre d'éléments qu'il contient. Ces nombres s'opposent aux nombres ordinaux qui servent à indiquer le rang d'un objet dans une collection ou l'ordre d'un événement dans une succession. Le cardinal d'un ensemble peut s'associer à un ensemble quelconque, alors que l'ordinal suppose de poser un ordre sur les éléments de l'ensemble. Cantor exprime bien cette différence  en écrivant :

J'entends par cardinal d'un ensemble M le concept universel ou générique que l'on obtient en faisant abstraction pour l'ensemble aussi bien de la constitution de ses éléments que de toutes les relations que ses éléments ont entre eux ou avec d'autres choses, donc, en particulier aussi, de l'ordre qui règne entre eux, et ne considère que ce qui est commun à tous les ensembles équivalents à M.

Un nombre ordinal peut être défini grâce à l'ensemble des ordinaux qui le précèdent. John von Neumann identifie ainsi un entier positif à l'ensemble de ses prédécesseurs sur :





Ainsi, deux est l'ensemble dont les éléments sont l'ensemble vide et l'ensemble dont l'unique élément est l'ensemble vide.

En nommant les premier nombres cardinaux, ceux-ci sont considérés comme plus importants ou plus fondamentaux.

Les numéraux cardinaux, sauf vingt et cent, sont invariables, ce qui montre leur importance. Ils ne s'accordent ni en genre, ni en nombre avec le nom auquel ils se rapportent, sauf :

- un, qui devient une devant un nom féminin, et

- vingt et cent qui se mettent au pluriel quand :

  • ils sont multipliés par un nombre plus grand que un et qu'ils ne sont pas suivis d'un autre adjectif cardinal : quatre-vingts, mais quatre-vingt-deux, deux cents, mais deux cent mille, ou
  • ils précèdent directement les noms million, milliard, billion, ... : quatre-vingts millions d'années, mais quatre-vingt-dix-sept millions, six cents millions de volts, mais six cent quarante millions.
Le nom de nombres ordinaux se forme dans la plupart des cas en ajoutant le suffixe -ième au dernier élément du nombre cardinal correspondant : le deuxième, le troisième, ... Ils s'accordent en genre et en nombre avec le nom qui suit : la vingt-cinquième heure, les premiers froids.

C'était le treizième article de ce blog ou le numéro treize.



mercredi 25 février 2009

Pas très moral

Si a = 0, puisque et , peut-on simplifier l'égalité par a pour obtenir que 1 = 0 ?

C'est bien sûr la simplification par a qui conduit à l'erreur 1 = 0. Pour avoir le droit de simplifier par a, celui-ci doit admettre un inverse. Ainsi, pour faire disparaître a, on doit multiplier par l'inverse de a des deux côtés de l'égalité : . Seulement, dans un anneau, l'élément 0, qui est l'élément neutre de la loi +, est le seul qui n'admet pas d'inverse pour la loi multiplicative. Ainsi, l'égalité implique que a = 0. Cette propriété qui affirme que a . b = 0 implique que a = 0 ou b = 0 est nommée intégrité. L'anneau est donc intègre.

Le mot intègre ne vient pas dans ce cas du français. En effet, pourquoi un anneau pour lequel 0 n'a pas d'inverse pour la loi . posséderait-il plus de moralité que celui qui en admet ? L'adjectif intègre vient ici de l'anglais integer signifiant entier, car l'anneau intègre de référence est l'anneau des entiers relatifs . La lettre utilisée vient par contre de l'allemand Zahl (nombre). L'étude de l'algèbre trouve son origine chez des mathématiciens allemands du 19 ème siècle, comme par exemple, Kummer, Dedekind, Kronecker et Hilbert.

Les nombres entiers, puisqu'ils nous servent à compter, nous paraissent plus naturels que les autres. L'utilisation des nombres négatifs n'est devenue familière que plus tardivement. Leur construction, due à Dedekind, se fait à l'aide des entiers positifs. Les nombres négatifs deviennent ainsi relatifs aux entiers positifs. Selon Léopold Kronecker, "Dieu a fait les nombres entiers, tout le reste est l'œuvre de l'homme". Kronecker va lui même plus loin : il ne croit pas non plus en l'existence des nombres transcendants et la construction des nombres réels due à Weierstrass. Ces idées l'amenèrent à s'opposer à Cantor, Dedekind et à Weierstrass qui fut pourtant un de ses amis.


La propriété d'intégrité est très utile pour résoudre des équations. Si on doit résoudre l'équation , on peut se ramener à (x-2)(x+2) = 0, d'où x = 2 ou x = -2.

Ils existent des anneaux qui ne sont pas intègres. Par exemple, dans , [6] . [2] = [12]. Or, la classe de 12 est égale à celle de zéro, car 12 est un multiple de 4, sans que 6 ou 2 ne soient équivalents à 0. On a l'égalité [6] . [2] = [0]. On dira que [6] et [2] sont des diviseurs de 0. L'anneau devient intègre lorsque p est premier.

Tous ces anneaux n'ayant aucune moralité, on laisse au lecteur le soin de trouver la morale de cette histoire, même si d'après Albert Camus : Aucune morale, ni aucun effort ne sont a priori justifiables devant les sanglantes mathématiques qui ordonnent notre condition

dimanche 14 décembre 2008

Notation de Schläfli

Un polygone est un ensemble de segments inclus dans le plan tel que chaque extrémité de chaque sommet correspond à une extrémité d'un seul autre segment qui est non aligné avec le premier. Un polygone est dit régulier si tous ses côtes sont de même longueur et tous ses angles sont égaux.

Un polyèdre est dit régulier si toute ses faces sont identiques et sont des polygones réguliers, et en chaque sommet s'intersectent le même nombre de faces. Un polyèdre régulier est donc entièrement déterminé par son type de face et le nombre d'arêtes concourant en chaque sommet. La notation de Schläfli tient compte de ces propriétés pour représenter les polyèdres réguliers. Le symbole de Schläfli d'un polyèdre convexe régulier est {p,q} si ses faces sont des polygones avec p arêtes et si en chaque sommet se rencontrent q faces. Le symbole de Schläfli d'un cube est donc {4,3}, puisque chaque face est un carré et 3 faces (et 3 sommets) sont issues de chaque sommet du cube.

En dimension 3, il y a 5 polyèdres réguliers convexes :

  • le tétraèdre ({3,3}),
  • le cube ({4,3}),
  • le octaèdre ({3,4}),
  • le dodécaèdre ({5,3}),
  • le icosaèdre ({3,5}).

Ils sont appelés solides de Platon, qui dans le dialogue Timée (vers 358 avant J.-C.), associe à chacun des quatre éléments (la terre, l'air, l'eau et le feu) un solide régulier. La terre était associée avec le cube, l'air avec l'octaèdre, l'eau avec l'icosaèdre et le feu avec le tétraèdre. Le dodécaèdre est en correspondance avec le Tout, parce que c'est le solide qui ressemble le plus à la sphère. Euclide démontra dans le livre XIII des éléments, le dernier, que ces polyèdres sont exactement au nombre de 5.

En 1596, Johannes Kepler (1571-1630) publie Mysterium Cosmographicum où il propose un modèle de l’univers s’appuyant sur les solides de Platon. A cette époque, six planètes sont connues. Kepler remarque que les sphères représentant les orbites des planètes peuvent contenir les solides de Platon. À Mercure, il associe l'octaèdre, à Venus l'icosaèdre, à Mars le dodécaèdre, à Jupiter le tétraèdre et à Saturne le cube. La terre sert de séparation entre deux groupes de solides.

Pour un polygone convexe régulier à p côtés, la notation de Schläfli est  {p}. Pour représenter des polyèdres étoilés, les fractions sont utilisées. Ainsi, le pentagone étoilé ou pentagramme est représenté par {5/2}, ce qui signifie que ce polyèdre possède 5 arêtes et que chacune de ces arêtes relie les sommets de numéro s et s + 2. Ainsi, la première arête relie le premier et le troisième sommet, la deuxième le troisième et le cinquième, ...

La notation de Schläfli permet aussi de décrire les pavages du plan. Il y a dans le plan 3 pavages réguliers qui ont été décrits précisément par Kepler. Les symboles de Schläfli associés à ces pavages sont : {4,4} pour le pavage carré, {6,3} pour le pavage hexagonale et {3,6} pour le pavage triangulaire.

vendredi 12 décembre 2008

Espace affine

Lorsque des vecteurs sont déplacés pour être additionnés ou lorsque l'on parle de points, l'espace considéré est un espace affine. Dans un espace vectoriel, les vecteurs sont tous liés à l'origine, alors que dans un espace affine, il n'y a pas d'origine privilégiée. Il n'y a dans un espace vectoriel que le vecteur nul qui peut être considéré comme un point.

L'adjectif affine vient du latin affinis qui veut dire parent (par les liens du mariage), et par extension lié ou associé.

Soit E un espace vectoriel. Un espace affine de direction E est un ensemble A muni d'une application de A \times A dans E :

                                                     (x,y) \mapsto xy

qui vérifie les deux propriétés suivantes :

  1. pour tout x, y, z \in A, xy + yz = xz ;
  2. pour tout x\in A, et pour tout u\in E, il existe un unique y\in A tel xy = u.

La première propriété correspond à l'égalité de Chasles.

La deuxième propriété permet de définir une addition de A \times E dans A par x + u = y avec tel que y tel xy = u. L'application définie par T(x) = x + u, qui est une bijection, est la translation de x par le vecteur u.

Dans un espace affine, un vecteur peut désormais être défini à l'aide de deux points A et B. Le couple (A,B) est appelé bipoint où le point A est l'origine du vecteur et B est son extrémité.

L'espace affine est de la même dimension que l'espace vectoriel E.

Un espace vectoriel peut être vu comme un espace affine. L'addition définie de  E \times E dans E vérifie les deux propriétés précédentes.

samedi 6 décembre 2008

Espace vectoriel

Le terme de vecteur a été introduit en 1843 par William Hamilton (1805-1865). Ce mot vient du latin vector qui signifie qui conduit ou qui transporte quelque chose. Ce sens de vecteur se retrouve en médecine pour parler de vecteur d'une maladie ou d'un agent infectieux.

Le mot vector provient du verbe latin vehere qui veut dire transporter. Pour les romains, vector désignait aussi bien le passager que le conducteur d'un bateau ou d'un chariot. Les mots français véhicule, voiture, mais aussi invective proviennent de cette même racine latine. Au Moyen Âge et jusqu'à la Renaissance, le vecteur est utilisé pour parler du conducteur d'un bateau ou d'un véhicule. Le terme vecteur sera ensuite repris par les astronomes sous la forme d'un adjectif voulant dire qui porte, qui entraîne. Ils emploient ainsi l'expression de tourbillon vecteur pour désigner le mouvement d'une planète. Kepler utilise rayon-vecteur pour désigner un segment qui va du centre d'un astre à un satellite. Le mot vecteur se répand un peu plus tard avec son utilisation par les physiciens anglais, en particulier Maxwell qui dans son Traité d'électricité et de magnétisme (Treatise on Electricity and Magnetism, 1873) reprend les travaux d'Hamilton.


En mathématiques, les vecteurs sont les éléments d'un espace vectoriel. Le premier à définir la notion d'espace vectoriel  est Giuseppe Peano (1858-1932) en 1888. Il le définit sur le corps des réels et il généralise les travaux préexistant de Grassmann sur le calcul vectoriel. Otto Töplitz (1881-1940), élève de Hilbert à Göttingen, donna la définition axiomatique d'un espace vectoriel sur un corps quelconque.

Pour définir un espace vectoriel, on considère d'abord K un corps commutatif muni de lois +_{K} et  ._{K} dont l'élément neutre pour la loi  ._{K} est noté 1.  Un espace vectoriel sur un corps K est un ensemble E muni d'une loi de composition interne + tel que (E,+) soit un groupe commutatif (ou abélien), et d'une seconde loi dite externe, application de  K x E  dans E notée par un  point ., vérifiant les propriétés :

  1. a . (x + y) = a . x + a . y 
  2.  (a +_{K}  b) . x = a . x + b . x  
  3. a . (b . x) = (a ._{K} b) . x 
  4. 1 . x = x   
où x et y désignent des éléments de E ou des vecteurs, a et b désignant des éléments de K qui sont appelés scalaires.

L'ensemble des fonctions continues de \mathbb{R} dans \mathbb{R} est un espace vectoriel sur \mathbb{R}.

Lorsque K est un anneau, on parle de module au lieu d'espace vectoriel. Ce terme est dû à Richard Dedekind (1831-1916) dans le 10ème supplément aux Leçons de Théorie des nombres de Dirichlet.

L'ensemble des polynômes à coefficients dans \mathbb{Z} est un module sur \mathbb{Z}.

mardi 2 décembre 2008

Polyèdre


Le mot polyèdre vient du grec poly qui veut dire plusieurs  et edron qui signifie  sièges, degrés ou faces. Il fut d'abord utilisé à partir 1690 avec l'orthographe polièdre et il désignait alors un corps solide possédant plusieurs faces.

Un polyèdre P de dimension p est défini mathématiquement comme la réunion d'un ensemble fini de simplexes de dimension n (où n est inférieur ou égal à p) tels que : 

  1. pour chacun de ces n-simplexes, chacune de ses d-faces est un élément de P ;
  2. l'intersection de deux simplexes est soit vide, soit une d-face commune à ces deux simplexes.

Ainsi, un simplexe de dimension n représente un cas particulier de polyèdre. Il est la réunion de ses faces de dimension n. L'intersection de deux faces quelconques d'un simplexe est soit vide, soit une face de dimension n − 1. Par exemple, un triangle, qui est un 2-simplexe, est la réunion de segments et l'intersection de deux segments adjacents est un point qui est un sommet du triangle.

Polytope

Le mot polytope désigne usuellement l'enveloppe convexe d'un nombre fini de points. Cependant, Coxeter définit en 1973 un polytope comme désignant une région finie délimitée par un nombre fini d'hyperplans.

Le mot polytope a d'abord été utilisé par Alicia Boole Stott (1860-1940), troisième fille du mathématicien George Boole (inventeur de l'algèbre de Boole). Elle l'utilisa pour désigner un solide convexe de dimension 4. Ludwig Schläfli (1814-1895) démontra le premier en 1852 qu'il y avait exactement 6 polytopes réguliers en dimension 4 dont les cellules (ou ses faces de dimension 3) étaient pour chacun :

  • 5 tétraèdres (l'hypertétraèdre ou pentachore),
  • 16 tétraèdres (l'hyperoctaèdre, l'orthoplexe ou l'hexadécachore) ,
  • 600 tétraèdres (l'hyperisocaèdre, le polytétraèdre, le tétraplexe ou l'hexacosichore),
  • 8 cubes (l'hypercube, le tesseract ou l'octachore),
  • 24 octaèdres (l'icositétrachore, le polyoctaèdre, l'octaplexe ou l'hypergranatoèdre),
  • 120 dodécaèdres (l'hyperdodécaèdre, le polydodécaèdre, le dodécaplexe ou l'hécatonicosachore).
Les résultats de Schläfli furent publiés après sa mort en 1901. Alicia Boole Stott en donne une autre preuve plus intuitive dans un article de 1900, On certain series of sections of the regular four-dimensional hypersolids. Les polytopes de dimension 4 sont désormais appelés des polychores. Schläfli montra que pour les dimensions plus grandes que 4, il n'y a que 3 polytopes réguliers.

Simplexe

Le mot de simplexe a été utilisé pour la première fois en 1902 par le mathématicien hollandais Pieter Hendrik Schoute (1846-1913), professeur à l'Université de Groningue.

Un simplexe correspond à l'enveloppe convexe de n+1 points (c'est-à-dire le plus petit ensemble convexe contenant n+1 points) dans un espace de dimension n. Si on ne tient pas compte de la dimension de l'espace dans lequel il se trouve, on parlera de simplexe de dimension n ou de n-simplexe. Ainsi, un 2-simplexe est un triangle, un tétraèdre est un simplexe de dimension 3. Le 4-simplexe est appelé pentachore.

Le n-simplexe est alors le polytope (c'est-à-dire le polyèdre convexe et borné) le plus simple de dimension n que l'on puisse construire, car c'est celui qui possède le plus petit nombre de sommets. Ce qui justifie son nom.

Tous les simplexes de dimension d (pour d est inférieur ou égal à n) appartenant à la  frontière d'un simplexe sont appelés les faces de dimension d ou d-faces du simplexe. Ainsi, la 2-face d'un triangle s'identifie au triangle lui-même, tandis qu'une 1-face est une arête du triangle et une 0-face un sommet.