Nom provisoire

Aller au contenu | Aller au menu | Aller à la recherche

jeudi 24 décembre 2015

Un peu de calcul mental, ça ne fait jamais de mal ...

À première vue, il peut paraître difficile de calculer de tête 125 au carré. Pourtant avec un peu d'entraînement, il est tout à fait possible d'obtenir rapidement le résultat, qui est tout simplement 15 625.

Tout d'abord, on peut remarquer que : si un nombre se termine par 5 alors son carré se termine par 25.

Pour calculer un carré se terminant par 5, on peut utiliser la méthode suivante :

On multiplie le chiffre a qui est avant 5 par son successeur a+1 et on accole 25 au résultat. Ainsi, , car 1*2=2 auquel on accole 25 ; , car 2*3 =6 auquel on accole 25.

La démonstration se fait grâce à l'identité remarquable

Cette identité remarquable permet de calculer de tête des carrés.


Ce qui donne en factorisant les deux premiers termes par 100*a :

Avec la généralisation des calculatrice, on fait de moins en moins de calcul mental et on a peu l'habitude de manipuler les chiffres. Par exemple, peu de personnes ont remarqué que si on multiplie un nombre pair par 6, le résultat se termine par le même chiffre :

6*2 = 12

6*4 = 24

6*6 = 36

6*8 = 48

6*10 = 60

Ce résultat est simplement dû au fait que 6 = 5 + 1. Par conséquent, comme le résultat de la multiplication d'un nombre pair multiplié par 5 se termine par zéro, le résultat de la multiplication d'un nombre pair par 6 se termine par le même chiffre.

La calculatrice se généralise au collège à partir de la 5ème. Si les élèves savent encore leur table en 6ème, il n'est par rare qu'elles soient oubliées ensuite. Néanmoins, la dernière réforme des programme scolaire prévoie dictée, calcul mental et lecture à l'école tous les jours. Comme le dit le titre, un peu de calcul mental, ça ne fait jamais de mal ...

mardi 29 octobre 2013

Loi de composition interne

Une fois qu'un ensemble de nombres est construit, comme les entiers naturels, relatifs, les nombres rationnels ou réels, il est possible de manipuler ces éléments pour effectuer des opérations. Pour cela, une opération sur un ensemble permet à partir de deux éléments d'en obtenir un troisième. Ainsi, à partir d'un couple d'éléments (a,b) d'un ensemble E, une opération permet d'obtenir un nouvel élément c de l'ensemble E, qui est le résultat de l'opération. Les deux éléments initiaux sont appelés les opérandes. Une opération, ou une loi de composition interne, est donc une application définie sur le produit cartésien et à valeur dans E :

On précise que la loi est interne pour exprimer qu'à deux éléments de E est associé un troisième, qui est toujours dans le même ensemble. Par exemple, la somme et la multiplication de deux entiers naturels donnent un entier naturel. Le produit scalaire de deux vecteurs de  n'est pas une loi interne, car cette loi associe à deux vecteurs de un nombre réel, et non un vecteur de . Par contre, le produit vectoriel est bien une loi de composition interne.

Une opération interne de l'ensemble E est définie sur le produit cartésien . Le produit cartésien de deux ensembles X et Y étant l'ensemble de tous les couples (x,y) tels que x est un élément de X et y un élément de Y. Il est important de remarquer qu'un couple est ordonné : si une opération est définie sur le couple alors la première composante du couple appartient à X et la deuxième à Y. L'ensemble qui contient x et y et qui n'est pas ordonné est noté, pour le distinguer du couple, avec des accolades : {x,y}. Il est dans ce cas appelé paire. La paire {x,y} est alors la même que {y,x}, tandis que le couple (x,y) est distinct de (y,x). Un mathématicien parlerait donc d'un couple de chaussures, plutôt que d'une paire, pour pouvoir distinguer la chaussure droite de la chaussure gauche.

Un ensemble muni d'un loi de composition interne est parfois appelé magma. L'ensemble des entiers naturels muni de l'addition, , est donc un magma. Il en va de même pour , qui est le même ensemble muni de la multiplication, tandis qu'avec la soustraction et la division (respectivement et ), il n'en est plus un. Un autre exemple d'ensemble qui est un magma lorsqu'il est muni de l'addition ou de la multiplication est l'ensemble des entiers pairs , puisque l'addition et la multiplication de deux nombres pairs ont à chaque fois pour résultat un nombre pair.

On a défini une opération pour deux éléments. Lorsqu'une loi opère sur plus de deux éléments, les opérations doivent être effectuées dans un certain ordre, qui est indiqué par les parenthèses. Ainsi, dans l'expression (a T b) T c, on effectue d'abord l'opération a T b, qui donne un premier résultat. Puis, si d = (a T b), on effectue ensuite d T c.

Dans l'expression (a T b) T c, le symbole d'opération T apparaît deux fois, ce qui correspond au nombre de fois que l'opération sera effectuée. Usuellement, la loi de composition T est placée entre les opérandes sur lesquelles elle agit. Cette notation est appelée notation infixée. On peut aussi considérer que l'opération T opère sur les 3 éléments simultanément. La notation préfixée met cela en valeur : T a b c. Elle est aussi appelée notation polonaise, car elle fut d'abord utilisée par le mathématicien polonais Jan Lukasiewicz (1878 - 1956). Par exemple, le langage de programmation Lisp utilise la notation préfixée avec parenthèses. Dans ce langage, l'expression (* 3 (+ 10 5) ) correspondra alors à : 3 * (10 + 5). Il est aussi possible de placer le symbole T après les opérandes, ce qui donne la notation postfixée, ou polonaise inversée : a b c T. Le langage PostScript utilise ainsi cette notation. Ces deux dernières notations présentent l'intérêt de ne pas utiliser de parenthèses lorsqu'une même opération est appliquée à plus de deux opérandes.

Dans ces exemples, la loi de composition opère sur trois éléments. En informatique, on parle de l'arité d'un opérateur pour désigner son nombre d'arguments. Dans les exemples précédents, l'opérateur est ainsi ternaire. Un opérateur unaire accepte un seul argument. Par exemple, le symbole - utilisé pour l'opposé est unaire : -2 pour l'opposé de 2.

Une opération est associative si l'ordre dans lequel sont effectuées les opérations ne modifie pas le résultat, c'est-à-dire que :  (a T b) T c = a T (b T c). L'addition et la multiplication sont associatives, car : (a + b) + c = a + (b + c) et . La soustraction ne l'est pas, car :

De même, le produit vectoriel n'est pas associatif.

Un ensemble muni d'une loi de composition interne associative est appelé demi-groupe ou semi-groupe. Puisque la loi $+$ des entiers naturels est une loi qui est interne et associative, est un demi-groupe ; tout comme , car la loi + possèdent ces mêmes propriétés pour les entiers pairs.

dimanche 9 septembre 2012

L'ensemble vide, ce n'est pas rien !

Il n'existe qu'un seul ensemble qui ne contient aucun élément : l'ensemble vide, noté . Cet ensemble est un peu particulier, puisqu'il ne contient rien. Sa définition est : C est l'ensemble vide si et seulement si pour tout x, on a : 

Ce qui signifie qu'il serait faux de trouver un élément appartenant à cet ensemble. Cette définition a ceci de paradoxal : elle pose un ensemble qui ne contient rien.

L'existence de l'ensemble vide est posé par le second axiome de la théorie des ensembles. Ce dernier dit finalement que rien existe et qu'il est possible de former un ensemble qui le contient. Autrement dit : il existe un ensemble qui ne contient rien. Cet axiome peu paraître a priori déroutant. Néanmoins, l'ensemble vide est nécessaire à la théorie des ensembles. Une analogie peut être faite avec l'entier naturel 0, qui ne dénombre aucun élément, mais qui pourtant est nécessaire à la construction des entiers naturels et qui est bien utile pour la numérotation. Il représente d'ailleurs le cardinal de l'ensemble vide, et inversement l'ensemble vide sert aussi à construire l'entier naturel 0.

Grâce à la définition de l'égalité entre ensembles, l'ensemble vide est unique. Deux ensembles sont égaux s'ils contiennent exactement les mêmes éléments :

La plupart du temps, cette définition est utilisée pour prouver que deux ensembles sont égaux à l'aide de la double inclusion. Mais, dans le cas de l'ensemble vide, il est impossible de raisonner avec la double inclusion, puisqu'il ne contient aucun élément. Pour démontrer l'unicité de l'élément vide, comme le plus souvent, on suppose par l'absurde, qu'il existe un deuxième ensemble V possédant la même propriété que l'ensemble vide .

Cependant, la formulation négative de la définition de l'ensemble vide (pour tout x, ) est peu commode à utiliser. On emploiera plus aisément le fait que s'il existait un élément x dans l'ensemble vide, cela conduirait à l'absurdité suivante : toute propriété énoncée sur l'élément x serait fausse. Par sa grande généralité, cet énoncé est beaucoup plus pratique à utiliser. Il s'écrit formellement :

où le symbole ~ indique la négation de la proposition entre parenthèses et xPx désigne une propriété P reliant x à x. L'énoncé formel exprime que cette dernière propriété ne sera jamais vérifiée. On peut remarquer que le quantificateur il existe s'applique ici à la propriété P. Ce genre d'énoncé appartient à la logique du deuxième ordre, due à Gottlob Frege (1848 - 1925), considéré comme un des fondateurs de la logique moderne, qui a le premier fait aussi porter les quantificateurs sur des prédicats P, et non plus seulement sur les variables, comme il était d'usage de le faire avant lui. Par opposition, la logique où les quantificateurs portent uniquement sur les variables est appelée logique du premier ordre.

Il est possible de considérer n'importe quelle propriété P. Un cas simple est d'utiliser l'égalité. Ce qui donne alors :

qui est équivalent à :

Ce qui voudrait dire qui si un élément appartenait à l'ensemble vide, il ne serait pas identique à lui-même. Cette conclusion est incompatible avec ce qui est appelé classiquement le principe d'identité. Bertrand Russel (1872 - 1970) explique qu'à partir d'une proposition fausse, n'importe quelle proposition peut être déduite. À un étudiant, qui lui demanda s'il pouvait démontrer qu'il était le Pape à partir de 2 + 2 = 5, il fit la démonstration : 

Supposons que 2 + 2 = 5. Soustrayons 2 de chaque membre de l’identité. Nous obtenons 2 = 3. Par symétrie, 3 = 2. Soustrayant 1 de chaque côté, il vient : 2 = 1. Maintenant, le Pape et moi sommes deux. Puisque 2 = 1, le pape et moi sommes un. Par suite, je suis le Pape.  

Si l'on raisonne par l'absurde, on suppose qu'il peut y avoir deux ensembles définis par :

Ce qui conduit aux équivalences suivantes :

Tout cela est assez logique puisque les deux ensembles sont définis exactement de la même manière. Mais, la théorie des ensembles se garde bien de toute évidence. Elle peut parfois donner l'impression de ne démontrer que de simples banalités. Comme le dit Ludwig Wittgenstein (1889 - 1951) dans le Tractatus logico-philosophicus : Toutes les propositions logiques sont des tautologies et Par conséquent, il ne peut jamais y avoir de surprises en logique.

Pour construire les entiers naturels, l'ensemble vide est donc nécessaire, puisqu'il est utilisé pour former initialement l'entier 0. Par l'unicité de l'ensemble vide, l'entier 0 est lui-même unique.

D'autre part, l'ensemble vide est un sous-ensemble de tout autre ensembles : ne possédant aucun élément, il est possible de dire que tous ses éléments sont contenus dans un ensemble quelconque E. Tout ensemble contient ainsi l'ensemble vide. Le philosophe des sciences Wesley Salmon (1925 - 2001) explique l'existence de l'ensemble vide :

L'imbécile croit que les ensembles vides n'existent pas. Mais s'il en était ainsi, alors l'ensemble de tous ces ensembles serait vide, et par conséquent, celui-ci serait l'ensemble vide ...

lundi 13 février 2012

Binôme de Newton

Une application des combinaisons est le développement du binôme :  (a + b)n. Ce polynôme est appelé binôme, car il est composé de deux termes. Pour le développer, on peut écrire cette expression sous la forme du produit :

(a + b) (a + b) ... (a + b).

Afin de n'oublier aucun terme, on les ordonne selon les puissances décroissantes de a. Le premier terme est donc an. Pour l'obtenir, on prend le terme a dans chaque facteur (a + b). Il n'y a alors pas le choix pour former le terme contenant an, qui ne peut être formé que d'une seule façon. Le coefficient devant an est donc 1.

Le deuxième terme est de la forme an-1 b. Pour obtenir une seule fois b, on doit choisir un facteur (a + b) parmi les n, où b sera pris. Dans tous les autres facteurs, on prendra a. On doit donc choisir un facteur parmi les n dans lequel on prendra b. Une fois le facteur choisi pour b, on prend tous les autres pour obtenir an-1, ce qui ne laisse plus le choix pour obtenir les a. Il y aura ainsi possibilités, c'est-à-dire n, pour choisir le facteur qui permettra d'obtenir le b du monôme an-1 b.

Pour obtenir le k ème facteur, qui est de la forme ak bn-k, on devra choisir k facteurs parmi n où l'on prendra b. Le coefficient devant ak bn-k est donc .

Par exemple, si l'on veut développer le binôme : (a + b)3, le terme a est pris dans les 3 facteurs pour obtenir a3. Pour former le terme suivant a2 b, il faut choisir un facteur (a + b) parmi les 3 présents pour obtenir b ; quand celui-ci est choisi, les a sont pris dans les 3 autres facteurs. Il y a donc 3 possibilités pour choisir le facteur où l'on prend b. De même, le coefficient devant a b2 est 3, car pour choisir 2 facteurs parmi 3, il y a 3 possibilités. Enfin, il n'y a qu'une seule possibilité pour obtenir b3, car il faut prendre tous les facteurs.

On observe qu'il y a une symétrie dans les coefficients, puisqu’on a :

Le premier coefficient est ainsi le même que le dernier, le deuxième est le même que l'avant-dernier, ... En effet, il revient bien au même de choisir les k facteurs où l'on choisit les a, que de choisir les (n - k) facteurs où l'on choisit les b, pour obtenir le monôme ak bn - k. On a peut donc écrire dans le développement :

ou

selon que l'on considère le nombre de façons de choisir les a ou de choisir les b pour former les termes de la forme ak bn - k

On obtient les coefficients du développement par la formule  du binôme de Newton :

Une façon de trouver les coefficients qui interviennent dans cette formule est d'utiliser le triangle de Pascal. Blaise Pascal lui consacre un livre entier en 1623 : le Traité du triangle arithmétique, mais qui ne sera publié qu'à titre posthume en 1665 par Guillaume Desprez. Dans ce livre, Pascal introduit aussi le raisonnement par récurrence. Le triangle était cependant déjà connu des mathématiciens persans, comme Omar Khayyam au XI ème siècle qui l'utilise pour développer (a + b)n. En 1685, Isaac Newton généralisa la formule à des exposants non entiers, ce qu'on appelle la formule du binôme généralisée.

Le triangle de Pascal est construit selon la formule de récurrence :

Pour comprendre cette relation entre les coefficients, on peut utiliser le fait que si deux ensembles sont disjoints, on peut faire la somme de leur cardinaux. Si A et B sont deux ensembles disjoints alors :

Pour utiliser cette propriété pour calculer le cardinal d'un ensemble, on partage l'ensemble dont on souhaite calculer le cardinal en deux ensembles disjoints pour pouvoir faire la somme de leur cardinal.

Considérons un ensemble E dont on souhaite donner l'ensemble de toutes les combinaisons. Soit un élément x de l'ensemble E. Les combinaisons peuvent alors être partagées entre les combinaisons contenant l'élément x et les combinaisons ne contenant pas cet élément.

Pour former les combinaisons contenant l'élément x, une fois l'élément x choisi, il reste (k - 1) éléments à choisir parmi les n restants, c'est-à-dire qu'il y a combinaisons contenant l'élément x. Pour les combinaisons qui ne contiennent pas l'élément x, on choisit k éléments parmi tous les éléments sauf x, il y a donc combinaisons sans l'élément x. On retrouve donc la somme :

Par exemple, si on considère l'ensemble E = {a,b,c,d}, on peut d'abord considérer toutes les combinaisons contenant l'élément a : {a,b,c}, {a,b,d}, {a,c,d}, puis celles ne contenant pas l'élément a : {b,c,d}. On a ainsi former toutes les combinaisons de l'ensemble E et en peut voit qu'il y en 4 dont 3 contiennent l'élément a et une seule qui ne le contient pas.

On trouve sur les site image des mathématiques des billets sur le triangle de Pascal : le triangle de Pascal, devinette en chiffres arabes.

lundi 6 février 2012

La combine des combinaisons

Les combinaisons ont une importance fondamentale en probabilité, puisqu'elles permettent de faire certains dénombrements, c'est-à-dire de compter le nombre d'éléments d'ensembles. L'étude des combinaisons a commencé à être traitée de façon rigoureuse avec le développement des probabilités au XVIIe siècle, notamment avec Blaise Pascal et Pierre de Fermat, qui échangèrent des lettres à propos de problèmes de jeux de hasard et d'espérance de gain. Dans leur correspondance, ils cherchent par exemple à résoudre le problème des partis : on considère ainsi que deux joueurs jouent à un jeu de hasard en 3 parties gagnantes (par exemple à pile ou face). Chacun a misé la moitié d'un enjeu total S, et le premier qui a gagné n parties obtient la somme totale S. Or, pour une raison quelconque, le jeu doit être interrompu avant la victoire de l'un d'eux. Il faut alors faire le parti, c'est-à-dire le partage de l'enjeu total entre les deux joueurs. En 1655, au cours d'un voyage en France, Christiaan Huyghens prend connaissance de la correspondance de Pascal et Fermat. En 1657, il publie un livre sur le calcul des probabilités : De ratiociniis in ludo aleae (Sur le calcul dans les jeux de hasard). Il y définit et utilise la notion d'espérance, mais il ne prétend pas pour autant être l'inventeur du calcul des probabilités qu'il attribue à Pascal et Fermat.

Les combinaisons sont enseignées en terminale, mais les modifications du programme ont rendu ce sujet obscur. La formule

y est donnée sans aucune explication. Elle doit donc être apprise par cœur sans être comprise. C'est que pour comprendre les combinaisons, il faut d'abord parler des arrangements. Seulement, depuis quelques années, les arrangements ont été supprimés du programme du lycée, ce qui fait qu'il est impossible de justifier la formule des combinaisons. Les réformes qui se suivent suppriment ainsi des choses qui permettent d'en comprendre d'autres. Chaque notion est alors de moins en moins comprise. On peut choisir pourquoi pas de simplifier le programme, mais en profiter alors pour mieux comprendre les notions enseignées, ce qui n'est pourtant pas le cas.

La seule amélioration apportée est peut être l'utilisation de la notation internationale

au lieu de la notation française, et qui sont apparues en 1904 dans  l'encyclopédie des sciences mathématiques pures et appliquées, publiée de 1904 à 1916 sous la direction de Jules Molk. La notation internationale est proche de celle d'Euler qui utilisa la notation :

Cette notation s'est simplifiée en au 19ème siècle pour donner la notation internationale.

Les bons (?) livres du supérieur expliquent que les combinaisons sont le nombre d'injections d'un ensemble à k éléments dans un ensemble en possédant n. Tout cela donnent des définitions qui sont la plupart du temps présentées de façon abstraite sans référence à un sujet concret. Il serait tout de même plus parlant de commencer par expliquer que les combinaisons permettent de calculer la probabilité de gagner au loto. Mais cela n'explique pas encore la formule et pourquoi il y a un k! au dénominateur. Pour comprendre cette formule, avant de jouer au loto, il faut commencer par jouer au tiercé afin de voir concrètement la différence. Ce qui permettra par la suite de justifier les formules employées. Ce dernier cas du loto correspond aux arrangements.

Le mot arrangement est bien de la même famille que le verbe ranger, puisqu'il s'agit de donner les numéros dans le bon ordre. Ce qui n'est pas le cas au loto où les numéros sont simplement cochés sur la grille sans tenir compte de leur ordre de sortie au moment du tirage.

Pour donner un exemple simple, considérons un exemple avec 5 chevaux pendant la course. Le but est alors de donner les 3 premiers chevaux dans l'ordre de leur arrivée. On peut alors donner l'ensemble de toutes les possibilités. Par exemple, toutes celles qui commencent par 1 :

(1, 2, 3) ;  
(1, 2, 4) ; 
(1, 2, 5) ; 
(1, 3, 2) ;  
(1, 3, 4) ;
(1, 3, 5) ; 
(1, 4, 2) ;
(1, 4, 3) ;
(1, 4, 5) ; 
(1, 5, 2) ; 
(1, 5, 3) ;
(1, 5, 4).

On voit alors qu'il y en a 12. De même, on pourrait donner toutes les possibilités commençant par 2, celles par 3, par 4 et par 5. À chaque fois, il y en aussi 12. Ce qui donne 60 arrangements au total.

Pour choisir le premier cheval, il y a 5 possibilités. Une fois le premier cheval choisi, le deuxième est à choisir parmi les 4 restants. Quand les deux premiers chevaux sont choisis, le troisième est choisi parmi les 3 restants. Ainsi le nombre total d'arrangements possibles est :

On peut exprimer ce résultat avec les factorielles qui sont définies par le produit :

Cette notation est due à Christian Kramp dans Éléments d'arithmétique universelle publié en 1808. Si l'expression 5! est ajoutée au numérateur, les facteurs 2 et 1 seront en trop. Pour les supprimer, il faudra alors diviser par 2!. Ce qui donne alors pour cet exemple :

La formule générale des arrangements est alors donnée par : 

Dans le cas du loto, l’ordre des numéros n'a cette fois plus d'importance. Il y a alors des combinaisons qui sont identiques. Par exemple, il y a 6 combinaisons qui sont identiques à (1,2,3)

(1, 2, 3) = (1,3,2) = (2,1,3) = (2,3,1) = (3,1,2) = (3,2,1).

À chaque fois, pour un arrangement, il y a 6 façons de changer l'ordre des chiffres. Ce sont les permutations que l'on peut former avec 3 chiffres différents. Pour passer des arrangements aux combinaisons, il faut donc supprimer les éléments identiques, qui sont les permutations. Il s'agit alors de savoir combien de sous-ensembles contenant chacun k éléments il est possible de former avec un ensemble en contenant initialement p. C'est une des utilités de la division : il y aura p/k sous-ensembles contenant chacun k éléments. Ainsi, s'il y a 60 éléments au départ, qui correspondent aux arrangements de 3 éléments parmi 5, pour trouver les combinaisons de 5 éléments parmi 3, on cherche à savoir combien il est possible de former de sous-ensembles contenant chacun 6 éléments : il y en a alors 60/6 = 10.

Ainsi, pour passer des arrangements aux combinaisons il faut supprimer les permutations de k éléments qui sont des doublons pour les combinaisons, c'est-à-dire des éléments identiques. Ce qui justifie la formule des combinaisons :


vendredi 4 novembre 2011

Bijection

Si on regarde un cours de mathématiques de terminale, on est assez étonné que la définition du mot bijection n'est à aucun moment donnée. Pourtant, on demande d'utiliser cette notion en exercice.

La définition rigoureuse d'une bijection est donnée en première année de fac, où on explique qu'une fonction bijective est d'être à la fois une injection et une surjection. Comme cette définition exacte n'est donnée que plus tard, on ne la donne plus en terminale.

Pourtant, dans le dictionnaire Larousse, à bijection, on peut lire : une application bijective est une application qui établit entre les éléments de deux ensembles une correspondance telle que tout élément de l'un a un correspondant et un seul dans l'autre ensemble. Cette définition est exacte et est tout à fait compréhensible.

On se rend donc compte que l'excuse de dire qu'on ne peut pas donner de définition rigoureuse en terminale ne tient pas, puisqu'on peut le faire sans introduire de nouvelles notions.

De plus, le dictionnaire donne un synonyme de bijection : application biunivoque. Univoque est le contraire d'équivoque, c'est-à-dire qu'un mot univoque conserve le même sens dans des emplois différents. Le préfixe bi- signifie qu'une application bijective est équivoque dans les deux sens : à un x correspond un seul y et inversement à un y correspond un seul x. On comprend donc mieux ce que veut dire le mot bijection : on retrouve le préfixe bi- qui indique une même opération dans les deux sens. Le suffixe -jection est de la même famille que jeter : on  jette un x sur un y, et inversement on jette un y sur un x.

Les anglo-saxons, qui ne cherchent pas à tout compliquer, utilisent le mot one-to-one correspondence pour fonction bijective : à un, elle associe un. Si l'on voulait être plus précis, il faudrait indiquer aussi : one-backward-one, qui permettrait d'indiquer qu'à un y correspond un seul x. Alors que one-to-one indique qu'a un x correspond un seul y.

Les bijections servent essentiellement à deux choses :

  1. à démontrer que l'équation E(X) = y admet une solution unique quand la fonction E est une bijection ;
  2. à montrer que la fonction f admet une fonction inverse lorsque f est une bijection : ainsi la fonction ln possède une fonction inverse qui est l'exponentielle

À force de ne leur donner aucune définition précise, certains élèves en viennent à tout confondre : équation, fonction, variable, inconnue, ...  Pense-t-on que parce que les mathématiques possèdent une certaine abstraction, on ne peut utiliser des mots précis ? Seulement, si on ouvre un dictionnaire, toutes ces définitions sont données. On ne peut pas faire autrement que d'ancrer la compréhension sur le langage.

samedi 29 octobre 2011

Dans tous ses états

L'expression "équation d'état" est issue de la thermodynamique, où elle désigne une équation reliant, à l'équilibre thermodynamique, des variables mesurables qui définissent l'état d'un système et qui ne dépendent que de l'état macroscopique du système considéré. Ces variables sont naturellement appelées variables d'état. Par exemple, la loi des gaz parfaits de Boyle-Mariotte, PV = nRT est une équation d'état, qui indique que sous les mêmes conditions de température et de pression, un gaz a toujours le même volume V.

Dans ce genre d'équation, il est possible de distinguer deux types de variables :
  1. les variables intensives, qui sont indépendantes de la quantité de matière ;
  2. les variables extensives, qui à l'inverse, sont dépendantes de la quantité de matière.
Ainsi, dans la loi des gaz parfaits, la température et la pression sont des variables intensives et le volume du gaz considéré est une variable extensive. On peut alors remarquer que les variables intensives correspondent aux conditions imposées par l’environnement sur le système et que les variables extensives, qui sont des propriétés intrinsèques au système, correspondent à la réponse de celui-ci.

De manière générale, tout échange d'énergie fait intervenir deux types de grandeur (intensive et extensive). On parle alors de grandeurs conjuguées. Des exemples sont : en thermodynamique, la température T, qui est intensive, est associée à l'entropie S, extensive ; en mécanique, la force F (intensive) et le déplacement dl (extensive) ; en électricité, le potentiel électrique V (intensive) et la charge q (extensive).

Le produit d'une variable intensive par une extensive donne une variable extensive. De plus, leur produit est homogène à une énergie. Ainsi, le travail d'un force,

est extensif et son unité est le joule (J). Le quotient de deux variables extensives donne une variable intensive. Par exemple, la masse volumique est une variable intensive, puisqu'elle est donnée par la formule :

où la masse m et le volume V sont des grandeurs intensives.

vendredi 30 septembre 2011

Splendeurs et misères de l'enseignement des maths

La fin de l'article sur les dérivées se montre critique sur l'enseignement. Le but n'est pas seulement de critiquer un enseignement qui n'est pas toujours facile. Seulement, les mathématiques enseignées au lycée finissent par devenir des méthodes, ou des sortes de recettes, à appliquer sans comprendre pour résoudre un exercice donné. Pour Henri Poincaré,

La science a eu de merveilleuses applications, mais la science qui n'aurait en vue que les applications ne serait plus de la science, elle ne serait plus que de la cuisine.

L'application devient bien pauvre quand il s'agit de résoudre des exercices types. Mais il est très difficile de trouver de l'intérêt et une quelconque satisfaction à quelque chose que l'on ne comprend pas.

Certains élèves s'en sortent, et ont parfois de très bonnes notes, en apprenant par cœur ces méthodes, sans avoir réellement compris les notions fondamentales. D'autres ne voient pas l'intérêt d'apprendre un cours que l'on ne comprend pas et qui ne sert pas à résoudre les exercices. Ainsi, dans le cas de la dérivée, la définition utilisant le taux d'accroissement est rarement utilisée en exercice. La définition de la dérivée, qui permet de donner une approximation linéaire de la fonction au voisinage d'un point :

n'est jamais utilisée en terminale. La dérivée est utilisée pour l'étude des variations d'une fonction et devient des + et des - dans un tableau pour tracer des flèches. Des exercices peuvent être résolus (notamment, l'exercice de 10 points au bac sur les études de fonctions) en associant le + à une flèche ascendante et le - à une flèche descendante, sans avoir compris qu'une fonction croissante admet une dérivée dont le coefficient directeur est positif.

De plus, les mathématiques sont devenues un outil de sélection, parfois même pour des filières où les mathématiques ne seront pas importantes. Or, il est bien difficile de juger de la capacité ou de l'intelligence de quelqu'un qui résout un exercice ou qui réussit un examen à un jour précis.

Il est dommage que les cours ne montrent pas le réel intérêt des mathématiques. Pour William Paul Thurston :

L'intérêt de la réflexion et la formation d'un esprit Il y a une joie réelle à faire des mathématiques, à apprendre de nouvelles méthodes de pensée qui expliquent, organisent et simplifient. On peut ressentir cette joie en découvrant de nouvelles mathématiques, (…) ou en trouvant une nouvelle façon d’expliquer (…) une structure mathématique ancienne.

Henri Poincaré critiquait déjà l'abstraction des définitions données aux étudiants. Il vaut mieux parfois commencer par donner des définitions plus intuitives et approximatives qui permettront de montrer le cheminement des idées. Dans Science et Méthode :

Nos pères croyaient savoir ce que c'est qu'une fraction, ou que la continuité, ou que l'aire d'une surface courbe ; c'est nous qui nous sommes aperçu qu'ils ne le savaient pas. De même nos élèves croient le savoir quand ils commencent à étudier sérieusement les mathématiques. Si, sans autre préparation, je viens leur dire : Non, vous ne le savez pas ; ce que vous croyez comprendre, vous ne le comprenez pas ; il faut que je vous démontre ce qui vous semble évident, et si dans la démonstration je m'appuie sur des prémisses qui leur semblent moins évidentes que la conclusion, que penseront ces malheureux ? Ils penseront que la science mathématique n'est qu'un entassement arbitraire de subtilités inutiles ; ou bien ils s'en dégoûteront ; ou bien ils s'en amuseront comme d'un jeu et ils arriveront à un état d'esprit analogue à celui des sophistes grecs.

Il est aussi important de montrer l'intérêt et l'utilité des notions utilisées. Toujours dans Science et Méthode, Poincaré écrit:

Il y a une chose qui me frappe : c'est combien les jeunes gens qui ont reçu l'éducation secondaire sont éloignés d'appliquer au monde réel les lois mécaniques qu'on leur a enseignées. Ce n'est pas seulement qu'ils en sont incapables ; ils n'y pensent même pas. Pour eux le monde de la science et celui de la réalité sont séparés par une cloison étanche. Il n'est pas rare de voir un monsieur bien mis, probablement bachelier, assis dans une voiture en s'imaginant qu'il l'aide à avancer en poussant sur l'avant, et cela au mépris du principe de l'action et de la réaction.

Ce qui rend difficile de lire un cours de mathématiques est qu'il se présente de manière déductive. Il montre le produit fini tel qu'il apparaît après un long déroulement fait de tâtonnements, d'erreurs, totalement cachés de l'enseignement. Pour Gian Carlo Rota :

Nous entendons souvent dire que les mathématiques consistent à prouver des théorèmes. Le travail d'un écrivain serait-il d'écrire des phrases ? L'œuvre d'un mathématicien est surtout un enchevêtrement de conjectures, d'analogies, de souhaits et de frustrations ; la démonstration, loin d'être le noyau de la découverte, n'est souvent que le moyen de s'assurer que notre esprit ne nous joue pas des tours.

Celui qui s'exprime le mieux la-dessus est sans doute Alexandre Grothendieck qui s'exprime en détails sur de nombreux sujets à propos des mathématiques dans son autobiographie de presque 1000 pages intitulée Récoltes et Semailles :

La deuxième chose sur laquelle je sentais le besoin de m’exprimer, dans ma fameuse introduction personnelle et philosophique à un texte mathématique, c’était au sujet de la nature du travail créateur justement, Je m’étais rendu compte déjà, depuis des années, que cette nature était généralement ignorée, occultée par des clichés à tout venant et par des répressions et des peurs ancestrales. (...) cette partie créatrice entre toutes dont je viens de parler dans le travail de découverte, ne transparaît pratiquement nulle part dans les textes ou discours qui sont censés présenter un tel travail (ou du moins, ses fruits les plus tangibles) ; que ce soient des manuels et autres textes didactiques, ou les articles et mémoires originaux, ou les cours oraux et exposés de séminaires etc. Il y a, depuis des millénaires semblerait-il, depuis les origines même de la mathématique et des autres arts et sciences, une sorte de "conspiration du silence" autour de ces inavouables labeurs qui préludent à l’éclosion de toute idée nouvelle, grande ou petite, venant renouveler notre connaissance d’une portion de ce monde, en création perpétuelle, où nous vivons.
Pour tout dire, il semblerait que la répression de la connaissance de cet aspect-là ou de ce stade-là, le plus crucial de tous dans tout travail de découverte (et dans le travail créateur en général) ; soit à tel point efficace, à tel point intériorisé par ceux-là même qui pourtant connaissent un tel travail de première main, que souvent on jurerait que même ceux-là en ont éradiqué toute trace de leur souvenir conscient. Un peu comme dans une société puritaine à outrance, une femme aurait éradiqué de son souvenir, en relation à chacun de ces enfants qu’elle se fait un devoir de moucher et de torcher, le moment de l’étreinte (subie à contre-cœur) qui le fit concevoir, les longs mois de la grossesse (vécue comme une inconvenance), et les longues heures de l’accouchement (endurées comme un peu ragoûtant calvaire, suivi enfin d’une délivrance).

Dans le même chapitre, il parle même de dégradation du milieu mathématique :

L’aspect de cette dégradation auquel je pense surtout ici (qui en est juste un aspect parmi de nombreux autres) est le mépris tacite, quand ce n’est la dérision sans équivoque, à l’encontre de ce qui (en mathématique, en l’occurrence) ne s’apparente pas au pur travail du marteau sur l’enclume ou sur le burin - le mépris des processus créateurs les plus délicats (et souvent de moindre apparence) ; de tout ce qui est inspiration, rêve, vision (si puissantes et si fertiles  soient-elles), et même (à la limite) de toute idée, si clairement conçue et formulée soit-elle : de tout ce qui n’est écrit et publié noir sur blanc, sous forme d’énoncés purs et durs, répertoriables et répertoriés, mûrs pour les banques de données engouffrées dans les inépuisables mémoires de nos mégaordinateurs. Il y a eu (pour reprendre une expression de C.L. Siegel) un extraordinaire aplatissement, un rétrécissement de la pensée mathématique, dépouillée d’une dimension essentielle, de tout son versant d’ombre, du versant féminin. Il est vrai que par une tradition ancestrale, ce versant-là du travail de découverte restait dans une large mesure occultée, personne (autant dire) n’en parlait jamais - mais le contact vivant avec les sources profondes du rêve, qui alimentent les grandes visions et les grands desseins, n’avait jamais encore (à ma connaissance) été perdu. Il semblerait que dès à présent nous soyons déjà entrés dans une époque de dessèchement, où cette source est, non point tarie certes, mais eu l’accès à elle est condamné, par le verdict sans appel du mépris général et par les représailles de la dérision.
Nous voilà approcher du moment, semble-t-il, où sera éradiqué en chacun non seulement le souvenir de tout travail proche de la source, du travail au féminin (ridiculisé comme vaseux, mou, inconsistant -ou au bout opposé comme trivialités, enfantillages, bombinage ... ), mais où sera extirpé également ce travail même et ses fruits : celui où sont conçues, s’élaborent et naissent les notions et les visions nouvelles. Ce sera l’époque aussi où l’exercice de notre art sera réduit à d’arides et vaines exhibitions de poids et haltères cérébraux, aux surenchères des prouesses pour craquer les problèmes au concours (de difficulté proverbiale) - l’époque d’une hypertrophie surpermacho fiévreuse et stérile, prenant la suite de plus de trois siècles de renouvellement créateur.

Il cherchera alors à réaliser une rédaction où ce travail ne serait pas caché :

Il ne s’agirait plus pour moi, désormais, de présenter des fondations méticuleuses et à quatre épingles pour quelque nouvel univers mathématique en gésine. Ce seraient des carnets de bord plutôt, où le travail se poursuivrait au jour le jour, sans rien en cacher et tel qu’il se poursuit vraiment, avec ses ratés et ses foirages, ses insistants retours en arrière et aussi ses soudains bonds en avant - un travail tiré en avant irrésistiblement jour après jour (et nonobstant les incidents et imprévus innombrables), comme par un invisible fil - par quelque vision élusive, tenace et sûre. Un travail tâtonnant bien souvent, surtout en ces moments sensibles où affleure, à peine perceptible, quelque intuition sans nom encore et sans visage ; ou au départ de quelque nouveau voyage, à l’appel et à la poursuite de quelques premières idées et intuitions, élusives souvent et réticentes à se laisser saisir dans les mailles du langage, alors que c’est justement le langage adéquat pour les saisir avec délicatesse qui souvent fait encore défaut. C’est un tel langage, avant toute autre chose, qu’il s’agit alors de faire se condenser hors d’un apparent néant de brumes impalpables. Ce qui n’est encore que pressenti, avant d’être seulement entrevu et encore moins "vu" et touché du doigt, peu à peu se décante de l’impondérable, se dégage de son manteau d’ombre et de brumes pour prendre forme et chair et poids ...

L'enseignement a aussi pour but de former une capacité de réflexion, une indépendance de penser, une liberté de l'esprit, la formation d'un esprit critique. Selon Henri Poincaré :

La liberté est pour la Science ce que l'air est pour l'animal. La pensée ne doit jamais se soumettre, ni à un dogme, ni à un parti, ni à une passion, ni à un intérêt, ni à une idée préconçue, ni à quoi que ce soit, si ce n'est aux faits eux-mêmes, parce que, pour elle, se soumettre, ce serait cesser d'être.

Ce qui bien plus ambitieux que d'amener 80 % d'une classe d'âge au bac.

dimanche 25 septembre 2011

Équilibre économique

Un des premiers à étudier la notion d'équilibre est Jean-Baptiste Say qui le définit en 1803 lorsque l'offre est égale à la demande. Il affirme que l'offre crée sa propre demande et que par conséquent il ne peut y avoir de déséquilibre durable entre l'offre et la demande. Pour lui, l'économie de marché est capable de s'auto-réguler spontanément.

Thomas Malthus est le premier à contredire Say. Il pense que les capitalistes limitent leur consommation pour épargner, avec pour but plus tard d'investir. Comme les travailleurs ne perçoivent qu'une partie de ce qu'ils produisent ils limitent la demande et n'absorbe alors pas complètement l'offre. Il insiste ainsi sur le rôle de la demande en économie

Pour Léon Walras, dans Élément d'économie pure (1874), un équilibre est une situation telle que ni les consommateurs ni les producteurs n'ont intérêt à à modifier les quantités de biens et de service productifs demandés et offerts sur le marché. Selon lui, la libre concurrence permet d'obtenir la meilleure situation sociale : si chaque individu est dans la meilleure situation possible, il en sera de même pour la société. Pareto ne l'affirme pas. Étant donné qu'il n'existe aucun moyen de mesurer les gains des uns et les pertes des autres, il est impossible, selon Pareto, d'affirmer que la situation réalisée par la libre concurrence donne à l'ensemble des individus une quantité globale de satisfactions supérieures à celle qui résulterait de l'intervention de l'État.

Les gouvernements se demandent régulièrement comment prendre et justifier une décision qui soit conforme à un principe de justice sociale. Ce qui est considéré comme le mieux pour la majorité n'est pas forcément le meilleur pour tous. De plus, l'égalité sociale accorde une grande importance aux droits individuels. Le libéralisme classique, développé au cours du siècle des Lumières, plaide en faveur de certaines libertés individuelles face à une autorité gouvernementale.

À partir Adam Smith, les notions de bien-être et d'intérêt général deviennent importantes en économie. Il explique avec la notion de main invisible que chaque individu en recherchant son propre intérêt oeuvre pour l'intérêt général qui est la somme des intérêts particuliers.

Vilfredo Pareto succède à Léon Walras à la chaire d'économie politique de l'Université de Lausanne. Il reprend les théories de ce dernier et celles de Francis Edgeworth. Tjalling Koopmans sera un des premiers à employer la notion d'équilibre de Pareto en 1951.

Pareto est le premier à définir précisément la notion d'équilibre. Dans son Manuel d'économie politique (1909), il considère qu'il y a une amélioration sociale chaque fois que le bien-être de certains s'accroît et que celui de personne ne décroît. Aucun ne concède alors à une détérioration de sa situation. Certains appellent ce genre de modification une amélioration parétienne. Chaque individu ne cherche alors pas simplement à améliorer sa propre situation, mais il doit aussi savoir ce que provoque en contrepartie cette amélioration pour les autres individus.

Une situation est considérée comme un équilibre de Pareto s'il n'est plus possible d'augmenter la satisfaction d'un individu sans diminuer celle d'un autre.  Selon Pareto, l’optimum est le plus grand bien-être possible pour les individus de la collectivité. D'après Gerard Debreu (1966), un optimum est un état réalisable auquel n'est préféré aucun état réalisable.

John Rawls reprend d'une certaine manière ces idées pour sa conception de la justice. Pour lui, on peut accepter des inégalités, ou des actions collectives qui en produisent, si en contrepartie elles améliorent le sort de tous. Dans Une théorie de la justice en 1971, il explique que :

Les inégalités économiques et sociales, par exemple les inégalités de fortune et de pouvoir, ne sont justes que si elles se traduisent par des gains compensatoires pour tous, en particulier pour les membres les moins favorisés de la société. Un tel principe exclut de pouvoir justifier des institutions en se fondant sur le fait que les torts causés à certains sont compensés par un bienfait plus important en tout.

ou encore :

Toutes les valeurs de la société -la liberté et les opportunités, le revenu et la richesse, et les fondements de l'amour-propre - doivent être réparties de manière égale, à moins qu'une répartition inégale de l'une de ces valeurs ou de toutes soit à l'avantage de tous. L'injustice n'est dons pas autre chose que les inégalités qui ne profitent pas à tous.

dimanche 18 septembre 2011

De la décroissance et des dérivées ...

Comment calculer l'équation de la tangente en une courbe représentative d'une fonction f donnée ?

Sur cette figure, le seul point que l'on connaît est le point rouge, le point de tangence, qui est commun à la courbe et à la droite. Ce seul point sera utilisé pour déterminer l'équation de la droite tangente à la courbe.

Or, lorsqu'on cherche à calculer l'équation d'une droite, on commence usuellement par calculer son coefficient directeur (ou sa pente). Pour cela, deux points A et B appartenant à cette droite sont nécessaires, puisque le coefficient directeur est donné par l'expression :

si la droite passe par les points A et B de coordonnées respectives et . Le coefficient directeur se calcule ainsi par la différence des ordonnées y sur la différence des abscisses x, ce que l'on peut noter par :

Dans le cas de la tangente, il est impossible d'utiliser directement cette expression pour calculer le coefficient directeur, puisqu'on ne connaît qu'un seul point passant par la tangente : le point de la tangente qui touche la courbe. Le mot tangente vient d'ailleurs du tangere qui signifie toucher, puisqu'au voisinage du point de tangence, la droite ne touche la courbe qu'en ce point.

Pour définir rigoureusement le coefficient directeur de la tangente, la notion de limite est utilisée. Pour cela, on considère deux points appartenant à la courbe représentative de la fonction : le point de tangence A et un autre point B. Supposons alors que les coordonnées du point A soient :

(l'indice 0 est utilisé pour indiquer que ce point est fixé une fois pour toute, c'est-à-dire qu'il ne bougera pas au cours de la construction). De plus, on considère que le deuxième point B, appartenant à la fois à la courbe et à la sécante, est un peu plus loin du point A sur sa droite. Les coordonnées (x,y) de ce point B seront alors notées

h est un nombre réel positif. Le coefficient de la sécante à la courbe passant par ces deux points A et B est donc :

.

Lorsque le point B se rapproche peu à peu du point A, la sécante (AB) se rapproche de plus en plus de la tangente à la courbe au point A. Quand le point B finit par être confondu avec le point A, la sécante devient la tangente, qui ne coupe le droite qu'en un seul point, le point de tangence A. Le coefficient de cette dernière droite est bien le coefficient de la tangente au point A. C'est cette construction que l'on peut voir sur l'animation ci-dessous, qui provient de la page tangente de Wikipédia (comme la première figure de cet article représentant une courbe et une tangente) (merci en passant à la licence libre GNU).



Cette construction peut être décrite à l'aide de limite suivante :

qui correspond à la limite des coefficients directeurs de chaque sécante (AB) lorsque le point B se rapproche de A ou quand h tend vers 0. Autant de choses dans cette formule si concise et tellement incompréhensible quand elle est vue pour la première fois en première ou en terminale!

Le rapport est la plupart du temps appelé taux d'accroissement. Pourtant, si la fonction f est décroissante au voisinage de A comme c'est le cas sur l'animation, ce taux va décroître au fur et à mesure que B s'approche de A et serait un "taux de décroissance" (comme celui des économies européennes et américaine). Il serait donc plus juste de l'appeler taux de variation.

En calculant cette limite, on obtient le coefficient directeur de la tangente au point A de coordonnées . Ainsi, dans la cas de la fonction , on aura :

En faisant tendre h vers 0 dans cette dernière expression, la dérivée de la fonction est 2x.

La longueur de cet article montre que la notion de dérivée n'est pas une notion simple, qui souvent n'est pas complètement comprise en terminale. Bien souvent, il faut attendre le niveau universitaire pour la maîtriser réellement. À cela, plusieurs raisons. La première, la plus évidente, est que la dérivée est une notion difficile. Seulement, dans les livres de terminale, les explications sur les dérivées sont rarement aussi détaillées. Si elles ne sont pas exposées clairement, comment un élève de terminale les comprendra-t-il par lui-même (surtout pour des notions aussi difficiles) ? On peut difficilement demander aux élèves de retrouver par eux-mêmes des notions, qui ont nécessité parfois des siècles pour être exposées correctement ; bien que l'idée dans ce cas soit de donner, par bonne intention, plus d'autonomie aux élèves. (Sur l'autonomie des élèves, on peut aussi s'étonner que quand un élève propose pour résoudre un exercice une méthode différente que celle vue en cours, il n'a parfois pas les points ; il faut dire qu'un pédagogue n'est jamais à une contradictions près). D'autre part, l'année de terminale passant vite, il est difficile à un professeur d'expliquer, par manque de temps, autant qu'il ou que les élèves le souhaiteraient (surtout que chacun d'entre-eux comprendra à son propre rythme et il est impossible de donner des explications différentes pour chacun).  De plus, la plupart du temps, les objectifs d'un chapitre ne sont pas explicités, car là encore on espère que l'élève les trouvera de lui-même. Les bons élèves sont souvent ceux qui comprennent ce qu'on attend d'eux et qui ont bien intégré les règles du système scolaire. Enfin, certains professeurs de mathématiques ne font pas un cours trop clair, car si celui-ci apparaît trop facile, il donne l'impression à l'élève qu'il a tout compris en cours et n'a pas besoin de réviser chez lui. On a l'habitude de dire, peut-être plus pour les études supérieures que pour le secondaire, qu'il faut à un moment donné larguer l'étudiant pour montrer que le sujet traité est difficile et qu'il doit travailler pour comprendre. Les livres de Stella Baruk sur l'enseignement des mathématiques, comme par exemple Échec et maths, sont à lire sur ce sujet. Elle montre que faute de compréhension les élèves en viennent à réciter par cœur un cours et des méthodes qu'ils ne comprennent pas et deviennent alors ce qu'elle appelle des "automaths". Pour des élèves qui n'y comprennent rien, les maths auront peu d'intérêt. Seulement, quand je ne comprends pas un sujet, I can get no satisfaction ... 'Cause I try!

mercredi 27 juillet 2011

Calcul infinitésimal

Le calcul infinitésimal a pour origine des notions, comme les fonctions continues ou les limites, qui étaient intuitives depuis les grecs et qui seront définies plus tard au XIX ème siècle.

La vitesse moyenne d'un mobile sur un intervalle de temps se calcule par :

Pour définir la vitesse en un instant t précis, la vitesse instantanée, on devra calculer le rapport :

quand devient de plus en plus petit, qui est donc la limite du rapport quand tend vers 0.  À cause du quotient égal à 0, les grecs ne savaient pas calculer cette limite.

Les études sur ces problèmes infinitésimaux se sont surtout développées au XVII ème siècle pour résoudre des problèmes liés à la mécanique.

Newton donne différentes explications du calcul infinitésimal. Dans Philosophia naturalis principia mathematica, publié en 1687, il utilise des quantités infiniment petites, qu'il appelle moments. Trouvant ces quantités insufisament rigoureuses, il cherche à mieux les définir dans Méthodes des fluxions et des suites infinies, terminé en 1671, publié à titre posthume en 1736. Il appelle fluxions les vitesses des quantités dépendant du temps et fluentes les quantités qui évoluent en fonction du temps :

J'appellerai quantités fluentes, ou simplement fluentes, ces quantités que je considère comme augmentées graduellement, et indéfiniment, je les représenterai par le dernières lettres de l'alphabet : v, x, y et z  et je représenterai par les mêmes lettres surmontées d'un point , , , les vitesses dont les fluentes sont augmentées par le mouvement qui les produit et que par conséquent on peut appeler fluxions.

Il énonce ensuite les problèmes du calcul infinitésimal :

Étant donné les relations entre des quantités fluentes, trouver la relation de leurs fluxions. Et inversement.

Pour trouver les fluentes, il note o un intervalle de temps infiniment petit, l'accroissement infiniment petit de x et l'accroissement infiniment petit de y. Pour trouver une relation entre et , il remplace dans la variable x par et y par , on obtient donc :

.

En utilisant le formule du binôme de Newton, on obtient :

Pour qu'il ne reste plus que , il retranche par et divise par o pour obtenir :

Enfin, il néglige les termes contenant o, c'est-à-dire les termes, comme , considérés comme indéfiniment petits pour tout entier n et pour tout réel x.

On a alors la propriété suivante : si o est indéfiniment petit, n o est lui aussi indéfiniment petit pour tout entier n. Or, dans , si a < b, il existe tel que nb > a. On dit alors que est un corps archimédien. Ainsi, en ajoutant à , les indéfiniment petits, le corps obtenu n'est plus archimédien, car si 0 < o < 1, alors pour tout , 0 < n o < 1, c'est-à-dire que n o reste un indéfiniment petit pour tout entier n. Les indéfiniment petits ne constituent donc pas un corps archimidien et ils possèdent des propriétés différentes de celles des nombres réels.

Dans Tractatus de quadratura curvarum écrit en 1674 et publié en 1704, Newton préfère écrire les rapports de la variation de x à celle de y. Avec le raisonnement similaire au précédent, il trouve :

qui est le rapport entre deux fluxions, qu'il appelle la dernière raison des variations évanouissantes et qui correspond à une limite.

Pour étudier le calcul infinitésimal, Leibniz étudie dans sa thèse en 1666 De arte combinatoria la suite des carrés et ses différences :

0, 1, 4, 9, 16, 25, 36
  1, 3, 5, 7, 9, 11
   2, 2, 2, 2, 2

Il remarque que la somme des premières différences est égale au dernier terme de la suite au carré : ainsi, , , . En notant, l la différence entre deux valeurs voisines de la fonction, on a la relation : . Il utilise bientôt la notation dy à la place de l et le symbole qui est le s de summa allongée. La relation devient alors :

Deux écoles vont se suivre : l'école anglaise et l'école continentale. La première avec Berkeley, Maclaurin, Taylor cherchent à clarifier les éléments infinitésimaux. La deuxième, dont Euler fait partie, cherche à lier le calcul différentiel à l'idée de fonction, car Leibniz rattache les bases du calcul différentiel à la géométrie des courbes et il parla pour la première fois de fonction en 1673 dans la Méthode inverse des tangentes ou à propos des fonctions. Pour Jacques Hadamard :

L'être mathématique, en un mot, ne fut plus le nombre : ce fut la loi de la variation, la fonction. La mathématique n'était pas seulement enrichie de nouvelles méthodes, elle était transformée dans son objet.

Après une correspondance entre Leibniz et Jean Bernoulli, celui-ci donne en 1718 la définition précise de fonction :

On appelle fonction d'une grandeur variable une quantité composée, de quelque manière que ce soit, de cette grandeur variable et de constantes.

Euler considère le calcul infinitésimal comme une extension de l'algèbre : aux opérations connues, deux nouvelles opérations sont ajoutées : la différentiation et l'intégration. Il cherche à affranchir le calcul infinitésimal de la géométrie.

Jean Le Rond d'Alembert comprend qu'il faut donner fonder le calcul différentiel sur la notion de limite. En tant que rédacteur scientifique de l'Encyclopédie dans l'article limite, il écrit que  la notion de limite est la vraie métaphysique du calcul différentiel. Il s'efforce alors de donner une idée rigoureuse de la notion de limite, mais il ne réussit pas à le faire de façon cohérente.

Il faudra attendre le XIX ème siècle pour élucider le concept de limite qui sera défini par Augustin Louis Cauchy dans son cours d'analyse à l'école polytechnique en 1821 :

Lorsque les valeurs successivement attribuées à une même variable s'approche indéfiniment d'une valeur fixe, de manière à finir par en différer aussi peu que l'on voudra, cette dernière est appelée la limite de toutes les autres.

Il peut ensuite définir rigoureusement la notion d'infiniment petit :

On dit qu'une quantité variable devient infiniment petite lorsque sa valeur numérique décroît indéfiniment de manière à converger vers la limite zéro.

L'histoire du calcul différentiel montre toute la difficulté de définir précisément des notions mathématiques ; ce qui peut prendre énormément de temps. Les limites seront définies plus d'un siècle après Newton, qui ne pouvait donner toutes les définitions à cause de barrières épistémologiques.

mercredi 24 février 2010

Théorèmes de Gödel

En 1787, dans Critique de la raison pure, Immanuel Kant affirmait que la logique formelle n'a pas pu faire un seul pas en avant, et qu'ainsi, selon toute apparence, elle semble close et achevée. Malgré tout, Gottlob Frege fait faire des progrès à la logique en introduisant le calcul des prédicats et avec Grundgesetze der Arithmetik (fondements de l'arithmétique), il tente de dériver l'arithmétique de la logique. Mais en 1902, Bertrand Russell montre que le système formel de Frege était incohérent. On pensait alors qu'un système formel pourrait être complété en ajoutant un nombre fini d'axiomes pour le rendre complet. En 1931, Kurt Gödel met fin à cet espoir en effectuant la démonstration des deux théorèmes d'incomplétude. Comme le fait remarquer Douglas Hofstadter dans Gödel Escher Bach : Les Brins d'une guirlande éternelle, la version originale était en allemand, et vous trouverez peut-être que vous auriez tout aussi bien compris en allemand. L'article de Gödel Über formal unentscheidbare Sätze der Principia Mathematica und verwandter Systeme (Sur les propositions formellement indécidables des Principia Mathematica et des systèmes apparentés, traduit en anglais par On Formally Undecidable Propositions of Principia Mathematica and Related Systems) commence par :

Le développement des mathématiques vers plus d'exactitude a conduit, comme nous le savons, à en formaliser de larges secteurs, de telle sorte que la démonstration puisse s'y effectuer uniquement au moyen de quelques règles mécaniques. Les systèmes formels les plus complets établis jusqu'à ce jour sont, d'un côté, le système des Principia Mathematica; et, de l'autre, le système axiomatique de la théorie des ensembles établi par Zermelo-Fraenkel (et développé par J. von Neumann). Ces deux systèmes sont tellement larges que toutes les méthodes de démonstration utilisées aujourd'hui en mathématiques y sont formalisées, c'est-à-dire ramenées à quelques axiomes et règles d'inférence. On pourrait par conséquent supposer que ces axiomes et règles d'inférence suffisent pour décider de toute question mathématique qui pourrait s'exprimer formellement dans ces systèmes. Dans ce qui suit, nous montrerons que tel n'est pas le cas et qu'il existe au contraire dans ces deux systèmes des problèmes relativement simples concernant la théorie des entiers que l'on ne saurait trancher sur la base de ces axiomes. Cette situation n'est pas due, comme on pourrait le croire, à la nature spécifique des systèmes établis mais touche une très large classe de systèmes formels, à laquelle appartiennent en particulier tous les systèmes qui résultent des deux systèmes cités plus haut par addition d'un nombre fini d'axiomes, pourvu que, par ces axiomes, aucune proposition fausse ne devienne démontrable.

Les théorèmes d'incomplétude s'énoncent de la façon suivante :
  • Dans tout système formel consistant contenant une théorie des nombres finitaires relativement développée, il existe des propositions indécidables.
  • La consistance d'un tel système ne saurait être démontrée à l'intérieur de ce système.
Avec ces deux théorèmes, Gödel répond au deuxième problème de Hilbert : Peut-on prouver la consistance de l'arithmétique ?  En d'autres termes, peut-on démontrer que les axiomes de l'arithmétique ne sont pas contradictoires ?

Pour démontrer le théorème d'incomplétude, Gödel reprend le paradoxe du menteur qui énonce cette phrase est fausse. Si cette phrase est fausse, elle est vraie. Inversement, si elle fausse, elle est vraie. Gödel réussi à formaliser ce type de paradoxe pour l'arithmétique en remplaçant la notion de vérité par celle de démonstration.

Gödel va utiliser une numérotation qui consiste à attribuer un nombre unique à chaque symbole du langage formel considéré. Par exemple, 1 est associé à la négation, 2 au ou logique, 3 à l'implication,... La numérotation de Gödel permet alors de définir une injection du système formel dans l'ensemble des entiers naturels .

Par exemple, l'assertion , qui signifie il existe x tel que x soit le successeur de y, sera transformée en la suite de nombres : 8 4 11 9   8 11 5 7 13 9. Cette suite de nombres est transformée en un entier grâce à la règle suivante : à partir de la suite de 10 nombres ci-dessus, on forme un nombre unique produit des 10 premiers nombres premiers où chacun est élevé à la puissance égale au nombre de Gödel de même rang de la suite :

.

De même, il est aussi possible d'associer un nombre de Gödel à une suite d'assertions. Considérons une suite formée de deux assertions. À chacune de ces deux assertions correspond un nombre. La suite d'assertions est alors associée au produit des deux premiers nombres premiers qui sont chacun élevés à la puissance égale au nombre de Gödel de l'assertion correspondante. Ainsi si m est le nombre de Gödel de la première asertion et n celui  de la deuxième, le nombre associé à cette suite d'assertions sera : .

À toute expression du système formel, que ce soit un signe, une suite de signes ou une suite de formules, il est donc possible d'associer un nombre unique. Inversement, par l'unicité de la décomposition d'un nombre en facteurs premiers, à un nombre de Gödel correspond une expression du système formel.

Gödel définit ensuite la relation entre les nombres x et z, notée Dem(x,z), qui veut dire que la suite de formules associée au nombre de Gödel x est une démonstration de la formule de nombre de Gödel z.

On considère alors la formule G : . Cette formule veut dire qu'il n'existe pas de démonstration ayant pour nombre de Gödel x de la formule de nombre de Gödel z, c'est-à-dire que l'assertion qui porte le nombre de Gödel z n'est pas démontrable.

Gödel considère un cas particulier de cette assertion. Pour cela, on note sub(m,p,q) le nombre de Gödel de la formule obtenue en substituant à la variable de nombre de Gödel p dans la formule de nombre de Gödel m le nombre q. Ainsi, sub(n,13,n) est le nombre de Gödel obtenu à partir de la formule qui porte le nombre de Gödel n et dans laquelle on substitue à la variable de nombre 13 la variable n. Par exemple, si l'assertion possède le nombre de Gödel n, la variable qui possède le nombre 13, qui est y, est remplacée par le nombre n. L'assertion devient alors : .

Le cas particulier de G considéré par Gödel est :
.
Cette assertion signifie : pour tout nombre de Gödel x, la suite de formules associée au nombre de Gödel x ne démontre pas la formule obtenue en substituant le nombre n à la variable de nombre 13 dans la formule de nombre de  Gödel n. Ce qui veut dire aussi que l'assertion qui possède le nombre de Gödel sub(n,13,n) n'est pas démontrable.

Cette assertion particulière porte elle-même un nombre de Gödel. Le nombre de Gödel de G est sub(n,13,n). En effet, sub(n,13,n) est le nombre de Gödel de la formule obtenue à partir de la formule qui porte le nombre de Gödel n en substituant le chiffre n à la variable qui porte le nombre de Gödel 13 (c'est-à-dire la variable y). Or, la formule a été obtenue à partir de la formule qui porte le nombre n en substituant à la variable y le chiffre n. Donc le nombre de Gödel de l'asserttion G est bien sub(n,13,n).

Or, l'assertion G affirme que l'assertion qui possède le nombre de Gödel sub(n,13,n) n'est pas démontrable. Donc, l'assertion G dit d'elle-même qu'elle n'est pas démontrable.

Gödel démontre ensuite que si G est démontrable alors ~ G est aussi démontrable. Si G est démontrable, il existe un nombre de Gödel k tel que . On peut prouver que si la relation Dem(x,z) existe entre deux nombres alors cette relation est démontrable. Donc est démontrable et est démontrable. Cette dernière formule correspond à ~ G. Réciproquement, Gödel montre que si ~ G est démontrable, G l'est aussi. Le système formel est dons inconsistant.

De plus, l'assertion G est vraie. En effet, on a montré que l'assertion G n'est pas démontrable. Or, c'est justement ce qu'énonce G.

On vient de montrer que la consistance d'un système implique qu'il est incomplet, c'est-à-dire qu'il existe une formule vraie qui est indémontrable et dont la négation n'est pas non plus démontrable. La validité de cette formule ne pourra pas être déterminée dans le cadre du système formel.

Le second théorème de Gödel énonce que la consistance (ou la non-contradiction) du système formel, c'est-à-dire qu'aucune contradiction ne peut être prouvée à partir de ses axiomes, ne peut être démontrée à l'intérieur de ce système.

Avec le premier théorème d'incomplétude, on montre qu'à partir d'un système formel cohérent on aboutit à G. La consistance entraîne donc la formule G. Si on pouvait démontrer dans le système formel, la consistance, alors il s'en suivrait que G serait démontrable dans ce système formel. Or, la démonstration précédente montre que ce n'est pas le cas. Par conséquent, c'est qu'il est impossible de démontrer dans le système formel la consistance.

Mark Dominus donne une brève explication du théorème de Gödel en reprenant une idée de Raymond Smullyan. Pour plus de compléments sur le théorème de Gödel, on pourra lire les livres Le théorème de Gödel de Ernest Nagel, James R. Newman et Jean-Yves Girard qui réussit à vulgariser la démonstration du théorème de Gödel, ainsi que Gödel Escher Bach : Les Brins d'une guirlande éternelle de Douglas Hofstadter qui établit des parallèles entre les œuvres de Gödel, de l'artiste Maurits Cornelis Escher et du compositeur Johann Sebastian Bach. Les résumés de cours de Jacques Bouveresse au Collège de France de 2003 à 2006 sur Gödel sont disponibles : Kurt Gödel, mathématiques, logique et philosophie.

mercredi 17 février 2010

Nombres réels et suites de Cauchy

Une fois les nombres rationnels construits, il manque les nombres irrationnels pour obtenir l'ensemble des réels. Le premier à utiliser le terme d'irrationnel est l'évêque de Lisieux Nicolas Oresme dans son Traité sur la sphère tout en s'excusant de transcrire du latin certains mots abstraits qu'il introduit dans la langue française. Cantor nomme les nombres réels en 1883 dans les fondements d'une théorie générale des ensembles afin de les distinguer des nombres imaginaires.

Il existe plusieurs constructions des nombres réels. L'une d'elles est due à Richard Dedekind. La méthode qu'il propose est géométrique : elle exprime que l'ensemble des réels est continu. Une deuxième est due à Charles Méray et Georg Cantor. Dans ce cas, les nombres réels sont vus comme limites de suites de rationnels.

Il fut longtemps difficile de savoir si les irrationnels étaient à considérer comme de véritables nombres. Michael Stifel dans Arithmetica Integra (1544) considère les irrationnels comme des nombres valides :

Il est à juste titre discuté si les nombres irrationnels sont de véritables nombres ou non. En étudiant les figures géométrques, où les nombres rationnels sont utilisés, les irrationnels trouvent leur place, et montrent de manière précise ce que les nombres rationnels sont incapables de montrer... Nous sommes contraint d'admettre qu'ils sont corrects.

Cependant, même s'ils sont corrects, il ne les considère pas comme de véritables nombres, car ils ne pas proportionnels aux nombres rationnels. Pour Simon Stevin, en 1585, une racine quelconque est nombre. Mais pour d'Alembert, en 1751, n'est point un nombre proprement dit, c'est une quantité qui n'existe point, qu'il est impossible de trouver.

Abraham Kästner en 1758 est le premier qui propose de définir les nombres réels de manière arithmétique en se rendant compte qu'un nombre irrationnel est proche d'un rationnel :

On peut considérer le nombre irrationnel comme étant composé de deux parties : l'une, le commencement, est rationnelle et peut être prolongée à volonté de telle sorte que l'autre partie, la fin, qui reste en toute rigueur toujours inconnue, devienne plus petite que toute grandeur donnée. (...) Si X est un nombre irrationnel, A son commencement rationnel, a sa fin inconnue, alors tout ce qui est vrai d'un nombre rationnel tel que A, doit être vrai de X, étant donné que cet A peut constituer une partie aussi considérable que X qu'on le désire, par rapport à laquelle a devient de plus en plus petit et peut donc, pour ainsi dire disparaître.

Pour Kästner, un nombre irrationnel X est la somme d'un nombre rationnel A et d'une partie irrationnel a rendue aussi petite que voulue : X = A + a.

Les nombres rationnels sont dits denses dans l'ensemble des nombres réels, c'est-à-dire que tout nombre réel peut être approché par un nombre rationnel de manière aussi précise qu'on le souhaite. Ainsi, le nombre peut être approché par un nombre rationnel de deux chiffres après la virgule : 3.14. Si cette approximation est insuffisante, on peut considérer 3.141 ou 3.1415 comme approximation rationnelle de .

De même, pour les fonctions, d'après le théorème de Stone-Weierstrass, les polynômes sont denses dans l'ensemble des fonctions continues, ce qui justifie l'utilisation des développements limités.

Kästner ne parle pas encore de limite qui sera définie plus tard par Augustin Cauchy dans son cours d'analyse à l'Ecole Polytechnique. Cauchy définit les infiniment petits qu'il considère comme des variables particulières. Ce sont des variables qui tendent vers 0, mais qui sont considérées comme des intermédiaires disparaissant dans le résultat final.

Méray en 1869 dans Remarques sur la nature des quantités définies par la condition de servir de limites à des variables données et Cantor en 1883 ou en 1872 formalisent les nombres réels en les considérant comme limite d'une suite de nombres rationnels. Par exemple, on peut définir le nombre réel comme la limite de la suite 1, 1.4, 1.41 , 1.414, ... où chaque nombre est rationnel. Cette suite se rapproche indéfiniment de sans jamais l'atteindre. Le nombre réel est ainsi obtenu par approximation successive. La suite construite est une suite de Cauchy, c'est-à-dire que les termes se rapprochent de plus en plus les uns des autres :
.
De telles suites convergent et leur limite est unique.

Pour construire , on considère les classes d'équivalence des suites de Cauchy où les suites de même limite sont équivalentes :
.
L'ensemble correspond alors à l'ensemble quotient des suites de Cauchy par cette relation d'équivalence. Un nombre réel est donc une classe d'équivalence de suite de Cauchy pour la relation .

L'addition et de la multiplication de nombre réels peuvent être définies à partir des suites. Ces opérations posaient problème en considérant le développement décimal d'un nombre réel. En effet, en posant une addition, on commence le calcul par la droite. Ce qui est impossible pour des nombres réels, puisque le développement décimal est infini.

L'addition et de la multiplication des nombres réels sont celles des suites :

.
Cela permet ainsi d'étendre aux nombres réels ces opérations qui sont bien définies pour les nombres rationnels.

Pour la construction des nombres, on pourra aller faire un tour sur le blog Choux romanesco, Vache qui rit et intégrales curvilignes qui est très complet.  D'après Wikipédia,

Une troisième construction s'appuie sur la méthode des segments emboîtés. Un emboîtement est une suite décroissante d'intervalles fermés de nombres rationnels dont la longueur tend vers 0. Un nombre réel est alors défini comme une classe d'emboîtements modulo une relation d'équivalence. Selon Mainzer, « la vérification des propriétés de corps ordonnée est relativement pénible », ce qui explique pourquoi cette approche apparaît moins avantageuse que les deux précédentes. Il existe aussi une autre méthode à partir des développements décimaux, cependant l'addition puis la multiplication ne sont pas des opérations simples à définir.

Xavier Caruso donne une autre construction peu connue des nombres réels à l'aide du groupe additif des entiers relatifs .
Enfin, on pourra aussi signaler que pour Jacques Lacan, le non-concept « réel » est tout simplement substantivé au titre d'une hypostase. Un antidote à ce dernier sera Impostures intellectuelles d'Alan Sokal et Jean Bricmont ou Prodiges et vertiges de l'analogie de Jacques Bouveresse.

lundi 15 février 2010

Nombres rationnels

Les nombres rationnels portent-ils ce nom parce qu'ils seraient plus raisonnables ou plus conformes à la raison que les autres nombres?

On raconte que le pythagoricien qui aurait découvert que la diagonale du carré de côté 1 valait , considéré comme incommensurable, a été jeté par-dessus bord au cours d'une pêche tragique ou encore qu'Hippase de Métaponte a été excommunié, coupable d'avoir découvert ces nombres irrationnels. Léon Brunschvicg, dans Le rôle du pythagorisme dans l'évolution des idées, évoque que cette harmonie entre l'intelligible et le réel sur laquelle reposait leur conception du monde et de la vie, voici qu'elle se rompt avec une évidence contraignante, avec un éclat douloureux et cruel de l'application scrupuleuse des méthodes qui avaient fait l'honneur de l'École.

Pourtant si ces nombres sont rationnels, c'est qu'il y deux sens du mot latin ratio : l'un qui renvoie bien à la raison et un autre qui signifie calcul, compte que l'on retrouve en français dans le mot ratio. C'est aussi par cette dernière étymologie que l'on parle de la raison d'une suite géométrique.

Muni des lois + et ., l'ensemble forme un anneau. Les entiers relatifs ne possèdent pas d'inverse pour la loi multiplicative. Pour former le corps des fractions , on considère l'ensemble des nombres rationnels :

.

Cet ensemble est noté comme quotient.

L'idée pour construire les nombres rationnels est proche de celle utilisée pour la construction des nombres relatifs. Il s'agit de poser une relation d'équivalence sur un espace produit : dans le cas des nombres relatifs, c'était sur l'ensemble des couples d'entiers naturels ; pour les nombres rationnels, ce sera l'ensemble des couples d'entiers relatifs où le second élément du couple est non nul.

Deux couples de seront équivalents si et seulement si leurs produits en croix sont égaux :

.

Sur , des couples étaient équivalents lorsque leurs sommes en croix étaient égales.

L'addition et la multiplication sont définies par :


et
.
Ce qui revient bien aux lois usuelles des fractions :

Les opérations sont alors bien définies si le résultat ne change pas lorsqu'un couple est remplacé par un autre qui lui est équivalent.

Georg Cantor a montré que l'ensemble des rationnels est dénombrable, c'est-à-dire que l'ensemble des nombres rationnels peut être mis en bijection avec l'ensemble des entiers naturels. Puisqu'il est possible d'associer un à un les entiers naturels avec les nombres rationnels, on peut dire qu'il y a le même nombre de rationnels que d'entiers naturels. Cantor nota ce nombre avec la première lettre de l'alphabet hébreu aleph : . Pour plus de détails sur Cantor et l'infini, on pourra lire l'article de Patrick Dehornoy : Cantor et les infinis. Jean-Paul Delahaye donne aussi une introduction à l'infini et ses paradoxes dans l'infini est-il paradoxal?

lundi 7 septembre 2009

L'invention des logarithmes ou la révolution du calcul

Aujourd'hui, il est difficile d'imaginer à quel point l'invention des logarithmes fut une révolution dans le domaine du calcul. Pourtant, le logarithme possède une propriété importante : il transforme un produit en une somme. Ainsi, log (xy) = log(x) + log(y). Plutôt que d'effectuer une multiplication, on pourra effectuer une addition en passant par la fonction logarithme.

La notion de logarithme est introduite par John Neper en 1614, à partir d’un exemple issu de la cinématique. Dans son article Mirifici Logarithmorum Canonis Descriptio, il compare le mouvement rectiligne de deux points M et M' dont le premier M a une vitesse qui augmente proportionnellement avec la distance qui le sépare d'un point fixe O et dont le second  M' se déplace de manière uniforme vers un point O'. La distance O'M' parcourue par le point M' est alors, selon Neper, le logarithme de la distance OM. Le logarithme a ainsi la propriété de transformer un  mouvement augmentant proportionnellement en un mouvement régulier.



Neper est le premier à calculer une table de logarithme en base e dans l'article Mirifici Logarithmorum Canonis constructio écrit en 1614 et publié en 1619. Il choisit d’appeler les nombres de cette table logarithmes, car il les considère comme des relations entre des nombres. Il utilise alors les racines grecques logos et arithmos et crée le mot logarithmus, puisqu’il écrit en latin. 

Soixante-dix ans avant Neper, en 1544, le moine et mathématicien allemand Michael Stifel (1486–1567) avait déjà publié à Nuremberg un traité de mathématique Arithmetica Integra, où il mettait en relation la suite des entiers avec celle des puissances de 2. Dans cet ouvrage, il montrait comment il est possible de transformer une multiplication en addition. 
Puisque le logarithme transforme un produit en une somme, les calculs s'en trouvent grandement facilités. Ainsi, si l'on veut multiplier 8 par 32, on va chercher pour chacun leur logarithme (en base 2) dans la table, qui se trouve sur la première ligne et dans la même colonne. Ainsi, le logarithme de 8 est 3 et celui de 32 est 5. On calcule la somme des logarithmes, qui dans ce cas est 8. Le résultat de la multiplication de 8 par 32 est alors le nombre admettant 8 pour logarithme, c'est-à-dire le nombre se trouvant sur la deuxième ligne et dans la même colonne que le chiffre 8, soit le nombre 256.

La formule utilisée ici est  :  .

Après la publication des travaux de Neper, le mathématicien anglais Henry Briggs (1561–1630) comprend aussitôt l’intérêt de cette relation entre les nombres et voit ainsi le moyen de faciliter les calculs en transformant les multiplications en additions. Pour simplifier encore plus ces calculs, il suggère à Neper de choisir 10 pour base. En 1615, Briggs calcula la table de ces nouveaux logarithmes décimaux, qu'il publia après une rencontre avec l'inventeur des logarithmes.

Indépendamment de Neper, un suisse, Bürgi, qui avait été assistant de Kepler à Prague, calcula entre 1603 et 1611 une table d'antilogarithme (il appelle ainsi la fonction inverse du logarithme). Cette table fut imprimée dans cette ville en 1620. Facilitant grandement les calculs, notamment ceux des astronomes, les tables de logarithmes connurent alors un succès immédiat.

En l'honneur de Néper, on parle désormais de logarithme néperien (noté ln). La définition moderne le définit à partir de l'intégrale de la fonction 1/x :



Ainsi, le logarithme néperien correspond à l'aire sous l'hyperbole entre 1 et x.


Le premier à mettre en évidence le comportement logarithmique de l'aire sous l'hyperbole est Grégoire de Saint-Vincent en 1647 dans son ouvrage Opus geometricum quadraturae circuli et sectionum coni decem libris comprehensum. Il écrit alors : 

Si les abscisses d'une hyperbole équilatère croissent en progression géométrique, les aires des surfaces découpées entre l'hyperbole et son asymptote par les lignes ordonnées correspondantes croissent en progression arithmétique.

C'est-à-dire que l'aire sous l'hyperbole de 1 à 2 ajoutée à l'aire de 1 à 3 donnera l'aire de 1 à 6 ( ln (6) = ln(2) + ln(3) ). Ainsi, si les abscisses suivent une suite géométrique, les surfaces suivront une suite arithmétique. 

Grégoire de Saint-Vincent ne relie pas encore son travail aux logarithmes. Un de ses lecteurs, le jésuite Sarassa mentionnera que les aires hyperboliques peuvent tenir lieu de logarithmes.

Il faudra attendre le milieu du 18e siècle, après l’invention de la notion de fonction et du calcul différentiel, pour que le logarithme soit défini par Euler comme fonction réciproque de la fonction exponentielle. 

La propriété des logarithmes a permis d'inventer la règle à calcul en 1859 par Amédée Mannheim. Les nombres inscrits sur la règle suivent alors une échelle logarithmique pour calculer aisément des produits.

Selon Pierre-Simon Laplace, mathématicien, physicien et astronome français : 

L’invention des logarithmes, en réduisant le temps passé aux calculs de quelques mois à quelques jours, double pour ainsi dire, la vie des astronomes.

jeudi 9 avril 2009

Nombres réels

L'ensemble des nombres réels forme une droite. La propriété importante de cet ensemble est d'être continu.

Au 15 ème siècle, Nicolas de Cues énonce le principe de continuité dans De mathematica perfectione : une grandeur continue qui évolue entre une grandeur A et une grandeur B prend au moins une fois toute valeur intermédiaire. Dans les Nouveaux essais de l'entendement humain publié en 1764, Leibniz reproche à Euclide de ne donner qu'une image sensible de la droite au lieu d'une définition. Pour le philosophe et mathématicien allemand, rien ne se fait dans la nature tout d'un coup, et c'est une de mes grandes maximes et des plus vérifiées, que la nature ne fait jamais de sauts. J'appelle cela la loi de la continuité.


La continuité sera d'abord définie pour les fonctions par Cauchy dans son cours d'analyse de 1821. Il démonte le théorème des valeurs intermédiaires, sans encore se rendre compte que c'est d'abord une propriété des nombres réels avant d'être une propriété des fonctions.

Une construction rigoureuse de est due à Dedekind en 1872 dans Stetigkeit und irrationale Zahlen (Continuité et nombres irrationnels). Il définit les nombres réels grâce aux coupures :

Si l'on répartie tous les points de la droite en deux classes telles que chaque point de la première soit situé à gauche de chaque point de la deuxième classe, alors il existe un point et un seul qui engendre cette partition de tous les points de la droite, cette découpe de la droite en deux parties.

Une coupure dans le corps des nombres rationnels est définie par deux sous-ensembles non vides et tels que :

  • pour tout  et , on a .
Un exemple de coupure est définie par l'ensemble des nombres rationnels inférieurs à 7 et par l'ensemble des nombres supérieurs ou égaux à 7. Cette coupure possède la propriété  suivante : soit il existe un plus grand élément dans C1, soit il existe un plus petit élément dans C2, qui est 7 dans cet exemple. Inversement, une coupure possédant cette propriété détermine un nombre rationnel.

Il existe des coupures n'ayant pas cette propriété. Ainsi, on peut considérer, l'ensemble des nombres rationnels négatifs plus les nombres rationnels positifs dont le carré est inférieur à 2 et les autres nombres rationnels. Un plus grand élément dans ou un plus petit élément dans devrait satisfaire , ce qui est impossible pour et il ne peut y avoir de plus grand élément dans ou de plus petit dans . Cette coupure crée un nombre irrationnel a tel que . À toute coupure correspond alors un nombre, rationnel  ou irrationnel.

Pour Dedekind,

Chaque fois que nous sommes en présence d'une coupure non produite par un nombre rationnel, nous créons un nombre nouveau, irrationnel x, que nous considérons comme parfaitement déterminé par cette coupure ou qu'il engendre cette coupure.

Une autre construction des nombres réels est due à Cantor et Méray. Dans cette construction, tout nombre réel est la limite d'une suite de Cauchy de nombres rationnels.

lundi 6 avril 2009

Nombres relatifs

Les entiers naturels désignent les nombres entiers positifs . A partir des entiers naturels, on peut construire les nombres relatifs en ajoutant les opposés. Ils sont notés pour le mot allemand die Zahl. La construction des entiers relatifs est due à Dedekind.

Les éléments de ne possèdent pas d'inverse pour la loi +. L'ensemble ajoute l'inverse pour la loi + de chaque élément et sera ainsi un groupe commutatif.


Pour définir les nombres relatifs, on considère l'ensemble des couples d'entiers. Le couple va correspondre au nombre   qui représente la distance entre n1 et n2 ou la longueur de l'intervalle .

Pour obtenir , une relation d'équivalence est ajoutée sur . Le couple est équivalent au couple si . Ainsi, (2;0) = (3;1), car 2 + 1 = 3 + 0. Deux couples sont équivalents si leur sommes en croix sont égales. On a peu l'habitude de parler de somme en croix alors qu'on parle usuellement de produit en croix. L'ensemble des entiers relatifs correspond alors à l'ensemble quotient . Un entier relatif correspond donc à la classe d'équivalence pour la relation.

Sur cet ensemble, les opérations usuelles de somme et produit peuvent être définies. Ainsi, la somme est naturellement définie par.

Le produit est défini par . Par exemple,.

Muni de ces lois, devient un anneau. Cependant, les éléments de ne possèdent pas d'inverse pour la multiplication. Pour cela, il faudra construire l'ensemble des nombres rationnels .

Les nombre négatifs n'ont pas toujours été évidents. Lazare Carnot les pensait absurdes :

Il faudrait retrancher une quantité effective de zéro, ôter quelque chose de rien : opération impossible. Ceci entraînerait une absurdité, par exemple, -3 serait moindre que -2, tandis que (-3)² serait plus grand que 2², le carré de la plus grande serait moindre que le carré de la plus petite et réciproquement, ce qui choque toutes les idées claires qu'on peut avoir de la quantité. 

 

lundi 2 mars 2009

Algèbre


Le mot algèbre vient du livre écrit par le mathématicien d'origine perse Muhammad ibn Musa Al-Khawārizmī : Al-ĵabr wa'l-muqābalah qui veut dire en français la transposition et la réduction. Ce livre est dédié au calife Al-Ma'moun qui régna à Bagdad de 813 à 833 après son père, le célèbre calife, Haroun al-Rashid, qui régna de 786 à 809, et après une guerre de succession qui se termine par l'assassinat de son frère aîné en 813. 

Une grande partie du livre est consacrée à des problèmes de la vie quotidienne de l'époque, en particulier ceux des partages d'héritage que les droits de succession musulmans rendaient très ardus. Il traite de la résolution des équations du premier et du deuxième degré. Le mot jabr peut se traduire par restauration. Il indique dans ce cas le passage d'un terme d'une équation de l'autre côté du signe égal. Par exemple, on fait une jabr, quand on transforme y + 4 = x en y = x - 4. Le mot muqabalah est traduit par confrontation ou réduction. Il désigne l'opération consistant à réduire des termes semblables dans une équation. Par exemple, on fait une muqabalah, lorsqu'on transforme a + y - a = x en y = x.


Le livre d'Al-Khawārizmī ne contient aucun chiffre, ni aucun symbole. Toutes les équations sont exprimées avec des mots. Une constante est un dirham (du nom de l'unité monétaire grecque la drachme), l'inconnue est «la chose» ou shay ou jidhr, quand il représente la racine d'une équation, le carré de l'inconnue est nommé le mâl. Le mot shay se transcrit en xay en espagnol ancien et il est à l'origine de l'utilisation de x dans une équation pour désigner l'inconnue.

Les équations sont ramenées à 6 types :

Le titre du livre d'Al-Khawārizmī a été traduit en latin par Algoritmi de numero indorum. Algoritmi est la transformation de Al-Khawārizmī et deviendra plus tard algorithme. C'est sans doute par l'influence du mot arithmétique que l'on retrouve un t dans algorithme.

Au 16 ème, les tenants de l'abaque, les abaquistes, s'opposent aux algoristes, qui sont les tenants du calcul écrit avec les chiffres arabes. Les techniques du calcul indien avec les chiffres arabes et le zéro sont apparues en occident au 12 ème siècle avec le retour des croisades et à la suite de contacts avec les arabes d'Espagne et d'Afrique du nord. Les savants (Fibonacci est un des premiers) adaptent rapidement ce nouveau calcul écrit, alors que les commerçants continuent à utiliser l'abaque à jetons employé depuis l'époque romaine. Cette opposition se prolonge jusqu'à la révolution qui interdit officiellement l'abaque dans les écoles et les administrations. Aujourd'hui, nous sommes tous des algoristes.

vendredi 27 février 2009

Cardinal

Un cardinal désigne un ecclésiastique chargé d'élire et d'assister le pape dans le gouvernement de l'Église. Les cardinaux sont surtout connus pour se réunir en conclave pour élire le nouveau pape. Le mot conclave vient du latin clavis voulant dire clef, car pendant leur délibération les cardinaux sont enfermés à l'abri de tout contact extérieur. Existe-t-il un rapport entre ces cardinaux et les nombres cardinaux : un, deux, trois, quatre, cinq, ...?

Pour comprendre leur relation, il faut déjà comprendre l'étymologie du mot cardinal. En latin ecclésiastique, cardinal se dit cardinalis, qui vient lui même du mot cardo qui veut dire gond, pivot. Il représente donc quelque chose de fixe et d'important. Il est employé au sens figuré pour désigner les cardinaux de l'église qui sont une autorité morale sur laquelle s'appuyer.

Le mot cardinal a d'abord été employé comme adjectif pour désigner ce qui sert de référence. Ainsi, les points cardinaux (nord, sud, est et ouest) servent à désigner la position de tous les autres. Les vents cardinaux sont des vents qui soufflent des quatre points cardinaux. Les quatre vertus cardinales sont la justice, la prudence, la tempérance et la force. L'Église l'utilise ensuite au sens figuré pour désigner certains dignitaires ecclésiastique, comme pontifex cardinaliscardinalis veut dire principal, ou pour désigner un prêtre affecté d'une manière permanente à une église déterminée : cardinalis sacerdos, ou les évêques suburbicaires, c'est-à-dire soumis à l'autorité de Rome : episcopi cardinales.

À partir du 17 ème siècle, les nombres cardinaux servent à désigner une quantité précise : il y a 25 personnes dans la salle. Le mot cardinal devient un nom au début du 20 ème siècle avec le cardinal d'un ensemble qui correspond au nombre d'éléments qu'il contient. Ces nombres s'opposent aux nombres ordinaux qui servent à indiquer le rang d'un objet dans une collection ou l'ordre d'un événement dans une succession. Le cardinal d'un ensemble peut s'associer à un ensemble quelconque, alors que l'ordinal suppose de poser un ordre sur les éléments de l'ensemble. Cantor exprime bien cette différence  en écrivant :

J'entends par cardinal d'un ensemble M le concept universel ou générique que l'on obtient en faisant abstraction pour l'ensemble aussi bien de la constitution de ses éléments que de toutes les relations que ses éléments ont entre eux ou avec d'autres choses, donc, en particulier aussi, de l'ordre qui règne entre eux, et ne considère que ce qui est commun à tous les ensembles équivalents à M.

Un nombre ordinal peut être défini grâce à l'ensemble des ordinaux qui le précèdent. John von Neumann identifie ainsi un entier positif à l'ensemble de ses prédécesseurs sur :





Ainsi, deux est l'ensemble dont les éléments sont l'ensemble vide et l'ensemble dont l'unique élément est l'ensemble vide.

En nommant les premier nombres cardinaux, ceux-ci sont considérés comme plus importants ou plus fondamentaux.

Les numéraux cardinaux, sauf vingt et cent, sont invariables, ce qui montre leur importance. Ils ne s'accordent ni en genre, ni en nombre avec le nom auquel ils se rapportent, sauf :

- un, qui devient une devant un nom féminin, et

- vingt et cent qui se mettent au pluriel quand :

  • ils sont multipliés par un nombre plus grand que un et qu'ils ne sont pas suivis d'un autre adjectif cardinal : quatre-vingts, mais quatre-vingt-deux, deux cents, mais deux cent mille, ou
  • ils précèdent directement les noms million, milliard, billion, ... : quatre-vingts millions d'années, mais quatre-vingt-dix-sept millions, six cents millions de volts, mais six cent quarante millions.
Le nom de nombres ordinaux se forme dans la plupart des cas en ajoutant le suffixe -ième au dernier élément du nombre cardinal correspondant : le deuxième, le troisième, ... Ils s'accordent en genre et en nombre avec le nom qui suit : la vingt-cinquième heure, les premiers froids.

C'était le treizième article de ce blog ou le numéro treize.



mercredi 25 février 2009

Pas très moral

Si a = 0, puisque et , peut-on simplifier l'égalité par a pour obtenir que 1 = 0 ?

C'est bien sûr la simplification par a qui conduit à l'erreur 1 = 0. Pour avoir le droit de simplifier par a, celui-ci doit admettre un inverse. Ainsi, pour faire disparaître a, on doit multiplier par l'inverse de a des deux côtés de l'égalité : . Seulement, dans un anneau, l'élément 0, qui est l'élément neutre de la loi +, est le seul qui n'admet pas d'inverse pour la loi multiplicative. Ainsi, l'égalité implique que a = 0. Cette propriété qui affirme que a . b = 0 implique que a = 0 ou b = 0 est nommée intégrité. L'anneau est donc intègre.

Le mot intègre ne vient pas dans ce cas du français. En effet, pourquoi un anneau pour lequel 0 n'a pas d'inverse pour la loi . posséderait-il plus de moralité que celui qui en admet ? L'adjectif intègre vient ici de l'anglais integer signifiant entier, car l'anneau intègre de référence est l'anneau des entiers relatifs . La lettre utilisée vient par contre de l'allemand Zahl (nombre). L'étude de l'algèbre trouve son origine chez des mathématiciens allemands du 19 ème siècle, comme par exemple, Kummer, Dedekind, Kronecker et Hilbert.

Les nombres entiers, puisqu'ils nous servent à compter, nous paraissent plus naturels que les autres. L'utilisation des nombres négatifs n'est devenue familière que plus tardivement. Leur construction, due à Dedekind, se fait à l'aide des entiers positifs. Les nombres négatifs deviennent ainsi relatifs aux entiers positifs. Selon Léopold Kronecker, "Dieu a fait les nombres entiers, tout le reste est l'œuvre de l'homme". Kronecker va lui même plus loin : il ne croit pas non plus en l'existence des nombres transcendants et la construction des nombres réels due à Weierstrass. Ces idées l'amenèrent à s'opposer à Cantor, Dedekind et à Weierstrass qui fut pourtant un de ses amis.


La propriété d'intégrité est très utile pour résoudre des équations. Si on doit résoudre l'équation , on peut se ramener à (x-2)(x+2) = 0, d'où x = 2 ou x = -2.

Il existe des anneaux qui ne sont pas intègres. Par exemple, dans , [6] . [2] = [12]. Or, la classe de 12 est égale à celle de zéro, car 12 est un multiple de 4, sans que 6 ou 2 ne soient équivalents à 0. On a l'égalité [6] . [2] = [0]. On dira que [6] et [2] sont des diviseurs de 0. L'anneau devient intègre lorsque p est premier.

Tous ces anneaux n'ayant aucune moralité, on laisse au lecteur le soin de trouver la morale de cette histoire, même si d'après Albert Camus : Aucune morale, ni aucun effort ne sont a priori justifiables devant les sanglantes mathématiques qui ordonnent notre condition

- page 1 de 2