Un milieu graphico-cinématique pour l`apprentissage des dérivées
Transcription
Un milieu graphico-cinématique pour l`apprentissage des dérivées
Université de Liège Faculté des Sciences Didactique des sciences mathématiques Un milieu graphico-cinématique pour l’apprentissage des dérivées dans une praxéologie "modélisation" : potentialités et limites Dissertation présentée par Jean-Yves Gantois en vue de l’obtention du grade de Docteur en Sciences Sous la direction du professeur Maggy Schneider Le 29 août 2012 Membres du Jury : Prof. Prof. Prof. Prof. Prof. Prof. G. Hansoul, Université de Liège, Président F. Bastin, Université de Liège I. Bloch, Université de Bordeaux I T. Lavendhomme, Facultés universitaires Saint-Louis (Bruxelles) M. Rigo, Université de Liège M. Schneider, Université de Liège, Directrice Année académique 2011-2012 Université de Liège Faculté des Sciences Didactique des sciences mathématiques Un milieu graphico-cinématique pour l’apprentissage des dérivées dans une praxéologie "modélisation" : potentialités et limites Dissertation présentée par Jean-Yves Gantois en vue de l’obtention du grade de Docteur en Sciences Sous la direction du professeur Maggy Schneider Le 29 août 2012 Membres du Jury : Prof. Prof. Prof. Prof. Prof. Prof. G. Hansoul, Université de Liège, Président F. Bastin, Université de Liège I. Bloch, Université de Bordeaux I T. Lavendhomme, Facultés universitaires Saint-Louis (Bruxelles) M. Rigo, Université de Liège M. Schneider, Université de Liège, Directrice Année académique 2011-2012 Résumé Cette recherche étudie les potentialités et les limites d’un certain milieu dans l’apprentissage des dérivées au niveau de l’enseignement secondaire. Ce milieu est qualifié de "graphico-cinématique" en ce sens que les tâches qui sont dévolues aux élèves mobilisent des mouvements rectilignes précisés par une loi de mouvement, d’abord donnée sous forme graphique, assortie ensuite d’une expression analytique. En outre, ces mouvements sont quelconques pour privilégier la variété graphique, l’étude ne portant pas sur d’éventuelles forces les régissant : on est donc bien non dans le cadre de la dynamique mais dans celui de la cinématique. Au delà de l’étude de ce milieu, il s’agit d’illustrer en quoi peuvent consister des praxéologies de type « modélisation », les formes embryonnaires qu’y prennent les savoirs mathématiques (Schneider 1988 et 2011) et ce qu’elles supposent en termes de discours technologique qui légitime une technique mathématique dans un contexte particulier sans forcément relever d’un discours proprement mathématique. Notre apport particulier est d’analyser l’impact sur la construction de savoirs par les élèves des variables didactiques des situations qui leur sont proposées et dont nous cherchons à mettre en évidence le caractère fondamental par rapport au savoir visé. Abstract This research explores the potentialities and the limits of a certain environment in the learning of the derivatives by students aged 16 to 17 years. This environment is called "graphico-kinematics" in the sense that the tasks which are assigned to students mobilize rectilinear motions specified by a law of motion, first given in graphical form, then given in an analytical expression. Moreover, these motions are unspecified to privilege the graphic variety and the study does not relate to the possible forces governing these motions : it is therefore not part of the dynamics but in that of the kinematics. Beyond the study of this environment, it is to illustrate what may constitute praxeologies of the "modeling" type, the embryonic forms what are the mathematical knowledge (Schneider 1988 and 2011) and what they imply in terms of technological discourse that legitimizes a mathematical technique in a particular context without necessarily belong to a strictly mathematical discourse. Our particular contribution is to analyze the impact on the construction of knowledge by students of didactic variables of the situations that are offered and which we seek to highlight the fundamental characteristic referred to concerned knowledge. - 7/709 - À Marie-France. . . (et à ceux qui étaient certains que je terminerai cette thèse.) « Il n’a pas fini d’étudier. . . » (Pierre Morichaud) Remerciements Préparer une thèse est une aventure dans laquelle on s’embarque sans savoir très bien à quoi on s’engage car la recherche s’étend sur plusieurs années et, si l’on savait précisément ce que l’on cherche, c’est qu’on l’aurait déjà trouvé, si bien qu’une telle recherche n’en serait pas une. Or, ne pas savoir où l’on va est à la fois enrichissant et frustrant : enrichissant par ce que l’on découvre d’inattendu, et frustrant en raison des moments d’obscurité pendant lesquels on se demande si l’on parviendra à percer une issue au tunnel que l’on a choisi de creuser. Au terme de ces années de recherche, de doute, de joies et de peines, je veux remercier toutes les personnes qui ont rendu possible ce travail, par leurs conseils, leurs propres recherches ou leurs encouragements. Mes remerciements s’adressent tout d’abord à ma Directrice de thèse, Maggy Schneider, qui m’a donné les outils pour mener à bien cette recherche et a su me stimuler avec tact dans des moments plus difficiles. Je veux également remercier les membres du Jury pour avoir suivi avec diligence l’évolution de mon travail et pour leur lecture avisée des pages qui vont suivre. Merci à Micheline Citta qui a bien voulu relire ma dissertation minutieusement. Merci à tous mes collègues de l’Institut technique Saint-Joseph, des Facultés universitaires Saint-Louis et de l’ICHEC qui m’ont soutenu par leurs encouragements. Je veux saluer tout spécialement Pierre Job et Franck Pastor, mes complices à l’époque où nous étions tous trois doctorants et assistants aux Facultés universitaires Saint-Louis. Mes pensées vont aussi aux membres du GEM, en particulier à Christiane Hauchart qui m’a donné envie de m’intéresser à la didactique des mathématiques, à Christine Docq avec qui j’ai le plaisir de travailler régulièrement à l’ICHEC et à Nicolas Rouche dont le rayonnement reste un encouragement permanent à donner davantage de sens à l’enseignement des mathématiques. Un grand merci ensuite à tous mes collègues professeurs qui ont permis le bon déroulement de l’expérimentation dans leur classe, à commencer par Béatrice Magos, Patricia Pellegrims et Édith Baeten. Je ne saurais oublier de remercier tous les élèves qui, durant les expérimentations, se sont si bien prêtés au jeu. J’en citerai nommément quatre. Ces quatre élèves n’ont pas passé davantage de temps avec moi que les autres, mais, moi, j’ai passé des dizaines d’heures avec eux, à les écouter et à les réécouter pour retranscrire le plus fidèlement possible les conversations enregistrées dans leur groupe : Élise P., Colin M., Martin B. et Nicolas M. Enfin, et non des moindres, je voudrais remercier tous mes proches, famille et amis, qui ont parfois subi les dommages collatéraux d’un travail qui ne s’en est pas tenu aux seuls horaires de bureau. . . Je veux donc ici saluer leur patience et les remercier pour leur soutien indéfectible. Sommaire I Introduction 25 1 Un concept à la charnière entre l’enseignement secondaire et l’enseignement supérieur 29 1.1 Un constat d’échec . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30 1.1.1 Contexte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30 1.1.2 Le questionnaire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31 1.1.3 Éléments d’interprétation d’un constat négatif . . . . . . . . . . . . . 36 2 Hypothèse centrale 37 2.1 Genèse artificielle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37 2.2 La notion d’ingénierie didactique . . . . . . . . . . . . . . . . . . . . . . . . . 38 2.3 L’ingénierie didactique comme méthodologie de recherche interne . . . . . . . 40 2.3.1 2.3.2 2.4 Caractéristiques de l’ingénierie didactique comme méthodologie de recherche interne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40 Les différentes phases de l’ingénierie didactique en tant que méthodologie 41 2.3.2.1 Analyses préalables . . . . . . . . . . . . . . . . . . . . . . . 42 2.3.2.2 Analyse a priori . . . . . . . . . . . . . . . . . . . . . . . . . 42 2.3.2.3 Analyse a posteriori . . . . . . . . . . . . . . . . . . . . . . . 42 Conclusion du chapitre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42 13 Sommaire II Les analyses préalables 43 3 Analyse épistémologique des contenus visés 3.1 47 Praxéologies-déduction et praxéologies-modélisation . . . . . . . . . . . . . . 47 3.1.1 Deux niveaux praxéologiques bien distincts . . . . . . . . . . . . . . . 48 3.1.2 Praxéologies-modélisation . . . . . . . . . . . . . . . . . . . . . . . . . 48 3.1.3 Praxéologies-déduction . . . . . . . . . . . . . . . . . . . . . . . . . . . 49 3.1.4 Des perspectives différentes mais complémentaires . . . . . . . . . . . 50 3.2 Éléments d’histoire de l’analyse . . . . . . . . . . . . . . . . . . . . . . . . . . 51 3.3 Les mathématiciens grecs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53 3.3.1 La quadrature de la parabole chez Archimède . . . . . . . . . . . . . . 54 3.3.1.1 Tâche dans La Méthode : déterminer une aire curviligne . . . 55 3.3.1.2 Technique dans La Méthode : le pesage de segments de droites 55 3.3.1.3 Technologie dans La Méthode : le principe des leviers . . . . 56 3.3.1.4 Archimède et les praxéologies-modélisation . . . . . . . . . . 58 3.3.1.5 Archimède et le Calcul infinitésimal . . . . . . . . . . . . . . 58 3.3.1.6 Tâche dans La Quadrature de la Parabole : démontrer le résultat 60 3.3.1.7 Technique dans La Quadrature de la Parabole : la méthode d’exhaustion . . . . . . . . . . . . . . . . . . . . . . . . . . . 60 Technologie dans La Quadrature de la Parabole : la réduction à l’absurde et la propriété de l’ordre des réels . . . . . . . . . 62 Archimède et les praxéologies-déduction . . . . . . . . . . . . 63 La tangente chez Apollonius de Perge . . . . . . . . . . . . . . . . . . 63 3.3.2.1 Tâche : déterminer la tangente à une parabole . . . . . . . . 63 3.3.2.2 Technique : construction géométrique ordonnée . . . . . . . . 64 3.3.2.3 Technologie : une tangente à une parabole n’a qu’un point commun avec elle et lui est extérieure ; réduction à l’absurde 65 Apollonius de Perge et praxéologie-modélisation . . . . . . . 66 Mathématiciens grecs et praxéologies-modélisation . . . . . . . . . . . 66 3.3.1.8 3.3.1.9 3.3.2 3.3.2.4 3.3.3 - 14/709 - Sommaire 3.4 Foisonnement de découvertes (première moitié du XVIIe siècle) . . . . . . . . 67 3.4.1 Redécouverte des mathématiciens grecs . . . . . . . . . . . . . . . . . 67 3.4.2 Volumes et aires chez Cavalieri . . . . . . . . . . . . . . . . . . . . . . 68 3.4.2.1 Tâche : déterminer une aire/un volume . . . . . . . . . . . . 69 3.4.2.2 Technique : la méthode des indivisibles . . . . . . . . . . . . 69 3.4.2.3 Technologie : validation pragmatique . . . . . . . . . . . . . 71 3.4.2.4 Cavalieri et les praxéologies-modélisation . . . . . . . . . . . 73 Le mouvement uniforme et uniformément accéléré chez Galilée . . . . 73 3.4.3 3.4.3.1 Tâche : déterminer la vitesse moyenne d’un mouvement uniformément accéléré . . . . . . . . . . . . . . . . . . . . . . . 73 3.4.3.2 Technique : la méthode des indivisibles modifiée . . . . . . . 73 3.4.3.3 Galilée et les praxéologies-modélisation . . . . . . . . . . . . 75 La tangente chez Roberval . . . . . . . . . . . . . . . . . . . . . . . . . 75 3.4.4.1 Tâche : déterminer la tangente à une courbe . . . . . . . . . 75 3.4.4.2 Technique : la cinématique . . . . . . . . . . . . . . . . . . . 76 3.4.4.3 Technologie : un axiome selon lequel la vitesse (vectorielle) est tangente à la trajectoire . . . . . . . . . . . . . . . . . . . . . 77 Roberval et les praxéologies-modélisation . . . . . . . . . . . 78 Conclusion : fin de la préhistoire de la dérivée. . . . . . . . . . . . . . 78 La dérivée est utilisée . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78 3.4.4 3.4.4.4 3.4.5 3.5 3.5.1 Tâches : déterminer les extrema d’une fonction algébrique, déterminer une tangente, etc. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79 Technique : la méthode d’adégalisation. . . . . . . . . . . . . . . . . . 79 3.5.2.1 La méthode d’adégalité pour la recherche des extrema . . . . 80 3.5.2.2 La méthode d’adégalité pour la recherche des tangentes . . . 81 Technologie : aux alentours d’un extremum, la variation en ordonnée est faible. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84 La dérivée est découverte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85 3.5.2 3.5.3 3.5.4 3.6 - 15/709 - Sommaire 3.6.1 Barrow et les rapports d’infinitésimaux . . . . . . . . . . . . . . . . . 85 3.6.1.1 Tâche : calcul de la tangente à une courbe . . . . . . . . . . 85 3.6.1.2 Technique : passage d’un triangle curviligne à un triangle rectangle non assignable puis à un triangle rectangle assignable 85 Absence de discours technologique . . . . . . . . . . . . . . . 87 3.6.2 Nécessité d’un principe unificateur . . . . . . . . . . . . . . . . . . . . 88 3.6.3 Newton et la découverte du théorème fondamental . . . . . . . . . . . 88 3.6.3.1 Première étape : l’infinitésimal est explicité . . . . . . . . . . 88 3.6.3.2 Seconde étape : apport d’une imagerie cinématique . . . . . 91 3.6.3.3 Troisième étape : rapports d’infinitésimaux et ultima ratio . 93 3.6.3.4 Newton et les praxéologies-modélisation . . . . . . . . . . . . 96 Leibniz et la découverte du théorème fondamental . . . . . . . . . . . 97 3.6.4.1 Triangle caractéristique et cercle vicieux . . . . . . . . . . . . 97 3.6.4.2 Puissance des notations de Leibniz . . . . . . . . . . . . . . . 99 3.6.4.3 Leibniz et la rigueur mathématique . . . . . . . . . . . . . . 100 3.6.4.4 Leibniz et les praxéologies-modélisation . . . . . . . . . . . . 100 La dérivée est explorée et développée . . . . . . . . . . . . . . . . . . . . . . . 101 3.6.1.3 3.6.4 3.7 3.7.1 Multiplication des découvertes mathématiques au détriment de la rigueur101 3.7.2 Confiance dans les notations symboliques . . . . . . . . . . . . . . . . 102 3.7.3 Absence d’une théorie adaptée . . . . . . . . . . . . . . . . . . . . . . 103 3.7.4 Théorisation de l’analyse . . . . . . . . . . . . . . . . . . . . . . . . . 104 3.7.5 Origines du retour à la rigueur . . . . . . . . . . . . . . . . . . . . . . 105 3.7.5.1 Une première explication : éviter les erreurs . . . . . . . . . . 105 3.7.5.2 Une deuxième explication : unifier les résultats . . . . . . . . 106 3.7.5.3 Une troisième explication : les mathématiques rigoureuses par nature . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107 3.7.5.4 3.7.6 Euler et le concept de fonction . . . . . . . . . . . . . . . . . . . . . . 109 3.7.6.1 Euler et les praxéologiques-déduction . . . . . . . . . . . . . 111 Lagrange et l’algébrisation de l’analyse . . . . . . . . . . . . . . . . . . 112 3.7.7.1 Lagrange se positionne par rapport à ses prédécesseurs. . . . 113 3.7.7.2 Algébrisation de l’Analyse . . . . . . . . . . . . . . . . . . . 115 3.7.7.3 L’erreur de Lagrange . . . . . . . . . . . . . . . . . . . . . . 117 3.7.7.4 Lagrange et les praxéologies-déduction . . . . . . . . . . . . . 119 La dérivée est définie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119 3.8.1 Cauchy et le concept unificateur de limite . . . . . . . . . . . . . . . . 119 3.8.1.1 Conclusion. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121 Bolzano et le théorème des valeurs intermédiaires . . . . . . . . . . . . 122 Conclusion : évolution praxéologique dans l’histoire des mathématiques . . . 125 3.7.7 3.8 3.8.2 3.9 Une quatrième explication : le développement de l’enseignement108 - 16/709 - Sommaire 4 Analyse des conceptions des élèves, des difficultés et obstacles qui marquent leur évolution 127 4.1 Les obstacles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127 4.1.1 Le statut de l’erreur . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129 4.2 Les obstacles épistémologiques . . . . . . . . . . . . . . . . . . . . . . . . . . 130 4.3 Les obstacles épistémologiques liés au concept de dérivée . . . . . . . . . . . . 130 4.3.1 Des conceptions provisoires de la tangente . . . . . . . . . . . . . . . . 131 4.3.2 L’obstacle géométrique de la limite . . . . . . . . . . . . . . . . . . . . 134 4.3.3 L’obstacle de l’hétérogénéité des dimensions . . . . . . . . . . . . . . . 138 4.3.4 L’obstacle des mathématiques conçues comme copie conforme de l’expérience sensible . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 140 Conclusion : impasse didactique . . . . . . . . . . . . . . . . . . . . . . . . . . 144 4.4 5 Analyse de l’enseignement et de ses effets 5.1 5.2 Un programme scolaire monolithique . . . . . . . . . . . . . . . . . . . . . . . 145 5.1.1 La dérivée dans le programme scolaire belge . . . . . . . . . . . . . . . 145 Espace Math 56 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147 5.2.1 Les intentions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 148 5.2.1.1 Ambition des auteurs . . . . . . . . . . . . . . . . . . . . . . 148 5.2.1.2 Structure du manuel . . . . . . . . . . . . . . . . . . . . . . . 148 Analyse de l’ouvrage . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149 5.2.2.1 Activités de l’unité Dérivées. . . . . . . . . . . . . . . . . . . 149 5.2.2.2 Notions développées à l’unité Dérivées. . . . . . . . . . . . . 155 5.2.2.3 Un petit bout d’histoire, relatif à l’unité Dérivées. . . . . . . 166 5.2.2.4 Activités de l’unité Applications des dérivées. . . . . . . . . . 166 5.2.2.5 Notions développées à l’unité Applications des dérivées. . . . 169 5.2.2.6 Un petit bout d’histoire, relatif à l’unité Applications des dérivées. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 183 Conclusion sur Espace Math 56 . . . . . . . . . . . . . . . . . . . . . . 184 Actimath 54 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 185 5.3.1 Analyse de l’ouvrage . . . . . . . . . . . . . . . . . . . . . . . . . . . . 185 5.3.1.1 Activités . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 185 5.3.1.2 Nombre dérivé, fonction dérivée . . . . . . . . . . . . . . . . 190 5.3.1.3 Calcul des dérivées . . . . . . . . . . . . . . . . . . . . . . . . 198 5.3.1.4 Applications diverses . . . . . . . . . . . . . . . . . . . . . . 201 5.3.1.5 Dérivées : synthèse . . . . . . . . . . . . . . . . . . . . . . . . 211 Conclusion sur Actimath 54 . . . . . . . . . . . . . . . . . . . . . . . . 212 Conclusion : formulation de l’hypothèse mise à l’épreuve . . . . . . . . . . . . 213 5.2.2 5.2.3 5.3 5.3.2 5.4 145 - 17/709 - Sommaire III Conception de l’ingénierie didactique 6 Précisions relatives à la question didactique traitée 215 219 6.1 Du contrat didactique à la situation adidactique . . . . . . . . . . . . . . . . 219 6.2 Caractère fondamental d’une situation . . . . . . . . . . . . . . . . . . . . . . 223 6.3 Le concept de milieu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 224 6.4 Le préconstruit vitesse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 225 6.5 Le concept de variable didactique . . . . . . . . . . . . . . . . . . . . . . . . . 227 6.6 Un problème référent, ses variables didactiques et leur impact . . . . . . . . . 227 6.7 Conclusion du chapitre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 229 7 Variables didactiques globales 231 7.1 Survol rapide de l’ingénierie proposée . . . . . . . . . . . . . . . . . . . . . . . 231 7.2 Un contexte cinématique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 232 7.3 Des lois de mouvement avant tout données graphiquement . . . . . . . . . . . 233 7.3.1 Milieu graphique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 233 7.4 Comparer un mouvement uniforme et un qui ne l’est pas . . . . . . . . . . . . 235 7.5 S’assurer que les élèves seront capables d’interpréter les graphiques . . . . . . 236 7.6 Poser une question relative au temps plutôt qu’à la vitesse du mobile qui accélère237 7.7 Permettre la validation pragmatique de la procédure infinitésimale en jeu . . 237 7.8 Rendre le savoir visé optimal . . . . . . . . . . . . . . . . . . . . . . . . . . . 238 7.9 Justifier la définition du concept de vitesse instantanée en termes de calcul infinitésimal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 239 7.10 Une même procédure pour la vitesse et l’accélération, positive et négative . . 239 7.11 De la vitesse instantanée au taux instantané de variation . . . . . . . . . . . . 240 7.12 La tangente et les approximations affines . . . . . . . . . . . . . . . . . . . . . 240 7.13 Synthèse rapide quant aux variables didactiques globales . . . . . . . . . . . . 243 7.14 Conclusion du chapitre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 243 - 18/709 - Sommaire 8 Analyse a priori, situation par situation 8.1 Situation I . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 245 8.1.1 Description . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 246 8.1.2 Variables didactiques locales . . . . . . . . . . . . . . . . . . . . . . . 246 Différents niveaux de lecture du graphique : position, vitesse et accélération . . . . . . . . . . . . . . . . . . . . . . . . . . 246 8.1.2.2 Pas de vitesses négatives . . . . . . . . . . . . . . . . . . . . 249 8.1.2.3 Pente d’une courbe . . . . . . . . . . . . . . . . . . . . . . . 249 8.1.2.4 Position initiale non nulle . . . . . . . . . . . . . . . . . . . . 250 8.1.2.5 Lecture spatiale . . . . . . . . . . . . . . . . . . . . . . . . . 250 8.1.2.6 Institutionnalisation de la vitesse moyenne . . . . . . . . . . 251 8.1.2.7 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . 251 Situation II . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 251 8.2.1 Description . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 251 8.2.2 Variables didactiques locales . . . . . . . . . . . . . . . . . . . . . . . 252 8.2.2.1 Deux parties successives . . . . . . . . . . . . . . . . . . . . . 253 8.2.2.2 Deux points d’intersection . . . . . . . . . . . . . . . . . . . 253 8.2.2.3 Plusieurs stratégies envisageables . . . . . . . . . . . . . . . . 254 8.2.2.4 Un coefficient angulaire irrationnel . . . . . . . . . . . . . . . 256 8.2.2.5 Un calcul simplifié par le choix d’une fonction du second degré 257 8.2.2.6 Validation pragmatique . . . . . . . . . . . . . . . . . . . . . 257 8.2.2.7 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . 258 Situation III . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 258 8.3.1 Description . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 258 8.3.2 Variables didactiques locales . . . . . . . . . . . . . . . . . . . . . . . 259 Une loi de mouvement du troisième degré : invalidation des stratégies non infinitésimales . . . . . . . . . . . . . . . . . . 259 Validation . . . . . . . . . . . . . . . . . . . . . . . . . . . . 261 8.1.2.1 8.2 8.3 245 8.3.2.1 8.3.2.2 - 19/709 - Sommaire 8.3.3 La valeur d’une vitesse à un instant donné . . . . . . . . . . . . . . . . 261 8.3.3.1 Validation par double réduction à l’absurde . . . . . . . . . . 262 8.3.3.2 Vitesse instantanée d’un mobile . . . . . . . . . . . . . . . . 262 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 263 Situation IV . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 263 8.4.1 Description . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 263 8.4.2 Variables didactiques locales . . . . . . . . . . . . . . . . . . . . . . . 264 8.4.2.1 Une copie partielle de la situation I . . . . . . . . . . . . . . 264 8.4.2.2 Des vitesses négatives . . . . . . . . . . . . . . . . . . . . . . 264 8.4.2.3 De l’interprétation de l’accélération . . . . . . . . . . . . . . 265 8.4.2.4 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . 268 Situation V . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 268 8.5.1 Description . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 268 8.5.2 Variables didactiques locales . . . . . . . . . . . . . . . . . . . . . . . 269 8.5.2.1 Une fonction du troisième degré . . . . . . . . . . . . . . . . 269 8.5.2.2 L’annulation du taux instantané de variation d’une fonction dérivable comme condition nécessaire d’un extremum . . . . 270 8.5.2.3 Vers une classe de fonctions . . . . . . . . . . . . . . . . . . . 270 8.5.2.4 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . 271 Situation VI . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 272 8.6.1 Description . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 272 8.6.2 Variables didactiques locales . . . . . . . . . . . . . . . . . . . . . . . 273 8.6.2.1 Droites-guide . . . . . . . . . . . . . . . . . . . . . . . . . . . 273 8.6.2.2 La tangente à une courbe . . . . . . . . . . . . . . . . . . . . 275 8.6.2.3 Droites-estimatives . . . . . . . . . . . . . . . . . . . . . . . . 277 8.6.2.4 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . 280 Conclusion du chapitre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 280 8.3.4 8.4 8.5 8.6 8.7 - 20/709 - Sommaire IV Expérimentations et analyse a posteriori 9 Déroulement et narration de l’expérimentation 283 287 9.1 Le public de l’expérimentation . . . . . . . . . . . . . . . . . . . . . . . . . . 287 9.2 Légende et notations choisies . . . . . . . . . . . . . . . . . . . . . . . . . . . 289 9.3 Situation I . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 289 9.3.1 Énoncé proposé aux élèves . . . . . . . . . . . . . . . . . . . . . . . . . 289 9.3.2 Résumé des enregistrements filmés dans le groupe 1 . . . . . . . . . . 290 Situation II.1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 298 9.4.1 Énoncé proposé aux élèves . . . . . . . . . . . . . . . . . . . . . . . . . 298 9.4.2 Résumé des enregistrements filmés dans le groupe 1 . . . . . . . . . . 299 Situation II.2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 305 9.5.1 Énoncé proposé aux élèves . . . . . . . . . . . . . . . . . . . . . . . . . 305 9.5.2 Résumé des enregistrements filmés dans le groupe 1 . . . . . . . . . . 305 Situation III . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 314 9.6.1 Énoncé proposé aux élèves . . . . . . . . . . . . . . . . . . . . . . . . . 314 9.6.2 Résumé des enregistrements filmés dans le groupe 1 . . . . . . . . . . 315 Situation IV . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 324 9.7.1 Énoncé proposé aux élèves . . . . . . . . . . . . . . . . . . . . . . . . . 324 9.7.2 Résumé des enregistrements filmés dans le groupe 1 . . . . . . . . . . 325 Situation V . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 334 9.8.1 Énoncé proposé aux élèves . . . . . . . . . . . . . . . . . . . . . . . . . 334 9.8.2 Résumé des enregistrements filmés dans le groupe 1 . . . . . . . . . . 335 Situation VI . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 349 9.9.1 Énoncé proposé aux élèves . . . . . . . . . . . . . . . . . . . . . . . . . 349 9.9.2 Résumé des enregistrements filmés dans le groupe 1 . . . . . . . . . . 351 9.4 9.5 9.6 9.7 9.8 9.9 - 21/709 - Sommaire 10 Analyse a posteriori 353 10.1 Des représentations graphiques qui se prêtent à une approche qualitative de la vitesse instantanée . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 353 10.1.1 Des graphiques correctement interprétés, un accent mis sur la variation de la vitesse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 354 10.1.2 D’une lecture de la concavité en termes d’accélération ou de décélération au découpage de plus en plus fin du temps . . . . . . . . . . . . . . . . 356 10.2 D’une approche globale des mouvements à la gestion d’une question locale relative au temps . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 358 10.2.1 Un contexte qui favorise la mise en œuvre de stratégies variées . . . . 358 10.2.2 Un contraste entre deux mouvements qui permet de localiser graphiquement l’instant cherché . . . . . . . . . . . . . . . . . . . . . . . . . 359 10.3 D’une question locale à une réponse mobilisant la formule-vitesse . . . . . . . 364 10.3.1 Des limites du travail numérique à l’identification d’un calcul algébrique nouveau et sujet à caution . . . . . . . . . . . . . . . . . . . . . . . . . 364 10.3.2 Validation pragmatique de ce nouveau calcul et extension de son champ d’application . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 371 10.4 La portée des problèmes analysés dans un apprentissage plus global de l’Analyse375 V 10.4.1 Vers la définition du concept de vitesse instantanée . . . . . . . . . . . 375 10.4.2 Avantages du nouveau point de vue sur la vitesse . . . . . . . . . . . . 377 10.4.3 De la vitesse instantanée au taux de variation instantané . . . . . . . 378 10.5 Conclusion de l’analyse a posteriori : de situations fondamentales au discours technologique propre aux praxéologies-modélisation . . . . . . . . . . . . . . . 381 10.5.1 Des situations à caractère fondamental . . . . . . . . . . . . . . . . . . 381 10.5.2 Un discours technologique incontournable qui s’écarte des standards . 382 Conclusion et perspectives 385 11.1 Dichotomie praxéologies-modélisation / praxéologies-déduction . . . . . . . . 387 11.2 Les praxéologies scolaires par rapport à la dichotomie praxéologies-modélisation / praxéologies-déduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 388 11.3 L’ingénierie didactique proposée ici et son rapport à la dichotomie praxéologiesmodélisation / praxéologies-déduction . . . . . . . . . . . . . . . . . . . . . . 389 11.3.1 Remise à l’honneur du milieu graphique . . . . . . . . . . . . . . . . . 390 11.3.2 Possibilité d’un discours technologique chez les élèves . . . . . . . . . . 391 11.4 Une activité mathématique authentique . . . . . . . . . . . . . . . . . . . . . 393 11.5 Vers un projet d’enseignement ? . . . . . . . . . . . . . . . . . . . . . . . . . . 393 - 22/709 - Sommaire Bibliographie 400 VI 401 Annexes A Transcription des conversations des élèves en classe A.1 Dialogues à propos de la situation I . . . . . . . . . . . A.2 Dialogues à propos de la situation II.1 . . . . . . . . . A.3 Dialogues à propos de la situation II.2 . . . . . . . . . A.4 Dialogues à propos de la situation III . . . . . . . . . . A.5 Dialogues à propos de la situation IV . . . . . . . . . . A.6 Dialogues à propos de la situation V . . . . . . . . . . B Observations faites sur des copies d’élèves B.1 Situation I sur les copies d’élèves . . . . . . B.2 Situation II.1 sur les copies d’élèves . . . . . B.3 Situation II.2 sur les copies d’élèves . . . . . B.4 Situation III sur les copies d’élèves . . . . . B.5 Situation IV sur les copies d’élèves . . . . . B.6 Stuation V.1 sur les copies d’élèves . . . . . B.7 Situation V.2 sur les copies d’élèves . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . C Analyse linéaire des observations faites lors des expérimentations C.1 Naturel des élèves face à la caméra et face à l’expérimentateur . . . . C.2 Situation I . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . C.2.1 Rappels . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . C.2.2 Analyse a posteriori de la situation I . . . . . . . . . . . . . . . C.3 Situation II.1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . C.3.1 Rappels . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . C.3.2 Analyse a posteriori de la situation II.1 . . . . . . . . . . . . . C.4 Situation II.2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . C.4.1 Rappels . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . C.4.2 Analyse a posteriori de la situation II.2 . . . . . . . . . . . . . C.5 Situation III . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . C.5.1 Rappels . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . C.5.2 Analyse a posteriori de la situation III . . . . . . . . . . . . . . C.6 Situation IV . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . C.6.1 Rappels . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . C.6.2 Analyse a posteriori de la situation IV . . . . . . . . . . . . . . C.7 Situation V.1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . C.7.1 Rappels . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . C.7.2 Analyse a posteriori de la situation V.1 . . . . . . . . . . . . . C.8 Situation V.2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . C.8.1 Rappels . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . C.8.2 Analyse a posteriori de la situation V.2 . . . . . . . . . . . . . - 23/709 - . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 403 403 416 429 465 494 526 . . . . . . . 575 575 577 584 589 594 602 606 . . . . . . . . . . . . . . . . . . . . . . 609 609 611 611 612 620 620 621 632 632 633 649 649 650 668 669 669 684 684 684 701 701 702 Sommaire - 24/709 - Première partie Introduction 25 La recherche qui va suivre est relative au concept de dérivée, concept charnière entre l’enseignement secondaire et l’enseignement supérieur. Notre point de départ est décrit au chapitre qui suit : c’est celui d’un constat d’échec de l’enseignement secondaire à propos de ce concept, en ce sens que des élèves issus du secondaire et se préparant à des études supérieures semblent éprouver des difficultés à mobiliser spontanément la dérivée dans des situations qui sortent du contexte habituel de leur enseignement sans pour autant être étrangères au programme scolaire en vigueur. Ce constat d’échec nous a conduit à envisager la construction d’un dispositif didactique qui, sans prétendre conduire jusqu’au concept mathématique de dérivée, favoriserait une meilleure compréhension ultérieure de ce concept. D’emblée, nous nous placerons dans une optique de recherche expérimentale et non dans le cadre d’un projet d’enseignement. Tel est l’objet du chapitre 2 (p. 37). - 27/709 - - 28/709 - Chapitre 1 Un concept à la charnière entre l’enseignement secondaire et l’enseignement supérieur Plusieurs concepts mathématiques sont des objets d’étude à la fois dans l’enseignement secondaire et dans l’enseignement supérieur, universitaire ou non. Ainsi en va-t-il du concept de dérivée et d’autres notions appartenant au même champ conceptuel et, en particulier, du concept de fonction. On peut se demander quel doit être le partage des responsabilités entre les deux niveaux d’enseignement : ce qui peut être abordé dans l’enseignement secondaire, ce qui est attendu au commencement des études supérieures, et ce qui sera abordé spécifiquement au cours des études supérieures. Sans doute la question doit-elle être traitée différemment selon qu’il s’agit d’élèves qui poursuivront des études de mathématiques ou d’autres dont on attend qu’ils soient « simplement » utilisateurs des mathématiques dans d’autres disciplines : futurs biologistes, économistes,... Nous nous sommes posés ici cette question pour ce dernier public, en nous focalisant sur les apprentissages liés à la dérivée. Les demandes exprimées par certains professeurs d’université à l’égard de l’enseignement secondaire ne nous semblent pas très claires. Ainsi, dans le Rapport final du projet interfacultaire « Explicitation des prérequis et mesure de leur maîtrise en première année du grade de Bachelier » des Facultés Notre-Dame de la Paix à Namur, peut-on lire ce qui est attendu des élèves qui vont entamer des études universitaires : « Fonctions : connaître la notion de fonction et le vocabulaire associé (variable, fonction constante, fonction positive,. . . ) au niveau graphique et/ou analytique, donner le domaine de définition et le graphe d’une fonction, connaître le vocabulaire élémentaire associé aux graphiques (abscisses, ordonnées,. . . ), interpréter le graphe d’une fonction, relier le graphique d’une fonction à une expression analytique ; connaître la notion de continuité d’une fonction et pouvoir calculer les limites de fonctions simples ; connaître la notion de dérivée d’une fonction, pouvoir établir la fonction résultant de la composition de deux fonctions ; connaître les notions de base relatives aux fonctions logarithmes et exponentielles (graphes, dérivées, propriétés élémentaires). » (Houart & Schmetz 2006) Ce type de description n’est pas isolé. On le retrouve dans les programmes scolaires et dans la description de cours universitaires. Le choix du verbe connaître, abondamment utilisé, masque mal une absence de signification précise. Ensuite, on demande aux futurs étudiants de connaître un vocabulaire et des notions subtiles — telle que la continuité — dont on peut se demander s’ils ne trouveraient pas mieux leur place dans l’enseignement supérieur. Enfin, il est exigé beaucoup de connaissances de type procédural qui s’expliquent par la grande importance habituellement accordée aux exercices dits de variations de fonctions. Ce n’est pas que l’étude des variations des fonctions soit sans intérêt, a priori ; le problème est que ce qui est demandé aux élèves revient à se soumettre à une sorte de rituel immuable où l’on détermine le domaine de définition de la fonction, sa fonction dérivée, son domaine de dérivabilité, etc. jusqu’à l’obtention du tableau de variations ; il n’est demandé aucune analyse qualitative préalable des fonctions considérées, lesquelles sont souvent assez élémentaires dans le secondaire et pourraient être étudiées sans faire appel à l’arsenal que nous venons de décrire ni même à la dérivée (nous pensons notamment aux fonctions homographiques et à certaines fonctions polynomiales). En revanche, quelle est la part de réelle compréhension attendue ? Seul le verbe interpréter fait référence à l’idée de compréhension. Néanmoins, le flou demeure quant à l’attente des auteurs du projet en ce sens. Maggy Schneider nous a fait part de propos tenu par un des responsables de ce projet, professeur en première année d’université et qui tend à montrer que certains enseignants considèrent que la compréhension des concepts mathématiques est le monopole de l’enseignement universitaire : « Je crois que tout simplement dans le secondaire j’ai vu la limite et la dérivée comme des techniques. Je savais très bien dériver, je ne me trompais pas mais la signification profonde de la dérivée, je ne l’avais pas perçue. Je pense que la maturité de l’élève est telle que c’est une notion sur laquelle il faut revenir après. Je ne vois pas de problème à dire : on a donné la définition, on a surtout insisté sur la technique de calcul parce que c’est à la portée des élèves à cet âge-là et puis en premier bac 1 , on revient sur la notion en disant : attention, voilà ce qu’il y a en plus. Même en bio, je reviens dessus en disant : c’est un taux de variation instantané particulier. Et ça, dans le secondaire, on ne l’a pas vu mais il ne fallait peut-être pas le voir. C’est à nous à le faire. » De fait, il semble que les élèves issus de l’enseignement secondaire aient effectivement des lacunes avant leur entrée à l’université ou dans l’enseignement supérieur. Dans les lignes qui vont suivre, nous allons donner un exemple observé à Bruxelles en 2007, à l’occasion d’une formation propédeutique aux Facultés universitaires Saint-Louis. Cet exemple est extrait d’un article publié dans la revue Petit X (Gantois & Schneider 2009). 1.1 1.1.1 Un constat d’échec Contexte Nous avons proposé un questionnaire à des élèves sortant de l’enseignement secondaire. Notre seule ambition était de voir, par un premier coup de sonde, jusqu’à quel point ces élèves 1. Le Bac est le premier cycle des études supérieures ; en France, pour éviter la confusion avec l’examen sanctionnant les études secondaires, on parle de la licence. - 30/709 - 1.1. Un constat d’échec mobiliseraient spontanément différents aspects liés aux dérivées, en dehors du contexte de leur enseignement. Les aspects en question sont explicitement mentionnés dans les programmes scolaires, qu’il s’agisse du programme à 4 heures ou 6 heures de mathématiques par semaine, programmes suivis par les élèves interrogés. Le questionnaire mentionné a été soumis à des élèves inscrits à une formation « propédeutique » aux Facultés universitaires Saint-Louis (Bruxelles, 2007) pour mettre à profit une partie de leurs vacances en se préparant aux études universitaires. Pour ne pas fausser l’expérience, les étudiants ignoraient quel serait le thème de la formation et sur quoi porterait le questionnaire. Nous reprenons ci-après chacune des questions, ses enjeux et quelques réponses des étudiants. 1.1.2 Le questionnaire Énoncé de la question 1 Considérons deux particules P1 et P2 qui se déplacent sur un axe orienté. Leurs positions respectives p1 et p2 en fonction du temps sont données par les graphiques de la figure ci-dessous. Les fonctions correspondantes sont : p1 (t) = t3 3 p2 (t) = 4 · t a) À quel moment ces deux particules ont-elles la même vitesse ? Estimer graphiquement, en faisant des mesures sur le graphique, ce moment. b) À quel moment ces deux particules ont-elles la même vitesse ? Déterminer ce moment par calcul. - 31/709 - 1.1.2. Le questionnaire Enjeu Cette question met en jeu l’interprétation cinématique de la dérivée, spécifiée par le programme scolaire. Elle s’inspire de l’ingénierie didactique que nous avons construite dans le cadre du présent travail et dont nous ferons l’analyse a priori à la section 8.3, p. 258. Mentionnons néanmoins que cette question requiert de savoir interpréter correctement des phénomènes cinématiques à partir de lois de mouvement donnant la position en fonction du temps, ce que l’on peut considérer comme un des objectifs des mêmes programmes scolaires, l’interprétation de graphiques dans divers contextes y étant reprise. Observations Seuls 5 étudiants sur 38 pensent spontanément à utiliser la dérivée pour résoudre la question 1.b). Parmi eux, trois parviennent à résoudre correctement cette question. Un de ces trois étudiants parle d’une droite parallèle au graphique de p2 qui rencontre celui de p1 en un seul point. Il égale les dérivées des fonctions t3 et 34 t pour trouver que t = 21 . Deux étudiants, sans penser à la dérivée, utilisent la pente pour résoudre la question 1.a) mais aucun d’eux ne parvient à résoudre la question 1.b). L’un d’eux écrit que « pour calculer l’instant des mêmes vitesses, il faut trouver l’instant t dont la pente = 3/4 ». Il poursuit : « ainsi : t3 = 34 t ». Deux autres étudiants font référence à la tangente mais ne parviennent pas à s’en servir pour résoudre analytiquement la question. La réponse au 1.b) de l’un d’eux est « Je ne me souviens plus de l’équation de la pente de la tangente ». Quant aux autres étudiants, ils considèrent que l’instant t cherché est tel que p1 = p2 . Lorsque nous demandons pourquoi à l’un de ces étudiants, sa réponse est « vitesse égale distance sur temps ». Certains justifient ainsi leur réponse : ils égalent v1 à v2 , remplacent v1 par p1 /t1 et v2 par p2 /t2 et concluent que p1 = p2 puisque t1 = t2 . Deux étudiants confondent la vitesse instantanée et la vitesse moyenne : v = ∆p/∆t. Citons enfin le cas de quatre autres étudiants qui voient dans la loi de mouvement de P1 une « accélération exponentielle » alors qu’ils disposent de l’expression analytique du troisième degré de cette loi. Aucun étudiant n’y voit un mouvement rectiligne uniformément accéléré (MRUA), contrairement à ce que l’on observe d’habitude en secondaire. Énoncé de la question 2 Considérons un mobile sur une trajectoire rectiligne. Il démarre à l’instant t = 0 de la position p = 2. Il accélère jusqu’à l’instant t = 3. À cet instant, il occupe la position p = 6 et sa vitesse instantanée vaut 2. Il décélère ensuite jusqu’à l’arrêt qui se produit à l’instant t = 6 et à la position p = 10. Il fait alors demi-tour et atteint la position p = 8, 25 à l’instant t = 7, 5. Sa vitesse vaut alors −2, 5. Il continue à décélérer jusqu’à l’instant t = 9 et la position p = 2. Sa vitesse devient alors constante et vaut −6. Dessiner le plus précisément possible la loi de mouvement de ce mobile sur le graphique suivant. (Suivait un repère orthonormé quadrillé pour faciliter la tâche des étudiants. La formulation de cette question est perfectible sur plus d’un point. En particulier, dans une version ultérieure, il sera question d’accélération négative et non de décélération et de marche arrière et non de demi-tour.) - 32/709 - 1.1. Un constat d’échec Enjeu Il s’agit ici de tester dans quelle mesure les élèves sont capables de traduire graphiquement un mouvement décrit dans la langue courante et à propos duquel on donne des informations relatives à la position, la vitesse et l’accélération. Cette question peut permettre d’approfondir les difficultés à mobiliser la dérivée dans un contexte cinématique, lequel n’est pas précisé graphiquement, comme dans la première question. L’analyse a priori de cette question est faite à la section 8.6.2.1, p. 273. Observations Le fait majeur relevé ici est que 22 étudiants (sur 38) se contentent de placer les points imposés et de les relier par des segments de droite. Parmi ces 22 étudiants, 3 seulement dessinent la courbe au-delà de t = 9 (dernier point indiqué). On note alors parfois une confusion entre vitesse constante et fonction constante : les élèves tracent, à partir de t = 9, une demi-droite horizontale, comme si la position restait elle-même constante. Une étudiante, à qui nous demandons comment elle distingue les phases d’accélération des phases de décélération, modifie son graphique en assimilant indûment accélération positive et croissance du graphique, accélération négative et décroissance. Deux étudiants se rendent compte que des segments de droite sont incompatibles avec la présence d’une accélération ou d’une décélération ; ils ne proposent rien d’autre cependant. Quatre étudiants compensent « l’invisibilité » du signe de l’accélération et de la vitesse par des annotations sur leur graphique (cf. figure ci-après). - 33/709 - 1.1.2. Le questionnaire Parmi les 16 étudiants qui dessinent un graphique « arrondi », aucun n’explique quel est le lien avec l’accélération. L’un d’eux colorie son graphique pour pouvoir distinguer les différentes phases, ce qui suggère que le graphique seul ne suffit pas pour lui à les distinguer. Un étudiant à qui il est demandé pourquoi il a arrondi la courbe précise ses raisons : « j’ai toujours dessiné les graphiques en arrondissant ». Parmi les 16 étudiants qui dessinent une courbe « arrondie », la moitié dessine la courbe au-delà de t = 9. Comme on s’y attendait, la proportion est bien supérieure à celle observée parmi ceux qui relient les points par des segments de droite. Un (seul) étudiant justifie la pente correspondant à la vitesse instantanée par une vitesse moyenne sur un intervalle centré sur l’instant donné. Un dernier étudiant représente les vitesses instantanées par des vecteurs. Énoncé de la question 3 √ On suppose ici que la loi de mouvement d’un certain mobile est p = t. Ainsi, à l’instant t = 9 = 32 , la position du mobile sera 3. Sans calculatrice, il n’est pas évident de connaître la valeur numérique de la position du mobile aux instants qui ne sont pas des carrés parfaits. Ainsi, à t = 8,46, on peut seulement dire que, grossièrement, la position est de l’ordre de 3. a) On voudrait trouver une approximation plus fine de cette position. Quel(s) moyen(s) proposez-vous (en excluant le recours à une calculette) pour donner une telle approximation ? b) Soit un mobile qui suit la loi de position est p = t17 + 3t − 1. Donner une approximation plus fine que p (1) = 3 de la position du mobile à l’instant t = 1,127. Enjeu Cette question se situe à nouveau dans un contexte cinématique, mais là n’est pas l’important a priori : nous cherchons à déterminer si la dérivée est mobilisée pour procéder à des approximations numériques locales, ce qui est également une compétence spécifiée par le programme scolaire. C’est également la dernière question issue de notre ingénierie didactique ; on en trouvera l’analyse a priori à la section 8.6.2.3, p. 277. Observations Aucun étudiant n’envisage de faire une approximation affine. Un (seul) étudiant a de vagues souvenirs : « Il existe une formule relative à la dérivée de la fonction (et aux tangentes ?) » écrit-il (c’est la première fois que le mot « dérivée » apparaît sur sa feuille). Un autre pense à la dérivée, parmi plusieurs « outils » relatifs aux fonctions, mais sans l’exploiter : - 34/709 - 1.1. Un constat d’échec Un dernier envisage d’utiliser une intégrale... Sur 38 étudiants, 22 proposent néanmoins une solution pour résoudre la question 3.a) sans pouvoir l’utiliser pour la question 3.b) : lecture sur un graphique, mise en valeur de carrés parfaits ou tâtonnement numérique. Énoncé de la question 4 On s’intéresse à la dérivée de x3 · u2 . Parmi les propositions ci-après, laquelle ou lesquelles sont correctes ? Justifier. a) x3 · 2u b) 3x2 · u2 c) 0 d) 3x2 · u2 + x3 · 2u Enjeu Il est évident que cette dernière question est de l’ordre du piège. On demande à l’étudiant de dériver une expression dans laquelle apparaissent deux lettres, x et u, la première étant généralement utilisée pour désigner une variable, la seconde ayant un statut non explicité dans l’énoncé en ce sens qu’elle peut être une variable ou une constante. Les élèves, à ce stade, ne savent dériver qu’une fonction d’une variable et l’énoncé ne précise pas s’il faut dériver par rapport à x ou à u. Le but est donc de voir dans quelle mesure les élèves s’en aperçoivent et le traitement qu’ils imposent à u. Notons que la forme même de la question peut induire qu’au moins une forme est correcte. Observations 34 étudiants sur 38 choisissent notamment la réponse d), trois étudiants choisissent exclusivement la réponse b), un étudiant donne sa propre réponse et un dernier ne répond pas. Parmi les 34 étudiants ayant choisi la réponse d), 29 justifient leur choix, mais aucun ne se demande par rapport à quelle variable il s’agit de dériver. De même, il ne fait de doute à personne que x est une variable. Un étudiant écrit dans la marge « mais 2 inconnues ? ». Cela ne l’empêche pas de choisir la réponse d). Deux étudiants se demandent explicitement si u est une variable ou une constante. Mais, le plus souvent, les étudiants citent « la » formule de la dérivée d’un produit. - 35/709 - 1.1.3. Éléments d’interprétation d’un constat négatif 1.1.3 Éléments d’interprétation d’un constat négatif Les réponses obtenues au questionnaire nous amènent à un constat négatif : les élèves éprouvent des difficultés à mobiliser la dérivée dans un contexte cinématique. Ils ne parviennent pas non plus à la réinvestir dans le cadre d’approximations numériques locales. Certes, la troisième question qui le testait était à nouveau formulée dans un cadre cinématique mais nous pouvons supposer, au vu d’observations faites par ailleurs, que le contexte joue ici un rôle négligeable. Quant au calcul de dérivées, il serait réduit à une procédure sans signification puisque les élèves ne semblent pas être conscients qu’il faut préciser la variable par rapport à laquelle on dérive. Comment interpréter ce constat ? On peut, bien sûr, évoquer les circonstances de passation du questionnaire : les étudiants ont pu ne pas prendre au sérieux une évaluation qui n’a pas de caractère certificatif ou, au contraire, ils ont développé un stress lié à la perspective de l’entrée à l’université et à ce que cela supposait en termes de connaissances. On peut évoquer aussi un phénomène plus global, bien connu en didactique, à savoir que la rétention des mathématiques du lycée est décevante à l’entrée à l’université. Il n’empêche que, d’une part, les questions posées nous paraissent assez élémentaires par rapport aux objectifs de l’enseignement secondaire et que, d’autre part, les élèves n’ont pas tout oublié puisqu’ils se souviennent de la formule donnant la dérivée d’un produit... Finalement, peut-on admettre, comme le suggèrent certains enseignants, que l’enseignement des dérivées au niveau secondaire soit axé essentiellement sur des acquisitions procédurales ? Cet enseignement est-il réellement procédural dans le secondaire ? Que peut-on vraiment espérer comme type d’apprentissage à ce niveau ? Pour tenter d’éclairer ces questions, nous avons mis au point et testé un ensemble construit de problèmes relatifs au concept de dérivée et qui se polarise sur le sens de ce concept et non sur le calcul procédural. C’est de cet ensemble — que nous appellerons bientôt ingénierie didactique — que nous allons traiter au chapitre suivant, dans lequel nous énoncerons l’hypothèse centrale de notre thèse. - 36/709 - Chapitre 2 Hypothèse centrale Le constat d’échec analysé au chapitre précédent peut se résumer à la difficulté des élèves interrogés à mobiliser la dérivée dans un contexte cinématique. Notre recherche vise à proposer la construction d’un dispositif didactique dont nous faisons l’hypothèse qu’il peut alimenter une genèse artificielle du concept de dérivée chez les élèves. Le mot alimenter signifie que nous ne prétendons pas atteindre le concept mathématique de dérivée au travers de notre dispositif didactique mais, plus modestement, il ambitionne de permettre une avancée significative dans cette direction. Telle est l’hypothèse centrale de notre travail. Dans la suite de ce chapitre, nous allons préciser la méthodologie choisie pour mener à bien notre recherche. 2.1 Genèse artificielle au paragraphe précédent, nous avons parlé de genèse artificielle. De quoi s’agit-il ? Une genèse est l’ensemble des faits qui concourent à la formation ou à la création de quelque chose. Cela rejoint la manière dont Lercher résume ce qu’est une genèse pour Piaget : « la genèse d’un être, d’une institution, d’un quelconque objet d’étude, c’est l’ensemble des étapes par lesquelles il est arrivé, depuis son origine, jusqu’à l’état dans lequel on le considère. » (Lercher 1985, pp. 80-81) Ce concept a été également développé par Bachelard (cf. Dorier 2000, p. 19). Les didacticiens des mathématiques ont repris ce concept à leur compte en l’appliquant aux concepts mathématiques enseignés en classe : « L’enseignement vise à recréer dans la classe une genèse des concepts mathématiques que l’élève doit s’approprier. Cette genèse sera qualifiée d’artificielle, dans la mesure où ce n’est pas la genèse historique, ou d’expérimentale, parce qu’elle est liée à l’expérience de la classe et de chaque élève. » (Dorier 2000, p. 19) On peut se demander pourquoi la genèse des concepts mathématiques au sein d’une classe ne suivrait pas la genèse historique ? La raison est que l’histoire s’insère dans une durée longue et non linéaire qui ne cadre ni avec le temps didactique des séquences d’enseignement, ni avec les contraintes institutionnelles (temps alloué par les programmes, finalité de l’enseignement, etc.) : « l’usage du mot genèse peut être trompeur en faisant croire à un développement linéaire et uniforme, ce qui n’est jamais le cas pour un savoir mathématique. La réalité est plus complexe [. . . ] Dans certains cas, l’évolution historique peut avoir suivi un parcours inutilement sinueux et des raccourcis possibles ont pu intervenir par la suite [. . . ] On peut dès lors bien sûr envisager de réorganiser les événements de façon à ne choisir que les étapes essentielles, en raccourcir certaines, en regrouper d’autres, etc. Mais un tel travail est difficile et n’est plus à proprement parler historique. Il comporte aussi le danger d’être exposé à l’arbitraire et au subjectif. Il doit s’intégrer dans une problématique bien définie et s’appuyer sur un cadre d’analyse théorique qui devra englober des outils didactiques. » (Ibid., pp. 19-20) Le but n’est donc pas de chercher à reproduire en classe les conditions de la genèse historique. Néanmoins, la genèse historique n’en est pas moins éclairante pour analyser ou construire la genèse artificielle d’un concept. Elle en constitue en quelque sorte un modèle ancestral et premier. « Certes les contraintes qui gouvernent ces genèses (artificielles) ne sont pas identiques à celles qui ont gouverné la genèse historique, mais cette dernière reste néanmoins, pour le didacticien, un point d’ancrage de l’analyse didactique, sorte de promontoire d’observation, quand il s’agit d’analyser un processus d’enseignement donné ou une base de travail, s’il s’agit d’élaborer une telle genèse. » (Artigue 1991, p. 244) C’est ainsi qu’au chapitre 3 (p. 47), nous nous intéresserons à l’analyse épistémologique des contenus visés afin d’observer, dans les grandes lignes, comment le concept de dérivée s’est constitué au fil des siècles. 2.2 La notion d’ingénierie didactique En voulant construire un dispositif didactique susceptible d’alimenter un genèse artificielle du concept de dérivée, notre travail va bien au-delà d’une simple construction de séquence d’enseignement, laquelle serait par exemple supposée améliorer l’enseignement de la dérivée. Même s’il était envisageable de reprendre tout ou partie de notre travail pour construire une séquence d’enseignement, celle-ci n’en serait qu’une sorte de retombée et non un objectif en soi. Ici, nous testons plutôt les effets du dispositif qui sera mis au point en termes d’apprentissage, et les limites d’un tel dispositif, ainsi que l’analyse de sa viabilité sur le terrain. - 38/709 - 2.2. La notion d’ingénierie didactique En effet, notre thèse s’inscrit dans le créneau de la construction des ingénieries didactiques, qui constituent, comme nous allons le voir au paragraphe d’après, une méthodologie de recherche. Michèle Artigue a publié un article dans lequel elle fait le point sur la notion d’ingénierie didactique et où elle montre en quoi une telle ingénierie constitue une méthodologie de recherche. En reprenant certains éléments de cet article, nous espérons éclairer le lecteur sur ce sujet essentiel pour bien comprendre l’objet de notre recherche. La notion d’ingénierie didactique apparaît en didactique des mathématiques au début des années 1980. Le mot ingénierie fait référence au travail de l’ingénieur qui, pour développer un nouveau projet, va à la fois s’appuyer sur ses connaissances scientifiques (et accepter un contrôle de type scientifique) et dépasser les modèles simplifiés connus : « [Il en va comme de l’ingénieur qui] se trouve obligé [. . . ] de s’attaquer pratiquement, avec tous les moyens dont il dispose, à des problèmes que la science ne veut ou ne peut encore prendre en charge. » (Artigue 1988, p. 283) L’ingénierie didactique est d’abord perçue « comme le moyen d’aborder deux questions cruciales, vu l’état du développement de la didactique des mathématiques à l’époque » (Ibid., p. 283) : • La première question concerne « les rapports entre la recherche et l’action sur le système d’enseignement » (Ibid., p. 283). La didactique des mathématiques se défie en particulier des rapports entre recherche et action pensés en termes d’innovation, idéologie qui isole l’approche du système de toute histoire, qu’il s’agisse de l’histoire des mathématiques en tant que construction passée des concepts, que de l’histoire en devenir des savoirs visés (cf. Ibid., pp. 283-284). La didactique des mathématiques se défie également des rapports entre recherche et action pensés par l’intermédiaire de la notion de recherche/action. C’est Chevallard qui nous met en garde à ce sujet : « En accolant ainsi deux moments du processus scientifique-technique [recherche et action] sans les articuler, on réduit la signification de chacun. On se déliera des contraintes qui pèsent normalement sur toute recherche en répondant que c’est l’action [. . . ] qui commande ; l’action "accomplie", on la déclarera comme ayant constitué une "recherche", échappant donc par là au jugement de valeur auquel nous acceptons ordinairement de soumettre nos actions les plus banales. » (Chevallard 1982, p. 20) • La deuxième question que l’ingénierie didactique permet d’aborder concerne « le rôle qu’il convient de faire jouer aux "réalisations didactiques" en classe » (Artigue 1988, p. 283). Selon Artigue, l’ingénierie didactique pourra désigner à la fois des productions réalisées pour l’enseignement à l’issue de recherches ayant fait appel à des méthodologies, dites externes, car non liées au système {classe, professeur, savoir visé} et une méthodologie de recherche spécifique (cf. Ibid, p. 285). Ce sont ces dernières qui vont nous intéresser car c’est dans cette optique que va s’inscrire notre ingénierie didactique (cf. paragraphe 2.3, p. 40). Auparavant, décrivons brièvement les méthodologies externes. De telles méthodologies s’appuient sur des questionnaires, des entretiens ou des tests. Ce sont les méthodologies les plus répandues : - 39/709 - « [C’est sur elles que] se fondent la majeure partie des recherches publiées à l’époque, sans doute parce qu’elles sont plus aisées à utiliser et à faire reconnaître comme productrices de résultats scientifiques. » (Ibid., p. 284) Ces méthodologies font un usage abondant des statistiques. Pourtant, de telles méthodologies, en raison de leur caractère externe, « sont insuffisantes à attraper la complexité du système étudié » (Ibid., p. 284). C’est également l’avis de pédagogues tels que Cardinet et Schmutz : « [La méthode statistique] cherche dans les faits moins des configurations uniques douées de cohérence interne que la manifestation des propriétés de certaines classes d’objets. Par là, elle se situe à un niveau assez faible de compréhension des phénomènes, qui ne permet pas de maîtriser le cas individuel. » (Cardinet & Schmutz 1975) 2.3 L’ingénierie didactique comme méthodologie de recherche interne Par opposition aux méthodologies externes, il existe des méthodologies de recherche internes, car nécessairement liées à la classe. Ainsi, l’expression ingénierie didactique désigne-t-elle également une méthodologie de recherche spécifique. Concrètement, une ingénierie didactique a alors un rôle phénoménotechnique, à savoir de créer des observables sur les difficultés d’apprentissage et sur les potentialités d’un milieu pour traiter ces difficultés (cf. Schneider, à paraître) La confusion possible entre les deux types de méthodologies est telle que nous nous permettons d’insister encore : par notre travail, nous ne prétendons ni ne prétendrons vouloir proposer une nouvelle ou une meilleure approche du concept de dérivée destinée à remplacer celle utilisée aujourd’hui dans les manuels scolaires. Dans la suite de cette dissertation, c’est bien en tant que méthodologie de recherche interne que nous considèrerons l’ingénierie didactique. À présent, nous allons tâcher de mettre en lumière les caractéristiques de l’ingénierie didactique en tant que méthodologie de recherche interne. 2.3.1 Caractéristiques de l’ingénierie didactique comme méthodologie de recherche interne • Les conception, réalisation, observation et analyse de séquences d’enseignement. « L’ingénierie didactique, vue comme méthodologie de recherche interne, se caractérise en premier lieu par un schéma expérimental basé sur des "réalisations didactiques" en classe, c’est-à-dire sur la conception, la réalisation, l’observation et l’analyse de séquences d’enseignement. » (Artigue 1988, pp. 285-286) - 40/709 - 2.3. L’ingénierie didactique comme méthodologie de recherche interne Artigue distingue la micro-ingénierie de la macro-ingénierie. La première est locale, plus aisée à mettre en œuvre mais, contrairement à la seconde, elle ne s’inscrit pas dans la durée : « Les recherches de micro-ingénierie [. . . ] ne permettent pas de composer la complexité du phénomène classe avec celle, essentielle, des phénomènes liés à la durée dans les rapports enseignement/apprentissage. » (Ibid., p. 286) Un autre inconvénient de la micro-ingénierie par rapport à la macro-ingénierie est de ne pas nécessiter « un découpage cohérent des objets de connaissance » (Ibid., p. 286). Il en résulte la nécessité de s’intéresser à la macro-ingénierie, malgré toutes les difficultés méthodologiques et institutionnelles qu’elles présentent. En nous intéressant à l’enseignement du concept de dérivée, c’est vers ce type de recherche que nous avons pris le risque de nous tourner. • Une seconde caractéristique de la méthodologie d’ingénierie didactique est son mode de validation, essentiellement interne. Comme signalé au paragraphe précédent (2.2, p. 39), certaines expérimentations réalisées en classe, en particulier celles menées par des psycho-pédagogues, ont une validation externe, « basée sur la comparaison statistique des performances de groupes expérimentaux et des groupes témoins » (Ibid., p. 286). Au contraire, l’ingénierie didactique conduit à une étude de cas et sa validation est fondée sur la confrontation interne de l’analyse a priori et de l’analyse a posteriori qui seront définies ci-après (p. 42). En revanche, les objectifs d’une ingénierie didactique peuvent être divers. Douady, citée par Artigue, « distingue par exemple les recherches qui visent l’étude des processus d’apprentissage d’un concept donné et donc en particulier l’élaboration de genèses artificielles pour un concept donné, de celles qui sont transverses aux contenus » (Artigue 1988, p. 286). En l’occurrence, comme nous l’avons annoncé au début de ce chapitre, nous faisons l’hypothèse que l’ingénierie didactique qui sera proposée peut alimenter une genèse artificielle du concept de dérivée. 2.3.2 Les différentes phases de l’ingénierie didactique en tant que méthodologie Chronologiquement, l’ingénierie didactique, en tant que méthodologie, se décompose en quatre phases : • • • • Analyses préalables Conception et analyse a priori des situations didactiques de l’ingénierie Expérimentation Analyse a posteriori et évaluation. Ce sont ces différentes phases qui, bien que de poids inégaux, vont constituer le plan de notre dissertation. Ainsi, dans la partie qui va suivre, nous traiterons en détail des analyses préalables à l’élaboration d’une ingénierie didactique. Arrêtons nous une minute pour définir ces analyses essentielles en didactique. Elles sont extraites d’un Lexique des termes clefs de didactique proposé par la Haute école pédagogique du Valais (2010). - 41/709 - 2.3.2.1 Analyses préalables « Ce sont les analyses préliminaires s’effectuant avant une phase de conception, dans le cadre d’une recherche en ingénierie didactique. » (Op. cité, p. 1) Elles seront décrites plus en détail au début de la partie suivante (p. 45). 2.3.2.2 Analyse a priori « S’appuyant sur les analyses préalables, cette analyse se fonde sur un ensemble d’hypothèses visant à anticiper les activités potentielles des élèves, les choix possibles, les difficultés qu’ils pourraient rencontrer à partir de la tâche qu’on leur propose. Elle vise la cohérence de la démarche d’enseignement et permet de déterminer en quoi les choix effectués permettent de contrôler les comportements des élèves et leur sens. En résumé, on pourrait dire, qu’il s’agit d’associer de façon hypothétique les actions à mener au comportement prévu des élèves. » (Op. cité, p. 1) 2.3.2.3 Analyse a posteriori « L’intérêt de l’analyse a priori se trouve dans la confrontation avec l’analyse a posteriori. Au contraire de l’analyse a priori, constituée d’hypothèses, l’analyse a posteriori s’appuie sur l’ensemble des données recueillies lors de l’expérimentation : observation d’une séance d’enseignement, production d’élèves en classe et hors classe, interactions et entretiens avec les élèves,. . . Il s’agira, concrètement, de reprendre les éléments de l’analyse a priori et de les analyser en comparaison avec ce qui s’est réellement passé afin d’identifier les causes de cette distance et d’y remédier par la suite. » (Op. cité, p. 1) 2.4 Conclusion du chapitre Dans ce chapitre, nous nous sommes expliqué sur ce qu’est la la genèse artificielle d’un concept, à savoir l’ensemble des étapes par lesquelles les élèves parviennent à s’approprier ce concept. Rappelons que notre ambition se limite à alimenter une telle genèse et non à parvenir à une élaboration du concept de dérivée. Ensuite, nous avons inscrit notre projet de dispositif didactique dans le cadre des ingénieries didactiques considérées en tant que méthodologie de recherche et non en tant que projet d’enseignement. Il en résulte que notre recherche devra comporter quatre phases : • Les analyses préalables (ce sera l’objet de la partie II, p. 45) • La conception de l’ingénierie didactique proprement dite (tel est l’objet de la partie III, p. 217) sur base d’une analyse dite a priori, car fondée sur les effets potentiels des choix didactiques effectués • L’expérimentation auprès du public cible • Une analyse dite a posteriori car elle confronte les hypothèses faites lors de l’analyse a priori et ce qui s’est réellement passé durant la phase d’expérimentation. Ces deux dernières phases font l’objet de la partie IV (p. 285). - 42/709 - Deuxième partie Les analyses préalables 43 Les analyses préalables précèdent la conception proprement dite de l’ingénierie didactique. Elles permettent de préciser le cadre théorique dans lequel s’inscrit une telle recherche. « Dans une recherche d’ingénierie didactique, la phase de conception s’effectue en s’appuyant sur un cadre théorique didactique général et sur les connaissances didactiques déjà acquises dans le domaine étudié. » (Artigue 1988, p. 287) Comme nous l’avons déjà fait plus haut, c’est au fur et à mesure de ce travail, à chaque fois que le besoin s’en fera sentir, que nous tâcherons d’expliquer au lecteur les différents éléments théoriques de la didactique des mathématiques nécessaires à la bonne compréhension de ces lignes. Nous espérons que l’exposé contextualisé de ces concepts plutôt que leur regroupement systématique en un chapitre à part rendra la lecture de cette dissertation moins ardue. Les analyses préalables sur lesquelles s’appuie la méthodologie d’ingénierie didactique sont ainsi répertoriées par Michèle Artigue (cf. Ibid., pp. 287-288) : • l’analyse épistémologique des contenus visés par l’enseignement, • l’analyse de l’enseignement usuel et de ses effets, • l’analyse des conceptions des élèves, des difficultés et obstacles qui marquent leur évolution, • l’analyse du champ de contraintes dans lequel va se situer la réalisation didactique effective, • la prise en compte des objectifs spécifiques de la recherche. L’analyse épistémologique (Chapitre 3, p. 47) permet de comprendre le développement historique du concept étudié, à savoir, dans notre cas, celui de la dérivée. L’enseignement usuel est analysé (Chapitre 5, p. 145) en termes d’état d’équilibre du fonctionnement du système {classe, professeur, savoir visé}, « un équilibre qui fut longtemps stable mais dont on sent poindre l’obsolescence » (Artigue 1988, p. 288). L’analyse préalable des conceptions des élèves (Chapitre 4, p. 127), des difficultés et erreurs tenaces constitue un point d’appui important de la conception de l’ingénierie didactique puisque celle-ci « est conçue pour provoquer, de façon contrôlée, l’évolution des conceptions » (Ibid., p. 291) chez les élèves. Nous renvoyons l’analyse des champs de contraintes dans lequel va se situer la réalisation didactique effective dans les conclusions et perspectives de notre travail (Section 11.5, p. 393). - 45/709 - - 46/709 - Chapitre 3 Analyse épistémologique des contenus visés Nous allons décrire ici, à travers l’histoire des mathématiques, comment l’analyse mathématique et, en particulier, le concept de dérivée se sont développés. Auparavant, nous allons nous arrêter un moment sur quelques concepts de didactique des mathématiques nécessaires à notre analyse, à commencer par celui de praxéologie, développé par Chevallard (1992). Notre grille d’analyse utilisera deux types de praxéologies : les praxéologies-modélisation et les praxéologies-déduction, telles que décrites par Schneider (2007). 3.1 Praxéologies-déduction et praxéologies-modélisation Dans la Théorie Anthropologique du Didactique (TAD), Chevallard modélise l’activité mathématique par le biais du concept de praxéologie. Ce néologisme se base sur le mot praxis, qui signifie action en grec. Il s’agit d’une activité en vue d’un résultat, par opposition à une connaissance ou à une théorie 1 . En didactique des mathématiques, la praxis renvoie à des pratiques mathématiques permettant de réaliser des tâches « par la manipulation réglée d’outils sémiotiques que sont les ostensifs mathématiques : symboles, représentations graphiques, etc. » (Chevallard 1992). La base praxis est complétée par le suffixe -logie, de logos en grec qui signifie discours, et sert à désigner ici une étude méthodique sur ces praxis 2 . Concrètement, il s’agit du discours qui vise « d’une part, [à] légitimer et rendre intelligibles les techniques en regard des tâches visées et, d’autre part, [à] favoriser la production de nouvelles techniques » (Chevallard 1992). Chevallard qualifie un tel discours de technologique. Il existe aussi un discours théorique dans lequel la théorie « reprend, par rapport à la technologie, le rôle que cette dernière tient par rapport à la technique » (Chevallard 1992). Ainsi, une praxéologie fait référence à des tâches, des techniques, une technologie et jusqu’à une théorie. Chevallard les note respectivement t, T, τ , Θ. La tâche est l’action, a priori difficile, à mener ; la technique est ce qui rend la tâche facile mais cette technique a un prix ; la technologie est ce qui justifie la technique, le prix à payer ; enfin, le cas échéant, la théorie est un niveau supérieur de théorisation proprement mathématique avec ce que cela suppose d’organisation déductive. 1. Voir les dictionnaires usuels tels que Petit Robert ou Larousse 2. cf. Dictionnaire Petit Robert 3.1.1. Deux niveaux praxéologiques bien distincts 3.1.1 Deux niveaux praxéologiques bien distincts Les théories mathématiques standardisées et reconnues comme telles par les mathématiciens professionnels 3 sont en rupture par rapport à un premier niveau de justification mathématique. Pour le montrer, Maggy Schneider distingue deux types de praxéologies « qui se définissent en référence à des projets fondamentaux fort différents bien que complémentaires » (Schneider 2007) : les praxéologies-modélisation (qui représentent ce premier niveau de justification mathématique) et les praxéologies-déduction (qui représentent le niveau abouti de justification mathématique). 3.1.2 Praxéologies-modélisation Maggy Schneider distingue un premier type de praxéologies qui concerne la modélisation mathématique de systèmes constitués d’objets, qu’elle considère comme des objets préconstruits au sens de Chevallard (1991), c’est-à-dire des objets dont l’existence résulte, aux yeux de personnes assujetties à une même institution 4 , d’un « croisement d’énoncés du langage et de situations surdéterminées » (Schneider 2007). Par exemple, une droite, pour un élève qui entre en secondaire, est un objet préconstruit : avant même d’en connaître la définition mathématique, il est en mesure d’en saisir les propriétés et de se la représenter mentalement. Un tel objet « n’est pas construit mais présenté, par une deixis qui est un appel à la complicité dans la reconnaissance ontologique ; l’existence de l’objet apparaît alors comme évidente, non douteuse, plus justement non susceptible de doute ; l’objet est installé, par la monstration qui le désigne dans son existence entêtée, dans un état qui échappe au questionnement, parce que tout questionnement le suppose : il est un point d’appui inattaquable de la réflexion » (Chevallard 1991). En reprenant l’exemple de la droite, lorsque le professeur trace un trait rectiligne au tableau, tous les élèves y reconnaissent une droite et non un segment, une droite n’ayant pas d’extrémité. Maggy Schneider explique l’importance de ces objets préconstruits dans l’apprentissage des concepts mathématiques : « De tels objets préconstruits jouent un rôle indéniable dans l’apprentissage, pouvant constituer des objets mentaux au sens de H. Freudenthal (1973) que j’ai retravaillé personnellement (Schneider 1988) comme "substituts de concepts" auxquels sont associées des convictions, des "images" qui peuvent soit faciliter, soit entraver l’apprentissage des concepts mathématiques correspondants. De fait, et mes travaux en analyse l’ont largement montré, il ne faut pas négliger une phase d’apprentissage au cours de laquelle, les objets préconstruits, existant d’abord par le truchement d’une désignation, se mettent à exister par le truchement d’une définition au sein d’une théorie, cette définition donnant prise à une organisation véritablement déductive. » (Schneider 2007, p. 33) 3. Nous verrons dans la partie suivante que, contrairement à ce que les élèves et les étudiants imaginent souvent et naïvement, les théories mathématiques ne se sont pas constituées par un processus déductif qui irait inexorablement de l’avant, mais bien par tâtonnement. 4. Dans notre recherche, nous considérons l’institution au sens de Chevallard (1991), c’est-à-dire comme un groupe de personnes aux yeux duquel au moins un objet existe. Il s’agit, par exemple, de l’université, de l’école, des mathématiciens d’une époque donnée, des professeurs ou des élèves d’une classe. - 48/709 - 3.1. Praxéologies-déduction et praxéologies-modélisation Tel serait le rôle des praxéologies auxquelles Maggy Schneider donne le nom de praxéologies-modélisation [et nous les appellerons ainsi dans la suite de notre recherche] (ou "praxéologies de type 1"). Dans le cadre du travail qui nous occupe, une vitesse variable et la pente en un point d’une courbe sont des objets préconstruits pour des élèves qui entrent en Cinquième (avant dernière année du secondaire en Belgique). Les praxéologies-modélisation peuvent s’appuyer sur ces objets pour se développer. « Les techniques sont les modes de détermination ou de modélisation "standard" de tels objets : dans le cas de l’analyse, le calcul des limites dans un état embryonnaire comme techniques consistant à supprimer des éléments de calcul, au moment opportun et sans jeu de compensations comme en algèbre, ou encore, le calcul plus performant des dérivées et des primitives. [. . . ] Comme ces objets n’existent pas encore comme objets d’une théorie et que le but est précisément de les constituer comme tels, le discours qui justifie ces techniques et les rend intelligibles eu égard à la tâche visée ne peut être théorique, au sens où l’entendraient des mathématiciens. Et c’est ce qui rend nécessaire, me semble-t-il, l’existence d’un niveau de discours qu’Y. Chevallard appelle discours technologique. Dans nos exemples, il s’agira de justifier qu’un calcul de limite fournit bien la valeur exacte d’une aire curviligne ou d’une vitesse instantanée, contrairement à l’intuition "commune" qui se constitue en obstacle épistémologique ainsi que je l’ai montré. » (Schneider 2007, p. 33) Nous verrons plus loin (p. 128) ce qu’on entend par obstacle épistémologique. En attendant, c’est par ces praxéologies-modélisation que, peu à peu, les objets préconstruits vont pouvoir devenir des concepts mathématiques à part entière, utilisables dans une théorie axiomatique. L’étape ultime consiste en une définition du concept. Ainsi, la vitesse instantanée sera-t-elle finalement définie comme la dérivée par rapport au temps de la fonction qui donne la loi de mouvement. En résumé, les praxéologies-modélisation partent d’objets préconstruits, puis visent à légitimer (technologie/théorie) leur modes (techniques) de détermination/modélisation (tâches) avant, finalement, de sublimer les objets préconstruits en les définissant comme des concepts mathématiques. La technologie, c’est-à-dire le discours qui justifie que la technique permet d’accomplir la tâche, est ici convaincante mais pas inattaquable, du moins en l’absence d’une théorie achevée. 3.1.3 Praxéologies-déduction « Entrent en jeu alors les praxéologies de type 2 [que nous appellerons praxéologiesdéduction dans la suite de notre recherche] dont les tâches diffèrent considérablement de celles des praxéologies de type 1. Elles sont en effet propres à la constitution d’une organisation déductive. Il s’agit de reformuler certains concepts pour en faire des proof-generated concepts au sens de Lakatos (1984), l’exemple typique étant celui du concept de limite, formulé en termes de quantificateurs et d’inégalités et inspirant un modèle de preuve faisant abstraction de toute considération géométrique ou cinématique. Il peut s’agir aussi de déduire tel résultat théorique d’axiomes et/ou de théorèmes antérieurement démontrés, d’établir un système d’axiomes "simple" et non redondant, de conjecturer un ordre d’agencement des théorèmes, etc. » (Schneider 2007, p. 33) - 49/709 - 3.1.4. Des perspectives différentes mais complémentaires En résumé, les praxéologies-déduction partent des concepts mathématiques et visent à les ordonner (tâches) selon les lois de la logique déductive (techniques). La tâche première d’une telle praxéologie est de rédiger un énoncé mathématiquement inattaquable aux yeux des mathématiques institutionnelles. La technique consiste à utiliser les définitions, propriétés et théorèmes disponibles. La technologie consiste à justifier les règles de déduction. Enfin, la théorie est ici une réflexion sur ce qui fait une bonne théorie (rigueur, non-redondance, etc.). 3.1.4 Des perspectives différentes mais complémentaires On le voit : les tâches, techniques, technologies et théories sont bien différentes dans les deux types de praxéologies que nous venons de décrire. Nous avons ainsi une grille d’analyse que nous utiliserons par la suite. « Ces deux types de praxéologies conduisent à des développements mathématiques presque étrangers les uns aux autres. Si une praxéologie de type 2 peut conduire à une théorie mathématique standardisée, plus ou moins globale, il n’en va pas de même des praxéologies de type 1 qui débouchent sur des argumentations non assimilables à des théories canoniques plus ou moins locales. En effet, s’il peut y avoir interpénétration entre les deux, c’est au niveau des tâches ou des techniques mais pas à celui des discours qui valident les secondes en regard des premières. En général, les tâches des praxéologies de type 1 deviennent des applications des théories résultant des praxéologies de type 2, ce que Y. Chevallard nomme "une déconnexion franche du cœur théorico-technologique de l’œuvre d’avec ses applications". » (Schneider 2007, p. 34) Il n’est donc pas étonnant, dans le cadre de praxéologies-déduction, d’observer dans les cours et manuels se réclamant d’une telle praxéologie que la détermination d’une vitesse instantanée est une simple application du calcul différentiel. Pourtant, l’histoire des mathématiques montre combien les praxéologies-modélisation ont permis de découvertes et ouvert la voie à des techniques d’avenir, à commencer par le calcul infinitésimal : « Par contre, les praxéologies de type 1 autorisent des modes de validation plus pragmatiques qui seront récusés dans les [praxéologies-déduction], tel celui qui consiste à tester la pertinence d’une technique nouvelle pour résoudre un problème dont la solution est déjà connue par ailleurs. C’est bien une telle démarche que fait Fermat lorsqu’il exploite sa méthode d’adégalité, dans laquelle on peut voir une forme embryonnaire du calcul des dérivées, pour retrouver des résultats connus depuis l’Antiquité, comme la détermination de la tangente en un point quelconque de la parabole. N’est-ce pas de tels tests qui légitimeront ultérieurement de définir l’objet préconstruit — ici une tangente — comme résultat de la mise en œuvre de la technique des dérivées ? » (Schneider 2007, p. 34) - 50/709 - 3.2. Éléments d’histoire de l’analyse À la section suivante, nous tâcherons de montrer à grands traits, à travers des exemples pris dans l’histoire des mathématiques, la fécondité des praxéologies-modélisation. Nous montrerons également comment le concept de dérivée a finalement émergé et comment les praxéologies-déduction ont permis la mise au point de l’analyse comme théorie « rigoureuse » du point de vue du mathématicien d’aujourd’hui. Autrement dit, les praxéologies-modélisation ont leur utilité en mathématique et penser que seules les praxéologies-déduction ont leur place en mathématique serait réducteur : « Ce serait une dangereuse méprise de croire que les mathématiques sont une science uniquement déductive, au sens où faire des mathématiques serait nécessairement et tout le temps raisonner par déduction. Il est vrai que le corpus des mathématiques constituées est un édifice déductif, mais la pensée mathématique vivante travaille sur des problèmes et progresse comme elle peut, s’appuyant sur des intuitions, des analogies, des images dont l’origine importe peu, des erreurs analysées, des rêves. Elle vise certes à produire un raisonnement sans défaut, mais elle emprunte pour y arriver les chemins les plus divers et parfois les plus inattendus. » (Rouche 2005, p. 41) Puisque notre objectif ici est d’alimenter une genèse artificielle du concept de dérivée, nous nous plaçons en amont des praxéologies-déduction et nous choisissons résolument d’inscrire notre ingénierie selon les praxéologies-modélisation : il s’agit d’observer dans quelle mesure les élèves développent eux-mêmes un discours technologique — c’est-à-dire comment ils justifient les techniques qu’ils utilisent — et de voir quels obstacles, qui échappent habituellement à la transposition didactique 5 du concept de dérivée, ils ont l’occasion d’affronter. Il ne s’agit pas pour autant de priver les élèves d’une mise en ordre déductive mais d’envisager cette dernière comme synthèse, in fine. Le lecteur comprendra donc pourquoi, dans l’ingénierie étudiée ici, il sera question moins de quantificateurs et autres définitions mathématiques formelles que de validations pragmatiques. 3.2 Éléments d’histoire de l’analyse N’étant pas spécialiste en histoire des mathématiques, nous nous appuierons volontiers sur les écrits des spécialistes en la matière, sans nécessairement remonter au texte originel des mathématiciens étudiés. Nous allons voir que l’on peut découvrir deux mouvements dans l’histoire de l’analyse : d’une part des créations, des innovations, des découvertes faites à partir de préconstruits ; d’autre part, la mise au point de définitions pouvant s’intégrer à des modélisations plus larges, se constituant peu à peu en vastes théories. Ainsi, nous tâcherons de décrire la manière dont les deux processus praxéologiques (modélisation et déduction) se sont articulés au long de cette histoire. Judith Grabiner (1983, p. 195), historienne des mathématiques, distingue chronologiquement quatre étapes dans le développement du concept de dérivée : 5. La transposition didactique est la transformation opérée pour rendre accessibles des connaissances acceptées comme telles par une communauté de référence (les mathématiciens, en l’occurrence) à une autre communauté qui, par nature, ne dispose pas du même référentiel de connaissances (les élèves et étudiants en l’occurrence). - 51/709 - 1. La dérivée est utilisée 2. La dérivée est découverte 3. La dérivée est explorée et développée 4. La dérivée est définie Francis Buekenhout résume brièvement ces quatre étapes : 1. « Des problèmes mathématiques (extrema, tangentes) conduisent dans des situations particulières (pour nous) à des méthodes ad-hoc où nous reconnaissons des dérivées. Citons Fermat durant la période 1630–1640. 2. Un concept général s’en dégage et est identifié. Ce processus interfère avec le précédent. Citons Descartes, Hudde, Sluse (cocorico !), Huygens, Wallis, Barrow durant la période 1640–1665. Le processus s’achève avec Newton et Leibniz. Le premier maîtrise le concept dès 1669 mais ne publie rien avant 1704. Le second fait les pas décisifs vers 1672-76 et publie en 1684. 3. Les propriétés sont expliquées et appliquées à la fois en mathématique et en physique. Citons Taylor, Euler, Lagrange et la période 1715 (Séries de Taylor) - 1797 (Théories des Fonctions Analytiques de Lagrange). 4. Une définition rigoureuse est obtenue et immergée dans une théorie cohérente. La notion de limite est maîtrisée. Citons Cauchy (1823) et Weierstrass (≥ 1850). » (Buekenhout 1992, p. 11) Un tel découpage ne prend pas en compte l’histoire des mathématiques avant le XVIIe siècle et, donc, en particulier les problèmes qui ont conduit peu à peu les mathématiciens à inventer 6 le concept de dérivée : « La découverte du Calcul différentiel et du Calcul intégral ne remonte qu’au [XVIIe] siècle, [. . . ] les questions par lesquelles on y a été conduit s’étaient présentées dès les premiers temps de la Géométrie. » (Lacroix, 1797, p. iv) C’est pourquoi nous allons rappeler tout d’abord quelques faits marquants, précurseurs non seulement du concept de dérivée mais encore du calcul infinitésimal en général. Notre première investigation porte sur la mathématique grecque et, en particulier sur les calculs d’aires, volumes et tangentes. 6. Le mot découverte, employé par Grabiner ci-dessus comme par Silvestre-François Lacroix (mathématicien français, 1765–1843) ci-après, sous-entend la préexistence du concept de dérivée qui serait simplement caché aux yeux des mathématiciens ; on peut lui préférer le mot invention qui sous-entend plutôt la préexistence d’une finalité déterminée. - 52/709 - 3.3. Les mathématiciens grecs 3.3 Les mathématiciens grecs Durant l’Antiquité grecque (à partir du VIe siècle avant Jésus-Christ), les aires et volumes et les tangentes ne sont pas définis en tant que tels. En revanche, les mathématiciens de l’époque ont mis au point des techniques pour les calculer. Jusqu’à cette époque, que ce soit dans la civilisation égyptienne ou babylonienne, on ne trouve pas encore de démonstration. Il semble que ce soit l’instauration de la démocratie qui, donnant aux débats toute leur place, invite les orateurs à convaincre l’auditoire par la raison. Lorsqu’Euclide écrit Les Éléments, il part d’un petit nombre d’axiomes considérés comme évidents pour en déduire toute une série de théorèmes : « Une autre nouveauté radicale de la pensée mathématique grecque est que, partant ainsi de quelques axiomes et définitions claires, elle en tire par le seul moyen de la déduction, une chaîne (ou plutôt une arborescence) de théorèmes constituant une vaste théorie. Celle-ci n’emprunte rien à d’autres sources qu’à ses axiomes, et elle peut être développée indéfiniment, c’est-à-dire étendue à de nouveaux théorèmes, sans jamais conduire à des résultats douteux ou ambigus. C’est une théorie déductive autonome de longue haleine. Or c’est là la propriété principale qui caractérise la pensée mathématique encore aujourd’hui. » (Rouche 2005, p. 32) On reconnaît ici ce qui caractérise les praxéologies-déduction. Par ailleurs, une autre caractéristique de la pensée euclidienne et de celle des mathématiques grecques de l’époque classique, est l’usage systématique de la preuve par l’absurde. Il s’agit du discours indirect par lequel, en partant de la négation d’une idée, on parvient (par déduction logique) à une absurdité, si bien que l’idée de départ est validée. Il semble qu’il s’agisse là d’une mode : les mathématiciens grecs faisaient de la démonstration un acte social, à l’instar du débat public ; or la démonstration par l’absurde s’inscrivait dans la culture de leur temps. Lacroix nous en donne un exemple : « La deuxième proposition du Livre XII des Éléments d’Euclide [. . . ] a pour objet, de prouver que les surfaces des cercles sont entre elles comme les quarrés des diamètres. [. . . Les Anciens] ont cherché à prouver que le rapport des cercles entre eux ne pouvait être ni plus grand ni plus petit que celui des quarrés de leurs diamètres ; et pour y parvenir, ils ont commencé par montrer qu’on pouvait toujours trouver un polygone inscrit, qui ne différât du polygone correspondant circonscrit, et à plus forte raison du cercle lui-même, que d’une quantité moindre qu’une grandeur donnée. » (Lacroix, 1797, pp. iv-v) Par cette double réduction à l’absurde, la conclusion s’impose : le résultat proposé est exact. Nous allons décrire l’une ou l’autre de ces démonstrations en nous attachant également à les situer en termes de praxéologies. - 53/709 - 3.3.1. La quadrature de la parabole chez Archimède 3.3.1 La quadrature de la parabole chez Archimède Parmi les aires de surfaces curvilignes (délimitées par des courbes) et les volumes de solides que les mathématiciens grecs ont su déterminer 7 , nous avons cité l’aire du disque par Euclide (v. 450-v. 380 av. J.-C.) ; nous citerons comme exemples supplémentaires le volume de la pyramide par Démocrite (v. 460-v. 370 av. J.-C. ; cf. Boyer 1949, p. 21), et la quadrature de la parabole 8 par Archimède (287-212 av. J.-C.). C’est à cette dernière que nous nous arrêterons. Nous donnerons ainsi un exemple de démonstration par l’absurde. Le choix de nous intéresser à Archimède n’est pas le fruit du hasard. En effet, en plus d’être sans doute le plus grand mathématicien de l’Antiquité (cf. Boyer 1949, p. 48), Archimède est aussi considéré comme ayant donné naissance au calcul infinitésimal : En outre, « He "gave birth to the calculus of the infinite conceived and brought to perfection successively by Kepler, Cavalieri, Fermat, Leibniz, and Newton" [Chasles, Aperçu historique sur l’origine et le développement des méthodes en géométrie, p. 22.] and so made the concepts of the derivative and the integral possible » 9 . (Boyer 1949, p. 48) D’autre part, Archimède est l’un des rares auteurs de l’Antiquité à avoir précisé comment il a eu l’intuition d’un résultat. Cela semble étrange dans notre culture de la transparence. Pourtant, chez les Anciens, le résultat à démontrer est donné sans aucune référence au moyen qui a conduit à sa découverte ; ce qui compte et ce qui mérite seul d’être publié, est la démonstration (par l’absurde) que ce résultat est correct. Il a fallu attendre 1906 (cf. Boyer 1949, p. 41) et la redécouverte de La Méthode 10 pour disposer d’un texte dévoilant une méthode heuristique. Jusque là, à l’instar des autres auteurs de l’Antiquité, on ne disposait que de la démonstration du résultat. Dans le cas de l’aire de la parabole chez Archimède, il s’agit de La Quadrature de la Parabole. Lorsque Lacroix publie son Traité du Calcul différentiel et du Calcul intégral en 1797, il ne connaît donc que ce dernier texte. Il n’est pas dupe pour autant qu’Archimède, aussi génial ait-il été, n’avait pas la science infuse : « Archimède s’éleva [. . . ] à des propositions beaucoup plus difficiles, telles que les rapports des surfaces et des solidités du cylindre et de la sphère, la quadrature de la parabole et les propriétés des spirales ; mais ne croyons pas qu’il les ait découvertes ainsi qu’il nous les a transmises. » (Lacroix, 1797, p. v) Ci-après, à propos des deux textes d’Archimède relatifs à la quadrature de la parabole, nous allons étudier quelles sont respectivement les tâche, technique et technologie employées par Archimède. Nous pourrons ainsi voir s’il est possible ou non de rattacher sa démarche à l’un des deux types de praxéologies qui nous intéressent. 7. Conformément à la culture de cette époque, ce ne sont pas les mesures d’une aire ou d’un volume qui sont calculées mais un rapport de ces mesures. 8. Dans l’Antiquité, on associait à la recherche d’une aire la construction d’un carré d’aire égale, ce qui a donné le mot quadrature ; il s’agit donc bien d’un calcul d’aire. 9. « Il a donné naissance au calcul de l’infini, conçu et mené à la perfection successivement par Kepler, Cavalieri, Fermat, Leibniz et Newton ; il a ainsi rendu possible les concepts de dérivation et d’intégrale ». 10. Le titre complet est La Méthode relative aux Théorèmes mécaniques. Il s’agit d’une lettre adressée à Eratosthène, géographe, astronome et mathématicien d’Alexandrie. - 54/709 - 3.3. Les mathématiciens grecs 3.3.1.1 Tâche dans La Méthode : déterminer une aire curviligne Avec la quadrature exacte d’un segment de parabole, c’est-à-dire de la surface délimitée par un arc de parabole et une corde qui le sous-tend, c’est la première fois qu’est trouvé un rapport, rationnel de surcroît, entre une aire curviligne — celle de l’arc de parabole — et une aire rectiligne — celle d’un triangle (cf. IREM de Basse-Normandie 1999, p. 44). Archimède découvre en substance que l’aire d’un segment de parabole vaut 4/3 de l’aire du triangle ayant pour base la corde et pour troisième sommet le point le plus éloigné de la corde sur la parabole. 3.3.1.2 Technique dans La Méthode : le pesage de segments de droites Nous donnons ici la proposition d’Archimède (texte et figures repris de IREM de BasseNormandie 1999). « [Proposition] I. Soit le segment ABΓ compris entre la droite AΓ et la parabole ABΓ ; divisons AΓ en deux parties égales par le point ∆, menons la parallèle 11 ∆BE au diamètre 12 et les droites AB et BΓ joignant B à A et à Γ. Je dis que le segment ABΓ est équivalent aux quatre tiers du triangle ABΓ. » (Op. cité, p. 48) Cette proposition semble suivre le schéma convenu de l’époque : le rapport de 34 est donné semble-t-il comme une « hypothèse préalable qu’on se proposerait de démontrer » (Ibid., p. 51). 11. Archimède, sur la figure qu’il propose, ne trace pas une parallèle au diamètre mais le diamètre lui-même : en effet, il a implicitement choisi comme direction de la corde la perpendiculaire à l’axe de symétrie de la parabole, si bien que le diamètre se confond avec cet axe de symétrie et passe par le milieu de la corde AΓ. Ainsi, le point B est situé au sommet de la parabole (et les points ∆ et H de la première figure se confondent). Cela n’a pas d’influence sur la généralité de sa démonstration : le point B reste le point le plus éloigné de la corde (hauteur maximale du triangle) situé sur la parabole, si bien que l’aire de ce triangle sera maximale (la base du triangle étant la corde, donc identique pour tous les triangles). 12. Le diamètre d’une conique est la droite qui coupe en deux parties égales toute corde ayant une direction donnée. Une conique a une infinité de diamètres. - 55/709 - 3.3.1. La quadrature de la parabole chez Archimède La justification recourt à la mécanique et, plus précisément, à l’équilibrage de poids par des bras de levier. Il s’agit d’une expérience de pensée : « Imaginons que ΓΘ soit un levier de centre K. . . » (Ibid., p. 49) Il opère alors un découpage de la figure. Le triangle AZΓ comme le segment de parabole ABΓ sont vus comme une succession de segments de droites parallèles. Archimède va mettre en équilibre un segment de droite quelconque ΞO du segment de parabole ABΓ avec le segment de droite correspondant ΞM du triangle AZΓ. La collection complète des segments de droites du triangle (respectivement, du segment de parabole) forme précisément ce triangle (respectivement, ce segment de parabole). Ce découpage s’inspire de la forme de la figure, à savoir une parabole, ce qui rend le résultat obtenu difficilement transposable à d’autres quadratures. Le résultat obtenu ne sera donc pas généralisable à d’autres cas de figure. 3.3.1.3 Technologie dans La Méthode : le principe des leviers Une phrase d’Archimède est le fameux « Donnez-moi un point fixe et un levier et je soulèverai la Terre 13 ». Elle illustre le principe du levier qu’Archimède maîtrise parfaitement et ses travaux sur les moments de force. Le principe des leviers, qui s’insèrera plus tard au sein de la théorie mécanique, est employé ici comme un état d’équilibre : un axe rigide (le levier) aux extrémités duquel deux forces s’exercent et qui repose sur un point d’appui. 13. « Πα βω και χαριστ ιωνι τ αν γαν κινησω πασαν ». - 56/709 - 3.3. Les mathématiciens grecs (source http://fr.wikipedia.org/wiki/Levier_(mécanique)) Il y aura équilibre si et seulement si le rapport des forces est inversement proportionnel au rapport des distances (appelées bras de levier) entre le point d’appui et les points d’apF1 L2 plication des forces : = . Le résultat est obtenu en calculant les moments des forces à F2 L1 l’équilibre. Dans le cas présent, il s’agit de masses (fictives de surcroît), ce qui ne change pas le résultat puisque, dans le rapport, la force gravitationnelle se simplifie. Concrètement, en un point Ξ quelconque de AΓ, Archimède a comme extrait un morceau ΞO du segment de parabole ABΓ qui fait juste contrepoids à un extrait M Ξ du triangle AZΓ. La généralisation à tous les segments découpés permet de recomposer le segment de parabole ABΓ et le triangle AZΓ, chacun faisant contrepoids à l’autre. L’application du résultat relatif aux bras de levier rappelé ci-dessus permet de trouver le rapport 31 entre les deux masses et donc entre les deux aires. Une propriété géométrique des triangles permet de revenir au triangle ABΓ avec un facteur multiplicateur de 4. D’où le rapport de 34 . Par ailleurs, Archimède emploie le mot « somme » à propos des deux aires prises dans leur ensemble et non à propos des lignes découpées : « . . . l’équilibre se faisant par rapport au point K , de façon que le centre de gravité de la somme des deux grandeurs soit le point K . » (IREM de Basse Normandie 1999, p. 50) - 57/709 - 3.3.1. La quadrature de la parabole chez Archimède 3.3.1.4 Archimède et les praxéologies-modélisation Ainsi, Archimède se fixe ici (tâche) de déterminer un objet préconstruit (une aire). Pour ce faire (technique), il pèse des segments de droite par une expérience de pensée. Il justifie (technologie) sa technique par le principe des leviers. Cette justification n’est pas nécessairement convaincante. Ainsi, lorsqu’Archimède écrit que les surfaces considérées sont « constituées par les segments de droites », il ne précise pas combien il y a de segments ou quelle est l’épaisseur de chacun. La première fois qu’il a considéré Ξ, il ne l’a pas présenté comme un point (quelconque, de surcroît) de la corde qui sous-tend l’arc de parabole ; il a plutôt considéré « une parallèle » au diamètre de la parabole. Quoi qu’il en soit, une telle parallèle est un segment de droite. Est-il légitime d’envisager sa masse et son épaisseur ? Archimède ne se pose pas ces questions car son but est pragmatique : trouver le rapport entre les aires des surfaces considérées. La démonstration rigoureuse est ici sans objet : elle viendra plus tard, dans la Quadrature de la Parabole. L’objectif ici est d’obtenir un résultat grâce à une modélisation. Tous ces éléments montrent que la démarche d’Archimède dans La Méthode se situe en termes de praxéologies-modélisation. 3.3.1.5 Archimède et le Calcul infinitésimal D’aucuns ont considéré qu’Archimède faisait du calcul infinitésimal à son insu. Avant de traiter de la Quadrature de la Parabole, étudions brièvement ce qui peut amener à l’envisager et ce qu’il en est réellement. « This method of Archimedes indicates an anticipation of the use of the concept of the indivisible which was to be made in the fourteenth century and which, when developed again more freely in the seventeenth century, was to lead directly to the procedures of the calculus. The basis of the method is to be found in the assumption of Archimedes that surfaces may be regarded as consisting of lines. » 14 (Boyer 1949, p. 50) En particulier, la démonstration d’Archimède contient en germe ce que sera le concept d’indivisible chez Cavalieri près de vingt siècles plus tard et dont nous parlerons plus loin (section 3.4.2, p. 68). Comme nous l’avons écrit au paragraphe précédent, La Méthode est l’exposé par Archimède de la manière dont il a obtenu le résultat cherché. Il ne prétend pas pour autant avoir donné là une démonstration rigoureuse de ce résultat. 14. « La méthode d’Archimède indique une anticipation de l’usage du concept d’indivisible qui allait naître au XIVe siècle et qui, une fois développé plus librement au XVIIe siècle, allait conduire directement aux procédures du calcul différentiel. La base de la méthode se trouve dans l’intuition d’Archimède que les surfaces peuvent être vues comme constituées de lignes ». - 58/709 - 3.3. Les mathématiciens grecs « In it Archimedes disclosed the method which is presumably that which he employed in reaching many of his conclusions in problems involving areas and volumes. » 15 (Ibid., p. 49) Fort de sa méthode, Archimède, a anticipé de nombreux résultats du calcul intégral : « He discovered, among other things, the volumes of segments of conoids and cylindrical wedges and the centers of gravity of the semicircle, of parabolic segments, and of segments of a sphere and a paraboloid. » 16 (Ibid., p. 50) D’autre part, son intuition qui consiste à considérer les surfaces comme constituées de segments de droites anticipe l’usage du concept d’indivisible. Pour autant, peut-on parler déjà de calcul infinitésimal chez Archimède, même implicite ? C’est l’avis, par exemple, de Eric Temple Bell, qui fut professeur à Harvard et président de l’Association Mathématique d’Amérique : « Pour prendre un exemple simple, supposons que nous voulions trouver l’aire d’un cercle ; parmi d’autres procédés, nous pouvons adopter celui-ci : diviser le cercle en un certain nombre de bandes parallèles d’égale largeur, enlever les portions courbes des extrémités des bandes, de manière que l’aire totale des portions enlevées soit la plus petite possible par des coupes perpendiculaires aux bandes, et faire la somme de tous les rectangles partiels obtenus. Ce procédé donne une approximation de l’aire cherchée. En augmentant le nombre des bandes jusqu’à l’infini et en prenant la limite de la somme, nous obtenons l’aire du cercle. Ce procédé (grossièrement décrit) qui consiste à prendre la limite d’une telle somme s’appelle intégration, et la méthode pour exécuter cette sommation s’appelle le calcul intégral. C’est ce calcul qu’Archimède a appliqué pour trouver l’aire d’un segment de parabole et pour résoudre d’autres problèmes. » (Bell 1939, p. 42) Il nous semble que c’est prêter à Archimède des intentions qu’il n’a, pour le moins, jamais explicitées. Les segments d’Archimède ne sont pas des bandes et, nous l’avons vu, il ne parle pas de largeur ; il ne somme aucun fragment d’aire ; il ne précise pas le nombre de segments ; a fortiori, il n’augmente pas leur nombre à l’infini ; finalement, il ne prend nullement la limite d’une somme. Boyer ne partage pas non plus l’avis de ceux qui voient dans le travail d’Archimède le premier calcul infinitésimal : « [. . . ] to assert that here "for the first time one can correctly speak of an integration" [Hoppe, "Zur Geschichte der Infinitesimalrechnung", p. 154 ; cf. also p. 155.] is to misinterpret the mathematical process known by this name. The definite integral is defined in mathematics as the limit of an infinite sequence and not as the sum of an infinite number of points, lines, or surfaces. » 17 (Boyer 1949, p. 50) 15. « Dans [ce texte], Archimède révèle la méthode qu’il a vraisemblablement utilisée pour obtenir nombre de ses conclusions dans des problèmes relatifs aux aires et aux volumes ». 16. « Il a découvert, entre autres choses, les volumes d’un segment de cône et des prismes cylindriques ainsi que les centres de gravité du demi-cercle, d’un segment de parabole, d’un segment de sphère et d’un paraboloïde ». 17. « Affirmer qu’ici, "pour la première fois on peut correctement parler d’une intégration", c’est mal interpréter le processus mathématique connu sous ce nom. L’intégrale définie est définie en mathématiques comme la limite d’une suite infinie et non comme la somme d’un nombre infini de points, droites ou surfaces ». - 59/709 - 3.3.1. La quadrature de la parabole chez Archimède Au mieux, y a-t-il implicitement chez Archimède des considérations de type infinitésimal. Mais l’absence d’idée de variation dans ses raisonnements interdit d’aller plus avant : « It was, as a result, necessarily unable to frame a satisfactory definition of the infinitesimal, which of necessity was to be regarded as a fixed quantity rather than as an auxiliary variable. » 18 (Ibid., p. 51) 3.3.1.6 Tâche dans La Quadrature de la Parabole : démontrer le résultat Nous allons à présent nous pencher sur La Quadrature de la Parabole, texte par lequel Archimède, suivant en cela la culture de son époque, démontre par double réduction à l’absurde l’exactitude du résultat obtenu par La Méthode. Dans La Quadrature de la Parabole, œuvre pourtant antérieure à La Méthode, Archimède fait deux démonstrations : « l’une est de type mécanique, puisqu’elle est fondée sur le principe de la balance dite romaine, c’est-à-dire de l’équilibrage des poids par des bras de levier de longueurs inversement proportionnelles ; l’autre est de type géométrique. » (IREM de Basse-Normandie 1999, p. 44) 3.3.1.7 Technique dans La Quadrature de la Parabole : la méthode d’exhaustion Dans les deux cas (par la mécanique comme par la géométrie), la même méthode est utilisée, à savoir la méthode d’exhaustion. « Archimedes employed his heuristic method, therefore, simply as an investigation preliminary to the rigorous demonstration by the method of exhaustion. It was not a generous gesture that led Archimedes to supplement his "mechanical method" by a proof of the results in the rigorous manner of the method of exhaustion ; it was, rather, a mathematical necessity. [. . . ] Archimedes was probably well aware of the lack of any sound basis for his method and for this reason recast all of his analysis by infinitesimals in the orthodox synthetic form [. . . ] However, formal proofs (both mechanical and geometrical) of the proposition were carried out by the method of exhaustion. » 19 (Boyer 1949, pp. 50-51) 18. « [La géométrie grecque] était par conséquent incapable de formuler une définition satisfaisante de l’infinitésimal, lequel, fatalement, était considéré comme une quantité fixe plutôt que comme une variable auxiliaire ». 19. « Archimède a donc employé sa méthode heuristique simplement comme une recherche préliminaire à la démonstration rigoureuse par la méthode d’exhaustion. Ce n’est pas un geste généreux qui a incité Archimède à compléter sa "méthode mécanique" par une preuve du résultat au moyen rigoureux de la méthode d’exhaustion ; c’est plutôt par nécessité mathématique. [. . . ] Archimède était probablement bien conscient de l’absence de fondement solide à sa méthode et, pour cette raison, a refondu toute son analyse par les infinitésimaux dans le moule orthodoxe de la démonstration synthétique [. . . ] Cependant, les preuves formelles (à la fois mécanique et géométrique) de la proposition sont effectuées par la méthode d’exhaustion. » - 60/709 - 3.3. Les mathématiciens grecs La démonstration synthétique était non seulement un moule dans lequel les mathématiciens grecs se sont fondus, mais encore l’était-ce pour tous les mathématiciens jusqu’à Descartes qui, le premier, en sortit (cf. Bell 1939, p. 42). Voyons en quoi consiste la démonstration donnée par Archimède grâce à la méthode d’exhaustion. Elle concerne la proposition 24 de la Quadrature de la parabole dont l’énoncé est le suivant : « Tout segment compris entre une droite et une parabole est équivalent aux quatre tiers du triangle ayant même base et même hauteur que le segment. » (IREM de Basse Normandie 1999, p. 59) Voici la démonstration qu’en donne Archimède : « Soit le segment A∆BEΓ compris entre une droite et une parabole, et le triangle ABΓ ayant même base et même hauteur que ce segment. Soit K une aire équivalente aux quatre tiers du triangle ABΓ. Il faut démontrer que K est équivalent au segment A∆BEΓ. Si K n’est pas équivalent au segment, K est ou bien supérieur ou bien inférieur à ce segment. » (Ibid., p. 59) Archimède engage donc deux raisonnements successifs : « Que le segment A∆BEΓ soit d’abord, si possible, supérieur à l’aire K . Or nous avons inscrit [dans le segment] les triangles A∆B , BEΓ comme cela a été indiqué, et nous avons aussi inscrit, dans les segments restants, d’autres triangles ayant même base et même hauteur que ces segments, et nous continuons à inscrire dans les segments apparaissant successivement des triangles ayant même base et même hauteur que ces segments. Les segments restants finiront, dès lors, par être inférieurs à l’excès du segment A∆BEΓ sur l’aire K . Il s’ensuit que le polygone inscrit sera supérieur à l’aire K , ce qui est impossible. Nous avons, en effet, ici des aires disposées en une suite de raison quatre, d’abord le triangle ABΓ, quadruple de la somme des triangles A∆B et BEΓ, ces derniers quadruples des triangles inscrits dans les segments suivants, et ainsi de suite. Il est donc évident que la somme de toutes ces aires est inférieure aux quatre tiers de la plus grande ; mais [par hypothèse] l’aire K est équivalente aux quatre tiers de la plus grande aire [celle du triangle ABΓ]. Le segment A∆BEΓ n’est donc pas supérieur à l’aire K . » (Ibid., p. 59) Voici le pendant du premier raisonnement : - 61/709 - 3.3.1. La quadrature de la parabole chez Archimède « Qu’il soit, si possible, inférieur à K . Donnons-nous dès lors une aire Z équivalente au triangle ABΓ, une aire H équivalente au quart de Z une aire Θ équivalente au quart de H , et ainsi de suite, jusqu’à ce que là dernière aire soit devenue inférieure à l’excès de l’aire K sur le segment. Soit I cette plus petite aire. La somme des aires Z , H , Θ, I augmentée du tiers de l’aire I , est donc équivalente aux quatre tiers de l’aire Z . Mais l’aire K est elle aussi équivalente aux quatre tiers de l’aire Z . L’aire K est donc équivalente à la somme des aires Z , H , Θ, I , augmentée du tiers de l’aire I . Du moment donc que l’aire K dépasse la somme des aires Z , H , Θ, I d’une aire inférieure à I , et qu’elle dépasse le segment d’une aire supérieure à I , il est évident que la somme des aires Z , H , Θ, I est supérieure au segment, ce qui est impossible ; car il a été démontré que, si dans une suite d’aires, en nombre quelconque et de raison quatre, la plus grande est équivalente au triangle inscrit dans le segment, la somme de toutes ces aires est inférieure au segment. Il s’ensuit que le segment A∆BEΓ n’est pas inférieur à l’aire K . » (Ibid., p. 60) D’où la conclusion : « Mais on a démontré qu’il ne lui est pas non plus supérieur. Il est donc équivalent à l’aire K . Mais l’aire K est équivalente aux quatre tiers du triangle ABΓ. Par conséquent, le segment A∆BEΓ est lui aussi équivalent aux quatre tiers du triangle ABΓ. » (Ibid., p. 60) 3.3.1.8 Technologie dans La Quadrature de la Parabole : la réduction à l’absurde et la propriété de l’ordre des réels La méthode d’exhaustion s’appuie sur le principe de double réduction à l’absurde qui se résume ici à : (A ≮ B et A ≯ B) ⇒ A = B. Dans le langage moderne, A et B sont des réels. Archimède ne calcule pas des aires mais des rapports d’aires ; il utilise implicitement la relation d’ordre sur les réels. Une telle démonstration convainc davantage l’esprit qu’elle ne l’éclaire (cf. Arnaud et Nicole, La logique ou l’art de penser, 1674). En effet, le principe de réduction à l’absurde présuppose de connaître le résultat. « [. . . ] il est intéressant de noter la différence de conception entre la méthode de double réduction à l’absurde et le calcul intégral moderne : il n’y a ni passage à la limite, ni possibilité d’un raisonnement comportant un nombre infini d’étapes. Ce type de raisonnement ne permet donc, en toute rigueur, que la démonstration de résultats sur lesquels on a déjà formulé des conjectures. » (IREM de BasseNormandie 1999, p. 12) Tel est le principal défaut de ce principe. Il ne s’agit en aucun cas d’une méthode générale pour trouver de nouveaux résultats. - 62/709 - 3.3. Les mathématiciens grecs 3.3.1.9 Archimède et les praxéologies-déduction Nous avons vu qu’avec La Méthode, Archimède se situe dans le cadre des praxéologiesmodélisation : les surfaces qu’il considère sont des préconstruits ; la tâche qu’il poursuit est de les déterminer ; la technique employée est une expérience de pensée consistant à mettre en équilibre des segments, technique convaincante car s’appuyant sur le principe des leviers ; néanmoins, aux yeux mêmes de l’auteur, il ne s’agit pas d’une démonstration inattaquable. C’est dans La Quadrature de la Parabole qu’est faite la démonstration rigoureuse. Ce n’est pas pour autant que l’on a affaire, comme par opposition, à une praxéologie-déduction. En effet, la tâche que se fixe Archimède n’étant pas l’ordonnancement logique de concepts mathématiques et de leurs propriétés, il n’y a pas lieu de parler de praxéologie-déduction. 3.3.2 La tangente chez Apollonius de Perge Apollonius de Perge est un mathématicien grec (Perge, vers 262 av. J.-C. à environ 180 av. J.-C.). Son traité relatif aux sections coniques (cercle, ellipse, parabole, hyperbole) est l’une des grandes œuvres des mathématiques grecques. Nous allons considérer son texte relatif à la tangente à la parabole, notamment parce que Fermat va s’appuyer sur le résultat d’Apollonius de Perge pour valider sa méthode (cf. section 3.5.2.2, p. 81). 3.3.2.1 Tâche : déterminer la tangente à une parabole La tangente chez Apollonius n’est pas définie en tant que telle. À la lumière de la démonstration qu’il fait en affirmant avoir trouvé la tangente à une parabole (voir ci-dessous), on peut supposer qu’Apollonius considère une telle tangente comme la droite « qui touche la parabole en un seul point et qui ne tombe pas à l’intérieur ». Il s’agit d’une conception de type topologique (cf. IREM de Basse-Normandie 1999, p. 72) ou algébrique. « La notion de tangente issue de l’héritage grec est, sauf exception rarissime, de nature statique. La tangente touche la courbe sans la couper et on suppose le plus souvent qu’elle coupe la courbe en un seul point. » (Buekenhout 1992) Une telle conception ne résiste pas au cas de courbes même simples comme celle d’une fonction cubique dont la tangente coupe la courbe en deux points. La tangente ne semble donc pas avoir encore le statut actuel de concept mathématique et Apollonius n’en a pas besoin puisqu’il limite son champ d’action aux seules coniques. Pour le domaine qui l’intéresse, la tangente peut rester à l’état de préconstruit ; et la tâche entreprise par Apollonius de Perge consiste à déterminer ce préconstruit : il semble que nous ayons affaire ici à une praxéologiemodélisation comme avec Archimède avec La Méthode. - 63/709 - 3.3.2. La tangente chez Apollonius de Perge 3.3.2.2 Technique : construction géométrique ordonnée La Proposition XXXIII d’Apollonius de Perge s’énonce ainsi : « Si l’on prend un point sur une parabole ; et si de ce point, l’on abaisse une droite de manière ordonnée sur le diamètre, et si l’on pose une droite égale à celle que cette dernière droite découpe sur le diamètre, dans la direction de celui-ci, et à partir de ce sommet, la droite de jonction, menée du point ainsi obtenu au point que l’on a pris, sera tangente à la section. » (Apollonius de Perge, trad. 1923) Pour comprendre cette affirmation, quelques explications s’imposent. Tout d’abord, le diamètre d’une parabole est la droite qui coupe en deux parties égales toutes les cordes à la courbe menées parallèlement à une direction donnée. Toute droite parallèle à la direction donnée est appelée par Apollonius de Perge une droite menée d’une manière ordonnée : Ensuite, poser une droite égale à celle que cette dernière droite découpe sur le diamètre, dans la direction de celui-ci, et à partir de ce sommet signifie prendre sur le diamètre le point symétrique du point de découpe par rapport au sommet. Sur la figure illustrant ci-après la démonstration donnée par Apollonius, Γ est le point choisi de la parabole, ∆ est le point de découpe, E est le sommet de la parabole et A est le symétrique obtenu. La droite de jonction est la droite qui passe par les points A et Γ. Enfin, tangente à la section signifie tangente à la parabole, la parabole étant définie comme la section d’un cône par un plan parallèle à l’une de ses génératrices. La formulation donnée par Apollonius est très concise, pour ne pas dire dépouillée. En particulier, à l’instar de la plupart des auteurs de son temps, Apollonius ne nous informe pas sur la genèse de sa construction géométrique : comment lui est venue l’idée d’une telle construction ? Cherchait-il la tangente à la parabole ou s’agissait-il d’un résultat trouvé par hasard ? - 64/709 - 3.3. Les mathématiciens grecs 3.3.2.3 Technologie : une tangente à une parabole n’a qu’un point commun avec elle et lui est extérieure ; réduction à l’absurde Pour démontrer la Proposition XXXIII, Apollonius s’appuie sur la Proposition XX dont voici l’énoncé : « Si, dans une parabole, l’on mène deux droites d’une manière ordonnée de la section sur le diamètre, les droites qu’elles découpent sur ce diamètre, du côté du sommet, seront entre elles comme les carrés des premières droites. » (Apollonius de Perge, trad. 1923) Cette proposition pourrait se traduire par : « les ordonnées des points d’une parabole sont entre elles comme les carrés des abscisses de ces points », pour autant que l’axe des abscisses soit le diamètre et celui des ordonnées, la direction conjuguée. Venons-en à la démonstration proprement dite de la Proposition XXXIII : « Soit une parabole dont un diamètre est la droite AB. Abaissons une droite Γ∆ de manière ordonnée ; posons une droite AE égale à la droite E∆, et menons la droite de jonction AΓ. Je dis que la droite AΓ prolongée tombera à l’extérieur de la section. En effet qu’elle tombe à l’intérieur comme la droite ΓZ, et abaissons la droite HB de manière ordonnée. Dès lors, puisque le rapport du carré de BH au carré de Γ∆ est plus grand que celui du carré de ZB au carré de Γ∆ ; mais que le carré de BA est au carré de A∆ comme le carré de ZB est au carré de Γ∆, et que BE est à ∆E comme le carré de HB est au carré de Γ∆, il s’ensuit que le rapport de BE à E∆ est plus grand que celui du carré de BA au carré de A∆. Or le quadruple du rectangle délimité sous BE, EA est au quadruple du rectangle délimité sous AE, E∆ comme BE est à E∆ ; donc le rapport du quadruple du rectangle délimité sous BE, EA au quadruple du rectangle délimité sous AE, E∆ est plus grand que celui du carré de BA au carré de A∆. Dès lors, par permutation, le rapport du quadruple du rectangle délimité sous BE, EA au carré de AB est plus grand que celui du quadruple rectangle délimité sous AE, E∆ au carré de A∆ ; ce qui ne peut avoir lieu car, E∆ étant égal à AE, le quadruple du rectangle délimité sous - 65/709 - 3.3.3. Mathématiciens grecs et praxéologies-modélisation AE, E∆ équivaut au carré de A∆, et le quadruple du rectangle délimité sous BE, EA est moindre que le carré de BA, puisque le point E n’est pas le milieu de la droite AB. Dès lors la droite AΓ ne tombe pas à l’intérieur de la section, donc elle lui est tangente. » (Apollonius de Perge 1923) Pour ne pas alourdir notre propos, nous ne « traduirons » pas la démonstration d’Apollonius en termes modernes. Comme annoncé plus haut, nous observons que la démonstration d’Apollonius s’appuie sur la conviction qu’une tangente n’a qu’un point de contact avec la courbe et qu’elle reste à l’extérieur de celle-ci. Cela introduit une forte limitation quant au champ d’application de la technique proposée : elle ne concerne que les courbes convexes. La démonstration se termine par l’usage du raisonnement par l’absurde qui achève de convaincre le lecteur à défaut de l’éclairer. De plus, on ne trouve chez Apollonius aucune considération infinitésimale. En particulier, le raisonnement proposé reste valable que les points Γ et H soient proches ou éloignés l’un de l’autre. Enfin, le recours à la Proposition XX interdit toute généralisation de la démarche d’Apollonius à d’autres courbes. En se plaçant dans le contexte étroit de la parabole, il est impossible de voir apparaître une technique plus générale qui serait éventuellement de nature infinitésimale. 3.3.2.4 Apollonius de Perge et praxéologie-modélisation Si la tâche visée par Apollonius (déterminer le préconstruit qu’est une tangente à une parabole) peut laisser espérer avoir affaire à une praxéologie-modélisation, le discours technologique qu’il formule nous convainc qu’il n’en est pas ainsi. En effet, ce discours se fonde sur la raisonnement par l’absurde et non sur une validation pragmatique ou expérimentale. On pouvait s’en douter à partir du moment où, à l’instar de ses contemporains — à l’exception notable mais singulière d’Archimède avec La Méthode —, Apollonius de Perge ne nous fait pas part de la méthode heuristique employée pour trouver le résultat donné. 3.3.3 Mathématiciens grecs et praxéologies-modélisation À travers ces deux exemples que nous croyons significatifs, on observe que les mathématiciens grecs sont en mesure de trouver des résultats qui seront plus tard le champ d’application privilégié de la dérivée ou du calcul intégral alors même qu’ils n’en soupçonnent pas l’existence. Les aires et volumes comme les tangentes sont déterminés alors qu’ils ne sont pas explicitement définis. Cela rapproche leur démarche des praxéologies-modélisation. Grâce à eux, on voit émerger des techniques qui ont, certes, un caractère assez local mais qui seront autant de sources d’inspiration des mathématiciens européens une fois leurs travaux redécouverts. En revanche, l’époque grecque est peu prolixe quant à la méthode heuristique employée pour trouver un résultat. Il en résulte que, d’ordinaire, le discours technologique (validation des techniques), se basant sur une démonstration par l’absurde, ne cadre pas avec une praxéologie-modélisation, dans laquelle la validation est pragmatique ou expérimentale, qu’il s’agisse d’une expérience physique ou d’une expérience de pensée. - 66/709 - 3.4. Foisonnement de découvertes (première moitié du XVIIe siècle) Foisonnement de découvertes (première moitié du XVIIe siècle) 3.4 3.4.1 Redécouverte des mathématiciens grecs À partir du Bas Moyen-Âge, la culture grecque est peu à peu redécouverte en Europe avec comme conséquence progressive majeure le rejet de la rigueur des méthodes démonstratives anciennes au profit de méthodes heuristiques nouvelles, dont la caractéristique, outre leur fécondité, est d’être vérifiables à défaut d’être légitimes : en effet, les mathématiciens du XVIIe siècle, en guise de validation, vont appliquer leurs nouvelles méthodes à des problèmes résolus par les Anciens ; en revanche, en l’absence d’une théorie mathématique suffisamment élaborée, le domaine de validité de ces nouvelles méthodes ne peut encore être démontré mathématiquement. « Après une période d’éclipse quant aux découvertes d’ordre scientifique, l’Europe savante, encore peu préoccupée par la transmission de l’héritage antique, émerge peu à peu à partir du XIe siècle avec la création des premières universités. L’héritage philosophique et scientifique grec lui est alors communiqué grâce à des traductions et commentaires arabes, par le canal du commerce méditerranéen, et grâce au travail des érudits byzantins, du fait des contacts avec le monde chrétien d’Orient. De nombreux textes de l’Antiquité sont ainsi redécouverts par le microcosme des savants, et seront diffusés plus largement après l’invention de l’imprimerie. Les mathématiciens européens se trouvent alors devant un corpus considérable de résultats et de démonstrations, souvent difficile à lire et à comprendre, et qui semble insurpassable. Tout travail nouveau est alors mesuré, légitimé à l’aune des méthodes anciennes. En ce qui concerne les quadratures, c’est évidemment le cas de la méthode de double réduction à l’absurde. Elle ne donne pas de méthode de découverte, et elle est, de plus, longue, et difficile à manipuler. Elle force l’admiration aux dépens de la compréhension de ses ressorts. Peu à peu des idées nouvelles vont voir le jour, de nouvelles méthodes vont se mettre en place, dont la caractéristique commune sera l’abandon, plus ou moins important, de la rigueur grecque. Ces méthodes de découverte, qui relèvent d’une heuristique nouvelle, ne sont plus légitimes, mais elles conduisent à des résultats, féconds de surcroît, puisque "vérifiables" dans les cas déjà connus des Anciens ; il n’est pas question de renoncer aux découvertes qu’elles permettent. Vont donc coexister, jusqu’à la fin du XVIIe siècle, deux démarches parallèles et concurrentes : l’heuristique et la démonstrative, en l’attente de nouveaux critères de validation ou de légitimation, c’est-à-dire jusqu’à la création du calcul infinitésimal proprement dit, voire jusqu’à sa conceptualisation rigoureuse. Les problèmes d’évaluation d’aires et de détermination des tangentes restent au centre des préoccupations des mathématiciens. Les recherches sont relancées par la découverte et l’utilisation de nouvelles courbes, ou de nouvelles propriétés de courbes anciennes. » (IREM de Basse-Normandie 1999, p. 79) Ainsi, contrairement à la culture dominante du mathématicien d’aujourd’hui, la priorité n’est ni la construction d’une théorie mathématique ni la démonstration inattaquable de - 67/709 - 3.4.2. Volumes et aires chez Cavalieri théorèmes et de propriétés. Le mode de validation est, à cette époque, davantage pragmatique que démonstratif. Ce qui compte avant tout est la découverte de résultats utiles aux progrès des sciences de l’époque ; si une méthode est efficace en ce sens, elle sera utilisée avant même de démontrer son éventuelle rigueur mathématique. Au XVIIe siècle, les mathématiciens s’intéressent toujours aux problèmes de quadrature/cubature et de tangente mais s’ajoutent désormais la cinématique, les problèmes d’optimisation et la question de l’infini (que les mathématiciens grecs cherchaient à éviter). C’est ainsi que les auteurs de Aux origines du calcul infinitésimal classent les manières d’aborder les problèmes sur lesquels vont s’exercer les nouvelles méthodes : 1˚) « Les quadratures (calcul ou encadrement d’aires, par comparaison avec des aires rectilignes), mais aussi les cubatures (calcul exact ou approché de volumes), les longueurs, les centres de gravité, etc. : les principales idées nouvelles sont alors les indivisibles et les sommes infinies. 2˚) Les mouvements : quelle relation y a-t-il entre vitesse et distance parcourue ? Ces problèmes viennent entre autres de l’étude de la chute des corps. Ils posent à un moment ou à un autre, le problème de la vitesse instantanée, de sa définition, de son statut. 3˚) Les tangentes : en particulier pour les nouvelles courbes étudiées, et en liaison avec l’optique et la cinématique. L’interaction avec la rubrique précédente conduit à la méthode cinématique de Torricelli ou à celle de Roberval. L’interaction avec la suivante conduit à la méthode de Fermat. 4˚) L’optimisation : les problèmes de minima et maxima, peu abordés dans la mathématique grecque, si ce n’est par Apollonius, sont liés maintenant à l’étude des mouvements des planètes et de leur position par rapport au Soleil. 5˚) L’utilisation quasi-explicite ou assumée de l’infini : l’infiniment grand dans des sommations ou dans des raisonnements par récurrence, l’infiniment petit dans l’usage d’éléments indivisibles et leur addition, l’équivalence d’un petit segment de courbe avec sa tangente, la comparaison d’infiniments petits d’ordres différents, etc. » (IREM de Basse-Normandie 1999, p. 80) Dans les paragraphes qui suivent, nous allons donner l’un ou l’autre exemple des méthodes mises au point par les mathématiciens de l’époque, à savoir la méthode des indivisibles pour déterminer les aires et volumes chez Cavalieri ; l’application modifiée de cette méthode pour déterminer une vitesse moyenne chez Galilée ; et la détermination d’une tangente à une courbe chez Roberval. 3.4.2 Volumes et aires chez Cavalieri Nous sommes au XVIIe siècle, une époque où les mathématiciens ignorent comment les mathématiciens grecs ont eu l’intuition des résultats qu’ils démontrent. Rappelons que La Méthode d’Archimède n’a pas encore été redécouverte. D’où la nécessité d’inventer autre chose : - 68/709 - 3.4. Foisonnement de découvertes (première moitié du XVIIe siècle) « Lorsqu’après quinze siècles de ténèbres, le flambeau des sciences vint à se rallumer, que les écrits d’Euclide et d’Archimède furent traduits et commentés, on chercha à retrouver le fil qui avait pu les diriger dans leurs découvertes ; mais on ne tarda point à s’apercevoir qu’ils s’étaient beaucoup plus occupés de convaincre que d’éclairer leurs contemporains : on fut donc obligé de quitter leurs traces, et de penser à se frayer des routes nouvelles. Telles furent sans doute les raisons qui portèrent Cavalieri à se départir de cette extrême rigueur, et le conduisirent à la méthode des indivisibles, par laquelle il regarda les lignes comme composées de points, les surfaces comme composées de lignes, et les solides comme composés de surfaces. » (Lacroix, 1797, p. vi) La composition dont parle Lacroix est un raccourci pratique mais inexact. En effet, Bonaventura Cavalieri (1598–1647) détermine deux aires à partir d’un même découpage en lignes mais il se garde bien de dire que les lignes constituent la surface (nous y reviendrons plus loin, p. 72). 3.4.2.1 Tâche : déterminer une aire/un volume Quoi qu’il en soit, Cavalieri se fixe de déterminer (tâche) l’aire d’une « figure plane quelconque » (Cavalieri 1635, Livre II, définition I). Il étend son ambition au calcul du volume d’un solide quelconque. La nouveauté par rapport aux mathématiciens grecs est que Cavalieri ne cherche plus l’aire de telle ou telle figure plane ou le volume de tel ou tel solide, mais bien l’aire d’une figure plane quelconque et le volume d’un solide quelconque. Il fait preuve donc ici à la fois d’une volonté de trouver de nouveaux résultats et d’une volonté de généralisation. C’est donc un pas important vers la modélisation. 3.4.2.2 Technique : la méthode des indivisibles Selon notre grille d’analyse en termes de praxéologies, après avoir identifiée la tâche que s’assigne Cavalieri, analysons quelle est la technique qui lui permet de l’accomplir. Cette technique s’appuie sur la méthode des indivisibles, inventée par lui 20 et développée par Roberval et Torricelli. Nous allons voir que la méthode des indivisibles n’est pas encore du calcul intégral mais qu’elle en est une préfiguration. La notion d’indivisibles chez Cavalieri revient à considérer une accumulation de lignes (dans le cas d’une aire) ou de surfaces (dans le cas d’un volume) engendrées par le mouvement d’un plan se déplaçant parallèlement à lui-même. Un tel découpage n’est pas sans rappeler celui opéré par Archimède dans la quadrature de la parabole ; mais ici, le découpage est dynamique. Voyons la définition donnée par Cavalieri dans le cas d’une figure plane : 20. Les historiens ont découvert depuis qu’elle est d’abord énoncée par Liu Hui au IIIe siècle. - 69/709 - 3.4.2. Volumes et aires chez Cavalieri « Soit donnée une figure plane quelconque avec ses deux tangentes opposées ; menons deux plans parallèles passant par ces tangentes ; ces plans peuvent être perpendiculaires ou obliques par rapport au plan de la figure, et on les suppose prolongés indéfiniment des deux côtés. L’un de ces deux plans se meut vers l’autre, en restant toujours parallèle, jusqu’à venir se confondre avec cet autre plan. On considère chaque fois les lignes droites qui sont engendrées durant tout le mouvement comme intersections du plan mobile et de la figure donnée, nous appellerons ces lignes, lorsqu’on les prend toutes à la fois, "toutes les lignes de cette figure", déterminées en prenant pour direction l’une des ces lignes. » (Cavalieri, 1635, Livre II, définition I) Cavalieri ne définit pas chacune des lignes mais il les considère comme un ensemble indivisible qu’il appelle « toutes les lignes de cette figure ». Ces lignes sont obtenues par une expérience de pensée pseudo-cinématique consistant à prendre toutes les intersections entre la figure plane et un plan qui « se meut ». Ainsi, pour Cavalieri, une surface est vue comme une juxtaposition de lignes parallèles, ces lignes étant des segments de droites parallèles. Chaque ligne est appelée un indivisible de la surface dont on cherche l’aire. Le principe de Cavalieri est alors de dire que si deux surfaces sont constituées de lignes de même longueurs, elles ont même aire et, plus généralement, que si les indivisibles respectifs, pris deux à deux sont tous dans un même rapport, alors les aires sont également dans le même rapport. Un principe analogue existe pour les volumes 21 : si deux solides sont constitués de sections transversales planes de même aires, ils ont même volume et, plus généralement, si les indivisibles respectifs, pris deux à deux sont tous dans un même rapport, alors les volumes sont également dans le même rapport. La méthode est d’un très grande efficacité pour retrouver, par exemple, le volume d’un cône : Considérons un cône de base S quelconque et de hauteur H. La méthode des indivisibles permet de déformer les sections planes du cône. Si leur aire est inchangée alors le cône et le solide déformé ont même volume. C’est ainsi que l’on peut démontrer que le volume d’un cône est égal au tiers du volume du cylindre de même hauteur et de même base. 21. Un solide est alors vu comme une succession de sections transversales. - 70/709 - 3.4. Foisonnement de découvertes (première moitié du XVIIe siècle) Chaque section transversale plane du cône est déformée en un rectangle de même aire h2 22 et de largeur arbitraire (mais fixe) k. Or Ss = H . Le solide obtenu est donc un cylindre 2 (présenté renversé sur la figure ci-dessus à droite 23 ) de hauteur k et de base le triangle curviligne OAB avec OA = H, AB = S/k. Le côté OB décrit une parabole. Le volume de ce cylindre, donc le volume du cône, vaut l’aire du triangle curviligne multiplié par k, c’est-àdire, avec les notations fonctionnelles actuelles, l’aire sous la courbe y = S/k x2 avec x variant H2 de 0 à H. Ainsi, le calcul du volume d’un cône se ramène-t-il à celui de l’aire sous une parabole. Cavalieri ramène également le calcul du volume d’une sphère à celui de l’aire sous une parabole. Ainsi, un même calcul profite à plusieurs problèmes. On va bien dans le sens d’une généralisation de la méthode par l’émergence d’une catégorisation en classes de problèmes. 3.4.2.3 Technologie : validation pragmatique Comment Cavalieri justifie-t-il que sa technique permet bien d’accomplir la tâche qu’il s’est fixée ? Sa démarche est avant tout pragmatique : il va vérifier que les résultats obtenus par sa méthode sont compatibles avec les résultats obtenus par d’autres méthodes ayant fait leurs preuves. « Le soin qu’il eut de vérifier sa méthode, recommandable par la brièveté qu’elle apportait aux démonstrations, en comparant les résultats qu’elle donnait avec ceux que les Anciens avaient prouvés à leur manière, lui inspira le courage de s’aventurer pour ainsi dire dans un pays nouveau. Il fut attaqué sur ses principes, mais il se défendit, en montrant qu’ils pouvaient être traduits dans ceux d’Archimède. "Ces surfaces et ces lignes dont Cavalieri examine les rapports, dit Montucla, ne sont antre chose que les petits solides ou les triangles inscrits et circonscrits d’Archimède, poussés à un si grand nombre, que la différence avec la figure qu’ils environnent, soit moindre que toute grandeur donnée ; mais tandis qu’Archimède à chaque fois qu’il entreprend de démontrer les rapports d’une figure curviligne avec une autre connue, emploie un long circuit de paroles, et un tour indirect de démonstrations ; le Géomètre moderne s’élançant en quelque sorte dans l’infini, va saisir par l’esprit le dernier terme de ces divisions et de ces sous-divisions continuelles, qui doivent enfin anéantir (ou plus exactement, qui tendent à anéantir. . . ) la différence entre les figures rectilignes inscrites et circonscrites, et les figures curvilignes. Le mot d’indivisible est impropre si l’on veut, mais il n’en résulte aucun danger pour la Géométrie", j’ajouterai, lorsqu’il est rappelé à sa juste valeur, et qu’on a fait voir qu’il ne doit être regardé que comme une expression abrégée. » (Lacroix, 1797, p. vi) 22. Pour s’en convaincre, on peut passer par un solide intermédiaire, un cône circulaire droit de base S et de hauteur H. Si R est le rayon de sa base et r le rayon d’une section transversale à la hauteur h, par le r h2 h r2 πr 2 s = R , donc H théorème de Thalès on a H 2 = R2 = πR2 = S . 23. figure trouvée sur le site Wikipedia (http://fr.wikipedia.org/wiki/Méthode_des_indivisibles) - 71/709 - 3.4.2. Volumes et aires chez Cavalieri Les critiques dont il est question sont venues déjà de ses contemporains, pour au moins deux raisons : la première est que Cavalieri ne définit pas clairement ce qu’est un indivisible ; la seconde est que sa méthode ne conduit pas nécessairement à un résultat correct. Par exemple, selon le principe de Cavalieri, si les indivisibles sont dans un rapport k entre deux figures, leurs aires sont aussi dans un rapport k. Or, ce principe permettrait de dire que l’aire du triangle ABC et celle du triangle ADC (figure ci-après 24 ) seraient en rapport k = l/L, alors que l’on sait que ces deux aires sont égales. Cavalieri pense d’abord que ce paradoxe provient de son découpage qui ne suit pas les mêmes directions mais, suite à la découverte d’autres paradoxes, il sent bien que sa méthode comporte un risque. « Ce faisant, Cavalieri tente de dépasser les débats philosophiques sur le continu, tels qu’on les trouve discutés chez Galilée, par exemple : la ligne est-elle formée de points, et une surface de lignes, alors que ceux-ci sont "sans grandeur" ou celleslà sont "sans épaisseur" ? Cavalieri indique d’ailleurs que son projet n’est pas de "composer le continu avec des indivisibles", i. e. de construire des volumes avec des surfaces ou ces dernières avec des lignes : il cherche simplement à comparer les solides ou les surfaces — ce qui est bien le projet de toute cubature ou quadrature — en comparant, terme à terme puis "en somme", les surfaces ou les lignes que l’on peut y découper. » (IREM de Basse-Normandie 1999, p. 264) Torricelli proposera une solution en donnant une épaisseur aux indivisibles, ouvrant ainsi la porte au calcul intégral : pour lui, la cause du paradoxe exposé ci-dessus est que les indivisibles du triangle ABC sont plus épais que ceux du triangle ADC. Finalement, la méthode de Cavalieri, aussi imparfaite soit-elle, a permis à elle seule de déterminer une multitude d’aires et de volumes, ce que les mathématiciens grecs n’étaient pas parvenus à faire. La validation pragmatique de sa méthode aura montré ses limites : prouver qu’un résultat est correct dans plusieurs cas particuliers — fussent-ils nombreux — ne suffit pas à rendre une méthode universelle. 24. Source : http://fr.wikipedia.org/wiki/Méthode_des_indivisibles. - 72/709 - 3.4. Foisonnement de découvertes (première moitié du XVIIe siècle) 3.4.2.4 Cavalieri et les praxéologies-modélisation Ainsi, tant par la tâche qu’il se fixe (détermination d’aires et volumes qui sont des préconstruits) que par son discours technologique (validation pragmatique), Cavalieri se situe dans le cadre des praxéologies-modélisation. Il ne dispose pas d’une théorie assez vaste pour (in)valider sa méthode dans son universalité mais, dans un certain champ d’application, elle lui permet de réaliser sa tâche efficacement. 3.4.3 3.4.3.1 Le mouvement uniforme et uniformément accéléré chez Galilée Tâche : déterminer la vitesse moyenne d’un mouvement uniformément accéléré Galilée (1564–1642), est plus connu du grand public comme physicien et astronome que comme mathématicien. Or, précisément, c’est grâce aux mathématiques qu’il est en mesure de vérifier par calcul certaines de ses intuitions. Il était également ingénieur et s’intéressait à la trajectoire des projectiles comme à la chute des corps, découvrant qu’ils étaient mus par un mouvement uniformément accéléré. C’est sans doute ainsi qu’il s’est intéressé à la détermination de la vitesse moyenne dans le cas d’un tel mouvement. Voici ce qu’il affirme : « Le temps pendant lequel un espace quelconque est franchi par un mobile, partant du repos, avec un mouvement uniformément accéléré, est égal au temps pendant lequel le même espace serait franchi par le même mobile avec un mouvement uniforme, dont le degré de vitesse serait la moitié du plus grand et dernier degré de vitesse atteint au cours du mouvement uniformément accéléré. » (Galilée, trad. 1970) Avec les notations actuelles, Galilée écrit que si un mobile est mû par un mouvement uniformément accéléré avec une vitesse initiale nulle, alors il aura parcouru, dans le même temps t, la même distance qu’un mobile se déplaçant à la vitesse constante égale à la moitié de la vitesse maximale atteinte par le premier mobile au bout du temps t. 3.4.3.2 Technique : la méthode des indivisibles modifiée Pour obtenir le résultat précédent, Galilée commence par faire une représentation de la vitesse d’un mouvement uniformément accéléré en fonction du temps : « Représentons par la ligne AB le temps pendant lequel un mobile, partant du repos en C, franchira d’un mouvement uniformément accéléré l’espace CD ; on représentera le plus grand et dernier des degrés de vitesse acquis durant l’intervalle de temps AB par la ligne EB, formant avec AB un angle droit ; menons AE : les lignes équidistantes et parallèles à BE, tirées des différents points de la ligne AB, représenteront les degrés croissants de vitesse après l’instant initial A. » (Galilée, trad.1970) - 73/709 - 3.4.3. Le mouvement uniforme et uniformément accéléré chez Galilée Dans cette représentation, trois grandeurs cinématiques sont en jeu : le temps, la vitesse et la distance parcourue. Cependant, selon nos schémas fonctionnels, la distance parcourue CD n’y est pas liée au temps écoulé. En revanche, toujours selon nos schémas fonctionnels, le segment AB représente le temps qui s’écoule tandis que le segment AE représente la vitesse instantanée du mobile en fonction du temps. Il n’est pas question de la mesure quantitative de ces grandeurs mais il y a bien un lien fonctionnel entre les deux grandeurs ainsi qu’une proportionnalité qualitative entre, d’une part les temps "lus" sur "l’axe" du temps et, d’autre part les vitesses instantanées "lues" sur "l’axe" perpendiculaire. Ensuite, Galilée construit le rectangle AGF B dont l’aire est égale à l’aire du triangle AEB, elle-même égale à la distance parcourue CD. Pour ce faire, il choisit le point F , milieu de EB, ce qui revient bien à considérer la vitesse constante comme étant égale à la moitié de la vitesse maximale atteinte par le mobile évoluant selon un mouvement uniformément accéléré. Ainsi, selon chacune des lois de mouvement, le mobile aura parcouru la même distance dans le même temps : « Divisons BE en son milieu par le point F et menons F G et AG respectivement parallèles à AB et F B ; le parallélogramme AGF B sera égal au triangle AEB, puisque CF coupe AE en son milieu, I, et que si, d’autre part, on prolonge les lignes du triangle AEB jusqu’à GIF , la somme de toutes les parallèles contenues dans le quadrilatère sera égale à la somme des parallèles comprises dans le triangle AEB : en effet les parallèles du triangle IEF sont équivalentes à celles du triangle GIA, et celles que contient le trapèze AIF B sont communes. Comme à tous les instants, pris un à un, de l’intervalle de temps AB correspondent tous les points, pris un à un, de la ligne AB, et comme les parallèles menées à partir de ces points à l’intérieur du triangle AEB représentent les degrés croissants de la vitesse grandissante, tandis que de leur côté les parallèles contenues dans le parallélogramme représenteront autant de degrés d’une vitesse non croissante, il s’ensuit que la somme des moments de vitesse, telle que l’expriment d’une part les parallèles croissantes du triangle AEB, et d’autre part les parallèles égales du parallélogramme GB, est la même dans le mouvement accéléré et dans le mouvement uniforme ; en effet, les moments qui font défaut dans la première moitié du mouvement accéléré (c’est-à-dire ceux que représentent les parallèles du triangle AGI) sont compensés par les moments que représentent les parallèles du triangle IEF . Il est donc clair que des distances égales seront traversées en des temps égaux par deux mobiles dont l’un, partant du repos, se meut d’un mouvement - 74/709 - 3.4. Foisonnement de découvertes (première moitié du XVIIe siècle) uniformément accéléré, et dont l’autre, animé d’un mouvement uniforme, se déplace avec un moment de vitesse égal à la moitié du plus grand moment de vitesse atteint par le premier. C.Q.F.D. » (Galilée, trad. 1970) Lorsque Galilée considère « les lignes équidistantes et parallèles à BE, tirées des différents points de la ligne AB », il s’agit d’indivisibles au sens de Cavalieri. Mais l’argumentation de Galilée consiste à observer que les indivisibles respectifs des triangles AGI et EF I, de même sommet I, forment des surfaces de même aire : l’égalité des aires ne vient pas d’une égalité ou d’une proportionnalité entre les indivisibles mais d’un jeu de compensation de ceux-ci. Galilée utilise les indivisibles mais pas le principe de Cavalieri au sens strict du terme. On remarquera aussi l’audace avec laquelle Galilée assimile les aires à « la somme des moments de vitesse » alors que Cavalieri se contente de comparer deux grandeurs sans assimiler chacune à l’ensemble de ses indivisibles. 3.4.3.3 Galilée et les praxéologies-modélisation Galilée se place lui aussi dans le cadre des praxéologies-modélisation. En effet, la vitesse instantanée qui intervient dans la détermination de la vitesse moyenne est un préconstruit ; en guise de modélisation, la vitesse moyenne est assimilée à une aire géométrique. Pour cela, il traduit la situation cinématique en termes géométriques. Quant au discours technologique, il est réduit à sa plus simple expression : Galilée a besoin de trouver des résultats ; il est convaincu que ceux qu’il obtient sont corrects et cela lui suffit. 3.4.4 3.4.4.1 La tangente chez Roberval Tâche : déterminer la tangente à une courbe Gilles Personne de Roberval (1602–1675) s’est intéressé aux tangentes d’un certain nombre de courbes, notamment des coniques. Nous retiendrons en particulier le cas de la parabole. Roberval dénomme touchantes ce que nous appelons désormais les tangentes, selon un usage assez répandu à l’époque (cf. IREM de Basse-Normandie 1999, p. 89). Cela montre que le concept de tangente n’a pas encore évolué fondamentalement par rapport à la conception qu’en avaient les mathématiciens grecs : la droite qui touche la courbe en un point et reste extérieure à cette courbe. C’est donc un préconstruit que Roberval entreprend de déterminer, ce qui nous place à nouveau dans le cadre des praxéologies-modélisation. - 75/709 - 3.4.4. La tangente chez Roberval 3.4.4.2 Technique : la cinématique Galilée, dans l’exemple que nous avons donné au paragraphe précédent, avait transposé un problème cinématique en un problème géométrique. Roberval, ici, transpose un problème géométrique (la détermination d’une tangente) en un problème cinématique. Voyons pourquoi. « L’utilisation de la cinématique pour étudier les tangentes est clairement liée à l’étude de la chute des corps, et des mouvements des projectiles. À la suite de Galilée, Torricelli — qui, comme Roberval, vulgarisa par ailleurs la méthode des indivisibles — s’emploie à décrire le mouvement plan d’un projectile comme composé de deux mouvements, l’un horizontal uniforme, l’autre vertical uniformément accéléré. La trajectoire du projectile possède en chaque point une tangente que l’on trouve en composant les deux vitesses, horizontale et verticale. L’idée de cette méthode, reprise ici par Roberval, consiste donc, pour étudier la tangente à une courbe, à définir, si possible, cette courbe comme une trajectoire, puis à appliquer le principe ci-dessus. Cette méthode est assez efficace pour des courbes dont la définition point par point se fait de manière cinématique, comme la roulette ou cycloïde, ou encore les conchoïdes. Mais de façon générale, il n’est pas si évident qu’une courbe quelconque, définie par des propriétés géométriques non cinématiques, puisse être systématiquement décrite par une définition cinématique simple qui aboutisse à ce que l’on appelle aujourd’hui encore la composition des vitesses. C’est le problème posé par plusieurs courbes rencontrées à cette époque, par exemple en optique, voire même de certaines courbes algébriques bien connues et considérées comme élémentaires, par exemple les coniques. En effet, si on connaît depuis longtemps des définitions cinématiques des coniques [. . . ], la découverte de mouvements à composer appropriés, et de surcroît uniformes, est le plus souvent d’origine synthétique, c’est-à-dire liée à la connaissance préalable de telle ou telle propriété tangentielle de la courbe. » (IREM de Basse-Normandie 1999, pp. 88-89) Cette technique contient donc en elle-même ses potentialités et ses limitations. En particulier, il ne s’agit pas d’une méthode généralisable à toute courbe. Néanmoins, la cinématique permet la modélisation de certaines courbes. En pratique, Roberval va décrire la courbe étudiée par la composition de deux mouvements simples, puis montrer que cette définition permet la construction explicite d’une infinité de points de la courbe et, enfin, donner la construction de la tangente en un point de la courbe. « Dans ses Observations [sur la Composition des Mouvements, et sur le Moyen de trouver les Touchantes des Lignes Courbes], avant d’aborder le cas de la cycloïde, Roberval traite de la tangente à la parabole. Il utilise la définition par égalité des distances au foyer et à la directrice, ce qui permet de construire, à la règle et au compas, autant de points que l’on veut de la courbe. Il décrit ensuite certains mouvements composés d’un point de la parabole, ce qui permet de tracer la tangente. » (Ibid., p. 171) En substance, la tangente est obtenue comme droite portée par la diagonale d’un parallélogramme. La lecture du texte de Roberval (cf. IREM de Basse-Normandie 1999, pp. 172-174) montre que la technique qu’il emploie ne comporte aucun argument d’ordre infinitésimal. - 76/709 - 3.4. Foisonnement de découvertes (première moitié du XVIIe siècle) 3.4.4.3 Technologie : un axiome selon lequel la vitesse (vectorielle) est tangente à la trajectoire Comment Roberval justifie-t-il sa méthode ? Il pose comme axiome que la direction du mouvement est la tangente cherchée et considère tenir ainsi une démonstration suffisante : « Axiome, ou principe d’invention La direction du mouvement d’un point qui décrit une ligne courbe, est la touchante de la ligne courbe en chaque position de ce point-là. Le principe est assez intelligible, et on l’accordera facilement dès qu’on l’aura considéré avec un peu d’attention. Règle générale Par les propriétés spécifiques de la ligne courbe (qui vous seront données) examinez les divers mouvements qu’a le point qui la décrit à l’endroit où vous voulez mener la touchante : de tous ces mouvements composés en un seul, tirez la ligne de direction du mouvement composé, vous aurez la touchante de la ligne courbe. La démonstration est mot à mot dans notre principe. Et parce qu’elle est très générale, et qu’elle peut servir à tous les exemples que nous en donnerons, il ne sera point à propos de la répéter. » (cité par IREM de Basse-Normandie 1999, p. 91) Prendre pour démonstration ce qui n’est qu’un principe serait jugé fort court aujourd’hui. . . Néanmoins, Roberval, par ce principe, définit de manière très novatrice la tangente par le biais des vitesses. « L’axiome, ou principe d’invention [. . . ], malgré la concision de sa "démonstration", opère un remarquable changement de point de vue par rapport à la pensée antique. En termes modernes, Roberval affirme — c’est un axiome ! — que le "vecteur-vitesse" est un "vecteur" tangent à la trajectoire du mouvement. Si, de plus, on sait composer les vitesses, il ne reste plus qu’à connaître les "vecteursvitesses" des différents mouvements qui composent le mouvement global pour obtenir une tangente à la courbe considérée. Cette composition s’apparente à la somme vectorielle par la "règle du parallélogramme". On voit que sous des apparences anodines l’axiome et la règle générale de Roberval auront une postérité importante. » (Ibid., p. 96) Roberval, du moins dans le cas de la tangente à la parabole, opère une validation pragmatique de sa méthode en vérifiant que sa construction est équivalente à celle d’Apollonius de Perge : « Pour montrer que notre façon de trouver les touchantes de la Parabole, s’accorde avec celle d’Apollonius livre I. Proposition 33, et pour le trouver en quelque façon analytiquement, posons qu’il soit vrai que LEC touche la Parabole en E. Si donc nous abaissons l’ordonnée EI, IF sera égale à F C, et ajoutant F B à IF , et F A à CF , les toutes CA et IB seront égales (car les ajoutées le sont par la construction) mais IB est égale à AE par notre construction, donc CA et AE sont égales, et l’angle ACE égal à l’angle AEG ; mais par notre construction nous avons divisé - 77/709 - 3.4.5. Conclusion : fin de la préhistoire de la dérivée. l’angle AEH en deux également, et par conséquent nous avons fait AEC, CEH égaux entr’eux, donc ACE est égal à CEH son alterne, ce qui est vrai, car par la construction EH est parallèle à CI. Ou si vous aimez mieux, puisque CI, EH sont parallèles, l’angle ACE est égal à CEH ; mais par la construction CEH est égal à AEC, donc ACE et AEC, sont égaux, et le triangle ACE isocèle, donc CA est égale à AE. Mais encore par la construction AE est égale à BI, CA est donc égale à BI, et en ôtant les égales AF , BF , CF sera égale à F I, et par conséquent la ligne CE touche la parabole, ce qu’il fallait démontrer. » (cité par Ibid., p. 173) 3.4.4.4 Roberval et les praxéologies-modélisation Ainsi, la démarche de Roberval qui détermine les tangentes (tâche), qui sont des objets mathématiques non encore bien définis, en faisant une expérience de pensée de type cinématique (technique), peut être placée dans le cadre des praxéologies-modélisation. Une telle approche, sans être inattaquable, aura permis une évolution importante par rapport à la pensée des Anciens. 3.4.5 Conclusion : fin de la préhistoire de la dérivée. À travers les trois exemples précédents — Cavalieri avec la méthode des indivisibles, Galilée qui transforme un problème cinématique en un problème géométrique et, enfin, Roberval qui transforme un problème géométrique en un problème cinématique —, nous avons un aperçu du foisonnement de découvertes faites pendant cette première moitié du XVIIe siècle. Les méthodes employées n’ont pas explicitement un caractère infinitésimal ; cependant, par exemple, les indivisibles de Cavalieri sont les précurseurs des découpages réguliers de Riemann. Des résultats connus dès l’Antiquité sont retrouvés par des méthodes nouvelles mais néanmoins encore peu généralisables. L’invention de la géométrie analytique par Fermat et Descartes et la découverte de nouvelles courbes sont la cause de cette recherche tous azimuts (cf. Buekenhout 1992). C’est ainsi que s’achève ce que nous pourrions appeler la préhistoire de la dérivée puisque celle-ci, pour reprendre le découpage proposé par Grabiner (cf. paragraphe 3.2, p. 51), n’a même pas encore été utilisée. 3.5 La dérivée est utilisée Nous allons à présent nous intéresser à la période où la dérivée est utilisée, sans que les mathématiciens d’alors en aient conscience. Le premier d’entre eux et le plus représentatif de cette période est Fermat. - 78/709 - 3.5. La dérivée est utilisée « Pierre de Fermat (1601–1665) est conseiller au Parlement de Toulouse. En plus de ses activités de légiste, il se consacre aux mathématiques, mais comme amateur. Il ne publie pratiquement pas, beaucoup de ses découvertes sont inscrites en marge des livres qu’il a étudiés. Malgré cela et en dépit d’une certaine réticence à développer ses démonstrations, les lettres, courts opuscules ou notes qu’il a laissés, en font un des plus grands mathématiciens français du XVIIe siècle. On peut le considérer comme le co-inventeur, avec Descartes, de la géométrie des coordonnées ; sa correspondance avec Pascal initie le calcul des probabilités ; il est aussi l’artisan de la renaissance de la théorie des nombres. Ses travaux ont porté aussi, bien sûr, sur le calcul infinitésimal. En premier lieu, en 1637, circule un petit traité que Fermat a rédigé en latin vers 1629, Methodus ad disquirendam Maximum et Minimum, et à la fin des années 1650, on voit paraître quelques écrits sur ce que nous appelons aujourd’hui le calcul intégral : en particulier, le traité De Aequationum Localium Transmutatione et Emendatione. . . , rédigé en latin, sans doute après 1635, sera inclus dans les œuvres de Fermat, rassemblées et imprimées après sa mort. » (IREM de Basse-Normandie 1999, p. 121) 3.5.1 Tâches : déterminer les extrema d’une fonction algébrique, déterminer une tangente, etc. Nous allons considérer plusieurs tâches bien distinctes, choisies par Fermat, et qu’il accomplit à l’aide d’une seule et même technique, preuve de l’efficacité de celle-ci. Il s’agit de la recherche des tangentes et des extrema. La question des tangentes n’est pas nouvelle et nous avons vu comment elle a déjà été traitée par les mathématiciens grecs. Il n’en est pas ainsi de la recherche des extrema. « Le problème de l’optimisation (recherche du plus grand et du plus petit, du maximum et du minimum) a été relativement peu abordée par la mathématique grecque, à l’exception des considérations d’Apollonius dans le livre V de ses Coniques — ouvrage qui n’avait pas encore été retrouvé au début du XVIIe siècle. Kepler semble avoir travaillé la question à propos du jaugeage des tonneaux, mais c’est Fermat qui va opérer l’avancée la plus significative dans ce domaine. » (IREM de Basse-Normandie 1999, pp. 121-122) 3.5.2 Technique : la méthode d’adégalisation. Voyons quelle technique Fermat a mis au point qui lui permet de résoudre des questions a priori très différentes telle que la détermination de la tangente à une parabole et la recherche des extrema. Sa méthode porte désormais le nom de méthode d’adégalité. - 79/709 - 3.5.2. Technique : la méthode d’adégalisation. 3.5.2.1 La méthode d’adégalité pour la recherche des extrema Avant de donner le texte de Fermat relatif à la recherche des extrema, donnons-nous les moyens de comprendre la traduction proposée (puisque le texte original est en latin). « La traduction proposée suit d’aussi près que possible la forme originale du texte latin, en ce qui concerne en particulier l’expression des rapports et des proportions. Il convient donc de rappeler le sens que revêt dans ces textes l’expression : "rectangle ABC", A, B et C désignant des points alignés ; il s’agit d’un produit de grandeurs linéaires qui équivaut à l’aire du rectangle dont les côtés auraient AB et BC pour mesures, soit en transcription moderne, du produit AB × BC. » (IREM de Basse-Normandie 1999, p. 123) Voici à présent le texte de Fermat. La citation est longue, mais elle est importante dans le cadre de ce travail puisque nous verrons par la suite que les élèves qui ont testé notre ingénierie didactique ont pu être amenés à appliquer une méthode similaire à celle de Fermat : « Toute la théorie de la recherche du maximum et du minimum suppose la position de deux inconnues et la seule règle que voici : Soit a une inconnue quelconque de la question (qu’elle ait une deux ou trois dimensions, suivant qu’il convient d’après l’énoncé). On exprimera la quantité maximale ou minimale en a, au moyen de termes qui pourront être de degrés quelconques. On substituera ensuite a+e à l’inconnue primitive a, et on exprimera ainsi la quantité maximale ou minimale en termes où entreront a et e à des degrés quelconques. On adégalera, pour parler comme Diophante, les deux expressions de la quantité maximale ou minimale, et on retranchera les termes communs de part et d’autre. Cela fait, il se trouvera que de part et d’autre tous les termes seront affectés de e, ou par une puissance de e d’un degré plus élevé, de façon que dans l’un au moins des termes de l’un quelconque des membres e disparaisse entièrement. On supprimera ensuite tous les termes où entrera encore e ou l’une de ses puissances et l’on égalera les autres, ou bien, si dans l’un des membres il ne reste rien, on égalera, ce qui revient au même, les termes en plus aux termes en moins. La résolution de cette dernière équation donnera la valeur de a, qui conduira au maximum ou au minimum, en reprenant sa première expression. Voici un exemple : Soit à partager la droite AC en E, en sorte que le rectangle AEC soit maximum. Posons AC = b ; soit a un des segments, l’autre sera b − a, et le produit dont on doit trouver le maximum : ba − a2 . Soit maintenant a + e le premier segment de b, le second sera b − a − e, et le produit des segments : ba − a2 + be − 2ae − e2 ; Il doit être adégalé au précédent : ba − a2 ; Supprimant les termes communs : be ∼ 2ae + e2 ; Divisant tous les termes : b ∼ 2a + e ; Supprimez e : b = 2a. Pour résoudre le problème il faut donc prendre la moitié de b. Il est impossible de donner une méthode plus générale. » (Fermat 1638) - 80/709 - 3.5. La dérivée est utilisée Fermat, avant même d’entreprendre la démonstration de l’efficacité de sa méthode, la déclare universelle. Comme annoncé plus haut, et comme nous le verrons plus loin, pour le prouver, il appliquera la même méthode à la détermination d’une tangente. Avant cela, reprenons la lecture de la méthode de Fermat, traduite en termes modernes. « Pour trouver un extremum d’une fonction polynomiale P (a), on calcule P (a + e) en l’ordonnant suivant les puissances croissantes de e ; soit : P (a + e) = P (a) + e · Q(a) + e2 · R(a) + . . . 25 Fermat indique que l’extremum est atteint pour une valeur de a qui annule le coefficient de e, soit une racine de l’équation : Q(a) = 0. » (IREM de Basse-Normandie 1999, p. 123) La nouvelle variable e signifie la présence d’un second point de même ordonnée. Après avoir égalé les deux polynômes, il s’agit de procéder aux simplifications algébriques possibles. Ensuite, pour trouver la réponse, il suffit de supprimer e, selon les mots de Fermat. Autrement dit, le statut de e passe de non nul (sinon il n’y aurait pas de second point) à nul. Il s’agit d’un passage à la limite en acte. Le double statut successif de e a conduit Fermat non à parler d’égalité mais d’adégalité, terme qu’il emprunte à Diophante sans en dire davantage. 3.5.2.2 La méthode d’adégalité pour la recherche des tangentes Pour prouver la puissance de sa méthode, Fermat va l’appliquer à la détermination de la tangente à la parabole. Il prouvera la validité de sa méthode en observant qu’il obtient le même résultat qu’Apollonius de Perge (cf. paragraphe 3.3.2, p. 63). Pour cela, il transforme la détermination d’une tangente en un problème d’extremum : « Pour trouver la tangente en un point donné d’une courbe, Fermat a utilisé plusieurs méthodes avant d’arriver à celle qui est exposée ci-dessous sur l’exemple classique de la parabole. Il s’intéresse d’abord aux courbes dites aujourd’hui algébriques, et que l’on savait pouvoir représenter par des équations, grâce à la "nouvelle analyse", dès lors que l’on connaissait une propriété caractéristique liant les points de la courbe à un diamètre et une direction d’ordonnées et ne faisant intervenir que des opérations élémentaires (additions, multiplications, proportions, extractions de radicaux, etc.). Ce qui est le cas des coniques. Depuis Apollonius, on sait que pour une parabole les carrés des ordonnées sont proportionnels aux segments joignant les pieds des ordonnées au sommet (les "abscisses"). On sait aussi que pour une ellipse, les carrés des ordonnées sont proportionnels aux produits des segments joignant les pieds des ordonnées aux sommets. Fermat recherche l’intersection de la tangente avec le diamètre, et prend comme inconnue le segment joignant ce point au pied de l’ordonnée (c’est la "sous-tangente"). Suivant la définition grecque d’une tangente, les points de la tangente sont tous situés à l’extérieur de la courbe. Par conséquent, si l’on remplace le point de la courbe par un point 25. « En lecteur fidèle de la géométrie grecque, Fermat sait que sa méthode ne fournit qu’une analyse du problème, une condition nécessaire. Il faudrait de plus une synthèse, une condition suffisante et qui puisse séparer le cas du maximum et celui du minimum. Fermat aborde ce problème dans une lettre, où il indique sur un exemple que le signe du coefficient de e2 , c’est-à-dire de R(a), permet de faire la distinction entre maximum et minimum » (Cette note fait partie de la citation donnée). - 81/709 - 3.5.2. Technique : la méthode d’adégalisation. de la tangente dans "l’équation" de la courbe, on va trouver une expression qui aura un extremum en un point connu : le point donné de la courbe. Il ne reste plus qu’à utiliser la méthode précédente pour chercher, non pas l’extremum, mais à quelle condition sur le paramètre "sous-tangente" on a un extremum au point donné initialement. » (IREM de Basse-Normandie 1999, p. 128) Il ne reste plus qu’à appliquer la méthode à ce cas particulier. Voici ce qu’écrit Fermat : « Nous ramenons à la méthode précédente l’invention des tangentes en des points donnés à des courbes quelconques. « Soit donnée, par exemple, la parabole BDN , de sommet D, de diamètre DC ; soit donné sur elle le point B, par lequel il faut mener la droite BE tangente à la parabole et rencontrant le diamètre en E. « Si l’on prend sur la droite BE un point quelconque O, dont on mène l’ordonnée OI, en même temps que l’ordonnée BC du point B, le rapport de CD à DI sera plus grand que celui du carré de BC au carré de OI, « puisque le point O est extérieur à la parabole. « Mais, à cause de la similitude des triangles, le carré de BC est au carré de OI comme le carré de CE est au carré de IE. « Donc le rapport de CD à DI sera plus grand que celui du carré de CE au carré de IE. « Or le point B est donné, donc l’ordonnée BC, donc le point C, donc CD. Soit donc CD = d, donnée. Posons CE = a et CI = e ; « Donc le rapport de d à d − e sera plus grand que celui de a2 à a2 + e2 − 2ae. « Faisant le produit des moyens et des extrêmes : da2 + de2 − 2dae sera plus grand que da2 − a2 e. - 82/709 - 3.5. La dérivée est utilisée « Adégalons, donc, d’après la méthode précédente ; on aura, en retranchant les termes communs : de2 − 2dae ∼ −a2 e, « ou, ce qui revient au même : de2 + a2 e ∼ 2dae. « Divisez tous les termes par e : de + a2 ∼ 2da. « Supprimez de ; il reste : a2 = 2da, donc : a = 2d. « Nous prouvons ainsi que CE est double de CD, ce qui est conforme à la vérité. « Cette méthode ne trompe jamais, et peut s’étendre à nombre de questions très belles ; grâce à elle, nous avons trouvé les centres de gravité de figures terminées par des lignes droites et courbes, aussi bien que ceux de solides et nombre d’autres choses dont nous pourrons traiter ailleurs, si nous en avons le loisir. » (Fermat 1638) Ainsi, Fermat, par cette technique qu’est la méthode d’adégalité, parvient à résoudre plusieurs problèmes (tâches) qui, jusqu’alors, semblaient si différents qu’il fallait pratiquement une méthode différente pour traiter chacun. 3.5.3 Technologie : aux alentours d’un extremum, la variation en ordonnée est faible. Comment Fermat justifie-t-il sa technique ? Il semble qu’il considère qu’aux alentours d’un extremum, les ordonnées ne varient pratiquement pas. « L’idée qu’il développe, puis étend, est qu’on peut, sous certaines conditions, dans un calcul algébrique ou géométrique, supposer que deux nombres ou grandeurs, manifestement différentes, sont égales. Cette opération, qu’il ne faut pas confondre avec une approximation, serait plus proche de la notion moderne d’équivalent. Les conditions qui permettent cette opération sont, par exemple chez Fermat, celles que remplissent deux ordonnées au voisinage d’un extremum, ou bien encore, l’arc, la corde et le segment de tangente à une courbe au voisinage du point de tangence. Cette méthode étant en place, on peut alors l’appliquer à la recherche des tangentes, en utilisant une définition "nouvelle" : en effet, la tangente réalise, parmi un ensemble de sécantes, l’extremum d’une certaine quantité. Cette méthode, qui nous semble étonnamment proche du calcul infinitésimal, est relativement bien accueillie, sauf par René Descartes (1596–1650). Ce dernier préférait, semble-t-il, éviter le recours à des arguments de type infinitésimal, sauf à traiter de problèmes non "algébrisables", et il lança une polémique contre Fermat à ce sujet. » (IREM de Basse-Normandie 1999, p. 122) À la décharge de Descartes, il faut dire que Fermat se contentait souvent d’énoncer des théorèmes et des résultats succinctement (parfois dans la marge d’un livre), sans prendre la peine de les expliquer ni de les démontrer : - 83/709 - 3.5.4. Conclusion « Fermat était en possession avant Descartes d’une méthode des tangentes ; mais il ne la publia qu’après que Descartes eut fait connaître la sienne, et il y joignit une méthode de Maximis et Minimis. Ces méthodes sont plus simples que celles de Descartes, mais elles ne furent pour ainsi dire qu’indiquées par Fermat, qui [. . . ] ne laissa point apercevoir, du moins pour celle de Maximis et Minimis, quelle route avait pu l’y conduire, et de quelle manière on pouvait la démontrer. » (Lacroix, 1797, p. viii) Certains historiens estiment que Fermat n’a pas considéré le terme e comme infiniment petit (cf. IREM de Basse-Normandie 1999, p. 121). Néanmoins, il a été jugé comme tel par son contemporain Descartes. La réticence de celui-ci à recourir à des arguments de type infinitésimal perdurera jusqu’à la fin de l’étape qui suivra dans l’histoire de la dérivée : la dérivée est découverte (cf. section 3.7.3 p. 104). « Comme l’expliquera plus tard Huygens, le fondement de la méthode de Fermat — au-delà de son apparence algorithmique — consiste en ceci : lorsque l’ordonnée est parvenue à un extremum, il y a, de part et d’autre de celle-ci, deux autres ordonnées qui l’avoisinent et qui sont égales entre elles. » (Ibid., p. 123) Dès lors, même si Fermat ne l’explicite pas, la variable « accessoire » e est un infinitésimal. Dans le cas de la tangente, cela revient à dire que la tangente touche la courbe en deux points infiniment proches. Reste la question non résolue du statut de l’infinitésimal e qui est spécifiquement non nul au départ puis qui, opportunément, est pris égal à zéro. De plus, on peut interpréter le résultat obtenu par Fermat pour trouver la tangente comme un nombre pair d’erreur : « Lorsqu’on veut déterminer une tangente et qu’on la remplace par une sécante infiniment voisine, on fait une première erreur ; de plus, dans le calcul de la pente de cette sécante, on néglige ensuite des infiniment petits d’ordre supérieur, ce qui fait une seconde erreur ; mais l’effet de ces deux erreurs se compensent, et le résultat donnant la pente de la tangente est tout de même juste ! [. . . ] L’obtention de résultats exacts au prix d’une double erreur est totalement inacceptable en mathématique. » (Ovaert & Sansuc 1976, p. 111) 3.5.4 Conclusion Le travail de Fermat, décrit ci-dessus, se situe dans le cadre des praxéologie-modélisation, pour ne pas dire au centre de ce cadre. La tâche qu’il entreprend est de trouver des résultats nouveaux ; pour ce faire, il emploie une méthode efficace mais non inattaquable et dont la validité est pragmatiquement démontrée, puisqu’elle donne le même résultat, déjà connu et prouvé par les mathématiciens grecs dans le cas de la détermination de la tangente à une parabole. Ce qui est inacceptable pour les mathématiques institutionnelles d’aujourd’hui l’était davantage au XVIIe siècle car, en l’absence d’une théorie bien établie, la discussion était ouverte et c’est avant tout l’efficacité de la méthode à produire de nouveaux résultats qui était visée. Ces résultats nouveaux étaient supposés corrects par conjecture, sur base de résultats anciens atteints par la même méthode. En l’absence notamment des concepts de fonction et de variable, la question de la continuité et moins encore celle de la dérivabilité ne pouvait encore être envisagée. - 84/709 - 3.6. La dérivée est découverte 3.6 La dérivée est découverte C’est pendant cette période qu’est découvert ce qui sera le théorème fondamental de l’Analyse, par Newton et Leibniz. Désormais, les mathématiciens vont considérer explicitement des infinitésimaux, voire des rapports d’infinitésimaux. 3.6.1 Barrow et les rapports d’infinitésimaux En plus de ces deux pères du calcul infinitésimal, nous allons considérer Isaac Barrow (1630–1677), qui fut un professeur de Newton et dont on verra plus loin l’influence sur ce dernier. À titre d’exemple, nous allons voir comment Barrow détermine la tangente à une courbe. 3.6.1.1 Tâche : calcul de la tangente à une courbe Une des tâches que Barrow affirme savoir conduire est le « calcul des tangentes » (ainsi qu’il l’écrit). Voyons quelle est la technique employée à travers ce qu’il en écrit. 3.6.1.2 Technique : passage d’un triangle curviligne à un triangle rectangle non assignable puis à un triangle rectangle assignable « Soient AP, P M deux lignes droites données en position (telles que P M coupe la courbe proposée en M ) & M T supposée toucher la courbe en M , et couper la droite AP en T , comme je cherche maintenant la quantité P T de la même droite, je pose l’arc de courbe M N indéfiniment petit ; alors je trace les droites, N Q parallèles à M P , & N R à AP ; je nomme M P = m ; P T = t ; M R = a ; N R = e ; quant aux restes des droites, déterminées par la nature particulière de la courbe et utiles à la proposition, je les désigne par leur nom ; je compare par le calcul au moyen de l’Equation considérée M R, N R elles mêmes (& par le moyen de celles-ci M P, P T ) ; en observant simultanément ces règles. 1. Parmi ce qui est calculé, je jette tous les termes dans lesquels a ou bien e sont des puissances d’eux-mêmes, ou bien dans lesquels ils sont multipliés entre-eux (en effet ces termes ne valent rien). 2. Après avoir établi l’égalité, je jette tous les termes dont les lettres désignent des quantités constantes ou bien fixées ; ou bien dans lesquels on n’a pas a ou e (en effet ces termes amenés dans une des parties de l’égalité seront toujours rendus égaux à rien). 3. Je substitue à la place de a, m lui-même ; (ou bien M P ) à la place de e, t lui-même (ou bien P T ). De là on trouvera précisément les valeurs de P T elles-mêmes. - 85/709 - 3.6.1. Barrow et les rapports d’infinitésimaux Parce que si une partie indéfiniment petite d’une courbe quelconque entre dans le calcul, on pourra substituer à cet endroit une petite partie de tangente ; ou bien (à cause de l’infini ténuité de l’arc de courbe) n’importe quelle droite équipollente à celle-ci. » (Barrow 1670, cité par Saelens 1995, Annexe 21) Ainsi, la méthode de Barrow permet de déterminer la tangente à une courbe a priori quelconque. Il s’agit donc d’une méthode générale, du moins pour le calcul d’une tangente. Pour nous aider à dégager la technique employée par Barrow pour mener à bien la tâche qu’il se propose, regardons le texte modernisé rédigé par Kline. Ce dernier applique la méthode au cas de la parabole. Il change la dénomination des points considérés par Barrow (M et P sont échangés, N devient Q et T devient N ) mais il conserve néanmoins les mêmes notations pour les termes a et e : « Barrow assimile, tout comme Fermat, un arc de courbe P P 0 au segment P Q de la tangente, ce qui lui permet de conclure au rapport a/e = P M/M N où e = P R et a = P 0 R (il assimile le triangle P P 0 R au triangle P QR). Ensuite, il utilise l’équation de la courbe y 2 = px où il remplace x par x + e et y par y + a, ce qui donne y 2 + 2ay + a2 = px + pe. - 86/709 - 3.6. La dérivée est découverte Il soustrait y 2 = px et obtient 2ay + a2 = pe. En négligeant a2 , il trouve a/e = p/2y, d’où P M/M N = p/2y, ou encore y/M N = p/2y et aboutit à M N = 2y 2 /p = 2x. » (Kline 1972) Ainsi, l’approche de Barrow n’est-elle pas sans rappeler la méthode de Fermat. En outre, ils considèrent deux points appartenant simultanément à la tangente et à la courbe (le triangle P QR étant assimilé au triangle curviligne P P 0 R, cf. figure ci-dessus). Mais là où Barrow se distingue de Fermat qui, au mieux, considérait un seul infinitésimal, e, c’est qu’il considère désormais deux infinitésimaux (a et e). De plus, s’il considère que les puissances d’infinitésimaux « ne valent rien », il ne néglige plus un infinitésimal isolé mais s’intéresse plutôt à un rapport d’infinitésimaux. En effet, en passant d’un triangle non assignable (de dimensions infinitésimales) P QR à un triangle assignable M N P , il est en mesure de déterminer le rapport a/e. Un tel rapport préfigure la f (x + ∆x) − f (x) dérivée telle qu’elle est définie puisque a/e peut s’écrire . ∆x Enfin, Barrow ne s’intéresse pas au rapport d’infinitésimaux pour eux-mêmes mais en tant que variable intermédiaire pour trouver M N : il y a d’une part P M/M N = a/e et d’autre part a/e = p/2y, ce qui permet, par élimination, de trouver son inconnue principale : MN. La technique de Barrow consiste donc à passer d’un triangle curviligne à un triangle rectangle non assignable puis de ce triangle à un triangle assignable. 3.6.1.3 Absence de discours technologique Ce qui justifie la technique utilisée par Barrow est assez léger : pour passer du triangle curviligne au triangle rectangle, il « pose l’arc de courbe M N (P P 0 sur la figure ci-dessus) indéfiniment petit », a-t-il écrit plus haut. Ensuite, par construction de la sous-tangente, les triangles M N P et P QR sont semblables. Barrow est conscient de la faiblesse de sa justification, ce qui le préoccupe finalement assez peu : « En complément, sous forme d’un appendice, nous ajouterons une méthode que nous utilisons du calcul des tangentes. Toutefois je ne sais pas, après tant de méthodes déjà connues et rejetées, si on peut faire quelque chose de l’emploi de celle-ci. Encore fais-je ceci sur les conseils d’un ami ; d’autant plus volontiers que ce que j’ai traité devant les autres paraît fructueux et général. » (Barrow 1670) Ainsi, Barrow est conscient de ne pas avoir prouvé que sa méthode fonctionne. Ceux à qui il l’a exposée semblent la trouver pertinente mais, contrairement à Fermat et d’autres, il ne s’efforce même pas de l’appliquer sur un exemple dont le résultat serait connu par ailleurs. Pour autant, il se situe bien dans le cadre des praxéologies-modélisation en raison du type de tâche accomplie et le peu de préoccupation qu’il a à justifier une technique qui semble performante. - 87/709 - 3.6.2. Nécessité d’un principe unificateur 3.6.2 Nécessité d’un principe unificateur Désormais, tous les ingrédients semblent réunis pour découvrir ce qui unit toutes ces méthodes de calcul et tous les problèmes qu’elles permettent de résoudre. Car c’est précisément le défaut de toutes les approches rencontrées jusqu’ici : l’absence d’un principe unificateur. Certes, Fermat affirme que sa méthode ne peut être plus générale ; Barrow prétend que la sienne détermine la tangente à n’importe quelle courbe. Il y a une quête de généralisation mais elle n’a pas encore abouti : « À la fin du XVIIe siècle, on se trouve, dans le domaine des quadratures et des tangentes devant un ensemble très important de travaux et de résultats, dans lesquels nous repérons les prémices du calcul infinitésimal. Cavalieri, Torricelli, Fermat, Pascal, Roberval, Wallis, Barrow et d’autres développent des méthodes, qui sont souvent liées à la nature de la courbe étudiée. Les résultats paraissent souvent isolés. Le lien entre tous ces problèmes n’est pas mis en avant dans toute sa généralité, et tous ne le perçoivent pas. Bientôt, toutes les techniques qui vont conduire à la découverte d’un algorithme général, qui reste à venir, et les principaux résultats que ce calcul synthétisera, sont établis ; il y manque seulement le sens de l’universalité des règles. » (IREM de Basse-Normandie 1999, p. 80) 3.6.3 Newton et la découverte du théorème fondamental Isaac Newton (1642–1727) n’est pas seulement mathématicien mais aussi physicien, astronome et penseur. . . Il ne découvre pas le théorème fondamental en une fois, par une sorte d’intuition géniale, mais par une succession d’essais/erreurs, ce qui ne retire rien à son génie. Au contraire, ayant mis par écrit au fur et à mesure ses idées, nous sommes davantage en mesure de comprendre comment il est parvenu à sa découverte. On peut distinguer trois étapes dans sa découverte. 3.6.3.1 Première étape : l’infinitésimal est explicité Dans une première étape, Newton aborde les infinitésimaux sans en calculer de rapport (bien que, comme nous le verrons ci-dessous dans la démonstration qu’il propose, il divise par la quantité infinitésimale o) et son calcul est proche de celui opéré par Fermat. Il écrit vers 1669 (mais ne publie pas) un petit traité intitulé De Analysi per Æquationes Numero Terminorum Infinitas. C’est dans cet ouvrage que Newton énonce pour la première fois ce qui sera le Théorème Fondamental de l’Analyse : « Soit l’ordonnée BD perpendiculaire à la base AB d’une courbe AD ; posons AB = x et BD = y. Soient de plus a, b, c,. . . des quantités données et m, n des entiers. Alors m+n m na Règle 1 : Si ax n = y, on aura m+n x n = aire ABD. - 88/709 - 3.6. La dérivée est découverte La chose apparaît clairement sur les exemples. Exemple 1 Si x2 (= 1x2/1 ) = y, c’est-à-dire si a = 1 = n et m = 2, alors (Newton 1669) 1 3 3x = ABD. » Suivent d’autres exemples que nous ne reproduirons pas ici. Newton démontre sa Règle 1 à la fin du traité : « Soit alors une courbe quelconque ADδ ayant, comme ci-dessus, AB = x pour base, BD = y pour ordonnée et ABD = z pour aire. De même, posons Bβ = o, BK = v et le rectangle BβHK (ov) égal à l’espace BβδD. On a, par conséquent, Aβ = x + o et Aδβ = z + ov. Avec ces prémisses, à partir d’une relation supposée et arbitraire entre x et z, je cherche y de la manière que l’on va voir. Prenons arbitrairement 23 x3/2 = z ou 49 x3 = z 2 . Alors, quand x + o (Aβ) est substitué à x et z + ov (Aδβ) à z, il vient (par la nature de la courbe) 4 3 (x + 3x2 o + 3xo2 + o3 ) = z 2 + 2zov + o2 v 2 . 9 En enlevant les quantités égales ( 94 x3 et z 2 ) et en divisant par o, il reste : 4 (3x2 + 3xo + o2 ) = 2zv + ov 2 . 9 - 89/709 - 3.6.3. Newton et la découverte du théorème fondamental Si maintenant nous supposons que Bβ soit infiniment petit, c’est-à-dire que o est zéro, v et y seront égaux et les termes multipliés par o vont disparaître, et en conséquence, il restera 4 2 2 2 3x = 2zv ou x2 ( = zy) = x3/2 y 9 3 3 c’est-à-dire x1/2 x2 = 3/2 x ! =y Donc, inversement : si x1/2 = y, on aura 2 3/2 x = z. » (Newton 1669) 3 Newton poursuit sa démonstration en faisant le même raisonnement dans le cas général avec n ax(m+n)/n = z. m+n Une fois achevée sa démonstration, Newton conclut : « Notons ici en passant que voici une méthode par laquelle toutes les courbes d’aire connue que l’on voudra pourront être trouvées : à savoir, en supposant à volonté une équation quelconque comme relation entre l’aire z et la base x, et en cherchant à partir de là l’ordonnée y. » (Newton 1669) À ce stade, le mode opératoire est très semblable à celui de Fermat, quoique Newton explicite l’emploi de l’infinitésimal o : il part d’une égalité dans laquelle il simplifie les termes égaux de part et d’autre ; il reste des termes qui sont tous multipliés par l’infinitésimal o ; il divise chaque membre de l’égalité par o ; finalement, il supprime les termes où o subsiste encore en le prenant égal à zéro. Newton ne s’exprime pas sur la question du changement de statut de l’infinitésimal qui, d’abord non nul (puisqu’il divise par o), est pris ensuite égal à zéro. Enfin, pour arriver au résultat annoncé, Newton utilise en acte un argument de continuité en assimilant y à v pour arriver à la fonction y = x1/2 . Ce double statut des infinitésimaux était problématique en termes de rigueur, même si la méthode donnait des résultats corrects : « Newton’s first conception of the calculus used the concept of infinitesimals, values that are greater than zero but less than any quantity, as a basis for his method of determining tangents. However, the use of this concept, although producing generally correct results, is rigorously troubling. When differentiating, ignoring infinitesimal terms led Newton to recognizably correct solutions [. . . ] However, logical inconsistencies cropped up when one tried to define just how "small" infinitesimals were. If they were non-zero, then equations that had been developed about the derivative would be false. If they were zero, then the equations that had been developed were "illformed". 26 » (Collingwood 2005, p. 3)) 26. « La première conception du calcul infinitésimal chez Newton recourait au concept d’infinitésimal, nombre plus grand que zéro mais plus petit que n’importe quelle quantité ; ainsi se basait sa méthode pour déterminer des tangentes. Cependant, l’utilisation de ce concept, bien que produisant généralement des résultats corrects, est troublant en terme de rigueur. Au moment de dériver, ignorer les termes infinitésimaux conduisait Newton à des solutions reconnues comme correctes [. . . ] Néanmoins, des incohérences logiques survenaient quand on essayait de définir combien précisément les infinitésimaux étaient petits. S’ils étaient non nuls, alors l’équation qui avait été développée pour la dérivée serait fausse. S’ils étaient nuls, alors les équations qui avaient été développées étaient sans objet. » - 90/709 - 3.6. La dérivée est découverte 3.6.3.2 Seconde étape : apport d’une imagerie cinématique Newton, conscient de cette difficulté, a cherché une autre base sur laquelle fonder le calcul infinitésimal. En 1671, il rédige (mais ne publie pas) un deuxième traité (De Methodis Serierum et Fluxionum) dans lequel l’accent est mis moins sur le contexte des aires sous des courbes que sur celui des mouvements 27 . Voici des extraits de ce que Newton y écrit à propos du théorème fondamental de l’Analyse : LV « [. . . ] Reste maintenant à donner quelques essais de problèmes, surtout ceux que nous présente la nature des courbes, et cela pour mettre l’art analytique dans un plus grand jour. Et d’abord j’observerai que toutes leurs difficultés peuvent se réduire à ces deux problèmes seulement que je vais proposer sur un espace décrit par un mouvement local retardé ou accéléré de façon quelconque. LVI-1 « La longueur de l’espace décrit étant continuellement donnée, trouver la vitesse du mouvement à un temps donné quelconque. LVII-2 « La vitesse du mouvement étant continuellement donnée, trouver la longueur de l’espace décrit à un temps donné quelconque » (cité par IREM de Lyon 2006, p. 26). Ainsi, Newton est-il parvenu à formuler les deux problèmes majeurs du calcul infinitésimal : connaissant la distance parcourue en fonction du temps, trouver la vitesse en fonction du temps et, réciproquement, connaissant la vitesse à tout instant, en déduire la distance parcourue. Il annonce de manière contextualisée la formulation que donnera Lagrange de ce théorème : ayant f , trouver f 0 et, réciproquement, ayant f 0 , trouver f . Ensuite, Newton considère le cas de la parabole pour définir ce qu’il appelle les fluxions et les fluentes : LVIII « Ainsi, dans l’équation xx = y, si y représente la longueur de l’espace décrit à un temps quelconque, lequel temps un autre espace x en augmentant avec une vitesse uniforme ẋ mesure et représente comme décrit, alors 2xẋ représentera la vitesse avec laquelle dans le même instant l’espace y viendra à être décrit et vice-versa ; et c’est de là que j’ai dans ce qui suit considéré les quantités comme produites par une augmentation continuelle à la manière de l’espace que décrit un corps en mouvement. LIX « Mais comme nous n’avons pas besoin de considérer ici le temps autrement que comme exprimé et mesuré par un mouvement local uniforme, et qu’outre cela nous ne pouvons jamais comparer ensemble que des quantités du même genre, non plus que leurs vitesses d’accroissement et de diminution ; je n’aurai dans ce qui suit aucun égard au temps considéré proprement comme tel ; mais je supposerai que l’une des quantités proposées de même genre doit 27. Dans un ouvrage rédigé ultérieurement (Tractatus de Quadratura Curvarum, rédigé en 1676), Newton précise que c’est « pendant les années 1665 et 1666 » qu’il a mis au point la méthode qui est décrite ci-après, donc avant de rédiger le traité De Analysi per Æquationes Numero Terminorum Infinitas et qui correspond à la première étape de la pensée de Newton - 91/709 - 3.6.3. Newton et la découverte du théorème fondamental augmenter par une fluxion uniforme, à laquelle quantité je rapporterai tout le reste comme si c’était au temps ; donc par analogie cette quantité peut avec raison recevoir le nom de temps ; ainsi quand dans la suite pour donner des idées plus claires et distinctes, je me servirai du mot temps, je n’entends jamais le temps proprement pris comme tel, mais seulement une autre quantité par l’augmentation ou fluxion de laquelle le temps peut être exprimé et mesuré. LX « J’appellerai quantités fluentes, ou simplement fluentes ces quantités que je considère comme augmentées graduellement et indéfiniment, je les représenterai par les dernières lettres de l’alphabet v, x, y et z pour les distinguer des autres quantités qui dans les équations sont considérées comme connues et déterminées qu’on représente par les lettres initiales a, b, c etc. Et je représenterai par les mêmes dernières lettres surmontées d’un point v̇, ẋ, ẏ et ż les vitesses dont les fluentes sont augmentées par le mouvement qui les produit, et que par conséquent on peut appeler fluxions. Ainsi pour la vitesse ou fluxion de v je mettrai v̇, et pour les vitesses de x, y, z je mettrai ẋ, ẏ, ż respectivement » (cité par IREM de Lyon 2006, p. 26). Nous avons vu plus haut qu’Archimède, déjà, avait eu recours à la mécanique pour avoir l’intuition du résultat de la quadrature de la parabole. Ici, Newton se rapproche plutôt de ce que nous avons observé chez des mathématiciens du XVIIe siècle tels que Roberval, à savoir l’utilisation du mouvement cinématique pour faciliter l’étude de courbes, et en particulier la détermination des tangentes. Mais Newton se distingue nettement de Roberval par la généralité de sa méthode qui ne nécessite pas le recours aux propriétés géométriques des courbes étudiées : « [Mais là où] la méthode de Roberval [. . . ] nécessite une étude spécifique pour chaque courbe, à partir de sa définition géométrique, [. . . ] l’apport le plus considérable [de Newton] fut de partir de l’équation [. . . ] de la courbe, et de considérer les deux variables en jeu comme animées d’un mouvement, dont la description particulière n’a pas à être prise en compte. Le traitement est général et purement analytique, avec l’axiome implicite suivant : dire que, à un instant donné, la vitesse de la variable x est égale à ẋ signifie que pendant un intervalle de temps infiniment petit noté o, cette variable est animée d’un mouvement uniforme, et que par conséquent son accroissement est oẋ. Pour la parabole x2 = y, par exemple, les deux variables (fluentes) x et y sont chacune en mouvement, avec des vitesses (fluxions) qu’il note respectivement ẋ et ẏ. La simplicité du calcul du rapport des fluxions [. . . ] est remarquable : durant un intervalle de temps infiniment petit noté o, l’accroissement de x sera oẋ, et celui de y sera oẏ. D’après l’équation de la courbe, on aura donc (x + oẋ)2 = y + oẏ ; après développement et réduction, l’équation se ramène à 2xẋ + oẋ2 = ẏ, mais comme le terme en o est nul en compaẏ raison des autres, il reste 2xẋ = ẏ. On connaît donc le coefficient , grâce auquel ẋ on peut tracer la tangente, sans qu’il n’ait jamais été besoin de faire intervenir, comme le faisait Roberval, la définition géométrique de la parabole. On peut dire que l’analyste Newton compose de façon purement formelle le mouvement de deux variables x et y liées par la relation x2 = y, tandis que le géomètre-mécanicien - 92/709 - 3.6. La dérivée est découverte Roberval aurait composé les deux mouvements particuliers qui définissent la parabole : le mouvement sur une droite qui tourne autour du foyer et un mouvement orthogonal à la directrice » (IREM de Lyon 2006, pp. 26-27). Par ailleurs, Newton prend la peine de préciser que le temps dont toutes les variables (fluentes) dépendent n’est pas le temps du physicien, le temps du chronomètre, mais celui de l’expérience de pensée : pour prendre un exemple dans le plan orthogonal, tandis qu’une grandeur x se déplace tel un point sur l’axe des abscisses à une certaine vitesse, la variable y, que l’on peut visualiser comme un segment vertical (perpendiculaire à l’axe des abscisses) de longueur variable (l’extrémité « libre » du segment a pour vitesse ẏ), se déplace à la verticale de x. Nous retiendrons qu’à cette seconde étape, c’est une imagerie cinématique qui est porteuse de l’inspiration de Newton. Il considère la vitesse instantanée, qui est alors à l’état de préconstruit, comme un taux de variation par rapport au temps. 3.6.3.3 Troisième étape : rapports d’infinitésimaux et ultima ratio Néanmoins, la présence précisément du facteur temps gêne Newton. C’est vers 1676 que Newton rédige le Tractatus de Quadratura Curvarum dans lequel il a trouvé le moyen d’éliminer ce facteur. Pour cela, il ne s’intéresse plus au concept de fluxion lui-même mais au rapport de deux fluxions. Dans son introduction il écrit : « Les fluxions sont à très peu de chose près comme les accroissements des fluentes engendrés en des éléments de temps égaux très petits, et pour le dire précisément, elles sont dans le rapport initial des accroissements naissants ; elles peuvent être représentées par des lignes quelconques qui leur sont proportionnelles. « Si les aires ABC, ABDG sont décrites par les ordonnées BC, BD progressant d’un mouvement uniforme sur la base AB, les fluxions de ces aires seront entre elles comme les ordonnées BC et BD qui les décrivent, et elles peuvent être représentées par ces ordonnées mêmes, parce que ces ordonnées sont comme les accroissements naissants des aires. Que l’ordonnée BC avance de sa position BC jusqu’à une position nouvelle quelconque bc. Complétons le parallélogramme BCEb, et menons la droite V T H qui touche la courbe en C ; bc et BA prolongés aboutissant en T et - 93/709 - 3.6.3. Newton et la découverte du théorème fondamental V . Et les augmentations de l’abscisse AB, de l’ordonnée BC et de la ligne courbe ACc engendrées à l’instant seront Bb, Ec et Cc. Les côtés du triangle CET sont dans le rapport initial de ces augmentations naissantes. Par conséquent les fluxions des mêmes AB, BC et AC sont comme les côtés CE, ET et CT de ce triangle CET , et elles peuvent être représentées par ces côtés, ou ce qui revient au même par les côtés du triangle semblable V BC. « On a la même chose si on prend les fluxions dans le rapport ultime des parties évanescentes. Traçons la droite Cc et prolongeons la jusqu’à K. Que l’ordonnée bc retourne jusqu’à sa position antérieure BC, les points C et c se rejoignent, la droite CK coïncide avec la tangente CH, et le triangle évanescent CEc dans sa forme ultime finit par devenir semblable au triangle CET . Ses côtés évanescents CE, Ec et Cc seront à la fin entre eux comme les côtés CE, ET , et CT de l’autre triangle, et à cause de cela les fluxions sont dans le rapport des lignes AB, BC et AC. Si les points C et c sont distincts l’un de l’autre d’un petit intervalle quelconque, la droite CK sera distante d’un petit intervalle de la tangente CH. Pour que la droite CK coïncide avec la tangente CH et que les rapports ultimes des lignes CE, Ec et Cc soient trouvées, les points C et c doivent se rejoindre et coïncider tout à fait. Dans les choses mathématiques, les erreurs si petites soient-elles ne doivent pas être négligeables » (cité par Saelens 1995, Annexe 23). Newton passe du rapport initial des côtés d’un triangle provisoirement assignable (CET ), triangle qui est semblable à un triangle définitivement assignable, aux rapports ultimes 28 des côtés d’un triangle curviligne et désormais non assignable (CEc) ; « et le triangle évanescent CEc dans sa forme ultime finit par devenir semblable au triangle CET ». La méthode proposée ici par Newton n’est pas sans rappeler celle de Barrow (qui fut son maître) et les progrès apportés par Newton sont indéniables : « The formula used was essentially the same used today 29 » (Collingwood 2005, p. 3). En termes de rigueur, des lacunes subsistent : « While this basis for the calculus was much more rigorous than infinitesimals, Newton left some ambiguity as to what exactly he meant by these ratios. Since Newton’s conception of the calculus was in more geometric terms, his view of a limit "was bound up with geometric intuitions which led him to make vague and ambiguous statements" (Boyer 1949, p. 197). This ambiguity in Newton’s work would lead to much debate between his successors about what he actually meant 30 » (Collingwood 2005, p. 3). 28. L’histoire a retenu son expression originelle en latin : « ultima ratio ». 29. « La formule utilisée était essentiellement la même que celle utilisée aujourd’hui ». 30. « Alors que cette base du calcul infinitésimal était beaucoup plus rigoureuse que [celle reposant sur les seuls] les infinitésimaux, Newton a laissé quelques ambiguïtés au sujet de ce qu’il signifiait par ces rapports [d’infinitésimaux]. Comme la conception de l’analyse chez Newton était plutôt en termes géométriques, sa vision d’une limite "était liée à des intuitions géométriques qui l’ont conduit à faire des déclarations vagues et ambiguës" (Boyer 1949, p. 197). Cette ambiguïté dans l’œuvre de Newton a conduit à de nombreux débats parmi ses successeurs sur ce qu’il voulait réellement dire ». - 94/709 - 3.6. La dérivée est découverte Pourtant, les explications données par Newton ne sont pas uniquement géométriques. Dans les Principes mathématiques de philosophie naturelle publiés en 1687, Newton précise ce qu’il entend par ultima ratio : « Il faut entendre par la dernière raison des quantités évanouissantes la raison qu’ont entre elles des quantités qui diminuent, non pas avant de s’évanouir, ni après qu’elles sont évanouies mais au moment même où elles s’évanouissent » (Newton 1687). Pour illustrer ce qu’il veut dire, dans le même livre, Newton recourt à l’imagerie cinématique : « On peut dire, contre ce principe des premières et dernières raisons, que les quantités qui s’évanouissent n’ont point de dernière proportion entre elles ; parce qu’avant de s’évanouir, la proportion qu’elles ont n’est pas la dernière, et que lorsqu’elles sont évanouies, elles n’en ont plus aucune. Mais on pourrait soutenir par le même raisonnement qu’un corps qui parvient d’un mouvement uniformément retardé, à un certain lieu où son mouvement s’éteint, n’a point de dernière vitesse. Car, dirait-on, avant que ce corps soit parvenu à ce lieu, il n’a pas encore sa dernière vitesse, et quand il l’a atteint, il n’en a aucune, puisque alors son mouvement est éteint ». Chez Newton, cette imagerie cinématique est une expérience de pensée. Lacroix synthétise les concepts utilisés par Newton, en particulier celui de fluxion ; il montre notamment comment l’usage des fluxions permet d’éviter les infiniments petits d’ordre supérieur à un : « Newton supposa les lignes engendrées par le mouvement d’un point, et les surfaces, par celui d’une ligne, et il appela fluxions les vitesses qui réglaient ces mouvements. Ces notions, quoique très rigoureuses, sont étrangères à la Géométrie, et leur application peut être difficile. Il est bien vrai qu’en imaginant un point qui se meuve sur une ligne, pendant qu’elle est emportée parallèlement à elle-même, avec une vitesse uniforme, on peut représenter une courbe quelconque ; mais la vitesse du point décrivant étant variable à chaque instant, on ne peut la déterminer qu’en recourant soit à la méthode des Anciens ou d’exhaustion, soit à celle des premières et dernières raisons, et c’est presque toujours de celle-ci, que Newton s’est servi, en sorte que les fluxions n’étaient à proprement parler pour lui, qu’un moyen de donner un objet sensible aux quantités sur lesquelles il opérait. Il entendait par la méthode des premières et dernières raisons, la recherche du rapport qu’ont entre elles, au premier ou au dernier instant de leur existence, des quantités qui naissent ou qui s’évanouissent ensemble ; et il trouvait dans la première raison des espaces parcourus par l’ordonnée sur la ligne des abscisses et par le point décrivant sur l’ordonnée, espaces qu’il nommait moments, le rapport de la fluxion de l’abscisse à celle de l’ordonnée ; d’où il tirait la direction de la tangente. Le calcul n’était que celui dont Barrow faisait usage pour sa méthode des tangentes, mais que Newton par le moyen de sa formule du Binôme et de la réduction en séries, avait étendu aux expressions irrationnelles. L’avantage de la Méthode des fluxions sur le Calcul différentiel, du côté de la Métaphysique, consiste en ce que les fluxions étant des quantités finies, leurs moments ne sont que des infiniment petits du premier ordre, et leurs fluxions sont encore finies : par ce moyen on évite les infiniment petits des ordres supérieurs » (Lacroix 1797, pp. xx-xxi). - 95/709 - 3.6.3. Newton et la découverte du théorème fondamental Ainsi, Newton obtient la notion de limite par le biais de celle de vitesse instantanée, ce qui va lui valoir de nombreuses critiques par la suite, de Lagrange en particulier. En effet, comme nous le verrons plus loin (à partir du paragraphe 3.7.6, p. 109), l’analyse moderne a parfaitement inversé la démarche de Newton : partant de la notion de limite, la dérivée est calculée tandis que la vitesse n’est plus qu’une application de la dérivée. Nous avons observé en filigrane dans tout ce qui précède parmi les travaux de Newton que celui-ci ne publie pas ses découvertes au fur et à mesure. Les historiens se perdent encore entre les dates supposées ou affirmées des découvertes de Newton, celles où il a rédigé des manuscrits et celles où ceux-ci ont été publiés. Une possible interprétation de ces hésitations serait que Newton n’était pas satisfait de son travail : « It has been suggested that Newton’s long delay in publication of his three chief works on the calculus was occasioned by the fact that he was dissatisfied with the logical foundations of the subject 31 » (Collingwood 2005, p. 4). Newton, en 1704, fait ce commentaire : « Errors are not to be disregarded in mathematics, no matter how small 32 » (cité par Boyer 1949, p. 201). L’intention de Newton est donc bien de rendre son travail rigoureux, même s’il n’y parvient pas entièrement. Par rapport aux mathématiciens qui le précèdent, c’est un tournant historique : la préoccupation du mathématicien n’est plus seulement de trouver le moyen de résoudre des problèmes grâce au calcul infinitésimal mais aussi de donner à celui-ci une base rigoureuse, incontestable d’un point de vue logique. 3.6.3.4 Newton et les praxéologies-modélisation Newton se situe toujours dans le cadre des praxéologies-modélisation. En effet, sa priorité est d’accomplir la tâche de résoudre des problèmes au moyen d’une technique, dont la version la plus élaborée est l’utilisation du rapport entre les fluxions. Comme technologie, c’est-à-dire comme discours justifiant sa technique, il fait appel à la mécanique et plus précisément à une imagerie cinématique. Ses priorités, de fait, restent les tâches et les techniques alors que ce qui caractérise les praxéologies-déduction est la priorité attachée à la théorie. Nous avons néanmoins noté le souci qu’a Newton de rendre sa méthode rigoureuse : il entrouvre ainsi la voie à une justification théorique qui ne sera atteinte que cent cinquante ans plus tard (cf. Grabiner 1974, p. 359). Enfin, on trouve chez Newton une ébauche de théorisation au travers de la mise en évidence des deux problématiques du calcul infinitésimal et de ce qui les lie par réciprocité si bien qu’on peut lui attribuer la (co-)paternité du théorème fondamental de l’Analyse. 31. « Il a été suggéré que le long délai de publication des trois chefs-d’œuvre de Newton relatifs au calcul infinitésimal était dû au fait qu’il n’était pas satisfait par les fondements de cette matière » (Boyer 1949, p. 202). 32. « Les erreurs en mathématiques ne doivent pas être ignorées, aussi petites soient-elles ». - 96/709 - 3.6. La dérivée est découverte 3.6.4 Leibniz et la découverte du théorème fondamental Wilhelm Gottfried Leibniz est un philosophe et savant allemand (1646–1716) qui fit des mathématiques parmi beaucoup d’autres activités des plus variées. Mais c’est en tant que co-découvreur (avec Newton) du calcul différentiel et intégral que nous allons nous intéresser à lui. « Leibniz invented the basic elements of his calculus in October and November of 1675 33 » (Collingwood 2005, p. 4). Il ne commença à publier ses travaux qu’à partir de 1682, après un séjour à Londres (1672) où il se lia d’amitié avec Oldembourg, lequel correspondait avec Barrow et Collins. Ces trois derniers répandirent les découvertes analytiques de Newton à plusieurs mathématiciens du continent (cf. Lacroix 1797, p. xi). D’où la querelle (à partir de 1699, cf. Lacroix 1797, p. xiii) pour savoir si Leibniz ne se serait pas inspiré des travaux de Newton. 3.6.4.1 Triangle caractéristique et cercle vicieux Quoi qu’il en soit, voyons comment Leibniz a inventé le calcul différentiel : « En 1713, Leibniz écrit un mémoire intitulé Histoire et origine du calcul différentiel, dans le but essentiel de se défendre contre des accusations de plagiat portées par Newton et ses partisans. Parlant de lui-même à la troisième personne, Leibniz retrace les étapes de son existence et les cheminements de sa pensée qui l’ont conduit à l’invention de son calcul différentiel [. . . ] Leibniz expose sa théorie du triangle caractéristique DY y 0 , formé par une portion infinitésimale de courbe (qui sera assimilée à une portion infinitésimale de tangente) et les portions infiniment petites des parallèles aux axes des abscisses et ordonnées. 33. « Leibniz a inventé les bases de son calcul infinitésimal en octobre et novembre 1675 ». - 97/709 - 3.6.4. Leibniz et la découverte du théorème fondamental « Ce triangle, bien qu’infiniment petit et inassignable, est semblable à d’autres triangles non infiniment petits ; en particulier, les triangles DY y 0 et XY P sont semblables, d’où les égalités : PY y0Y = 0 XY yD et PX YD = 0 XY yD « Posons x = AX, alors AZ = XY = f (x) est l’équation de la courbe et XP = g(x) est la longueur de la sous-normale. « De même que y 0 D = dx est la différentielle de x (soit un accroissement infinitésimal de x), Y D est la différentielle de f (x), soit df (x). Ainsi : g(x)dx = f (x)d[f (x)]. « Si l’on suppose que x peut varier entre deux valeurs a et b, et que f (a) = 0, il vient : Z b 1 g(x)dx = f (b)2 2 a « C’est le sens de la phrase de Leibniz : "C’est pourquoi la figure formée par les sous-normales multipliées par les éléments d’axe est toujours égale à la moitié du carré ayant pour côté l’ordonnée correspondante." « Ainsi, dans ce texte, les deux problèmes fondamentaux du calcul infinitésimal au XVIIe siècle, d’une part le problème des tangentes, qui est celui de la différentiation, d’autre part le problème des quadratures, qui est celui de l’intégration, apparaissent clairement comme réciproques l’un de l’autre. » (Dhombres & al. 1987, pp. 173-175). Néanmoins, Leibniz a échoué dans sa tentative de définir un rapport d’infinitésimaux au moyen de la tangente. En effet, la comparaison entre un triangle non assignable à un triangle assignable (dont les côtés ne sont pas infinitésimaux) est fondée sur sa définition de la tangente, à savoir la droite joignant deux points infiniment proches ; il est donc implicitement fait référence à la notion d’infinitésimal, ce qui constitue un cercle vicieux. Le rôle joué par les triangles caractéristiques est de ramener toute courbe à un polygone : « Leibniz envisagea les grandeurs comme variant par des différences successives ou par sauts, ce qui le conduisit à substituer des polygones aux courbes, et dès lors toutes les questions qu’on pouvait se proposer sur elles, furent ramenées au calcul des triangles rectilignes ; mais pour faire coïncider ensemble le polygone et la courbe, il supposa les différences infiniment petites » (Lacroix 1797, p. xix). - 98/709 - 3.6. La dérivée est découverte 3.6.4.2 Puissance des notations de Leibniz Leibniz, à l’instar de Newton au début de ses recherches, a fondé ses travaux sur les infinitésimaux, mais ce n’est pas sur eux qu’il se focalise mais sur le moyen de les utiliser algébriquement : « Il est important pour Leibniz de bien montrer que son calcul ne se réduit pas à une simple utilisation des infiniment petits ou des indivisibles que ses prédécesseurs ajoutaient pour obtenir des quadratures. Ses "différentielles" sont douées de propriétés formelles et se prêtent à une utilisation algorithmique, de nature algébrique » (Dhombres & al. 1987, p. 173). En ce sens, Leibniz se distingue déjà de Newton : « Unlike Newton, however, Leibniz sought the "algebraization of infinitesimals", rather than using a purely geometric basis 34 » (cf. Calinger 1999 cité par Collingwood 2005, p. 4). Ainsi, Leibniz va mettre au point des notations qui nous sont désormais familières et qui, du moins pour certaines, portent son nom : R R « He employed x, or later xdx, for the "sum" of all the x’s — or the "integral" of x, as called it later, on the suggestion of the Bernoulli brothers. For the "differences" in the values of x, he wrote dx 35 » (Boyer 1949, p. 205). Grâce à ces notations utilisables algébriquement, Leibniz en déduit notamment les règles de dérivation : « Leibniz established the rules for the derivatives of products, quotients, and powers as well as defining the integral as a sum of an infinite number of infinitely narrow rectangles 36 » (Collingwood 2005, p. 4). De ce fait, Leibniz transcende les limitations observées chez les mathématiciens du XVII siècle : e « Après les trésors d’invention de Roberval, Wallis, Descartes, etc. pour chacune des courbes étudiées au XVIIe siècle, ce qui fait la force de la méthode leibnizienne, c’est son universalité, la simplicité de son algorithme, sa notation élégante et son formalisme ; elle permet d’effectuer mécaniquement les calculs, en perdant de vue la nature des courbes étudiées » (Dhombres & al. 1987, p. 174). 34. « Contrairement à Newton, cependant, Leibniz chercha "l’algébrisation des infinitésimaux" davantage que de s’appuyer sur une ». R base purement géométrique R 35. « Il employait x ou, plus tard, xdx pour la "somme" de tous les x — ou "l’intégrale" de x comme il l’appela plus tard, à l’instigation des frères Bernoulli. Pour les "différences" dans les valeurs de x, il écrivait dx ». 36. « Leibniz établit les règles de dérivation des produits, quotients et puissance tout comme il définit l’intégrale comme une somme infinie de rectangles infiniments étroits ». - 99/709 - 3.6.4. Leibniz et la découverte du théorème fondamental 3.6.4.3 Leibniz et la rigueur mathématique Les travaux de Leibniz ont été considérés comme moins rigoureux que ceux de Newton : « This is due to the fact that Leibniz never stopped using infinitesimals. His refusal to stop using infinitesimals can be attributed to his attitude toward the calculus. Unlike Newton, who believed he was only extending known methods to produce new results, Leibniz realized that he was creating a new discipline (Boyer, 208) 37 » (Collingwood 2005, p. 5). Sa priorité était de voir jusqu’où pouvaient le conduire les techniques algébriques qu’il avait mises au point et non de se poser des questions en termes de rigueur : « Algebra, he thought, had a wider scope than the mathematics of the time. Thus, he rejected the idea that algebraic reasonings are "only shortcuts for the solution of arithmetical or geometrical problems" (479). Leibniz made it his practice to promote his beliefs by trying to extend algebraic techniques first and worrying about foundations and logical inconsistencies caused by infinitesimals later (479) 38 » (Collingwood 2005, p. 5). À ceux qui le critiquent de manquer de rigueur, Leibniz se défendait d’être rigoriste comme eux : « Leibniz answered [. . . ] defending himself from "overprecise" critics, whom he likened to the Skeptics of long before 39 » (Boyer 1949, p. 214). 3.6.4.4 Leibniz et les praxéologies-modélisation Comme nous avons tâché de le mettre en lumière, Leibniz a développé une technique (l’utilisation de notations nouvelles) très efficace pour résoudre deux familles entières de tâches : différentier (problème des tangentes) et intégrer (quadratures) ; mais la technologie est quasi-inexistante. On voit par là que les travaux de Leibniz se situent dans le cadre des praxéologies-modélisations dans lesquelles, en quelque sorte, la fin justifie les moyens, du moins jusqu’à un certain point. 37. « C’est dû au fait que Leibniz n’a jamais cessé d’utiliser les infinitésimaux. Ce refus peut être attribué à son attitude envers le calcul infinitésimal. Contrairement à Newton, qui croyait seulement étendre des méthodes connues pour obtenir de nouveaux résultats, Leibniz s’est rendu compte qu’il était en train de créer une nouvelle discipline (cf. Boyer 1949, p. 208) ». 38. « L’algèbre, pensait-il, avait une portée plus large que les mathématiques de l’époque. Par conséquent, il rejetait l’idée que les raisonnements algébriques sont "seulement des raccourcis pour résoudre des problèmes d’arithmétique ou de géométrie" (Kitcher 1981, p. 479). Leibniz a réussi son exercice de persuasion en tâchant d’abord d’étendre les techniques algébriques et en s’inquiétant par après des fondements et des contradictions logiques causées par les infinitésimaux ». 39. « Leibniz répondit en se défendant bien de faire des critiques "sur-précises", qu’il assimilait aux Sceptiques des temps anciens ». - 100/709 - 3.7. La dérivée est explorée et développée 3.7 La dérivée est explorée et développée Le XVIIIe siècle, que Boyer qualifie de « Period of Indecision » (Boyer 1949, pp. 224-266) est, selon Grabiner, la période où, suite à sa découverte par Newton et Leibniz, la dérivée est explorée et développée (cf. section 3.2, p. 51). 3.7.1 Multiplication des découvertes mathématiques au détriment de la rigueur Newton et Leibniz laissent une œuvre majeure pour l’histoire des mathématiques et du calcul infinitésimal en particulier : « Both gave to the calculus powerful methods that could immediately be used to solve problems and uncover new results. However, both, but Leibniz more so than Newton, left foundational issues unresolved. Thus, we should not be too surprised to find "confusion among their followers as to the nature of the subject" (Boyer, 221). Although early attempts were made to rigorize the calculus, significant headway was not made until nearly the end of the century 40 » (Collingwood 2005, p. 5). Au XVIIIe siècle, les spécialistes de l’histoire des mathématiques observent une multiplication des découvertes mathématiques, au détriment de progrès en termes de rigueur. Il y a comme une régression en ce sens. Grabiner se demande quelle est la cause de ce manque d’intérêt pour la rigueur : « One reason is that mathematics participated in the great explosion in science known as the Scientific Revolution [. . . ] The invention of the calculus at the end of the seventeenth century intensified the drive for results ; here was a powerful new method which promised vast new worlds to conquer. One can imagine few more exciting tasks than trying to solve the equations of motion for the whole solar system. The calculus was an ideal instrument for deriving new results, even though many mathematicians were unable to explain exactly why this instrument worked 41 » (Grabiner 1974, p. 356). 40. « Tous deux ont donné au calcul infinitésimal des méthodes puissantes qui pouvaient être immédiatement utilisées pour résoudre des problèmes et découvrir de nouveaux résultats. Cependant, tous deux, mais davantage Leibniz que Newton, ont laissé en plan la question des fondements. Ainsi, nous ne devrions pas beaucoup nous étonner de constater "une confusion parmi leurs disciples à propos de la nature de la matière" (Boyer 1949, p. 221). Bien que, très tôt, des tentatives fussent faites pour rendre rigoureux le calcul infinitésimal, on ne rencontre aucun progrès significatif avant pratiquement la fin du [XVIIIe] siècle ». 41. Une raison est que les mathématiques participaient à la grande explosion des sciences connue comme la Révolution Scientifique [. . . ] L’invention du calcul infinitésimal à la fin du XVIIe siècle a intensifié la soif de résultats ; c’était là une méthode nouvelle et puissante qui promettait la conquête de nouveaux et vastes mondes. Il est difficile d’imaginer une tâche plus passionnante que celle de résoudre les équations du mouvement pour l’ensemble du système solaire. Le calcul infinitésimal était l’instrument idéal pour découvrir de nouveaux résultats, même si de nombreux mathématiciens étaient incapables d’expliquer exactement pourquoi cet instrument fonctionnait. - 101/709 - 3.7.2. Confiance dans les notations symboliques Cette soif de résultats faisait que la rigueur était considérée comme une perte de temps. Plus exactement, la notion de rigueur avait évolué. À ceux qui critiquaient le manque de rigueur de Leibniz, Lacroix répondait violemment : « Géomètres médiocres de ce temps-là [qui], pour se consoler de l’impuissance où ils étaient d’entendre et d’appliquer les nouveaux calculs, déclamaient sans cesse contre leur exactitude ; la conformité des résultats, avec ceux qui étaient connus antérieurement, et les démonstrations synthétiques qu’on pouvait donner des nouveaux, faisaient retomber sur les adversaires du Calcul différentiel, les coups qu’ils voulaient lui porter » (Lacroix 1797, p. xix). Ainsi, la validation pragmatique et le champ immense d’opérationnalité des techniques employées sont jugés suffisants au XVIIIe siècle. Lacroix observe encore, à propos de l’aire du cercle chez Euclide (cf. section 3.3, p. 53) : « Il y a ici un passage du fini à l’infini ; car dans la proposition précédente, Euclide montre que ce rapport est celui des polygones semblables, inscrits dans deux cercles différents, et il me paraît évident que le Géomètre, quel qu’il soit, qui découvrit cette vérité, voyant qu’elle était indépendante du nombre de côtés du polygone, et qu’en même temps ces polygones différaient d’autant moins des cercles, qu’ils avaient plus de côtés, a dû nécessairement conclure de là, en vertu de la loi de continuité, que la propriété des premiers convenait aux seconds. On regarderait aujourd’hui comme suffisamment prouvée par ces raisonnements, la proposition qui en est l’objet, et la plupart des livres élémentaires n’en donnent pas même d’aussi complets. Mais les Anciens ont été plus difficiles que nous à cet égard ; ils n’ont jamais voulu se permettre de confondre entre elles deux quantités qui auraient une différence, si petite qu’elle fût » (Lacroix 1797, pp. iv-v). 3.7.2 Confiance dans les notations symboliques Une deuxième cause du désintérêt pour la rigueur manifesté par de nombreux mathématiciens de l’époque serait la confiance aveugle qu’ils pouvaient avoir dans les symboles mathématiques : « Sometimes it seems to have been assumed that if one could just write down something which was symbolically coherent, the truth of the statement was guaranteed. And this assumption was not applied to finite formulas only. Finite methods were routinely extended to infinite processes. Many important facts about infinite power series were discovered by treating the series as very long polynomials 42 » (Grabiner 1974, p. 356). 42. « Parfois, certains allaient jusqu’à affirmer que si l’on pouvait seulement écrire quelque chose qui était cohérent symboliquement, la véracité du contenu en était garanti. Et cette supposition n’était pas seulement appliquée aux formules finies [ayant un nombre fini de termes]. Les méthodes finies étaient étendues de manière systématique aux processus infinis. Beaucoup de propriétés relatives aux développements en séries infinies ont été découvertes en considérant ces séries comme de très longs polynômes ». - 102/709 - 3.7. La dérivée est explorée et développée L’origine d’une telle confiance serait le succès de l’algèbre et du calcul infinitésimal. Le succès du premier est dû notamment aux notations introduites par François Viète (1540–1603) par lesquelles les grandeurs, les données et les inconnues sont représentées par des lettres : « Symbolic notation lets you discover what dozens of numerical examples may not : the relation between the roots and the coefficients of any polynomial equation of any degree. 43 » (Ibid., p. 357). Néanmoins, comme nous avons pu l’observé chez la plupart des auteurs rencontrés du XVIIe siècle, l’usage des notations algébriques a tardé à se répandre. À ce titre, les notations de Leibniz semblent avoir grandement contribué à rendre l’algèbre incontournable : « The faith in symbolism nourished by algebra was enhanced further by the success of the calculus. [. . . ] The success of Leibniz’s notation for the calculus reinforced mathematicians’ belief in the power of symbolic arguments to give true conclusions 44 » (Ibid., p. 357). Désormais, puisque le symbolisme algébrique permettait de révéler et d’expliquer des relations jusque là difficiles à comprendre, il était d’autant plus difficile de s’attaquer à la rigueur que cela revenait à mettre en cause l’usage même de ces notations : « this often successful use of symbols proved to dissuade mathematicians from prodding deeper into the rigor that lay beneath the manipulation of these notations. Since the symbols seemed to provide correct answers, it did not seem there was any reason to challenge the validity of their usage in this manner 45 » (Collingwood 2005, p. 7). 3.7.3 Absence d’une théorie adaptée À ces causes, que nous pourrions qualifier de circonstancielles, s’en ajoutait une qui est propre à toute discipline naissante : l’absence du recul nécessaire et des outils ad hoc pour construire une théorie : 43. « La notation symbolique permet de découvrir ce que des centaines d’exemples numériques ne le peuvent : la relation entre les racines et les coefficients de n’importe quelle équation polynomiale d’un quelconque degré ». 44. « La confiance dans le symbolisme nourri par l’algèbre s’est trouvé renforcé par le succès du calcul infinitésimal. [. . . ] Le succès remporté par la notation de Leibniz en calcul infinitésimal a renforcé la conviction des mathématiciens dans la puissance des arguments symboliques pour parvenir à des conclusions exactes ». 45. « l’usage souvent efficace des symboles a achevé de dissuader les mathématiciens de se risquer à s’intéresser à la rigueur induite par la manipulation de ces notations ». - 103/709 - 3.7.4. Théorisation de l’analyse « To make a subject rigorous requires more than just choosing the appropriate definitions for the basic concepts ; it is necessary also to be able to prove theorems about these concepts. Developing the methods needed for these proofs is seldom merely a trivial consequence of choosing the right definitions ; in fact, the prior existence of the methods of proof is often necessary in order to recognize suitable definitions. A great deal of labor was required to devise the techniques and concepts needed to establish a firm foundation for the diverse results and applications of the calculus 46 » (Grabiner 1981, p. 16). Or, les mathématiciens du XVIIIe siècle n’étaient même pas d’accord entre eux quant à la base même à donner au calcul infinitésimal : « Much of the Analyst controversy and the confusion in the interpretation of the limit concept was due to the lack of a clear distinction between questions of geometry and those of arithmetic, and to the absence of the formal idea of a function. 47 » (Boyer 1949, pp. 235-236). 3.7.4 Théorisation de l’analyse C’est Euler qui va définir le concept de fonction, ouvrant ainsi la voie à la théorisation de l’analyse. Cette théorisation s’est faite progressivement et recouvre deux périodes de l’histoire de la dérivée : avec Euler et Lagrange, nous sommes toujours dans la période où la dérivée est explorée et développée tandis qu’à partir de Cauchy, la dérivée aura été définie (cf. section 3.2, p. 51). Le changement le plus visible désormais, par rapport aux approches du calcul infinitésimal faites jusque là, est le renversement de l’architecture, de l’ordre de présentation des concepts de l’Analyse. Il a été initié par Euler également. « Au cours du XVIIe siècle, la cinématique, ou étude des trajectoires de mobiles, a souvent été le moyen privilégié d’approcher des notions d’analyse. C’est ainsi qu’a procédé Napier pour le logarithme. Pour de nombreux savants (Galilée, Torricelli, Roberval, Newton), la vitesse est à la base de la dérivée : une courbe n’est que la trajectoire d’un point mobile. Mais la création du calcul infinitésimal a permis de donner une signification abstraite à ces notions. « Un renversement de l’ordre logique de la construction des mathématiques s’imposait donc ; Leonhard Euler en fut l’auteur au milieu du XVIIIe siècle. Son Introduction à l’analyse des infinis, parue en latin en 1748, est le premier traité dans lequel le concept de fonction est à la base de l’exposé. Euler, et à sa suite les autres géomètres du XVIIIe siècle, rompent avec le langage, le choix et l’organisation des 46. « Pour rendre une matière rigoureuse, il faut davantage que de choisir les définitions appropriées aux concepts de base ; il faut aussi être capable de prouver des théorèmes relatifs à ces concepts. Développer les méthodes nécessaires à ces preuves est rarement une simple conséquence évidente du choix des bonnes définitions. Beaucoup de travail a été nécessaire pour concevoir les techniques et les concepts requis pour donner un fondement solide aux différents résultats et applications du calcul infinitésimal ». 47. « L’essentiel de la controverse des Analystes et de la confusion dans l’interprétation du concept de limite était dû au manque de distinction claire entre les questions de géométrie et celles d’arithmétique, ainsi qu’à l’absence d’idée formelle de fonction ». - 104/709 - 3.7. La dérivée est explorée et développée mathématiques antérieures. L’ordre d’exposition des principales notions de l’analyse y est, à peu de choses près, le même qu’aujourd’hui : rappels sur les éléments d’algèbre et les propriétés des nombres, étude des fonctions, des suites, puis calcul différentiel et intégral ; viennent après seulement les applications à la géométrie, à la mécanique, etc. Ce bouleversement de l’architecture dans l’édifice mathématique constitue une rupture épistémologique dans l’histoire de cette discipline » (Dhombres & al. 1987, p. 193). Ainsi, le calcul infinitésimal, qui a été découvert comme une application de la physique (du moins chez Newton), est désormais considéré comme premier par rapport à la physique et à de nombreuses sciences qui deviennent dès lors une partie de son champ d’application. C’est ce que Chevallard appelle « une déconnexion franche du cœur théorico-technologique de l’œuvre d’avec ses applications » comme nous l’avons déjà cité à la page 50 de cette dissertation. Or, généralement, « les tâches des praxéologies "modélisation" deviennent des applications des théories résultant des praxéologies "déduction" » (Schneider 2011, p. 192). Nous sommes donc peut-être en présence également d’une rupture praxéologique. 3.7.5 Origines du retour à la rigueur Même si, au XVIIIe siècle, la priorité des mathématiciens était encore la recherche de nouveaux résultats, la préoccupation pour établir des bases logiques à l’Analyse se développait petit à petit (nous avons abordé le cas d’Euler et nous évoquerons plus loin celui de d’Alembert), jusqu’à devenir prépondérante au XIXe siècle. Grabiner se demande ce qui peut expliquer une telle évolution. Elle voit plusieurs explications possibles dont aucune, estime-telle, ne se suffit à elle-même. 3.7.5.1 Une première explication : éviter les erreurs La première explication que Grabiner propose pour justifier le retour à la rigueur est le désir d’obtenir des résultats sans erreur ; elle reconnaît néanmoins que les erreurs étaient rares avant même le retour à la rigueur, ce qui déforce une telle explication : « The first explanation which may occur to us is like the one we use to justify rigor to our students today : the calculus was made rigorous to avoid errors, and to correct errors already made. But this is not quite what happened. In fact, there are surprisingly few mistakes in eighteenth-century mathematics. There are two main reasons for this. First, some results could be verified numerically, or even experimentally ; thus, their validity could be checked without a rigorous basis. Second, and even more important, eighteenth-century mathematicians had an almost unerring intuition. Though they were not guided by rigorous definitions, - 105/709 - 3.7.5. Origines du retour à la rigueur they nevertheless had a deep understanding of the properties of the basic concepts of analysis 48 » (Grabiner 1974, p. 358). Ainsi, Grabiner constate que la rigueur n’est pas nécessaire à une compréhension profonde des concepts mathématiques. En termes praxéologiques, cela peut se traduire en disant que les praxéologies-modélisation permettent d’atteindre une compréhension profonde des concepts mathématiques, alors même que ceux-ci ne sont pas encore définis. À la fin du XVIIIe siècle, cependant, confrontés à des difficultés nouvelles, les mathématiciens ont vu leurs connaissances devenues insuffisantes, voire caduques, et il devenait nécessaire de les modifier en conséquence : « There was increasing interest among mathematicians in complex functions, in functions of several variables, and in trigonometric series. In these subjects, there are many plausible conjectures whose truth is relatively difficult to evaluate intuitively. Increased interest in such results may have helped draw attention to the question of foundations 49 » (Ibid., pp. 358-359). 3.7.5.2 Une deuxième explication : unifier les résultats Une deuxième explication est le désir légitime d’unifier les résultats obtenus jusqu’alors : « Many results had been discovered, but they were fairly loosely connected in nature 50 » (Collingwood 2005, p. 9). Mais Grabiner (1974) considère que la rigueur n’est pas la réponse adéquate à ce désir d’unité : « Unifying results does not always make them rigorous ; moreover, the function of rigor is not just to unify, but to prove 51 » (Op. cité, p. 359). 48. « La première explication qui nous vient à l’esprit est celle que l’on utilise aujourd’hui pour justifier la rigueur auprès de nos étudiants : le calcul infinitésimal a été construit avec rigueur pour éviter les erreurs et pour corriger les erreurs du passé. Mais ce n’est pas précisément ainsi que les choses s’étaient passées. De fait, il y a étonnement peu d’erreurs dans les mathématiques du XVIIIe siècle. Il y a deux raisons principales à cela. Premièrement, les résultats pouvaient être vérifiés numériquement ou même expérimentalement ; ainsi, leur validité pouvait être contrôlée sans devoir recourir à une base rigoureuse. Deuxièmement, et plus important, les mathématiciens du XVIIIe siècle jouissaient d’une intuition quasi infaillible. Bien qu’ils n’aient pas été guidés par des définitions rigoureuses, ils ont pourtant atteint une compréhension profonde des propriétés des concepts basiques de l’analyse ». 49. « Parmi les mathématiciens, il y avait un intérêt croissant pour les fonctions complexes, les fonctions de plusieurs variables et les séries trigonométriques. Dans ces matières, il y a plusieurs conjectures possibles dont la pertinence est relativement difficile à évaluer intuitivement. Un intérêt croissant pour de tels résultat peut avoir aidé à attirer l’attention sur la question des fondements ». 50. « De nombreux résultats avaient été découverts mais il n’étaient que très approximativement reliés entre eux par nature ». 51. « Unifier des résultats ne les rend pas pour autant rigoureux ; de plus, le rôle de la rigueur n’est pas uniquement d’unifier mais aussi de prouver ». - 106/709 - 3.7. La dérivée est explorée et développée Grabiner imagine aussi qu’en cette fin de XVIIIe siècle, le ralentissement de la course aux résultats permet de prendre un certain recul sur le chemin parcouru : « if progress was slowing, it was time to sit back and reflect about what had been done 52 » (Ibid., p. 359). Kleiner (1991) va également dans ce sens : « After close to 200 years of vigorous growth with little thought given to foundations, such foundations as did exist were ripe for reevaluation and reformulation 53 » (Op. cité, p. 298). On retrouve la même idée chez Lacroix, contemporain de Lagrange : « On remarque dans l’histoire des Mathématiques certaines époques où, sans que la vérité des propositions particulières ait souffert aucune atteinte, leur enchainement systématique a changé par les rapprochements auxquels les nouvelles découvertes ont donné lieu. Les principes sont devenus plus féconds, les détails moins nécessaires, et la généralité des Méthodes a permis encore d’embrasser la science en entier, malgré les pas immenses qu’elle avait faits. « Nous sommes, à ce que je crois, dans une de ces époques » (Lacroix 1797, p. iii). Ce que cette deuxième explication au désir renouvelé de rigueur nous enseigne en termes praxéologiques est que le passage des praxéologies-modélisation aux praxéologies-déduction a été notamment le fruit d’une maturation. Les mathématiciens qui ont mis au point la théorie analytique n’y seraient pas parvenus s’ils n’avaient pas bénéficié du substrat accumulé par leurs collègues aux siècles précédents. Dès lors, il n’est pas déraisonnable d’imaginer que les élèves rencontrent des concepts mathématiques encore à l’état de préconstruits dans leur esprit, qu’ils les manipulent au sein de praxéologies-modélisation, avant d’en retirer la substantifique mœlle conformément à des praxéologies-déduction. 3.7.5.3 Une troisième explication : les mathématiques rigoureuses par nature Une troisième explication est la conviction que les mathématiques se doivent d’être rigoureuses : « Everybody from the Greeks on knew that mathematics was supposed to be rigorous 54 » (Grabiner 1974, p. 359). N’en est-il pas toujours ainsi à notre époque ? Il ne semble pas que Lagrange se soit intéressé à la rigueur pour cette raison : 52. « si le progrès ralentissait, il était temps de se détendre et de réfléchir au chemin parcouru ». 53. « Après environ 200 ans de développement vigoureux avec peu d’attention portée aux fondements, de telles fondements étaient mûrs pour une réévaluation et une reformulation ». 54. « Tout le monde depuis les Grecs savait que les mathématiques étaient supposées rigoureuses ». - 107/709 - 3.7.5. Origines du retour à la rigueur Au collège, Lagrange « s’intéressa d’abord aux classiques et c’est plus ou moins par hasard qu’il se passionna pour les mathématiques. Tout en poursuivant ses études classiques, il prit connaissance des travaux d’Euclide et d’Archimède en géométrie ; ceux-ci ne paraissent pas l’avoir impressionné outre mesure » (Bell 1939, p. 169). En revanche, ce fut le cas de Cauchy pour qui les mathématiciens grecs étaient une référence incontournable : « the Greek methods were his model of rigor 55 » (Grabiner 1981, p. 30). Le théologien et philosophe Berkeley (1685–1753) s’en prit violemment aux quantités évanescentes 56 de Newton. Ses critiques ont eu une influence sur plusieurs mathématiciens mais pas au point d’expliquer la place centrale qui allait être celle de la rigueur en analyse : « The discussions of foundations by Maclaurin, d’Alembert, and Lagrange were all at least somewhat influenced by Berkeley’s work. Nevertheless, Berkeley’s attack in itself was not enough to cause foundations to become a major mathematical concern 57 » (Grabiner 1974, pp. 359-360). 3.7.5.4 Une quatrième explication : le développement de l’enseignement Une dernière explication considérée par Grabiner est la nécessité économique pour les mathématiciens d’enseigner. Elle s’expliquait non seulement par le déclin des cours royales (notamment en France avec la Révolution) mais surtout par la création de nouvelles écoles destinées à promouvoir la science et à former des élites. En quoi le fait d’enseigner, en l’occurrence les mathématiques, entraîne-t-il un effort de rigueur ? Grabiner l’explique indirectement par le contrat didactique : « Teaching always makes the teacher think carefully about the basis for a subject. A mathematician could understand enough about a concept to use it, and could rely on the insight he had gained through his experience. But this does not work with freshmen, even in the eighteenth-century. Beginners will not accept being told, "After you have worked with this concept for three years, you’ll understand it" 58 » (Grabiner 1974, p. 360). 55. « les méthodes grecques étaient son modèle de rigueur ». 56. Évanescente est une autre traduction possible pour évanouissante. 57. « Les discussions à propos des fondements par Maclaurin, d’Alembert et Lagrange étaient au moins influencées par l’œuvre de Berkeley. Néanmoins, l’attaque de Berkeley, en elle-même, n’était pas suffisante pour faire de la question des fondements un souci mathématique majeur ». 58. « L’enseignement fait toujours que l’enseignant réfléchisse soigneusement aux fondements de sa matière. Un mathématicien pourrait comprendre assez d’un concept pour l’utiliser, et il pourrait compter sur la sagacité qu’il aurait acquise par son expérience. Hélas, cela ne marche pas avec des étudiants de première année, même au XVIIIe siècle. Des débutants n’accepteront pas de s’entendre dire, "Quand vous aurez approfondi ce concept pendant trois ans, vous le comprendrez" ». - 108/709 - 3.7. La dérivée est explorée et développée Elle observe ainsi que les plus grandes avancées dans la théorisation du Calcul infinitésimal est l’œuvre de professeurs de mathématiques qui ont écrit pour leurs étudiants : « Until the end of the eighteenth century, most work on foundations did not appear in scientific journals, apparently because foundations were not considered to pose major mathematical (as opposed to philosophical) questions. Instead, such work appeared in courses of lectures, in textbooks, or in popularizations. Even in the nineteenth century, when foundations had been established as essential to mathematics, their origin was often in teaching. The work on foundations of analysis of Lagrange [. . . ], of Cauchy [. . . ], of Weierstrass [. . . ], and of Dedekind [. . . ], all originated in courses of lectures 59 » (Ibid., p. 360). C’est donc la transposition didactique, qui semble avoir été une cause importante d’un retour à la rigueur, concrétisée par la mise au point d’une théorie inattaquable. 3.7.6 Euler et le concept de fonction Jean d’Alembert (1717–1783) et Leonhard Euler (1707–1783) ont tenté de donner à l’analyse la base qui lui manquait. « D’Alembert et Euler ont cherché à donner au Calcul différentiel, une base qui leur parut plus solide que la subordination des infiniment petits ; le premier se servit de la méthode des limites, et le second considéra les infiniment petits, comme des zéros absolus, mais qui conservaient un rapport dérivé de celui qu’avaient entre elles les quantités évanouies qu’ils remplaçaient. On se demandera sans doute, ce qu’on peut entendre par le rapport de quantités qui ont cessé d’exister, et cette objection qu’on fait contre la Métaphysique d’Euler, s’applique également à celle de la Méthode des premières et dernières raisons ; car il n’y a point de milieu entre être et ne pas être, et du moment où les accroissements sont quelque chose, leur rapport n’est ni celui des fluxions ni celui des limites » (Lacroix 1797, p. xxi). Nous avons donc ici deux mathématiciens qui se préoccupent davantage de chercher une base solide au Calcul infinitésimal que de découvrir de nouveaux résultats. Le point de départ de la théorisation de l’Analyse chez Euler est le concept de fonction qu’il développe. « Pour Euler, une fonction est une combinaison quelconque d’opérations prises dans le stock des modes de calcul connus à son époque et applicables aux nombres : opérations usuelles de l’algèbre, exponentielle, logarithme, passage d’un arc à ses lignes trigonométriques, etc., 59. « Jusqu’à la fin du XVIIIe siècle, la plupart des travaux sur les fondements n’étaient pas publiés dans les revues scientifiques, apparemment parce que les fondements n’étaient pas considérés poser des problèmes mathématiques majeurs (contrairement aux fondements philosophiques). Par contre, de tels travaux figuraient dans les cours magistraux, les manuels scolaires, ou dans les ouvrages de vulgarisation. Même au XIXe siècle, une fois les fondements établis comme essentiels aux mathématiques, leur origine était souvent dans l’enseignement. Les travaux sur les fondements de l’Analyse de Lagrange [. . . ], Cauchy [. . . ], Weierstrass [. . . ] et Dedekind [. . . ], tous trouvaient leur origine dans des cours magistraux ». - 109/709 - 3.7.6. Euler et le concept de fonction certaines de ces opérations pouvant être répétées un nombre illimité de fois. Euler qualifie ces opérations d’analytiques. C’est donc le mode de construction de ces expressions analytiques qui fournit à Euler la classification des fonctions » (Dhombres & al. 1987, p. 193). Dans son Introduction à l’analyse des infinis, en 1748, après avoir choisi les « premières lettres de l’alphabet, a, b, c, etc. » pour désigner les quantités fixées et connues et « de représenter les quantités variables par les dernières lettres de l’alphabet z, y, x, etc. », Euler définit ce qu’il entend par fonction : « Une fonction de quantité variable est une expression analytique composée, de quelque manière que ce soit, de cette même quantité et de nombres, ou de quantités constantes. « Ainsi toute expression analytique, qui outre la variable z contiendra des√quantités constantes, est une fonction de z. Par exemple, a + 3z ; az − 4zz ; az + b aa − zz ; cz ; etc., sont des fonctions de z. [. . . ] « La principale différence des fonctions consiste dans la combinaison de la variable et des quantités constantes, qui les forment. « Elle dépend donc des opérations par lesquelles les quantités peuvent être composées et combinées entre elles. Ces opérations sont l’addition et la soustraction ; la multiplication et la division ; l’élévation aux puissances et l’extraction des racines ; à quoi il faut ajouter encore la résolution des équations. Outre ces opérations, qu’on appelle algébriques, il y en a plusieurs autres qu’on nomme transcendantes : comme les exponentielles, les logarithmiques, et d’autres sans nombre, que le calcul intégral fait connaître » (Euler 1748) . La démarche d’Euler est un apport capital dans l’histoire des mathématiques puisque, pour la première fois, l’analyse est construite à partir de la notion de fonction. Par exemple, Euler définit la fonction logarithme comme la fonction réciproque de l’exponentielle, cette dernière étant définie comme une puissance dont l’exposant est variable : « Quoique la connaissance des fonctions transcendantes doive faire un des objets du calcul intégral, cependant il sera à propos de traiter ici de quelques espèces qui se présentent plus fréquemment, et qui préparent la voie à plusieurs recherches. Nous considérerons donc d’abord les quantités exponentielles, ou les puissances dont l’exposant est une quantité variable ; car il est clair que ces sortes de quantités ne peuvent être rapportées aux fonctions algébriques, puisque celles-ci n’admettent que des exposants constants. On distingue plusieurs espèces de quantités exponentielles, suivant que l’exposant seul, ou que l’exposant avec le nombre qu’il affecte, est une quantité variable ; az est de la première espèce, et y z , de la seconde. [. . . ] « Si étant donné le nombre a, on peut conclure de chaque valeur de z, celle de y ; réciproquement ayant pris pour y une valeur quelconque positive, on conçoit qu’il existe pour z un nombre convenable pour que az = y ; cette valeur de z, en tant qu’elle peut être regardée comme une fonction de y, s’appelle ordinairement le logarithme de y. La théorie des logarithmes suppose donc l’existence d’un nombre - 110/709 - 3.7. La dérivée est explorée et développée constant représenté par a, que pour cette raison on appelle la base des logarithmes. Cette base une fois choisie, le logarithme d’un nombre y n’est autre chose que l’exposant de la puissance az égale à ce nombre y. On a coutume d’indiquer le logarithme du nombre y de cette manière ly. Conséquemment, si az = y, z = ly. Il s’ensuit que la base logarithmique, quoique arbitraire, doit cependant être plus grande que l’unité, et qu’il n’y a que les nombres positifs qui puissent avoir des logarithmes réels » (Euler 1748). Une fois les exponentielles et logarithmes définis, Euler s’intéresse aux fonctions trigonométriques : « Après la considération des logarithmes et des quantités exponentielles, vient celle des arcs de cercle, et de leurs sinus et cosinus, tant parce qu’ils forment une autre espèce de quantités transcendantes, que parce qu’ils dérivent des quantités logarithmiques mêmes et des quantités exponentielles, lorsqu’elles renferment des imaginaires, ce qu’on verra clairement ci-après » (Euler 1748). On observe ainsi comment la trigonométrie, qui était une branche de la géométrie entre désormais dans le giron de l’analyse, par le biais du concept de fonction. « L’introduction de la notion de fonction provoque une révolution copernicienne dans l’organisation de l’exposé des mathématiques ; des parties qui relevaient traditionnellement de la géométrie, telle la trigonométrie, passent désormais sous la coupe de l’analyse, qui devient, en quelque sorte, première. On est bien loin du Traité des sinus du quart de cercle dont Leibniz tirait l’inspiration dans les débuts de son calcul différentiel » (Matheron 2000, p. 275). 3.7.6.1 Euler et les praxéologiques-déduction Où se situe le travail d’Euler en termes de praxéologies ? La tâche qu’il accomplit est la construction d’une nouvelle théorie, l’analyse, à partir de la mise en place du concept de fonction. Ainsi, le retournement effectué par Euler se situe dans le cadre des praxéologiesdéduction. Il est le premier à entreprendre de couper le Calcul infinitésimal de tout ce qui en est l’origine. Plus exactement, ce qui constituait jusqu’alors les tâches des praxéologiesmodélisation (trouver des résultats) grâce à des techniques dont l’apothéose est le Calcul infinitésimal, est réduit au rang de simple application de ce dernier. Cette inversion se retrouve dans la structure même du cours de mathématique d’Euler. On retrouve à nouveau la « déconnexion franche du cœur théorico-technologique de l’œuvre d’avec ses applications » (cf. section 3.1.4, p. 50). - 111/709 - 3.7.7. Lagrange et l’algébrisation de l’analyse 3.7.7 Lagrange et l’algébrisation de l’analyse Joseph-Louis Lagrange (1736–1813) va reprendre le concept de fonction d’Euler dans le but de reformuler le calcul infinitésimal et, ainsi, tenter de lui donner une base inattaquable. « Lagrange est, pour l’essentiel, dans la lignée d’Euler [dont il reprend] les concepts clés de fonction et de série. [. . . ] De façon précise, le développement en série (formelle) des fonctions lui-permet de définir, à partir d’une fonction donnée (dite primitive), d’autres fonctions, dites dérivées. Lagrange met ensuite en œuvre un principe fondamental de passage du formel au numérique, qui lui permet d’appliquer l’Analyse algébrique, ou « calcul des fonctions », aux divers secteurs mathématiques (calcul numérique, géométrie différentielle, mécanique, problèmes de maximis et de minimis, calcul des variations) » (Ovaert & Sansuc 1976, pp. 121122). À la fin de la révolution française, Lagrange fut désigné pour enseigner les mathématiques à l’École Normale puis à l’École Polytechnique : « Quand, après la fermeture de Normale, la grande École Polytechnique fut fondée, en 1797 60 , Lagrange organisa le cours de mathématiques et en fut le premier professeur ; il n’avait, jusque-là, jamais enseigné à des jeunes gens peu préparés ; s’adaptant à cette matière à peu près vierge, Lagrange conduisit ses élèves, par l’intermédiaire de l’arithmétique et de l’algèbre, jusqu’à l’analyse. [. . . ] Les élèves de Lagrange éprouvaient quelque difficulté à saisir les concepts de l’infiniment petit et de l’infiniment grand dont était imbue la forme traditionnelle du calcul différentiel et intégral ; pour éliminer ces difficultés, Lagrange entreprit l’exposé du calcul sans user des "infinitésimaux" de Leibniz, ni de la conception particulière de limite suggérée par Newton » (Bell 1939, pp. 185-186). C’est à cette époque que Lagrange rédigea ses deux œuvres majeures relatifs aux fondements du calcul infinitésimal (cf. Grabiner 1983a, p. 189) : la Théorie des fonctions analytiques (1797), et les Leçons sur le calcul des fonctions (1806). Dans le premier ouvrage, Lagrange explicite son but : « L’objet de cet Ouvrage est de donner la théorie des fonctions, considérées comme primitives et dérivées, de résoudre par cette théorie les principaux problèmes d’Analyse, de Géométrie et de Mécanique, qu’on fait dépendre du Calcul différentiel, et de donner par là à la solution de ces problèmes toute la rigueur des démonstrations des Anciens » (Lagrange 1797, p. 20). L’ambition de Lagrange revient bien à reformuler le Calcul infinitésimal pour lui donner des bases rigoureuses pour, ensuite, appliquer tout aussi rigoureusement cette théorie à la géométrie et à la mécanique. Le but du second ouvrage cité est de « servir de commentaire et de supplément à la première Partie de la Théorie des fonctions analytiques » (Lagrange 1806, p. 6). Lagrange justifie sa démarche en critiquant les méthodes utilisées à partir de la découverte du calcul infinitésimal, c’est-à-dire à partir de Newton et Leibniz. 60. Selon Grabiner cette fondation date de 1795 (Grabiner 1974, p. 360). - 112/709 - 3.7. La dérivée est explorée et développée 3.7.7.1 Lagrange se positionne par rapport à ses prédécesseurs. Lagrange distingue six courants que décrit Ovaert (1976) et qui nous donnent ici un résumé des différentes méthodes proposées jusque là pour aborder le calcul différentiel et intégral : La méthode des infiniments petits. Lagrange critique cette méthode (utilisée notamment par Leibniz) pour quatre raisons : « manque de clarté pour les commençants, vérité obtenue au prix d’une double erreur, [. . . ] transfert en analyse de notions géométriques attachées aux courbes, métaphysique étrangère au problème mathématique » (Ovaert 1976, p. 162). La méthode d’Euler. C’est celle des rapports de quantités absolument nulles : « Euler, d’Alembert, etc., ont cherché à suppléer [au défaut de la méthode précédente] en faisant voir [. . . ] que les différences qu’on suppose infiniment petites doivent être absolument nulles et que leur rapports, seules quantités qui entrent réellement dans le calcul, ne sont autre chose que les limites des rapports des différences finies ou indéfinies. Mais il faut convenir que cette idée, quoique juste en elle-même, n’est pas assez claire pour servir de principe à une science dont la certitude doit être fondée sur l’évidence, et surtout pour être présentée aux commençants » (Lagrange 1797, p. 16). De plus, Lagrange estime que des objections faites à Leibniz demeurent : « Euler regarde les différentielles comme nulles, ce qui réduit leur rapport à l’expression zéro divisé par zéro, laquelle ne présente aucune idée » (Lagrange 1806, p. 7). La méthode des limites. C’est celle mise en œuvre par Maclaurin et d’Alembert. Lagrange ne la rejette pas pour des raisons de rigueur mais métaphysiques : « Au reste je ne disconviens pas qu’on ne puisse, par la considération des limites envisagées d’une manière particulière, démontrer rigoureusement les principes du calcul différentiel, comme Maclaurin, d’Alembert et plusieurs autres auteurs après eux l’ont fait. Mais l’espèce de métaphysique que l’on est obligé d’y employer est sinon contraire, du moins étrangère à l’esprit de l’Analyse qui ne doit avoir d’autre métaphysique que celle qui consiste dans les premiers principes et dans les premières opérations fondamentales du calcul » (Lagrange 1806, p. 8). Ce rejet du concept de limite entraînera l’opposition de Cauchy aux idées de Lagrange (cf. Ovaert 1976, p. 163), comme nous le verrons plus loin. La méthode des fluxions. C’est celle de Newton et de Maclaurin. Elle est ainsi décrite et critiquée par Lagrange : - 113/709 - 3.7.7. Lagrange et l’algébrisation de l’analyse « Newton, pour éviter la supposition des infiniment petits, a considéré les quantités mathématiques comme engendrées par le mouvement, et il a cherché une méthode pour déterminer directement les vitesses ou plutôt le rapport des vitesses variables avec lesquelles ces quantités sont produites ; c’est ce qu’on appelle, d’après lui, la Méthode des fluxions ou le Calcul fluxionnel, parce qu’il a nommé ces vitesses fluxions des quantités. Cette Méthode ou ce Calcul s’accorde, pour le fond et pour les opérations, avec le Calcul différentiel, et n’en diffère que par la Métaphysique, qui paraît en effet plus claire, parce que tout le monde a ou croit avoir une idée de la vitesse. Mais, d’un côté, introduire le mouvement dans un calcul qui n’a que des quantités algébriques pour objet, c’est y introduire une idée étrangère, et qui oblige a regarder ces quantités comme des lignes parcourues par un mobile ; de l’autre, il faut avouer qu’on n’a pas même une idée bien nette de ce que c’est que la vitesse d’un point à chaque instant lorsque cette vitesse est variable ; et l’on peut voir par le savant Traité des fluxions de Maclaurin, combien il est difficile de démontrer rigoureusement la Méthode des fluxions et combien d’artifices particuliers il faut employer pour démontrer les différentes parties de cette Méthode » (Lagrange 1797, p. 17). On notera que, d’une part, Lagrange, en bon analyste, rejette l’idée d’introduire la vitesse comme étant une idée étrangère ; et que, d’autre part, la vitesse instantanée n’a pas encore été définie mathématiquement. La méthode des différences finies. Selon Lagrange, une telle méthode, utilisée par John Landen (1719–1790) et le marquis de Condorcet (1743–1794), n’est pas à proprement parler du calcul différentiel : « Ainsi le calcul qu’on a nommé aux différences finies, n’est proprement que le calcul des suites, et ne peut être assimilé au Calcul différentiel, qui est essentiellement le Calcul des fonctions dérivées. Mais on a pensé que la considération des différences finies pouvait conduire à celle des différences infiniment petites, et que le calcul aux différences finies conserverait toute sa rigueur, en devenant Calcul différentiel, par l’omission des termes infiniment petits. Et de là est née la méthode des limites dans laquelle on regarde le rapport des différences infiniment petites comme la limite du rapport des différences finies, et les équations différentielles comme les limites des équations aux différences finies. Je ne disconviens pas qu’on ne puisse, de cette manière, démontrer la légitimité des résultats du calcul différentiel ; mais, quoique cette marche paraisse directe et naturelle, le passage du fini à l’infini exige toujours une espèce de saut, plus ou moins forcé, qui rompt la loi de continuité et change la forme des fonctions » (Lagrange 1806, pp. 269-270). Ovaert voit là une explication supplémentaire de la méfiance de Lagrange vis-à-vis du concept de limite : « Une autre raison importante de la méfiance de Lagrange vis-à-vis de la notion de limite de fonction [est] que la notion de fonction est plus formelle que numérique, et c’est là un obstacle épistémologique 61 important pour la 61. cf. définition p. 128 - 114/709 - 3.7. La dérivée est explorée et développée construction du concept de limite (qui se réalise au moyen d’inégalités numériques). Pour Lagrange, le passage des différences finies aux différentielles ne se décrit pas en termes d’inégalités, mais en termes de modifications de formes des fonctions » (Ovaert 1976, p. 164). La méthode des séries. C’est une première méthode développée par Newton, critiquée par Jean et Nicolas Bernoulli, et qu’il abandonna sans s’en expliquer (cf. Lagrange 1797, pp. 19-20). Lagrange ne rejette pas le principe de l’utilisation du développement en série des fonctions dans le calcul différentiel mais il devine que c’est le développement théorique du concept de fonction encore insuffisant qui rend cette méthode caduque : « À la naissance du Calcul différentiel, on n’avait pas encore une idée assez étendue de ce qu’on entend par fonction » (Lagrange 1806, p. 9). 3.7.7.2 Algébrisation de l’Analyse Après avoir critiqué l’ensemble des méthodes préexistantes, Lagrange entreprend de reformuler le Calcul infinitésimal. C’est la tâche principale qu’il se fixe, ce qui nous situe d’emblée dans le cadre des praxéologies-déduction. Comme nous l’avons annoncé plus haut, Lagrange est préoccupé par la rigueur des fondements à donner à l’Analyse : « [Lagrange veut] recourir à des analyses rigoureuses dans les domaines qui le permettent et retrouver la perfection des raisonnements des Anciens, mais par l’usage des moyens théoriques modernes » (Ovaert 1976, p. 169). Ces moyens théoriques modernes sont le concept de fonction et l’utilisation de l’algèbre dans les développements en série : « Comme Euler, Lagrange situe la source de la rigueur dans la manipulation algébrique et formelle des fonctions et de leurs développements en série » (Ovaert 1976, p. 170). Lagrange va donc s’attacher à montrer le caractère algébrique et formel du concept de fonction ainsi que du concept de série. Par exemple, à propos des fonctions, il écrit : « [. . . ] on doit regarder l’algèbre comme la science des fonctions, et il est aisé de voir que la résolution des équations ne consiste en général qu’à trouver les valeurs des quantités inconnues en fonctions déterminées des quantités connues. Ces fonctions représentent alors les différentes opérations qu’il faut faire sur les quantités connues pour obtenir les valeurs de celles que l’on cherche, et elles ne sont proprement que le dernier résultat du calcul. « Mais, en algèbre, on ne considère les fonctions qu’autant qu’elles résultent des opérations de l’arithmétique, généralisées et transportées aux lettres, au lieu que, dans le calcul des fonctions proprement dit, on considère les fonctions, qui résultent de l’opération algébrique du développement en série, lorsqu’on attribue à une ou plusieurs quantités de la fonction, des accroissements indéterminés » (Lagrange 1806, p. 10). - 115/709 - 3.7.7. Lagrange et l’algébrisation de l’analyse Pour construire les fonctions qu’il appelle dérivées, Lagrange part du développement en série entière des fonctions à partir des formules de Taylor : « Lagrange believed that any function (that is, any analytic expression, whether finite or infinite, involving the variable) had a unique power-series expansion (except possibly at a finite number of isolated points) 62 » (Grabiner 1983a, p. 191) . Fidèle à son principe théorique, la construction des fonctions dérivées et des algorithmes de dérivation se fonde sur la seule manipulation algébrique des séries entières formelles (cf. Ovaert 1976, p. 182). Voici ce qu’écrit Lagrange pour définir les fonctions primitives et dérivées : « Considérons une fonction f (x) 63 d’une variable quelconque x. Si à la place de x on substitue x + i, i étant une quantité quelconque indéterminée, elle deviendra f (x + i), et, par la théorie des séries, on pourra la développer en une suite de cette forme f (x) + pi + qi2 + ri3 + · · · , dans laquelle les quantités p, q, r, . . . , coefficients des puissances de i, seront de nouvelles fonctions de x, dérivées de la fonction primitive de f (x), et indépendantes de la quantité i. « Il est clair que la forme des fonctions p, q, r, . . . , dépendra uniquement de celle de la fonction donnée f (x), et l’on déterminera aisément ces fonctions, dans les cas particuliers, par les règles de l’Algèbre ordinaire, en développant la fonction dans une série ordonnée suivant les puissances de i. [. . . ] « Dénotons en général par f 0 (x) la fonction p dérivée de la fonction f (x), en mettant un accent à la caractéristique f , pour indiquer la dérivation de la fonction. Dénotons de même par f 00 (x) la fonction dérivée de la fonction f 0 (x), en ajoutant un accent à la caractéristique f 0 de la fonction f 0 (x) d’où elle est dérivée. Dénotons pareillement par f 000 (x) la fonction dérivée de f 00 (x), et ainsi de suite. « Ces fonctions f 0 (x), f 00 (x), f 000 (x), . . . ne seront autre chose que les coefficients de i dans les premiers termes des développements des fonctions f (x + i), f 0 (x + i), f 00 (x + i) . . . [. . . ] « Donc, substituant ces expressions dans la série f x + ip + i2 q + i3 r + · · · , 62. « Lagrange croyait que toute fonction (c’est-à-dire toute expression analytique, qu’elle soit finie ou infinie, impliquant une variable) avait un unique développement en série entière (à l’exception possible d’un nombre fini de points isolés) ». 63. D’après (Ovaert 1976, p. 174), Lagrange avait d’abord écrit f x et non f (x). Quoi qu’il en soit, les notations de Lagrange ont largement été adoptées, spécialement dans les manuels scolaires. - 116/709 - 3.7. La dérivée est explorée et développée qui est le développement de f (x + i), on aura cette formule fondamentale f (x + i) = f (x) + if 0 (x) + i2 00 i3 000 i4 f (x) + f (x) + f iv (x) + · · · 2 2·3 2·3·4 « Cette expression du développement de f (x+i) a l’avantage de faire voir comment les termes de la série dépendent les uns des autres, et surtout comment, lorsqu’on sait former la première fonction dérivée d’une fonction primitive quelconque, on peut former toutes les fonctions dérivées que la série renferme. « Nous appellerons la fonction f (x) fonction primitive par rapport aux fonctions f 0 (x), f 00 (x), . . ., qui en dérivent ; et nous appellerons celles-ci fonctions dérivées par rapport à celle-là » (Lagrange 1806, p. 13 et 16-17). Une fois le calcul différentiel et intégral ainsi fondé, Lagrange fait un travail de type hypothéticodéductif pour résoudre les « principaux problèmes d’Analyse, de Géométrie et de Mécanique » (Lagrange 1797, p. 20) comme indiqué plus haut (p. 112). Par exemple, « Lagrange établit correctement [. . . ] les algorithmes concernant les dérivées d’une somme, d’un produit, d’un quotient [. . . ], d’une fonction composée [. . . ]. Il étend ensuite tous ces algorithmes aux dérivées d’ordre supérieur. Lagrange étudie également en détail [. . . ] les problèmes de changement de variable dans le calcul des dérivées successives. Il traite enfin le cas des fonctions réciproques. Puis Lagrange étend toute la théorie aux fonctions de plusieurs variables [. . . ], et c’est alors qu’il introduit le concept de dérivée partielle ; les algorithmes sont généralisés dans ce cadre et il met en évidence le caractère commutatif des opérations de dérivation partielle » (Ovaert 1976, pp. 183-184). 3.7.7.3 L’erreur de Lagrange Néanmoins, Lagrange commet une erreur en se fiant aveuglément à l’algèbre alors même qu’il considère des développements en série ayant un nombre infini de termes : « There is no "algebra" of infinite series that gives power-series expansions without any consideration of convergence and limits 64 » Grabiner 1983a, p. 191). Ainsi, en ayant repris la formule de Taylor avec reste, en « introduisant une quantité inconnue j moindre que i » (Lagrange 1806, p. 100), Lagrange obtient la formule f (i) = f + if 0 + i2 00 i3 000 iµ−1 iµ f + f + ··· + f (µ−1) + f (µ) (j). 2 2·3 2 · 3···µ − 1 2 · 3···µ Lagrange précise que l’exposant µ est quelconque 65 . Lagrange est persuadé de la parfaite rigueur de sa démonstration : 64. « Il n’existe pas une "algèbre" des séries infinies qui assure des développements en séries entières sans aucune considération de convergence et de limite ». 65. Lagrange parle à juste titre d’exposant mais, aujourd’hui, on confond exposant et degré d’une puissance ; ici, il s’agit de l’ordre d’une dérivée et, pour éviter la confusion, la notation moderne consiste à mettre l’exposant entre parenthèses. - 117/709 - 3.7.7. Lagrange et l’algébrisation de l’analyse « On a par là une démonstration rigoureuse de cette proposition qu’on s’était contenté de supposer jusqu’ici : savoir que, dans le développement d’une fonction, on peut donner à la variable, suivant laquelle est ordonné le développement, une valeur assez petite pour qu’un terme quelconque de la série soit plus grand que-la somme de tous ceux qui le suivent ; car il est clair qu’il suffit pour cela de faire voir qu’on peut toujours prendre i assez petit pour que l’on ait iµ−1 iµ f µ−1 > f µ (j), 2 · 3 · · · (µ − 1) 2 · 3···µ condition qui se réduit à celle-ci f (µ−1) > i (µ) f (j), µ à laquelle il est visible qu’on peut toujours satisfaire en diminuant la valeur de i, pourvu qu’on n’ait pas f µ−1 = o » (Lagrange 1806, pp. 103-104). Pourtant, c’est dans ces lignes que réside l’erreur. Il ne s’agit pas d’une erreur grossière mais d’une lacune théorique qui sera comblée bien après Lagrange : « La nature de cette erreur est assez subtile : il y a confusion entre développements "asymptotiques" et développements en série convergente. Cette question ne sera élucidée que beaucoup plus tard, avec les travaux de Weierstrass, Laguerre et Borel. Cependant, Cauchy et même Lacroix, bien qu’incapables d’expliquer le phénomène, verront dans ce passage une obscurité majeure, et abandonneront, de ce fait, la formule de Taylor pour l’étude des fonctions dérivées » (Ovaert 1976, p. 181). Il n’en reste pas moins vrai que Lagrange a su reformuler le calcul infinitésimal pour le délier de ses origines géométrique et mécanique, en appliquant les règles de l’algèbre à toute l’analyse : « En mettant l’accent sur l’encadrement des restes de séries, Lagrange place l’Analyse mathématique dans un cadre général qui est encore le sien actuellement et présente ce secteur non seulement comme science d’égalités ce qui était la conception d’Euler, mais surtout comme science des majorations, encadrements, approximations. « Avec Lagrange, on aboutit vraiment au sommet de l’algébrisation des grandeurs continues par l’utilisation systématique de la formule de Taylor et sans référence à la géométrie ni aux infiniment petits. À ceci près bien sûr que les nombres réels n’ont pas encore de fondement et à ceci près encore que les questions de convergence sont, souvent soit escamotées, soit totalement négligées » (Dhombres 1978). - 118/709 - 3.8. La dérivée est définie 3.7.7.4 Lagrange et les praxéologies-déduction En termes de praxéologies, la démarche de Lagrange est manifestement au niveau des praxéologies-déduction puisqu’il a pour but de construire une théorie basée de façon cohérente sur des définitions, des axiomes et des théorèmes. Il n’est plus fait référence aux problèmes (géométriques et mécaniques, essentiellement) qui ont conduit à la naissance du calcul infinitésimal, sauf à les voir comme des applications de la théorie ainsi construite. Il confirme définitivement le retournement opéré par Euler de partir du concept de fonction pour bâtir le calcul infinitésimal et non de la géométrie ou de la mécanique. « [Lagrange] entrenched rigor as an important area of mathematics, developed new techniques to carry out rigorous analysis, and set an example of how to thoroughly prove known results of the calculus from definitions 66 » (Grabiner 1981, p. 37). 3.8 La dérivée est définie 3.8.1 Cauchy et le concept unificateur de limite Avec Augustin-Louis Cauchy (1789–1867), nous entrons dans la dernière étape relative au concept de dérivée et distinguée par Grabiner (cf. section 3.2, p. 51), celle où la dérivée est définie de façon rigoureuse : « [Cauchy] rigorized the notions of such fundamental topics as limits, continuity, convergence, the derivative, and the integral 67 » (Collingwood 2005, p. 14). Dans ce domaine, ses trois œuvres majeures sont le Cours d’analyse de l’École Royale Polytechnique (1821), le Résumé des leçons sur le calcul infinitésimal (1823) et les Leçons sur le calcul différentiel (1829). « Through these works Cauchy did more than anyone else to impress upon the subject the character which it bears at the present time 68 » (Boyer 1949, p. 271). Jusque là, le concept de limite n’était pas défini ou, du moins, les tentatives qui avaient été faites pour le définir n’étaient pas convaincantes pour tous. Par exemple, nous avons vu plus haut la critique de Lagrange pour la méthode des limites (cf. section 3.7.7.1, p. 113). Boyer le confirme : 66. « [Lagrange] ancra la rigueur comme un domaine important des mathématiques, développa de nouvelles techniques pour faire de l’Analyse avec rigueur, et donna un exemple de la façon dont il était possible de prouver complètement des résultats connus du calcul infinitésimal à partir de définitions ». 67. « [Cauchy] a rendu rigoureuses les notions de sujets fondamentaux tels que les limites, la continuité, la convergence, la dérivée et l’intégrale ». 68. « À travers ces œuvres, Cauchy a fait davantage que n’importe qui pour imprimer à cette matière le caractère qui reste encore le sien à notre époque ». - 119/709 - 3.8.1. Cauchy et le concept unificateur de limite « The limit concept lacked precision of formulation. This resulted from the fact that it was based on geometrical intuition 69 » (Boyer 1949, p. 271). Pour rompre avec cette intuition, Cauchy suit l’exemple de Lagrange : « Cauchy divorced the idea from all reference to geometrical figures or magnitudes 70 » (Boyer 1949, p. 272). Voici en quels termes Cauchy définit la limite 71 : « Lorsque les valeurs successivement attribuées à une même variable s’approchent indéfiniment d’une valeur fixe, de manière à finir par en différer aussi peu que l’on voudra, cette dernière est appelée la limite de toutes les autres » (Cauchy 1821, p. 19). Boyer commente que cette définition est la plus aboutie jusqu’alors du concept de limite : « This is the most clear-cut definition of the concept which had been given up to that time, although later mathematicians were to voice objections to this also and to seek to make it still more formal and precise 72 » (Boyer 1949, p. 273). De fait, malgré ses intentions, Cauchy ne parvient pas à rompre totalement avec la géométrie et les grandeurs. En témoigne le vocabulaire employé par Cauchy : il fait référence au mouvement (utilisation du verbe s’approcher) pour définir une notion se voulant purement numérique ; de même, Cauchy fait référence au temps à travers le mot successivement. Il n’empêche que, « Cauchy’s definition appealed to the notions of number, variable, and function, rather than to intuitions of geometry and dynamics 73 » (Boyer 1949, p. 273). Grâce au concept de limite, Cauchy va déduire et définir les concepts d’infinitésimal, de continuité, de dérivée, d’intégrale et de série qui jusque là semblaient parents, certes, mais de façon qui restait parfois obscure. Le concept de limite apporte au contraire l’unité du Calcul différentiel et intégral. Voici par exemple ce que Cauchy écrit à propos des infinitésimaux : 69. « Le concept de limite manquait de précision dans sa formulation. C’était parce qu’il était fondé sur une intuition géométrique ». 70. « Cauchy sépare l’idée de toute référence aux figures géométriques ou aux grandeurs ». 71. Nous noterons que Cauchy définit ici la limite d’une variable et non celle d’une fonction. 72. « Il s’agit de la définition du concept [de limite] la plus claire et nette qui ait été donnée jusqu’à cette époque, même si, plus tard, des mathématiciens ont exprimé des objections à son sujet et ont cherché à la rendre encore plus formelle et précise ». 73. « La définition donnée par Cauchy fait davantage appel aux notions de nombre, de variable et de fonction qu’aux intuitions de la géométrie et de la dynamique ». - 120/709 - 3.8. La dérivée est définie « Lorsque les valeurs numériques successives d’une même variable, décroissent indéfiniment, de manière à s’abaisser au-dessous de tout nombre donné, cette variable devient ce qu’on nomme un infiniment petit ou une quantité infiniment petite. Une variable de cette espèce a zéro pour limite » (Cauchy 1821, p. 19). Dès lors, un infinitésimal peut être considéré comme une variable comme une autre : « An infinitesimal was consequently not different from other variables, except in the understanding that it is to take on values converging toward zero as a limit 74 » (Boyer 1949, p. 273). De même, la dérivée est définie comme étant le résultat d’un calcul de limite : « Cauchy donne la définition désormais classique de la dérivée comme limite, quand f (x + h) − f (x) elle existe, précise-t-il, de lorsque h tend vers 0 » (Dhombres h 1978). En particulier, il n’est plus question de tangente ni de vitesse. Le renversement opéré par Cauchy de considérer la limite pour pouvoir calculer des dérivées reste d’actualité dans les traités de mathématiques comme dans les manuels scolaires. Nous reparlerons, au chapitre 5 à partir de la page 145, de cette inversion didactique qui fait que, dans l’enseignement, le concept de limite est pratiquement toujours étudié avant celui de dérivée. 3.8.1.1 Conclusion. En termes praxéologiques, le travail de Cauchy est évidemment situé au niveau des praxéologies-déduction. Il a su ordonner et clarifier des concepts déjà connus : « Cauchy’s definitions of the derivative and the differential are not in any real sense new. They indicate rather a clarification, by the application of the concepts of function, variable, and limit of a variable, of others previously given 75 » (Boyer 1949, p. 376). La volonté affichée d’une mise en ordre déductive ainsi que le travail de clarification sont typiques des praxéologies-déduction. Désormais, un nouveau mode de validation existe qui s’affranchit et de la méthode d’exhaustion des Anciens, et des validations pragmatiques ou expérimentales jugées suffisantes quelques temps auparavant : « le concept de limite est construit comme un outil de preuve permettant un système de validation logiquement cohérent et une organisation déductive globale de l’analyse. Mais on gère là des théorèmes généraux, tels que ceux relatifs à l’algèbre des limites et non plus un calcul de grandeur particulier. Ce projet correspond à la constitution de l’analyse proprement dite, comme discipline autonome, épurée donc de toute intuition géométrique ou cinématique. C’est la praxéologie "analyse moderne" dont les historiens s’accordent à attribuer la paternité à Cauchy parce qu’il a construit le concept de limite, ou du moins une version discursive, comme outil permettant un nouveau mode de validation » (Schneider 2011, p. 190). 74. « Un infinitésimal n’était, par conséquent, pas différent des autres variables, à condition de comprendre que cette variable doit prendre des valeurs convergeant vers la limite zéro ». 75. « Les définitions de la dérivée et de la différentielle données par Cauchy ne sont pas nouvelles au sens propre du terme. Elles offrent plutôt une clarification par l’application des concepts de fonction, de variable, de limite d’une variable et d’autres déjà connus ». - 121/709 - 3.8.2. Bolzano et le théorème des valeurs intermédiaires 3.8.2 Bolzano et le théorème des valeurs intermédiaires Nous avons vu comment Cauchy, par le concept unificateur de limite, est parvenu à refondre de manière cohérente toute l’Analyse. Il restait néanmoins à finir d’épurer formellement sa définition de limite qui restait discursive. Par ailleurs, faute d’utilisation de quantificateurs, Cauchy s’est trompé dans un théorème sur la continuité des séries : « La démonstration culbute sur l’absence a priori d’uniformité de la convergence [. . . ] L’écriture de l’analyse n’est pas encore quantifiée » (Dhombres 1978). C’est la représentation numérique du continu qui en est la clé, ce qui viendra plus tard : « Il fallut attendre [. . . ] jusqu’aux environs de 1870, pour que cette représentation du continu soit mise au point. Elle est due à quatre auteurs : Dedekind, Cantor, Weierstrass et Méray. Depuis lors donc, les grandeurs continues peuvent être représentées par des nombres. Ce sont les nombres appelés réels » (Rouche 2005, p. 36). Néanmoins, Bernhard Bolzano (1781–1848), contemporain de Cauchy, a travaillé également sur la continuité des fonctions. En 1817, il en donne une nouvelle définition dans Rein analytischer Beweis. . . mais les travaux de Bolzano seront peu connus avant les années 1860. Inversement, Bolzano n’a pas encore lu Cauchy puisque l’écrit que nous allons citer est antérieur au Cours d’Analyse de Cauchy (1821). Pourtant la critique que formule Bolzano en 1817 à propos des démonstrations qu’il a déjà rencontrées s’applique bien à la démonstration faite par Cauchy du théorème des valeurs intermédiaires (cf. Cauchy 1821, p. 50). La démonstration de Cauchy commence par ces mots : « Pour établir la proposition précédente, il suffit de faire voir [. . . ] » (Cauchy 1821). Or, pour Bolzano, il s’agit là d’un manque de rigueur impardonnable. Sa critique nous intéresse car elle est typique de la logique qui préside aux praxéologies-déduction. Voici ce qu’il écrit : « Dans la méthode de démonstration la plus courante, on s’appuie sur une vérité empruntée à la géométrie : à savoir que toute ligne continue à courbure simple dont les ordonnées sont d’abord positives, puis négatives (ou inversement), doit nécessairement couper quelque part l’axe des abscisses en un point situé entre ces ordonnées. Il n’y a absolument rien à objecter ni contre la. justesse ni contre l’évidence de ce théorème géométrique. Mais il est tout aussi manifeste qu’il y a là une faute intolérable contre la bonne méthode qui consiste à vouloir déduire les vérités des mathématiques pures (ou générales) (c’est-à-dire l’arithmétique, de l’algèbre ou de l’analyse) de considérations qui appartiennent à une partie appliquée (ou spéciale) seule, à savoir à la géométrie. N’a-t-on pas, depuis longtemps, senti et reconnu l’incongruité d’une pareille metabasis eis allo genos ? Ne l’a-t-on pas déjà évité dans cent autres cas, où l’on connaissait le moyen de le faire, et n’a-t-on pas considéré cette élimination comme un mérite ? Si l’on insiste pour être conséquent ailleurs, ne doit-on pas s’efforcer de l’être ici aussi ? — En effet, dans la science, les démonstrations ne doivent nullement être de simples procédés de "fabrication d’évidences", mais doivent être bien plutôt des fondements ; il - 122/709 - 3.8. La dérivée est définie faut exposer le fondement objectif que possède la vérité à démontrer : celui qui se rend compte de lui-même de cela saura qu’une démonstration véritablement scientifique, c’est-à-dire le fondement objectif d’une vérité valable pour toutes les grandeurs, qu’elles soient ou non dans l’espace, ne peut pas se trouver dans une vérité valable seulement pour les grandeurs qui appartiennent à l’espace. Conformément à cette opinion, une telle démonstration géométrique est un vrai cercle vicieux dans la plupart des cas et en particulier dans le cas présent, comme on comprend facilement. Même si la vérité géométrique à laquelle on se réfère ici est (comme nous l’avons déjà dit) évidente au plus haut point et n’a donc point besoin de démonstration en tant que "fabrication d’évidence", elle n’a pourtant pas moins besoin d’un fondement. Les concepts dont elle est composée sont visiblement si complexes qu’on ne peut hésiter un instant à dire qu’elle n’appartient nullement à ces vérités simples dites principes ou vérités primitives, parce que, précisément, ces vérités ne sont que les fondements des autres et ne sont pas elles-mêmes des conséquences ; il s’agit plutôt ici d’un théorème ou d’une vérité déduite, c’està-dire d’une vérité qui a son fondement dans certaines autres et qui doit donc être démontrée aussi dans la science par une déduction à partir des principes 76 » (Bolzano 1817, cité par Saelens 1995, Annexe 29). Ce qui frappe ici est la volonté radicale de rejeter les "fabrications d’évidences", ce qui revient à rejeter les preuves "géométriques". Bolzano rejette également « les preuves reposant sur la mécanique » (Dhombres & al. 1987, p. 206) : « Il faut rejeter de même la démonstration que certains ont établie à partir du concept de continuité d’une fonction en y faisant intervenir les concepts du temps et du mouvement. [. . . ] 76. Texte original : « Bei der gewöhnlichsten Beweisart stützt man sich auf eine aus der Geometrie entlehnte Wahrheit : daß nämlich eine jede kontinuierliche Linie von einfacher Krümmung, deren Ordinaten erst positiv, dann negativ sind (oder umgekehrt), die Abscissenlinie nothwendig irgendwo in einem Punkte, der zwischen jenen Ordinaten liegt, durchschneiden müsse. Gegen die Richtigkeit sowohl, als auch gegen die Evidenz dieses geometrischen Satzes ist gar nichts einzuwenden. Aber eben so offenbar ist auch, daß es ein nicht zu duldender Verstoß gegen die gute Methode sei, Wahrheiten der reinen (oder allgemeinen) Mathematik (d. h. der Arithmetik. Algebra oder Analysis) aus Betrachtungen herleiten zu wollen, welche in einen bloß angewandten (oder speciellen) Teil derselben, namentlich in die Geometrie gehören. Und hat man die Unschicklichkeit einer dergleichen metabasis eis allo genos nicht längst schon gefühlt und anerkannt ? Hat man sie nicht schon in hundert andern Fällen, wo man ein Mittel gewußt, vermieden, und diese Vermeidung sich zum Verdienste angerechnet ? Muß man sich also nicht, wenn man anders folgerecht sein will, dieses aueh hier zu thun bestreben ? — Denn in der That, wer immer bedenket, daß die Beweise in der Wissenschaft keineswegs bloße Gewißmachungen, sondern vielmehr Begründungen d. h. Darstellungen jenes objectiven Grundes, den die zu beweisende Wahrheit hat, seyn sollen : dem leuchtet von selbst ein, daß der echt wissenschaftliche Beweis, oder der objective Grund einer Wahrheit, welche von allen Größen gilt, gleich viel, ob sie im Raume oder nicht im Raume sind, unmöglich in einer Wahrheit liegen könne, die bloß von Größen, welche im Raume sind, gilt. Bey Festhaltung dieser Ansicht begreift man vielmehr, daß ein dergleichen geometrischer Beweis, wie in den meisten Fällen, so auch in dem gegenwärtigen, ein wirklicher Zirkel sey. Denn ist gleich die geometrische Wahrheit, auf die man sich hier beruft, (wie wir schon eingestanden haben) höchst evident, und bedarf sie also keines Beweises als Gewißmachung ; so bedarf sie nichts desto weniger doch einer Begründung. Denn sichtbar sind die Begriffe, aus denen sie besteht, so zusammengesetzt, daß man nicht einen Augenblick anstehen kann, zu sagen, sie gehöre keineswegs zu jenen einfachen Wahrheiten, welche man eben deßhalb, weil sie nur Grund von andern, selbst keine Folgen sind, Grundsätze oder Grundwahrheiten nennet ; sie sey vielmehr ein Lehrsatz oder eine Folgewahrheit, d. h. eine solche Wahrheit, die ihren Grund in gewissen andern hat, und daher auch in der Wissenschaft durch Herleitung aus denselben, dargethan werden muß ». - 123/709 - 3.8.2. Bolzano et le théorème des valeurs intermédiaires Les concepts de temps et de mouvement (et celui-ci encore plus) sont tout aussi étrangers aux mathématiques générales que le concept d’espace, cela ne peut être mis en doute par personne 77 » (Bolzano 1817, cité par Saelens 1995, Annexe 29). Ainsi, pour Bolzano et, à sa suite, tout mathématicien rigoureux qui se respecte, une démonstration en bonne et due forme doit être purement analytique, c’est-à-dire qu’en partant de définitions et d’axiomes basiques, on doit pouvoir obtenir des propriétés et des théorèmes par déduction pure. Bolzano se situe se situe bien dans le cadre des praxéologies-déduction. Le résultat obtenu importe beaucoup moins que le moyen de le prouver : nous sommes à l’opposé de ce qui prévalait chez les mathématiciens du XVIIe siècle ! De même, nous retrouvons chez Bolzano que le mouvement et, plus généralement, ce qui a pourtant été à l’origine du calcul infinitésimal, a désormais valeur d’exemple et devient une application de la théorie ainsi mise au point : « Mais la représentation sensible par le mouvement d’un corps [. . . ] ne peut être considérée aucunement comme quelque chose de plus qu’un simple exemple qui ne démontre pas le théorème lui-même, mais qui plutôt ne doit être démontré que par celui-ci. 78 » (Bolzano 1817, cité par Saelens 1995, Annexe 29). La vision "pure" de l’analyse a prévalu sans conteste jusque vers la fin du XXe siècle. Sans doute en réaction aux mathématiques modernes, purement axiomatiques et déductives, c’est vers la fin des années 1960 que les historiens des mathématiques et quelques mathématiciens voudront retrouver le sens des concepts. Nous verrons au chapitre 5 comment cette réaction a été prise en compte dans les manuels scolaires. Quoi qu’il en soit, la vision de Bolzano, qui semblait jusque là l’archétype de la "pureté analytique" est plus nuancée : « Toutefois, nous n’aurions rien à objecter si ces deux concepts n’y étaient introduits qu’en tant qu’éclaircissement. Car nous ne sommes en aucune façon partisan d’un purisme tel qu’il exige, pour maintenir la science pure de tout élément étranger, de refuser dans l’exposé de la science toute expression empruntée à un domaine étranger, ne serait-ce qu’avec une signification figurée et dans l’intention de désigner ainsi une chose d’une façon plus brève et plus claire que ce n’est possible par une description conçue uniquement dans des termes particuliers, ne serait-ce même que pour éviter la cacophonie de la répétition continuelle des mêmes mots ou pour rappeler un exemple qui peut servir à confirmer la thèse simplement par un nom donné à la chose. Comme on peut le voir en même temps, nous sommes loin de tenir les exemples et les applications pour des choses qui nuiraient à la perfection d’un exposé scientifique. Nous n’exigeons fermement que ceci : on ne proposera jamais des exemples en place des démonstrations ; on ne fondera jamais l’essentiel de la déduction sur des expressions du langage employées improprement 77. Texte original : « Nicht minder verwerflich ist der Beweis, den Einige aus dem Begriffe Stetigkeit einer Function, mit Einmengung der Begriffe von Zeit und Bewegung, führten. [. . . ] Niemand wird wohl in Abrede stellen, daß der Begriff der Zeit, und vollends jener der Bewegung in der allgemeinen Mathematik eben so fremdartig sey, als der des Raumes ». 78. Texte original : « Keineswegs aber kann die zuletzt gegebene Versinnlichung durch die Bewegung eines Körpers für etwas Mehreres angesehn werden, als für ein bloßes Beyspiel, das den Satz selbst nicht beweist, vielmehr durch ihn erst bewiesen werden muß ». - 124/709 - 3.9. Conclusion : évolution praxéologique dans l’histoire des mathématiques et sur les représentations secondaires qu’elles portent avec elles ; la déduction ne serait pas valide dès qu’on change l’expression 79 » (Bolzano 1817, cité par Saelens 1995, Annexe 29). Bolzano se place dans le contexte où l’objectif est d’atteindre une démonstration en toute rigueur et non dans celui de l’exposition des concepts mathématiques ni, a fortiori, dans le cadre de leur enseignement. 3.9 Conclusion : évolution praxéologique dans l’histoire des mathématiques Dans ce chapitre, nous avons défini ce que l’on entend par praxéologie-modélisation et praxéologie-déduction. La première est une modélisation mathématique de systèmes constitués d’objets préconstruits au sens de Chevallard (1991) ; cette modélisation est obtenue par des techniques qui sont légitimées par un discours (dit discours technologique) qui n’est pas un discours théorique mais qui est cependant convainquant ; ainsi, dans le cadre de telles praxéologies, une validation de type pragmatique sera jugée suffisante. Les praxéologies-déduction partent des concepts mathématiques et visent à les ordonner selon les lois de la logique déductive. Ensuite, nous avons survolé près de trente siècles d’histoire des mathématiques ou, plus précisément, de l’histoire du concept de dérivée. Nous nous sommes surtout intéressés aux périodes où la dérivée a été utilisée, découverte, explorée et développée et, enfin, définie, pour reprendre la décomposition de Grabiner (cf. section 3.2, p. 51) ; c’est-à-dire essentiellement les XVIIe, XVIIIe et XIXe siècles. Nous avons vu comment les praxéologies-modélisation dominent le paysage mathématique jusqu’à Newton et Leibniz compris. Ces praxéologies répondent à un besoin pressant de trouver des résultats pour les nouvelles sciences en développement. Une fois le théorème fondamental de l’analyse découvert, une même méthode permet de résoudre tous les problèmes cherchés à l’époque, ce qui étanche la soif de résultats. Après quelques temps, il en résulte des interrogations quant à la rigueur des procédés mis au point, lesquels conduisent peu à peu à l’établissement d’une théorie qui justifie pleinement la validité des résultats obtenus mais qui, par un véritable retournement de situation, place les sciences qui sont à l’origine de cette théorie au simple et dernier rang d’application. C’est le fruit des praxéologies-déduction, lesquelles 79. Texte original : « Gleichwohl, wenn diese zwey Begriffe hier nur der Erläuterung wegen eingemengt waren, hätten wir nichts dagegen zu erinnern. Denn auch wir sind keineswegs einem so übertriebenen Purismus zugethan, der, um die Wissenschaft von allem Fremdartigen rein zu erhalten, verlangt, daß man in ihrem Vortrage nicht einmahl einen aus fremdem Gebiethe entlehnten Ausdruck, auch nur in uneigentlicher Bedeutung und in der Absicht aufnehme, um eine Sache so kürzer und klärer zu bezeichnen, als es durch eine in lauter eigenthümlichen Benennungen abgefaßte Beschreibung geschehen kann, oder nur, um den Uibelklang der steten Wiederholung der nähmlichen Worte zu meiden, oder um durch den bloßen Nahmen, den man der Sache beylegt, schon an ein Beyspiel zu erinnern, das zur Bestätigung der Behauptung dienen kann. Hieraus ersieht man zugleich, daß wir auch Beyspiele und Anwendungen nicht im Geringsten für etwas Solches halten, das der Vollkommenheit des wissenschaftlichen Vortrages Abbruch thue. Nur dieses fordern wir dagegen strenge : daß man die Beyspiele nie statt der Beweise aufstelle, und auf bloß uneigentlich gebrauchte Redensarten, und auf die Nebenvorstellungen, die sie mit sich führen, niemahls die Wesenheit des Schlusses selbst gründe, so daß der letztere wegfällt, sobald man jene ändert ». - 125/709 - dominent depuis lors le paysage mathématique. Bien que les praxéologies-modélisation et les praxéologies-déduction ne soient pas exclusives, nous avons vu que, historiquement, elles se sont succédées presque sans partage. En ce début de XXIe siècle, avec le retour en grâce des historiens des mathématiques et les recherches en didactique et en épistémologie des mathématiques, les deux types de praxéologies précitées pourraient coexister, non seulement pacifiquement (les mathématiciens dits "purs" respectant le travail de leurs collègues mathématiciens "historiens", "didacticiens" et "épistémologues" ; et réciproquement) mais aussi en s’enrichissant mutuellement. Nous y voyons deux raisons. La première est que les mathématiciens "purs" peuvent avoir une vision tronquée des concepts qu’ils manipulent, comme si ces concepts avaient été conçus tels quels : « Mathematicians are used to taking the rigorous foundations of the calculus as a completed whole. What I have tried to do as a historian is to reveal what went into making up that great achievement. This needs to be done, because completed wholes by their nature do not reveal the separate strands that go into weaving them — especially when the strands have been considerably transformed 80 » (Grabiner 1983a, p. 193). Le risque est alors de sous-évaluer les difficultés d’apprentissage des étudiants en sousestimant, voire en ignorant totalement, les obstacles épistémologiques que soulèvent ces concepts ; ce sera l’objet du prochain chapitre, en nous limitant au concept de dérivée. La deuxième raison s’appuie sur la complémentarité des deux praxéologies : il pourrait être intéressant de faire appel aux praxéologies-modélisation pour motiver les élèves et les étudiants dans leurs recherches, avant de faire appel aux praxéologies-déduction pour démontrer les résultats de manière rigoureuse : « Il est incontestable que la révolution ainsi accomplie [par Lagrange en l’occurrence] a constitué un grand progrès et qu’elle était indispensable. On peut toutefois se demander si l’abandon complet des méthodes moins rigoureuses des géomètres du XVIIIe siècle a été un bien au point de vue de la facilité de la découverte mathématique. Il a pu être nécessaire de les abandonner momentanément d’une manière complète, pour permettre au principe de la rigueur nécessaire de s’établir sans contestation ; mais, maintenant que ce principe est établi de manière définitive et irrévocable, l’étude des méthodes anciennes peut avoir du bon, à condition, bien entendu, qu’on les emploie seulement comme procédés de recherche, en se réservant de démontrer ensuite les résultats par les méthodes rigoureuses de l’Analyse moderne » (Ovaert 1976, p. 200). Ainsi, nous avons montré que les praxéologies-modélisation et les praxéologies-déduction sont très différentes mais n’en sont pas moins complémentaires, que ce soit dans l’histoire des mathématiques, dans la recherche en mathématiques et dans une perspective d’enseignement : « Il ne faut pas négliger une phase d’apprentissage au cours de laquelle, les objets préconstruits, existant d’abord par le truchement d’une désignation, se mettent à exister par le truchement d’une définition au sein d’une théorie, cette définition donnant prise à une organisation véritablement déductive » (Schneider 2007). 80. Les mathématiciens sont habitués à prendre les fondements rigoureux du calcul infinitésimal comme un tout achevé. Ce que j’ai essayé de faire comme historienne est de révéler ce qui s’est passé pendant la constitution de cette grande réalisation. C’est nécessaire parce qu’un tout achevé, par nature, ne révèle pas les fils distincts qui entrent dans son tissage — en particulier lorsque les fils ont été considérablement transformés. - 126/709 - Chapitre 4 Analyse des conceptions des élèves, des difficultés et obstacles qui marquent leur évolution Rappelons l’importance de l’analyse des conceptions des élèves : « un des points d’appui essentiels de la conception [d’une ingénierie didactique] réside dans l’analyse préalable fine des conceptions des élèves, des difficultés et erreurs tenaces, et l’ingénierie est conçue pour provoquer, de façon contrôlée, l’évolution des conceptions » (Artigue 1988, p. 291). Cette analyse vise à identifier les difficultés et obstacles qui marquent l’évolution des conceptions des élèves liées au concept de dérivée. Il s’agira moins de considérer les obstacles liés à la maturation intellectuelle des élèves que de nous intéresser aux obstacles qui sont intrinsèquement liés aux savoirs visés, indépendamment des dispositifs didactiques engagés, à savoir les obstacles épistémologiques. 4.1 Les obstacles Avant de préciser davantage ce qu’est un obstacle épistémologique (cf. section 4.2, p. 130) et quels sont ceux que les élèves peuvent rencontrer lors de l’apprentissage du concept de dérivée, analysons la multiplicité a priori des obstacles et tâchons de les classer pour les distinguer. Il existe plusieurs types d’obstacles. Il y a ceux qui s’opposent à l’apprentissage et ceux qui s’opposent à la résolution de problèmes par les élèves, qu’il s’agisse des problèmes en général ou seulement de certaines classes de problèmes. Brousseau (1983) classe les obstacles à l’apprentissage en trois catégories : • Les obstacles liés au développement des élèves sont appelés obstacles ontogéniques : « Les obstacles d’origine ontogénique sont ceux qui surviennent du fait des limitations (neurophysiologiques entre autres) du sujet à un moment donné de son développement : il développe des connaissances appropriées à ses moyens et à ses buts à cet âge-là » (Op. cité, p. 177). Le concept de dérivée est abordé en avant dernière année des études secondaires. Les élèves concernés ont donc au moins 16 ans et, d’après Piaget, de tels élèves ont atteint le dernier stade d’évolution de l’intelligence, celui des opérations formelles. On peut donc penser que les obstacles ontogéniques sont sans objet ici. • Les obstacles liés aux dispositifs d’enseignement sont qualifiés de didactiques. Nous les étudierons au chapitre suivant, lorsque nous analyserons l’enseignement de la dérivée tel qu’il est proposé dans les manuels scolaires et à travers certaines pratiques enseignantes. • Les obstacles liés aux savoirs enseignés sont appelés obstacles épistémologiques par Brousseau (Ibid.). Ce sont des obstacles liés intrinsèquement aux savoirs visés, « quels que soient les dispositifs didactiques choisis » précise Schneider (2008, p. 219). Cela ne signifie pas pour autant que les dispositifs didactiques choisis n’entrent pas en ligne de compte. En effet, les obstacles épistémologiques sont utiles, voire nécessaires, à l’apprentissage du concept visé. Or les dispositifs didactiques peuvent favoriser l’émergence de ces obstacles ou, au contraire, les éviter, volontairement ou non. Ce sont ces obstacles qui vont retenir notre attention dans ce chapitre. Tous ces obstacles, précisément parce qu’ils s’opposent « à l’apprentissage des concepts mathématiques eux-mêmes » (Schneider 2008, p. 203), sont susceptibles d’entrer dans le champ de la didactique des mathématiques. Quant aux obstacles à la résolution de problème, Schneider en distingue deux, à savoir les obstacles psychologiques et les obstacles méthodologiques. « [Les obstacles psychologiques] consistent en attitudes ou habitudes mentales qui empêchent de sortir des sentiers battus et donc de penser une solution originale appropriée au problème » (Ibid., p. 204). On parle d’obstacles méthodologiques lorsque certaines méthodes sont méconnues, que ces méthodes puissent être découvertes (par exemple par métaconnaissance sur des problèmes déjà rencontrés) ou non par les élèves. Nous ne nous attarderons pas sur ces obstacles, non qu’ils soient négligeables, mais parce qu’ils ne sont pas propres à la didactique des mathématiques. Enfin, on peut se demander quel rôle peuvent jouer les problèmes pour franchir les obstacles à l’apprentissage. Est-ce que n’importe quel problème est efficace ? Suffit-il de répéter de nombreuses fois un même type de problème ? Au fond, il faut commencer par s’entendre sur ce que serait un problème utile pour affronter les obstacles précités. Brousseau (1983), l’appelle un vrai problème : - 128/709 - 4.1. Les obstacles « L’obstacle est constitué comme une connaissance [. . . ]. Il va résister au rejet, il tentera, comme il se doit, de s’adapter localement, de se modifier aux moindres frais, de s’optimiser sur un champ réduit, suivant un processus d’accommodation bien connu. C’est pourquoi, il faut un flux suffisant de situations nouvelles [. . . ] qui vont le déstabiliser, le rendre inefficace [. . . ]. Aussi, le franchissement d’un obstacle exige un travail de même nature que la mise en place d’une connaissance, c’est-à-dire des interactions répétées, dialectiques de l’élève avec l’objet de sa connaissance. Cette remarque est fondamentale pour distinguer ce qu’est un vrai problème ; c’est une situation qui permet cette dialectique et qui la motive » (Op. cité, p. 176). Parfois, des connaissances antérieures peuvent faire obstacle à un apprentissage. Il ne s’agit pas de connaissances fausses, en contradiction avec toute logique. Ce sont plutôt des connaissances qui sont efficaces pour traiter certaines classes de problèmes mais ne le sont plus pour en traiter d’autres. 4.1.1 Le statut de l’erreur Le rapprochement entre une connaissance et un obstacle donne ses lettres de noblesse à ce dernier. En effet, cela revient à lier un objet à connotation éminemment positive (la connaissance), à un autre qui a une connotation négative (l’obstacle) ; tout le monde convient que la connaissance est appelée à s’élargir tandis que l’obstacle est destiné à être détruit ou, du moins, à être contourné. Or, en considérant l’obstacle comme une connaissance antérieure à dépasser, l’obstacle peut devenir un point de passage obligé, sinon utile à l’apprentissage parce qu’en tâchant de le dépasser, ce sont de nouvelles connaissances qui seront mises en place. Ainsi, il convient parfois de ne pas éviter ou camoufler l’obstacle mais bien de le rencontrer, de l’affronter. De tels obstacles constituent alors des crises salutaires, à l’image, par exemple, de la crise d’adolescence par laquelle le jeune va passer du stade de l’enfance à celui d’adulte 1 . L’erreur et l’échec revêtent, du même coup, un nouveau rôle : « L’erreur n’est pas seulement l’effet de l’ignorance, de l’incertitude, du hasard que l’on croit dans les théories empiriques ou béhavioristes de l’apprentissage, mais l’effet d’une connaissance antérieure, qui avait son intérêt, ses succès, mais qui, maintenant se révèle fausse, ou simplement inadaptée. Les erreurs de ce type ne sont pas erratiques et imprévisibles, elles sont constituées en obstacles. Aussi bien dans le fonctionnement du maître que celui de l’élève, l’erreur est constitutive du sens de la connaissance acquise » (Brousseau 1983, p. 171). 1. Cette image a ceci d’intéressant que, bien qu’une telle crise soit nécessaire à l’adolescent, aucun parent n’a envie qu’elle se produise en raison de sa violence possible et surtout de son caractère imprévisible ; il en va de même dans l’enseignement lorsqu’un professeur refuse de mettre en place des dispositifs didactiques destinés à favoriser l’émergence d’obstacles pourtant nécessaires sinon utiles à l’apprentissage, par peur de ne pas savoir réagir efficacement aux questions des élèves. - 129/709 - 4.2 Les obstacles épistémologiques Maggy Schneider (2008) observe que le concept d’obstacle épistémologique « est convoqué parfois mal à propos, encore aujourd’hui et y compris dans des milieux de chercheurs » (Op. cité, p. 219). Il est donc utile de rappeler quelques caractéristiques des obstacles épistémologiques. Comme nous l’avons écrit plus haut, un obstacle épistémologique est une connaissance antérieure au savoir visé, qui possède son domaine de validité, lequel se trouve justement dépassé quand il s’agit du savoir visé. D’autre part, comme le qualificatif l’indique, un obstacle épistémologique est supposé avoir laissé des traces dans l’histoire des mathématiques (cf. Brousseau 1983 et Sierpinska 1985). Néanmoins, Michèle Artigue et Maggy Schneider relativisent l’importance de cette référence à l’histoire (cf. Artigue 1991 et Schneider 2008, p. 257). En revanche, tout le monde s’accorde pour dire qu’un obstacle épistémologique « résiste et reparaît » (Brousseau 1983), c’est-à-dire que les mêmes erreurs reviennent années après années, chez les élèves qui doivent acquérir le savoir visé comme chez ceux qui sont supposés maîtriser désormais ce savoir : « Ces erreurs résistent aux mises en garde, elles ressurgissent sans crier gare. [De plus, elles] semblent indépendantes — ou peu s’en faut — de la formation reçue : certains de ces paradoxes ou erreurs embarrassent autant les professeurs que leurs élèves ; et indépendantes aussi de la réussite scolaire : les élèves jugés "forts" sont tout aussi démunis que les autres. » (Schneider 2008, p. 258) Un petit exemple vécu par nous-mêmes : à l’université, de nombreux étudiants, au détour d’un calcul par ailleurs éventuellement compliqué (calcul d’une dérivée partielle, etc.), se trompent uniquement parce qu’ils écrivent que le carré d’une somme est égale à la somme des carrés, erreur qu’ils ont peut-être rencontrée des centaines de fois pendant leurs études secondaires, sans jamais la vaincre totalement ; en revanche, si on leur parle alors de produit remarquable voire, simplement, si on leur demande de relire leur calcul à cet endroit-là, ils reconnaissent tout de suite leur erreur ; ils font un nouveau nœud à leur mouchoir, en espérant ne pas oublier la prochaine fois, mais le fond de l’obstacle épistémologique de la non-linéarité (de la plupart) des fonctions demeure ! 4.3 Les obstacles épistémologiques liés au concept de dérivée Pour notre travail, nous l’avons rappelé au début de ce chapitre, il est essentiel de connaître les obstacles épistémologiques que les élèves auraient intérêt à rencontrer dans le cadre de l’apprentissage du concept de dérivée. En particulier, l’ingénierie didactique devra être conçue en ce sens. Schneider (1988), dans sa thèse, a dressé la liste des obstacles épistémologiques liés à l’analyse mathématique et, en particulier, au concept de dérivée. Nous les retrouvons synthétisés dans son Traité de didactique des mathématiques (2008). Elle y montre d’abord « l’existence de conceptions qui sont susceptibles de gouverner les erreurs » (en s’appuyant notamment sur l’exemple des conceptions possibles de la tangente) avant de remonter aux obstacles épistémologiques proprement dits, puisqu’ils peuvent « gouverner les conceptions elles-mêmes » (Op. cité, p. 243). - 130/709 - 4.3. Les obstacles épistémologiques liés au concept de dérivée 4.3.1 Des conceptions provisoires de la tangente Le concept de tangente n’est pas défini de manière définitive aux élèves du secondaire, notamment parce que la tangente intervient bien avant la dérivée dans le cursus des élèves. On peut donc rencontrer plusieurs conceptions provisoires de la tangente : « L’exemple de la tangente nous amène [. . . ] à considérer des conceptions qui ne peuvent servir de définition que dans un cadre strictement limité ou bien auxquelles on n’accordera pas le statut de définition. » (Schneider 2008, p. 235) Voici quatre conceptions de la tangente parmi la dizaine que répertorie Artigue (1991) : • Une droite est tangente à une courbe si elle a un seul point commun avec cette courbe et reste toujours du même côté par rapport à la courbe. • Une droite est tangente à une courbe si elle coupe cette courbe en deux points confondus. • Une droite tangente à une courbe est la droite définie par le point de tangence et un point de cette courbe infiniment voisin. • La tangente à la courbe représentative d’une fonction f au point d’abscisse a est la droite passant par le point (a, f (a)) et dont la pente est la valeur de la dérivée de cette fonction en l’abscisse a. La première conception est appelée conception intersection globale par Corinne Castela (1995). En effet, elle conduit notamment à vérifier qu’en dehors du point de tangence, il n’y a aucune intersection de la droite tangente-candidate avec le reste de la courbe. Cette conception pourrait être acceptée comme définition provisoire dans la mesure où elle convient à certaines courbes comme les coniques. Elle se révèle fausse pour la plupart des autres courbes, même très simples, à commencer par les droites, lesquelles sont en tout point leur propre tangente. Un autre exemple est la courbe y = x3 : la tangente en (0, 0) traverse la courbe ; la tangente en (1, 1) rencontre la courbe en un point supplémentaire et traverse la courbe. « Schneider (1988) et Castela (1995) montrent [que cette conception] est tenace et fait "obstacle" à la quatrième conception correspondant à la définition que l’analyse mathématique standard donne de la tangente en un point d’une courbe » (Schneider 2008, p. 236). Comment cette conception s’installe-t-elle ? La réponse est complexe. Nous renvoyons à Johsua et Dupin (1993) pour lesquels la question de l’origine des conceptions est toujours en débat. « [En particulier, ces auteurs font] l’hypothèse que les conceptions des élèves, loin d’être intrinsèquement liées à ceux-ci, sont induites par les situations auxquelles ils sont confrontés et par les rapports que ceux-ci entretiennent avec l’institution (scolaire) qui leur propose ces situations. Cela ferait de certaines conceptions de "purs produits didactiques" » (Schneider 2008, p. 242). - 131/709 - 4.3.1. Des conceptions provisoires de la tangente Dans le cas présent, nous savons qu’une telle conception est « évidemment inspirée du cas du cercle » (Schneider 2008, p. 236) : la notion de tangente est abordée bien avant l’étude de la dérivée et même celle des fonctions. L’enseignant doit alors décrire la tangente au cercle comme la droite n’ayant qu’un point d’intersection avec le cercle et perpendiculaire au rayon du cercle. La dernière partie de cette description devient obsolète avec n’importe quelle autre courbe. Pourtant, même si l’enseignant parvenait à ne pas définir la tangente à ce moment-là et se contentait de parler de ses propriétés dans le cas du cercle, comment éviter que les élèves, auxquels on demande uniquement de savoir reconnaître une tangente au cercle, ne se choisissent, au moins implicitement, une définition tout à fait suffisante à ce moment-là ? Ensuite, quand ils abordent la tangente à une courbe, le souci d’économie de pensée les fera appliquer ce souvenir ancien pour répondre, à moindre frais, à la question posée. La deuxième conception est un progrès dans la mesure où elle s’attache à vérifier qu’il n’y a pas d’autre intersection dans un voisinage du point de tangence (le voisinage étant pris au sens topologique, voire au sens commun du terme). Elle est appelée de ce fait intersection locale par Castela (1995). La formalisation de la deuxième conception appelle une question : comment deux points, s’ils sont confondus, n’en forment-ils pas un seul ? Cette question ne semble pas cruciale pour les élèves. Schneider (1988) nous fait part de ses observations en classe : « [Il y a] des élèves qui, sans avoir reçu d’enseignement préalable, déterminent la tangente à la courbe y = x2 au point (1, 1) en s’inspirant [. . . ] de la deuxième conception. [. . . un] élève détermine les coefficients a et b de la tangente y = ax+b en exprimant le passage par le point de tangence et le fait que le système composé de l’équation de la parabole et de celle de la tangente se ramène à une équation du second degré dont le réalisand [ou discriminant] est nul » (Op. cité, p. 236). Cette procédure est efficace dans le cas d’une fonction du second degré, mais elle ne l’est déjà plus avec une fonction du troisième degré. Observons que, par leur formulation même, les deux premières conceptions de tangente ne prétendent pas constituer une définition de la tangente. Le si employé dans l’expression Une droite est tangente à une courbe si. . . indique une condition suffisante et non pas nécessaire : si les droites ont la propriété (globale ou locale, selon les conceptions) de ne pas avoir d’intersection supplémentaire avec la courbe et, le cas échéant, de rester toujours du même côté par rapport à la courbe, alors ces droites sont des tangentes. La réciproque étant fausse, il ne peut y avoir définition. Les deux autres conceptions présentées ici sont plus ambitieuses : cette fois, il n’y a plus de si mais la force affirmative du verbe être. Reprenons-les : La troisième conception considère un point infiniment voisin du point de tangence. Il est suffisamment éloigné de ce dernier pour que, ayant deux points, il soit possible de concevoir une droite passant par ces deux points ; et il reste suffisamment proche pour que cette droite ne soit pas une sécante. Le défaut de cette conception réside dans le statut que l’on donnerait à la notion d’être infiniment voisin, notion « non reprise dans les savoirs de l’analyse standard » (Schneider 2008, p. 236). Pourtant, ici aussi, Schneider (2008) observe que cette conception présente un intérêt dans l’apprentissage des élèves : - 132/709 - 4.3. Les obstacles épistémologiques liés au concept de dérivée « [Elle peut] inspirer des procédures qui conduisent à un résultat correct. [. . . Un] autre élève considère le point (1, 1) et le point 1 − n, (1 − n)2 en précisant que 1 − n est "un nombre quelconque sur la tangente" et calcule ensuite la pente de la droite passant par ces deux points. Une fois ce calcul simplifié, il annule n et obtient ainsi une valeur qu’il propose comme pente pour la tangente cherchée » (Op. cité, p. 236). Contrairement à ce qui a été observé avec la deuxième conception de tangente, une telle procédure fonctionne encore avec des fonctions du troisième degré et au-delà. Cette conception est à rapprocher de la méthode d’adégalité mise au point par Pierre de Fermat que nous avons rappelée au chapitre précédent. Sans être acceptable en regard de la quatrième conception — désormais canonique — de la définition de tangente en analyse mathématique standard, les deuxième et troisième conceptions de tangente ne sont pas dénuées d’intérêt : « [Elles] ne renvoient pas inéluctablement à des erreurs : ainsi, plusieurs conceptions [. . . ] de la tangente peuvent en constituer une définition. [. . . ] Dans [la structure cognitive des élèves] peuvent coexister le savoir lui-même et des intuitions cohérentes ou non avec ce savoir » (Ibid., p. 241). Nous verrons au chapitre suivant les liens entre ces obstacles et l’enseignement. En effet, « l’enseignement ne peut consister à déverser des savoirs dans la tête vide des élèves : leur mental n’est pas vierge mais fait de conceptions qui peuvent entraver l’apprentissage ou le faciliter. De plus, l’enseignement n’est pas toujours de nature ni à "rectifier" ces conceptions, ni à installer une conception unique et performante [. . . ] Cela relativise évidemment l’impact qu’on pourrait prêter a priori à [l’enseignement] » (Ibid., p. 241). Il existe un autre point de vue sur les conceptions, celui où la notion de conception est perçue comme « objet local, étroitement associé au savoir en jeu et aux différents problèmes dans la résolution desquels il intervient » (Artigue 1991). C’est précisément ce qui a été observé dans le cas de la tangente : « Telle conception de tangente inadaptée à certaines courbes devra être remplacée par une autre. Ce regard attire l’attention sur l’illusion de transparence de la théorie mathématique enseignée : celle-ci est plus polymorphe qu’on ne se l’imagine a priori [. . . ]. La définition adoptée est donc l’objet d’un choix didactique. Elle peut faire l’objet d’une évolution. De plus, ce deuxième point de vue montre l’intérêt de certaines perspectives d’enseignement [. . . ] : les conceptions installées chez les élèves pourraient être fonction des situations qui leur sont proposées. En contrepartie, on peut imaginer que la "théorie" soit adaptée aux situations rencontrées ou, en tout cas, que l’enseignement "travaille" des conceptions moins canoniques mais néanmoins productives comme peuvent l’être les deuxième et troisième conceptions de la tangente analysées plus haut » (Schneider 2008, pp. 241-242). En dressant une liste d’obstacles épistémologiques liés au concept de dérivée, nous nous plaçons en amont des difficultés conceptuelles des élèves. D’après ce qui précède, faire travailler les élèves sur ces obstacles, c’est-à-dire les placer en situation de confrontation directe avec eux, revient à leur faciliter l’apprentissage du savoir visé, en l’occurrence le concept de dérivée. - 133/709 - 4.3.2. L’obstacle géométrique de la limite 4.3.2 L’obstacle géométrique de la limite Le premier obstacle épistémologique dont nous parlerons est l’obstacle géométrique de la tangente étudié par Cornu (1983), Sierpinska (1985) et Schneider (1988). Par une analyse historique, Sierpinska (1985) observe ceci : « une idée géométrique de la différence entre une grandeur variable et une grandeur constante qui est sa limite. Justement : "Grandeur" et non "nombre". La conception du cercle comme "limite" des polygones inscrits ou circonscrits serait un des symptômes de cet obstacle : plus le nombre de côtés est grand, plus la forme du polygone devient proche de la forme du cercle. Aussi, une idée de tangente comme "limite" de sécantes variables où on se dit qu’à un certain moment la position de la sécante diffère aussi peu que l’on veut de la position de la tangente. C’est bien la conception de différence avec laquelle on a affaire dans la méthode d’exhaustion. Le terme "différence" changeait de sens avec le changement de la grandeur en question et ceci peut être une des raisons pour lesquelles on avait tant de mal à transformer cette méthode en théorème général » (Op. cité). Voyons comment les didacticiens perçoivent cet obstacle dans le travail des élèves. Selon les auteurs, le point de vue est davantage local ou davantage global. Sierpinska (1985) a une vision plutôt locale de l’obstacle géométrique de la limite, ainsi que Schneider (2008) en fait l’analyse : « Ayant identifié, dans l’histoire, ce qu’elle appelle obstacles épistémologiques, Sierpinska tente d’en déceler localement des traces dans les propos des élèves observés. Par exemple, elle perçoit la trace de l’obstacle géométrique de la limite dans le fait qu’un élève rejette systématiquement l’expression "s’approcher" proposée par son interlocuteur comme étant non-mathématique car, dit-elle, "cela peut manifester un sentiment de nécessité de préciser ce qu’il faut comprendre par la différence entre les grandeurs". Elle reconnaît le même obstacle lorsqu’un élève exprime sa conception de la tangente comme "une position de la sécante telle que tout changement de cette position fait qu’elle touche ou passe par un des points infiniment proches du point de tangence" » (Op. cité, pp. 243-244). Schneider (2008) propose une analyse plus globale de l’obstacle géométrique de la limite : « À cette analyse locale, je préfère adopter ici une vision plus globale qui fait de l’obstacle géométrique de la limite un schéma d’interprétation de difficultés conséquentes éprouvées par des élèves à propos du concept de tangente [. . . ], en particulier la difficulté à associer la pente d’une tangente à la limite d’une suite de quotients différentiels » (Op. cité, p. 244). - 134/709 - 4.3. Les obstacles épistémologiques liés au concept de dérivée La suite explique ce dernier point de vue. Mais partons d’abord de quelques observations. Cornu (1983) nous rapporte une expérience qu’il a conduite en classe. Il considère une courbe : M A En A, il plante un clou (perpendiculairement à la feuille de papier) et il tient un autre clou (également perpendiculaire à la feuille) sur le point M . Il appuie alors une règle sur les deux clous et déplace le point M vers le point A, le long de la courbe, en maintenant la règle appuyée contre les deux clous. A M Il demande aux élèves de décrire ce que fait la règle. Voici ce qu’il observe : « Tous les élèves font allusion au mouvement de la règle (l’angle diminue, la distance diminue ; les mots "rotation", "translation", sont employés). Mais beaucoup ne font pas allusion à ce qui se passe lorsque le point M arrive en A. Et, parmi ceux qui y font allusion, beaucoup n’ont pas vu la notion de limite : "la règle tombe", "un point ne suffit pas pour déterminer une droite". Le mot "tangente" a été introduit par plusieurs élèves. Mais, pour calculer la pente d’une droite, tous affirment qu’il faut deux points, ce qui a incité plusieurs élèves à mesurer sur le dessin les coordonnées de deux points de la tangente pour calculer la pente. Là encore, on a donc trouvé l’idée d’un état final, mais qui est isolé, qui est tout à fait indépendant de ce qui s’est passé avant » (Op. cité). Sierpinska (1985) observe un fait comparable : un expérimentateur manipule devant deux élèves un matériel semblable à celui que décrit Cornu, sans recourir à la parole. Les élèves ont ainsi l’occasion de voir la tangente comme position limite de sécantes qui tournent autour d’un point fixe. Deux semaines plus tard, ces élèves sont invités à déterminer l’équation de la tangente à la courbe y = sin x au point d’abscisse x = 0. Ils se souviennent de l’expérience ; cependant, Sierpinska observe ceci : « L’idée de calculer quelques valeurs du quotient différentiel au voisinage de zéro n’est pas venue des élèves ; elle leur a été soufflée par l’expérimentateur. La prise de conscience de la dépendance numérique de la position de la tangente à partir des positions de la sécante était très faible » (Op. cité). Schneider (1988 et 1991a, repris en 2008) interprète les observations faites précédemment : - 135/709 - 4.3.2. L’obstacle géométrique de la limite « La tangente est, dans une certaine présentation de l’analyse au cycle secondaire, un objet second par rapport à sa pente, puisqu’elle est définie par le biais de celle-ci. . Dans la théorie, le point de départ est la sécante, droite définie par deux points. Celle-ci détermine une pente exprimée par la "fonction-taux d’accroissement" et la limite de cette fonction est un nouveau nombre grâce auquel on définit le point d’arrivée, à savoir la tangente. Ce qui fait qu’on ne peut aller de cet objet géométrique qu’est la sécante à cet autre objet géométrique qu’est la tangente sans passer par un domaine autre que la géométrie et que nous qualifierons de"numérique symbolisé". "Numérique" car la tangente est définie par le biais d’un nombre : sa pente. "Symbolisé" parce que cette pente est la limite d’une suite de pentes de sécantes et que l’acte de passage à la limite ne peut être identifié et accompli que si l’on dispose de l’expression littérale de ces pentes. » (Schneider 2008, p. 246) Schneider résume ceci par le schéma suivant : domaine géométrique domaine "numérique symbolisé" sécantes - pentes limite THÉORIE ? tangente pente Ainsi, dans la théorie mathématique, le passage de la sécante à la tangente se fait de manière univoque via le quotient différentiel et la limite de celui-ci, c’est-à-dire en quittant un temps le domaine géométrique. Or, chez les élèves, ce parcours est beaucoup moins clair, comme l’observe Schneider : « Les élèves pensent plus volontiers à déterminer d’abord la tangente, ensuite sa pente, plutôt que le contraire. Par exemple, en traçant la tangente "à vue" et en mesurant les différences d’abscisses et d’ordonnées de deux points quelconques de celle-ci. Cette prégnance de la tangente par rapport à sa pente peut s’expliquer par le fait que la pente est un rapport et donc n’est susceptible que d’une expression symbolisée, tandis que la tangente est un objet. La tentation est grande, dès lors, de concevoir la tangente comme un objet géométrique défini au moyen d’autres objets géométriques, à savoir les sécantes, pour ensuite seulement revenir à sa pente. Les élèves passeraient donc des sécantes directement à la tangente avant d’envisager la pente de cette dernière. Dans ce schéma [ci-après] où la tangente est un objet premier par rapport à sa pente, le passage à la limite serait interprété de manière presque exclusivement géométrique : le mot limite du langage savant étant compris comme "position limite" de droites, au sens d’une topologie — implicite et confuse bien entendu — sur l’ensemble des droites. » (Ibid., pp. 246-247) - 136/709 - 4.3. Les obstacles épistémologiques liés au concept de dérivée domaine géométrique sécantes domaine "numérique symbolisé" "limite" - pentes - pente ÉLÈVES ? tangente Ainsi, les élèves passent des sécantes à la tangente sans quitter le domaine géométrique ; au mieux feront-ils des incursions dans le domaine "numérique symbolisé" pour calculer la pente de certaines sécantes mais sans chercher la limite de ces pentes. Quant à la tangente, 0 lorsqu’ils voudront en connaître la pente, ils ne pourront écrire autre chose que : 0 « C’est là d’ailleurs une confusion rencontrée dans plusieurs manuels scolaires 2 . Une imagerie mentale dynamique donne du sens à cette perception : les élèves imaginent la sécante tourner autour d’un point jusqu’à se confondre avec la tangente. Ainsi perçu, le "passage à la limite" s’accomplit jusqu’à son terme : les incréments ∆x et ∆y qui tendent vers 0 finissent par devenir effectivement nuls. Une fois la tangente perçue comme "limite géométrique" de sécantes, il faut pouvoir revenir à sa pente. Cela soulève d’énormes difficultés pour les élèves, étant donné la façon dont ils perçoivent cette "limite". En effet, en pensant le passage à la limite et son accomplissement dans le domaine géométrique, en se précipitant à l’état final, les élèves s’enfoncent dans une impasse : les ∆x et ∆y devenus nuls, la pente de la sécante devenue tangente s’écrit 00 ! Pour conforter cette interprétation, signalons que plusieurs élèves interrogés après un enseignement sur les tangentes, à propos de l’interprétation géométrique du nombre dérivé, parlent exclusivement des droites sécantes qui se rapprochent de la droite tangente et ne mentionnent pas la suite de leurs pentes. Le lapsus : tangente au lieu de pente de tangente est fréquent. En bref, c’est un glissement indu du domaine numérique à celui des grandeurs géométriques qui constitue cette interprétation. Or, un tel glissement caractérise bien l’obstacle géométrique de la limite. »(Ibid., p. 247). Finalement, ce qui pose problème chez les élèves est que la limite est pensée dans un univers inadéquat. Or ce phénomène n’est pas propre à la tangente comme nous allons le voir à présent. 2. Nous verrons au chapitre suivant que certains manuels scolaires peuvent entretenir la confusion dénoncée ci-dessus. - 137/709 - 4.3.3. L’obstacle de l’hétérogénéité des dimensions 4.3.3 L’obstacle de l’hétérogénéité des dimensions L’obstacle de l’hétérogénéité des dimensions consiste lui aussi en un glissement mental inconscient et indu mais, cette fois, du domaine des nombres à celui des grandeurs. Schneider (2008) fait travailler des élèves sur les indivisibles de Cavalieri (cf. section 3.4.2, p. 68) dont elle rappelle les caractéristiques : « Les indivisibles sont donc caractérisés par deux traits : ils ont une dimension de moins que la grandeur dont ils sont extraits (des surfaces dans des solides et des lignes dans des surfaces) et sont découpés parallèlement à un plan donné ou à une droite donnée. En négligeant la deuxième caractéristique, on est amené à déduire indûment un rapport entre les volumes de solides à partir des aires de sections planes. » (Op. cité, p. 250) Pour illustrer le risque encouru si l’on néglige la deuxième caractéristique précitée, Schneider choisit un exemple : « Le piège est particulièrement vicieux dans le cas de sections radiales comme dans l’exemple ci-dessous. Soit le solide engendré par la rotation autour de l’axe des x de l’aire sous la parabole d’équation y = x2 entre les bornes 0 et 1. y 1 y = x2 1 x 0 Certains élèves prétendent que ce volume vaut le tiers de celui du cylindre circonscrit, car, disent-ils, l’aire sous la parabole vaut le tiers de celle du rectangle circonscrit. » (Ibid., p. 250) Voici à présent l’analyse de Schneider quant à cette erreur : « Le piège sous-jacent est le suivant. Deux grandeurs A et B sont décomposées en ensembles équipotents de grandeurs ayant une dimension de moins (ici des sections radiales que nous continuerons à appeler "indivisibles", empruntant ce terme à Cavalieri, mais en lui prêtant une acception plus large). Supposons que la mesure de chaque "indivisible" de A soit égale ou proportionnelle à celle de son - 138/709 - 4.3. Les obstacles épistémologiques liés au concept de dérivée homologue dans B. On considère de plus que la décomposition en "indivisibles" transgresse les règles de découpage imposées par les principes de Cavalieri (et c’est là que nous élargissons la conception de ce dernier), ce qui est le cas de la décomposition des solides en sections radiales. Le piège consiste alors à transposer indûment aux mesures m des grandeurs A et B la loi vérifiée par celles de leurs indivisibles : m(A) = m(B) ou m(A) = k · m(B). D’où vient que les élèves transfèrent si spontanément aux mesures des grandeurs une loi vérifiée par celles de leurs "indivisibles" respectifs ? En effet, on ne peut inférer une relation entre les mesures de deux grandeurs d’une relation entre les mesures de leurs "indivisibles", si ce n’est par le biais d’une loi (d’additivité) reliant, pour chacune de ces grandeurs, sa mesure à celles de ses indivisibles. Or, une telle loi n’existe pas : on n’obtient pas le volume d’un solide, ni en additionnant les aires de ses sections radiales, ni en additionnant leurs volumes nuls. Cependant, le fait que les sections radiales composent le solide est tellement prégnant dans l’esprit des élèves qu’il supplée l’absence d’une telle loi dont il assume indûment le rôle, induisant ainsi un passage abusif du rapport des "indivisibles" au rapport des surfaces. Ainsi les élèves glisseraient inconsciemment du contexte des nombres à celui des grandeurs, empruntant à ce dernier une argumentation, un maillon de leur raisonnement qui leur fait défaut dans le premier. On comprend mieux la nature du dérapage lorsqu’on le contraste avec la position prudente de Cavalieri : pour ce dernier, les indivisibles sont implicitement définis tout autant par leur mode de découpage (des sections parallèles à un plan ou des segments parallèles à une droite) que par le fait qu’ils possèdent une dimension de moins que la grandeur dont ils font partie. Et ce sont précisément ces règles de découpage qui garantissent le transfert de l’égalité ou de la proportionnalité des mesures des indivisibles aux grandeurs elles-mêmes. Des glissements mentaux analogues peuvent expliquer d’autres erreurs multiples. Ainsi, pour obtenir le volume du solide représenté à la [figure ci-dessus], un élève propose de multiplier par 2π l’aire sous la parabole, exprimant indûment en termes de mesures l’engendrement du solide par une rotation complète de la surface. Quoiqu’erroné, ce calcul du volume du solide de révolution est le germe du théorème de Guldin selon lequel le volume d’un tel solide s’obtient en multipliant l’aire de la surface qui l’engendre par le périmètre du cercle décrit par le centre de gravité de cette dernière. Le calcul de l’élève est à rapprocher de celui qui consiste à multiplier la base d’un prisme oblique par la longueur de son arête pour obtenir son volume en considérant que ce solide est engendré par le mouvement de sa base le long de cette arête. Dans les deux cas, l’élève pense à une manière de concevoir une grandeur : tel solide est engendré par la rotation d’une surface et tel autre par la translation d’une surface. Cette perception est à ce point prégnante qu’il la traduit en termes de mesures : tel volume est le produit de l’aire (qui l’engendre) par l’amplitude du mouvement (rotation ou translation) sans réaliser le glissement mental qu’il effectue des grandeurs aux nombres. » (Ibid., pp. 251-252) Un tel glissement n’apparaît pas seulement lors de l’apprentissage de l’analyse. Ainsi, ce propos d’élève rapporté par Schneider (2008) : « Le volume du parallélépipède rectangle est constitué d’un certain nombre de fois la base d’aire (L × l). Le nombre est h. D’où on peut trouver la formule de V = L × l × h. » (Ibid., p. 253) - 139/709 - 4.3.4. L’obstacle des mathématiques conçues comme copie conforme de l’expérience sensible Voici l’analyse qu’en fait alors Schneider : « Relevons une partie de ce propos : "le nombre est h". Il révèle un glissement inconscient chez l’élève, du contexte numérique vers celui des grandeurs : en effet, tout se passe comme s’il comptabilisait le nombre de fois qu’une surface est reportée dans un solide au moyen de points (des grandeurs donc), comme s’il agglomérait ceux-ci en tant que tels pour former un segment (une autre grandeur) et revenait ensuite dans le domaine numérique en proposant la mesure de ce segment, comme nombre de surfaces (alors qu’il y en a une infinité). Là aussi, on constate peu d’étanchéité entre le domaine des grandeurs et celui des nombres-mesures. » (Ibid., p. 253). Reprenant les résultats de ses recherches (1988 et 1991b), Schneider (2008) caractérise finalement ainsi l’obstacle de l’hétérogénéité des dimensions : 1. « une certaine perception des grandeurs s’immisce dans les calculs d’aires ou de volumes de manière inconsciente et indue ; 2. des grandeurs de dimensions distinctes sont mêlées au sein de cette perception (solides avec surfaces ou surfaces avec lignes) » (Ibid., p. 254). Rappelons que l’obstacle géométrique de la limite décrit au paragraphe précédent (p. 134) consiste en un glissement indu du domaine numérique à celui des grandeurs géométriques. L’obstacle de l’hétérogénéité des dimensions que nous venons de décrire consiste en un glissement indu du domaine numérique à celui des grandeurs. La similitude est frappante. Schneider observe que si l’on élargit le domaine des grandeurs à des objets géométriques tels que la tangente et que l’on néglige la deuxième caractéristique de l’obstacle de l’hétérogénéité des dimensions donnée ci-avant, on peut considérer que cet obstacle de l’hétérogénéité des dimensions englobe, du moins « en un certain sens » (Ibid., p. 254) l’obstacle géométrique de la limite. Mais cette parenté ne s’arrête pas là. Un obstacle plus général encore englobe les deux obstacles que nous avons déjà étudiés : il s’agit d’une conception des mathématiques comme copie conforme de l’expérience sensible, et nous allons l’étudier à présent. 4.3.4 L’obstacle des mathématiques conçues comme copie conforme de l’expérience sensible À propos des concepts de vitesse et de débits instantanés, Maggy Schneider repère un obstacle plus global encore : une conception des mathématiques comme copie conforme de l’expérience sensible. Les deux obstacles précédents peuvent se résumer à un amalgame dans la tête de l’élève, d’une part entre des objets géométriques et certaines caractéristiques numériques de ceux-ci (obstacle géométrique de la limite), et d’autre part entre des grandeurs et des mesures-nombres (obstacle de l’hétérogénéité des dimensions). Ici, s’opère un amalgame entre le monde sensible et les concepts mathématiques : comme si ce que je vois pouvait être modélisé mathématiquement tandis que ce qui échappe à mes sens n’avait pas de raison d’être. Schneider (2008) analyse des réactions des élèves à propos du vase conique : - 140/709 - 4.3. Les obstacles épistémologiques liés au concept de dérivée « [Les élèves] invoquent la nécessité d’avoir un volume minimal pour avoir un débit : "Pour avoir un débit, il faut qu’il reste un petit volume", ou celle d’avoir un espace non nul pour pouvoir déterminer une vitesse : "Si le temps est nul, le mobile ne bouge plus". Ils soulignent le fait que toute mesure requiert un minimum de temps : "ça n’existe pas, il n’y a pas moyen de le mesurer, car le temps de regarder sa montre et du temps s’est déjà écoulé". Ces réactions seraient dues au fait que les élèves dénient aux concepts mathématiques la possibilité de circonscrire avec précision quelque chose qui leur semble échapper jusqu’à un certain point aux sens et aux mesures » (Op. cité, p. 254). Ainsi, puisque la mesure exacte de la vitesse instantanée est impossible, l’élève dénie aux mathématiques la possibilité de calculer la valeur exacte de cette vitesse. Cet ancrage dans l’expérience sensible peut être attribué à l’empirisme (ou positivisme empirique), qui est une théorie philosophique selon laquelle l’expérience est l’origine principale de nos connaissances. Une conséquence de cette théorie est qu’un bon observateur n’interprète en rien ce qu’il voit : il existe des "faits" objectifs et une seule "vision vraie". Or, au moins en partie, le monde sensible est illusoire : « Ce nouvel obstacle consiste en une attitude épistémologique particulière des élèves vis-à-vis des mathématiques : les objets étudiés ici, tangentes, aires curvilignes, vitesses instantanées correspondent à des grandeurs physico-géométriques, c’est-à-dire à des grandeurs qui, pour les élèves, font partie d’un monde sensible, à savoir un monde qu’ils croient pouvoir appréhender, d’une manière objective, par leurs seuls sens. Et nombreux sont ceux qui s’attendent à ce que les concepts mathématiques et leurs propriétés, les nombres en particulier, prolongent en quelque sorte leur perception première de ces objets issus du monde sensible, comme si les mathématiques étaient une copie quasi-conforme de ces objets. D’où les glissements mentaux décrits plus haut et les réserves vis-à-vis des vitesses instantanées. Dans une telle perspective, les mathématiques préexistent à toute activité humaine : plutôt que d’être création de l’esprit, elles se laisseraient découvrir par celui qui observe les objets concrets du "monde naturel". Or, ce monde sensible est illusoire : depuis les travaux de psychologie de la forme, on sait, par exemple, que la perception visuelle n’est pas réductible à la sensation enregistrée par la rétine : un même dessin peut-être perçu par certains comme le portrait d’une jeune fille, par d’autres comme celui d’une vieille femme. Les enseignements actuels de la psychophysiologie de la vision vont dans le même sens. C’est sans doute dans la mesure où ils croient en l’existence d’un monde sensible, en celle de faits observables, donné absolu et incontournable, que les élèves s’attendent à ce que les mathématiques traduisent ce donné presque terme à terme. S’ils se rendaient compte du caractère illusoire de ce monde sensible, c’est-à-dire s’ils étaient conscients que leur soi-disant "perception" est, en fait, une structuration mentale, une interprétation de l’esprit, conditionnée par un environnement socio-culturel, peut-être éprouveraient-ils moins de difficultés à remplacer cette structuration première par une autre qui s’articule autour de concepts mathématiques. » (Op. cité, p. 255) - 141/709 - 4.3.4. L’obstacle des mathématiques conçues comme copie conforme de l’expérience sensible À présent, nous allons considérer successivement l’empirisme du point de vue de l’apprentissage (processus d’acquisition d’une connaissance sous l’effet des interactions avec l’environnement) et du point de vue de l’enseignement (action de transmettre des connaissances). En termes d’apprentissage, l’empirisme se situe au niveau de l’épistémologie des sciences et au niveau du développement génétique de l’intelligence : 1. Au niveau de l’épistémologie des sciences, Gaston Bachelard (1980) dénonce l’usage abusif des métaphores qui ne sont dès lors pas une manière intuitive d’illustrer les théories mais un obstacle à la création de ces théories auxquelles elles se substituent. Il donne l’exemple de la limaille de fer jetée sur une paroi aimantée disposée verticalement : on pourrait expliquer l’attraction électrique par la présence d’une sorte de glu ; le problème se pose lorsque la métaphore tient lieu de pensée : « Si l’on n’intériorisait pas cette métaphore, il n’y aurait que demi mal ; on pourrait toujours se sauver en disant qu’il ne s’agit là que d’un moyen de traduire, d’exprimer le phénomène. Mais, en fait, on ne se borne pas à décrire par un mot, on explique par une pensée. On pense comme on voit, on pense ce qu’on voit : Une poussière colle à la paroi électrisée, donc l’électricité est une colle, une glu. On est alors engagé dans une mauvaise voie où les faux problèmes vont susciter des expériences sans valeur, dont le résultat négatif manquera même le rôle d’avertisseur, tant est aveuglante l’image première, l’image naïve, tant est décisive son attribution à une substance. » (Op. cité) 2. Au niveau du développement génétique de l’intelligence, Jean Piaget (1974) montre la difficulté pour un enfant de lire correctement une expérience. Il donne l’exemple de l’expérience qui consiste à dissoudre du sucre dans un verre d’eau ; or l’adjonction et la dissolution du sucre ne modifient pas le volume de l’eau ; si l’on demande aux enfants où est le sucre ils répondent qu’il n’y en a plus puisqu’on ne le voit plus. Piaget note l’importance, chez l’enfant, du moment où il sera capable d’une distanciation d’avec ce qu’il voit. Nous allons à présent considérer l’empirisme du point de vue de l’enseignement. En effet, les dispositifs didactiques peuvent contribuer ou non à renforcer l’impact de l’empirisme sur les élèves. Ainsi, Berthelot et Salin (1992) dénoncent l’ostension déguisée par laquelle l’enseignant demande à l’élève de voir la même chose que lui, alors même que ce qui est visible est trop élaboré pour que l’élève soit en mesure de voir ce que l’enseignant attend : « Au lieu de montrer à l’élève ce qui est à voir, le maître le dissimule derrière une fiction : celle que c’est l’élève lui-même qui le découvre sur les figures soumises à son observation. Comme ce savoir à découvrir est un savoir très élaboré, le maître est obligé de manipuler le milieu matériel pour rendre la lecture de ses propriétés la plus simple possible ; malgré cela ses interventions sont indispensables, mais au lieu d’être vécues par l’élève comme un apport d’informations dont il ne dispose pas, elles peuvent l’être comme le signe manifeste de son incapacité à voir et comprendre ce qui est si évident pour l’enseignant et une plus grande incitation à décoder les intentions didactiques du maître. » (Op. cité, p. 175) - 142/709 - 4.3. Les obstacles épistémologiques liés au concept de dérivée Nous trouvons au chapitre suivant un exemple d’une telle ostension déguisée : une activité (cf. section 5.3.1.1, p. 185) consiste à construire un tableau de valeurs des pentes de sécantes AB où B est un point dont l’abscisse vaut 2 (celle de A) plus h ; les valeurs de h vont de 1,5 à 0,01. La question posée est « Que constatez-vous quand h tend vers 0, c’est-à-dire quand le point B se rapproche du point A ? » (Delfeld & al. 2003, p. 167). À côté de la réponse attendue par les auteurs d’Actimath, il en existe beaucoup d’autres et l’expérience montre que les élèves ont plus de difficulté à voir où l’on veut les mener : des réponses telles que « la pente diminue », « la dernière décimale est toujours un 5 » ou « il y a deux décimales de plus dans le résultat que dans les valeurs de h » peuvent tout aussi bien être constatées. Or Bloch (2000) a montré que pour un même graphique, les visions respectives du professeur et des élèves pouvaient être très différentes, ce que le professeur ignore habituellement : « Les recherches montrent que l’enseignement traditionnel utilise surtout les graphiques sur le mode idéogrammatique, ce qui conduit à des phénomènes de dédoublement didactique, l’enseignant croyant que les élèves voient dans le graphique la même chose que lui (une fonction) alors que les élèves n’y voient qu’un idéogramme ou une icône » (Bloch 2000, p. 192) Schneider (2008) résume le lien entre l’ostension déguisée et une certaine épistémologie teintée d’empirisme ; puis sachant que le positivisme empirique est un obstacle épistémologique, elle s’inquiète de l’impact des pratiques ostensives qui renforceraient les élèves dans une vision trompeuse des choses : « Salin (1999) interprète les pratiques ostensives comme traces d’une épistémologie empiriste-sensualiste des enseignants qui se traduit par l’illusion que nos connaissances sont tirées d’une perception de l’expérience par nos sens plutôt que créées par la raison humaine dans une démarche de distanciation par rapport à l’expérience. Or, [. . . ] le positivisme empirique est source de nombreux obstacles d’apprentissage tant il est vrai qu’il n’existe pas de sensation non traitée par le cerveau, ainsi que l’ont montré les sciences de la cognition. Ne faut-il donc pas craindre les pratiques ostensives qui ne peuvent que conforter l’élève dans une vision trompeuse des choses selon laquelle un bon observateur n’interprète en rien ce qu’il voit et qu’il existe donc des "faits" objectifs ? » (Op. cité, pp. 170-171) Finalement, Schneider montre que cette conception, fort répandue parmi les enseignants en mathématiques, repose sur une confusion entre apprentissage et enseignement, comme si le discours du professeur impliquait nécessairement apprentissage de l’élève : « Cette épistémologie spontanée, imprégnée d’empirisme, semble être une conception dominante chez les enseignants de mathématiques. Elle est rarement exprimée, voire inconsciente et repose sur une confusion entre apprentissage et enseignement : "L’élève apprend ce que le professeur dit, et il n’apprend rien de ce que le professeur ne dit pas" (Margolinas 1992). Qui plus est, le discours du maître s’enregistrerait chez l’élève ; les phénomènes vus ou touchés s’imprimeraient dans son cerveau et, par conséquent, le professeur s’interdirait des dispositifs didactiques [. . . ] où des erreurs sont soumises à la sagacité des élèves. Or, rien ne confirme cette dépendance étroite de l’apprentissage des élèves au discours du professeur que du contraire, les travaux de Mercier (1992 et 1998) ayant montré que les élèves confrontés à leur ignorance sont susceptibles de s’enseigner aussi bien à eux-mêmes que les uns aux autres. » (Ibid., p. 171) - 143/709 - 4.4 Conclusion : impasse didactique Dans ce chapitre, nous nous sommes entendus sur ce que l’on nomme obstacle et nous en avons distingué plusieurs types. Parmi eux, nous nous sommes surtout intéressés aux obstacles épistémologiques dans la mesure où ils sont intrinsèquement et avant tout liés aux savoirs visés. Ces obstacles sont à la fois résistants aux mises en garde, multirécidivants (chez un même élève comme dans une classe donnée, d’année en année) et indépendants du niveau scolaire des élèves. Relativement au concept de dérivée, nous avons identifié trois obstacles épistémologiques : l’obstacle géométrique de la limite — qui est un glissement mental inconscient et indu du domaine numérique à celui des grandeurs géométriques —, l’obstacle de l’hétérogénéité des dimensions — qui est un glissement mental inconscient et indu du domaine numérique à celui des grandeurs — et enfin, l’obstacle des mathématiques conçues comme la copie conforme de l’expérience sensible — qui est un glissement mental inconscient et indu du monde sensible (ce qui est perçu par les sens) vers les concepts mathématiques. Schneider (2008) a montré la manière dont ces obstacles s’emboîtent : le dernier obstacle cité englobe le précédent qui englobe le premier cité, comme des poupées russes en quelque sorte. Enfin, nous avons montré que l’ostension déguisée — par laquelle l’enseignant demande à l’élève de voir la même chose que lui, alors que ce qui est visible est trop élaboré pour permettre une interprétation univoque — est la trace « d’une épistémologie empiriste-sensualiste des enseignants qui se traduit par l’illusion que nos connaissances sont tirées d’une perception de l’expérience par nos sens plutôt que créées par la raison humaine dans une démarche de distanciation par rapport à l’expérience » (Op. cité). Or, du fait que l’ostension déguisée est fort répandue chez les enseignants en mathématiques, l’obstacle des mathématiques conçues comme la copie conforme de l’expérience sensible risque de sortir renforcé des séquences d’enseignement. Cela constituerait une impasse didactique. Dans le chapitre suivant, à travers l’analyse de deux manuels scolaires très répandus en Belgique, nous allons montrer notamment que l’ostension déguisée y est bien présente. - 144/709 - Chapitre 5 Analyse de l’enseignement et de ses effets Dans ce chapitre, nous chercherons à analyser les pratiques enseignantes en ce qui concerne l’enseignement de la dérivée dans l’enseignement secondaire. Concrètement, nous tâcherons d’identifier les types de praxéologies employées dans deux manuels scolaires très répandus en Belgique. Nous pourrons ainsi compléter notre tentative d’interprétation du constat négatif fait en introduction de ce travail (cf. p. 36), ce qui nous conduira à la formulation de l’hypothèse mise à l’épreuve dans notre recherche. 5.1 Un programme scolaire monolithique En France, on dit souvent que chaque ministre de l’enseignement marque son passage par une réforme plus ou moins profonde de l’enseignement. Les enseignants se plaignent également des fréquents changements dans les programmes scolaires. Il en va de même en Belgique. En mathématique aussi : on déplace ceci à une autre année, on ajoute ou supprime cela. Cependant, si l’on regarde ce qui nous intéresse ici, à savoir l’enseignement de la dérivée, il y a des invariants, au premier rang desquels figure l’ordre dans lequel l’analyse est abordée : Étude des fonctions – Limites – (Continuité) – Dérivées – Applications des dérivées. Cet ordre n’est même pas justifié : il s’impose de lui-même, tant il semble évident à tout matheux (et, donc, à tout enseignant en mathématiques du secondaire). Pourtant, historiquement, comme nous l’avons vu, il n’en a pas toujours été ainsi ; du moins jusqu’à Euler. Il n’est donc pas interdit d’imaginer, par exemple, aborder la dérivée avant les limites. 5.1.1 La dérivée dans le programme scolaire belge Nous donnons ici un extrait du programme scolaire en Belgique, pays où ont eu lieu nos expérimentations. Voici le texte relatif au programme pour 4 "heures" par semaine : 5.1.1. La dérivée dans le programme scolaire belge Dérivées • Nombre dérivé, fonction dérivée. Interprétation géométrique (tangente), cinématique (vitesse), économique (coût marginal). . . • Le nombre dérivé en un point sera défini à partir du taux d’accroissement. • Calcul des dérivées. • Dérivée des fonctions usuelles ; dérivée d’une somme, d’un produit, d’un quotient ; dérivée de la composée de deux fonctions. [. . . ] Applications diverses : • Dérivées et croissance. • Modélisation de problèmes liés à la physique, l’économie, aux sciences humaines. . . • Approximation locale d’une fonction par une fonction du premier degré. • Résolution approchée d’une équation. • Problèmes liés à la recherche de valeurs extrémales. • Représentation graphique de quelques fonctions. On montrera le lien entre : - la dérivée première et la croissance de la fonction ; - la dérivée seconde, la croissance de la dérivée première et la concavité. Le programme 6h/sem. ajoute, outre une mention à la règle de l’Hospital, quelques références à ce qui est appelé « théorèmes classiques » ; ajout que l’on peut interpréter comme relevant d’un objectif d’approche un peu plus théorique : Théorèmes classiques : théorème des accroissements finis, relation entre la croissance d’une fonction dérivable et le signe de sa dérivée première, relation entre la concavité du graphique d’une fonction deux fois dérivable et le signe de sa dérivée seconde. Toutes les démonstrations ne doivent pas être établies, cependant les propriétés seront reliées entre elles. Une telle énumération est pour le moins vague, à la fois quant au contenu réel attendu de ce qui devra être enseigné et quant aux exigences attendues des productions des élèves. On n’y trouve aucune justification des choix opérés : par exemple, pourquoi envisager d’abord le nombre dérivé et non directement la fonction dérivée ? On n’y trouve aucune exigence quant à la signification du concept : à la lecture du programme, il s’agit de définir le nombre et la fonction dérivée, puis de les interpréter, ce qui n’éclaire pas le sens du concept ni même son origine historique. Ce programme semble reprendre les grandes lignes d’un traité d’analyse universitaire dans lequel on supprimerait le scolairement incorrect, c’est-à-dire ce qui est jugé inaccessible ou inutile aux élèves, à commencer par les démonstrations (« Toutes les démonstrations ne doivent pas être établies, cependant les propriétés seront reliées entre elles »). Le passage des mathématiques instituées (telles que pratiquées par les mathématiciens) aux contenus enseignés s’appelle la transposition didactique. Rien qu’à la lecture du programme scolaire, on peut craindre, d’une part ce que Rouy (2007) appelle les praxéologies - 146/709 - 5.2. Espace Math 56 à trous et le niveau de rationalité zéro et, d’autre part ce que Chevallard (2012) appelle le monumentalisme 1 . Les praxéologies à trous consistent à proposer aux élèves un cours d’analyse de type universitaire pour matheux dont on retire toute justification non immédiate : on parvient ainsi à conserver les définitions et les propriétés (qui « seront reliées entre elles » comme le demande le programme) mais les élèves ne disposent d’aucun moyen de réflexion sur la pertinence des résultats avancés ; d’où la notion de niveau de rationalité zéro. La priorité est donnée à l’utilité du concept pour résoudre une série d’exercices standard. On peut ainsi considérer que l’élève qui sait résoudre les exercices d’application des propriétés abordées au cours est un élève qui a compris. Mais compris quoi ? Ce qu’on attend de lui ; sans doute ; mais peut-être pas le concept sous-jacent. Certains enseignants, du secondaire comme du supérieur, ne s’en inquiètent pas : ce sera vu à l’université. D’autres enseignants considèrent que les élèves du secondaire, et non seulement les élèves dits forts, sont capables de construire des raisonnements mathématiques cohérents. N’est-ce pas précisément en cela que réside le fait de faire des mathématiques ? Sans doute est-ce pour cela que Chevallard (2012) dénonce le monumentalisme, c’est-àdire l’attitude de certains acteurs de l’enseignement qui confondent faire des mathématiques au sens donné ci-dessus avec la visite des monuments mathématiques au nombre desquels figure la dérivée, monument manifestement incontournable devant lequel on peut s’extasier sans en comprendre l’essence. Quoi qu’il en soit, c’est sur base du programme scolaire que sont élaborés les manuels scolaires et que chaque enseignant va construire son cours. Nous avons choisi d’analyser deux ouvrages : Espace Math 56, qui est une référence en Belgique et dont les auteurs ont publié des manuels scolaires pendant des décennies ; et Actimath 54, issu d’une collection qui s’est voulue novatrice par rapport aux manuels du type du précédent. Nous parlerons également du manuel Vers l’infini pas à pas, qui tranche nettement avec les manuels les plus répandus. 5.2 Espace Math 56 La collection Espace Math fut longtemps le manuel scolaire le plus répandu dans l’enseignement secondaire en Belgique. Nous allons analyser le manuel destiné aux élèves de Cinquième ayant 6 heures 2 de mathématiques par semaine, d’où le « 56 » dans son titre. L’édition est datée de 1999. 1. « Hier, je dénonçais le monumentalisme triomphant, dans lequel l’enseignement devient une suite de visites de monuments dont souvent on ignore les raisons d’être, alors que l’école devrait les enseigner ! Bientôt, on pique-niquera dans les ruines de ces monuments, en attendant la fin de la visite. Je vois en tout cela les prémisses d’un effondrement de l’ordre didactique scolaire ». (Op. cité, p. 2) 2. Il s’agit d’un abus de langage ; en réalité, il s’agit de 6 périodes, chacune ayant une durée de 50 minutes. - 147/709 - 5.2.1. Les intentions 5.2.1 Les intentions 5.2.1.1 Ambition des auteurs L’ambition des auteurs est affichée dans la préface : « [. . . ] ce manuel veut être avant tout un outil souple et efficace pour les enseignants et pour leurs élèves, dans deux domaines de prédilection : • la pédagogie des situations qui confronte l’élève à des activités qu’il doit organiser personnellement ou en équipes ; • l’enseignement en spirale qui ne veut pas épuiser d’emblée le contenu global des notions rencontrées et qui procède par touches progressives. » (Adam & Lousberg 1999, p. IV) Les auteurs n’hésitent pas à faire appel à des concepts à la mode, issus de la didactique et de la pédagogie, et qu’ils écrivent eux-même en italiques. En particulier, la pédagogie des situations : ce qu’ils en disent nous semble bien court. S’agit-il de situations fondamentales au sens où les définit Brousseau (1998) 3 ? Dans ce cas, elles supposent de confronter l’élève à des problèmes, c’est-à-dire à des situations sur lesquelles il va buter mais qu’il va finalement pouvoir dépasser à l’aide du nouveau savoir visé. Or les auteurs d’Espace Math parlent d’« activités » et non de problèmes ; et nous verrons plus loin que ces activités risquent effectivement de ne pas poser d’autre problème que leur formulation et leur finalité. De plus, les auteurs précisent que l’élève « doit organiser personnellement ou en équipes » ces activités ; nous verrons que, jusque dans leur formulation, les questions posées (du moins dans les chapitres analysés, appelés unités) ne sont pas ouvertes et que, par conséquent, un travail de groupe ne se justifie pas ; d’ailleurs, les auteurs expriment leurs questions à la deuxième personne du singulier. 5.2.1.2 Structure du manuel Les unités sont structurées selon trois parties, décrites également dans la préface : Activités : les auteurs ne formulent pas de commentaire à leur sujet sinon qu’il s’agit d’« activités d’approche ». (Ibid., p. IV) Notions : les auteurs affirment que « Les notions théoriques sont dégagées des démarches effectuées lors de ces activités d’approche ». (Ibid., p. IV) Un petit bout d’histoire : la motivation des auteurs est qu’ils sont « convaincus qu’un cours de mathématiques doit être replacé dans son contexte historique afin de convaincre nos élèves de l’utilité et de la richesse des démarches entreprises dans cette discipline par d’illustres prédécesseurs ». (Ibid., p. IV) En termes de praxéologies, les intentions affichées par les auteurs d’Espace Math 56 font penser à des praxéologies modélisation (notions théoriques dégagées des activités d’approche ; emploi des expressions « pédagogie des situations » et « enseignement en spirale »). Les exercices sont placés à la fin du manuel, dans l’ordre des unités. Ils comportent quatre sections : 3. Il s’agit d’un problème pour lequel le savoir visé apporte une réponse optimale (cf. section 6.1, p. 221) - 148/709 - 5.2. Espace Math 56 Pour appliquer : ce sont des exercices qui « ont pour but de fixer les notions et d’assurer le savoir-faire de base ». (Ibid., p. IV) Pour s’autocontrôler : quelques exercices corrigés. Pour chercher : des exercices qui « demandent une réflexion en profondeur ou font appel à plusieurs points de la matière ; sous cette rubrique on trouvera également de nombreux sujets qui pourront alimenter la recherche des élèves les plus curieux ». (Ibid., p. IV) Venus d’ailleurs : contient des exercices issus d’examens d’entrée de diverses institutions, essentiellement belges. 5.2.2 Analyse de l’ouvrage À l’instar du programme scolaire, l’ordre des chapitres est classique : la dérivée est traitée en deux chapitres (appelés unités : Dérivées et Applications des dérivées) et est précédée d’un chapitre sur les limites et d’un autre sur la continuité. Nous allons analyser le contenu des deux unités (chapitres) sur la dérivée en termes de praxéologies, que ce soient des praxéologies modélisation, déduction ou, nouvellement introduites, des praxéologies à trous, mais aussi en termes de niveaux de rationalité et d’ostension, plus éclairant ici. 5.2.2.1 Activités de l’unité Dérivées. Elles sont au nombre de trois et occupent 2 pages sur les 24 de l’unité. La première activité veut conduire les élèves vers une formule, celle de la limite du quotient différentiel ; la deuxième vise à exprimer cette formule tandis que la troisième suppose la formule correcte pour l’appliquer au calcul d’une vitesse instantanée. Voyons cela dans le détail. Activité 1. On donne le graphe et l’expression analytique f (x) = 0,25x2 d’une parabole P et l’on considère un point A d’abscisse a et un point voisin, B d’abscisse a + h. La droite passant par ces deux points est appelée s tandis que la droite passant par le premier point et de coefficient 0,5a) est appelée t. Viennent alors cinq questions : a) Dans le cas particulier a = 2, on demande à l’élève de calculer les coordonnées des points A et B, ainsi que les coefficients angulaires de s et t. Sur base de ces calculs, on lui demande : « Comment passes-tu, algébriquement, du coefficient angulaire de s à celui de t ? » (Ibid., p. 122) h + 0,25h2 Il faut donc passer de = 1 + 0,25h à 1. La question n’est pas comment h pourrait-on mais « comment passes-tu ». Or l’élève ne veut peut-être pas passer d’une expression à l’autre. Pour quelle raison autre qu’un effet de contrat didactique 4 devrait-il le faire ? La réponse attendue est de faire tendre h vers zéro. Mais 4. Un effet de contrat didactique est un leurre par lequel le professeur (et, ici, les auteurs du manuel) induit la bonne réponse aux élèves tout en faisant semblant, même inconsciemment, qu’elle vient d’eux. Ici, pour répondre, l’élève n’a pas besoin de comprendre ce que représentent respectivement les deux coefficients angulaires ; il lui suffit de deviner la réponse ou la démarche attendue par les auteurs du manuel. Nous y reviendrons à la section 6.1, p. 222. - 149/709 - 5.2.2. Analyse de l’ouvrage qu’est-ce qui, dans la présente activité, pourrait justifier et de façon nécessaire, une telle réponse ? Prendre h = 0 conviendrait tout aussi bien, une fois faites les simplifications algébriques. Et comment l’enseignant devrait-il réagir si un élève proposait une telle réponse ? Seul un effet de contrat, bien visible si l’élève lit la suite des questions et des activités, permet de trouver la réponse attendue, et non le savoir visé. De fait, le verbe passer n’étant pas précisé davantage, une infinité de réponses algébriques sont possibles : diviser chaque coefficient angulaire par luimême ; multiplier chaque coefficient par 0 avant de lui ajouter 1 ; prendre h = 2a et diviser le coefficient de s par a ou par 2 ; etc. b) L’élève doit d’abord tracer la droite t et, s’« inspirant de ce dessin », déterminer le nombre de points d’intersection de t avec la parabole. En réalité, il ne déterminera pas ce nombre mais il devra voir que t n’a pas d’autre intersection que le point A ; autrement dit, on incite l’élève à considérer que voir une propriété graphique — qui plus est à partir d’un tracé effectué lui-même, fut-ce « avec précision » comme le demandent les auteurs du manuel — suffit à déterminer un nombre : nous sommes ici à un niveau de rationalité 0. Le verbe conjecturer aurait été plus judicieux, nous semble-t-il. Ensuite, on lui demande de vérifier sa réponse par calcul avant une dernière question : « Comment qualifierais-tu la droite t relativement à P ? » (Ibid., p. 122) Ici encore, la question est faussement ouverte : la réponse attendue est tangente, ce que confirme les notations mêmes de l’activité : s pour sécante et t pour tangente. Ce qui doit induire la réponse de l’élève en ce sens est l’unicité du point d’intersection de la droite avec P et le dessin réalisé, autrement dit, il est invité à transposer le concept géométrique de tangente à un cercle à un nouveau contexte, comme si ce passage allait de soi. Or quelques pages plus loin, à propos de l’interprétation géométrique de la dérivée, les auteurs signaleront que le cas de la tangente au cercle « n’est pas généralisable », comme nous le verrons quand nous analyserons cette partie du cours. Ainsi, les élèves sont invités à se remémorer un concept qu’ils connaissent (la tangente au cercle) et à l’utiliser sans précaution pour répondre correctement à la question posée. Si l’élève échappe à l’effet de contrat dénoncé dans ces lignes, il pourrait répondre, par exemple, que la droite t n’est pas sécante à P, ou qu’elle est située sous P, ou qu’elle est croissante, ou même, pourquoi pas, qu’elle est très belle. . . c) Il est demandé de tracer les droites s pour quatre valeurs de h : 2, 1,5, 1 et 0,5. À partir de là, l’élève doit répondre à trois sous-questions. Voici la première : « Comment ferais-tu varier h pour passer de s à t ? » (Ibid., p. 122) Cette sous-question mélange à la fois le registre algébrique (la variation de h) et le registre géométrique (les droites s et t). On en verra les conséquences à la troisième sous-question. De plus, cette sous-question fait à nouveau référence à un passage de s à t, sans aucune référence mathématique. Que signifie passer d’une droite à une autre ? Les - 150/709 - 5.2. Espace Math 56 auteurs, implicitement, semblent fonder le choix de leur question sur une intuition présumée dans le chef des élèves, alors même que rien dans l’activité proposée ne justifie intrinsèquement la réponse attendue ; comme dit plus haut, la seule intuition raisonnable est de deviner l’intention du rédacteur. Dans la suite de cette activité et dans les suivantes, les questions posées aux élèves sont également capillotractées 5 , c’est-à-dire faussement ouvertes, l’intention du rédacteur permettant seule d’y répondre. Nous éviterons désormais de nous répéter sur ce sujet. Par ailleurs, en voyant le choix des valeurs proposées de h, un élève pourrait répondre que h doit varier selon une suite arithmétique de raison − 21 . Il choisira donc h = 0 comme valeur suivante ce qui, pour autant que l’élève ait l’occasion de questionner le professeur, risque de déstabiliser ce dernier : s « passe » bien à t mais, en même temps, s n’existe plus puisque A et B sont alors confondus et que le calcul de son coefficient angulaire devient impossible ( 00 ). Voici la seconde sous-question : « Quel est alors le déplacement de B relativement à A ? » (Ibid., p. 122) Quelle que soit la réponse apportée à la première sous-question, on peut répondre à la deuxième autrement que par le savoir visé. On peut par exemple déclarer que le déplacement de B se fait par sauts de puce ; ou que le déplacement de B est non nul contrairement à celui de A ; on peut aussi estimer une mesure de la distance parcourue de B sur la parabole. En tout cas, le choix des valeurs de h n’induit aucune continuité dans la manière dont h est censé tendre vers zéro. Enfin, la troisième sous-question est ainsi rédigée : « Comment qualifierais-tu, en termes de limite, la position de la droite t par rapport aux positions successives des droites s ? » (Ibid., p. 122) Cette dernière sous-question impose de faire référence à une « limite ». Le calcul des limites a été traité deux unités en amont. Le concept de limite est donc familier des élèves. Cependant, il s’agit de limite algébrique et, en aucun cas, de "limite"de ra de « position d’une droite ». Les auteurs considèrent une telle transposition évidente ou, du moins, transparente pour les élèves. Aucune précaution n’est prise pour signaler la difficulté ou le caractère provisoire d’une telle vision. En toute rigueur, compte tenu de l’autorité du professeur ou du manuel scolaire, nous pourrions qualifier ce discours d’incitation à la faute, pour ne pas dire d’incitation à la débauche mathématique. d) Il s’agit ici de reprendre « les mêmes démarches » qu’aux questions précédentes dans le cas où a = −4 et a = 0. Compte tenu de la formulation de celles-ci, nous ne voyons pas en quoi des valeurs différentes de a vont permettre aux élèves d’affiner leur réponse. À ce titre, il aurait sans doute été plus judicieux de considérer des valeurs de h plus proches de zéro : 0,1, 0,01, 0,001 et 0,0001, voire aussi des valeurs négatives de h. e) L’énoncé de la dernière question de la première activité est : 5. Néologisme signifiant tiré par les cheveux. - 151/709 - 5.2.2. Analyse de l’ouvrage « Tente une généralisation en utilisant f (x) au lieu de 0,25x2 et en ne donnant pas de valeur numérique au réel a. » (Ibid., p. 122) De quelle généralisation s’agit-il ? Une indication est qu’il s’agit de remplacer 0,25x2 par f (x). Or, le seul calcul où 0,25x2 intervenait était celui du coefficient angulaire de s à la première question. En ne donnant pas de valeur numérique à a, le f (a + h) − f (h) coefficient angulaire s’écrit immédiatement , expression qu’il n’est h alors pas possible de simplifier. En quoi cette écriture serait une généralisation de ce qui a été fait jusque là ? Si l’élève reprend la réponse attendue à la première question (qui était de faire tendre h vers zéro), le passage de ce coefficient angulaire de s vers celui de t se ferait par la jolie formule attendue f (a + h) − f (h) h→0 h lim mais rien ne prouve qu’il aura compris ce qui se cache derrière. Pire, si l’élève part de la réponse h = 0, réponse qui se défendait très bien à la première question, f (a + h) − f (h) il ne lui sera plus possible de la généraliser, l’expression n’ayant h alors plus de sens. Que pourrait alors faire l’enseignant pour aider l’élève qui se retrouverait ainsi dans une impasse, sinon lui dire de retourner mettre ses pas dans ceux de l’auteur de la question ? Activité 2. Cette activité comporte trois questions relatives à une fonction du second degré définie analytiquement par f (x) = 3x2 + 4x − 6. a) Il est demandé à l’élève de calculer f (2) et f (2 + h) et d’écrire cette dernière sous la forme f (2) + mh + nh2 . Viennent plusieurs questions. Voici les premières : « Quelle erreur commets-tu si, pour calculer f (2,1), tu négliges le terme nh2 ? Est-elle importante relativement à la valeur exacte ? Qu’en est-il si tu calcules f (2,01) ? Et f (2,001) ? » (Ibid., p. 122) La réponse relative à l’erreur absolue est contenue dans la question : c’est nh2 avec n = 3. Avec les valeurs de h proposées, on obtient respectivement une erreur absolue de 3 · 10−2 , 3 · 10−4 et 3 · 10−6 . Outre que ces valeurs sont déjà petites et que le calcul de l’erreur relative n’apporte dès lors pas grand chose, rien n’est dit sur l’enjeu de cette question. Pourquoi négliger un terme ? Pourquoi négliger ce terme plutôt que le terme mh ? Pourquoi ne pas négliger les deux termes ? Suit une dernière question : « Dirais-tu que f (2) + mh est une bonne approximation de f (2 + h) pour de petites valeurs de h ? » (Ibid., p. 122) Il est difficile de ne pas répondre affirmativement à la question mais on ne voit toujours pas pourquoi choisir cette approximation plutôt qu’une autre. Par exemple, pour de petites valeurs de h, f (2) est aussi une « bonne » approximation de f (2+h) ; de même pour f (2) + mh − 3h2 , f (2) + 21 mh, etc. - 152/709 - 5.2. Espace Math 56 L’élève est donc invité à appliquer aveuglément la procédure fixée par l’auteur du manuel et qui préfigure ce qui sera exposé dans la partie Notions de l’unité. S’il l’applique bien, on peut imaginer que le professeur sera satisfait de l’élève car il estimera que ce dernier a compris. Mais compris quoi ? b) On demande à l’élève de répondre « aux mêmes questions en remplaçant 2 par 5 ». Or, nous avons vu plus haut que l’énoncé donne une réponse (nh2 ) qui ne dépend pas de la valeur de x choisie. c) La première partie de l’énoncé de la dernière question est : « Tente de généraliser en remplaçant 2 par a. » (Ibid., p. 122) Dans la première activité, l’emploi du verbe tenter, à propos d’une généralisation, était bien choisi, du fait qu’il était difficile de savoir ce qu’il fallait généraliser. Ici, la phrase est formellement très semblable ; pourtant la réponse est évidente et aurait dû être faite dès la première question. Cela nous fait penser à la couleur du cheval blanc d’Henri IV : on partirait de Quelle est la couleur du cheval blanc du roi ? ; on remplacerait alors le mot roi par Henri IV, Dagobert ou Louis XVIII, avant de demander de généraliser ! Au-delà de la boutade, demeure la question de la pertinence du choix de l’approximation faite. La suite de la dernière question de cette activité est : « Est-il exact, que dans le développement obtenu, tu trouves f (a + h) − f (a) ? Justifie. » (Ibid., p. 122) h→0 h m = lim Cette question semble être la conclusion de la deuxième activité. Or elle ne nécessite pas le calcul de l’erreur faite en négligeant le terme nh2 dans le calcul de f (a + h), c’est-à-dire ce qui précède, en dehors du calcul de f (2 + h). De fait, le calcul de f (a + h) − f (a) donne m+nh ; d’où le résultat attendu. Mais alors, pourquoi cette h activité si tel était le but à atteindre sinon de forcer l’apparition d’une formule qui sera centrale dans la définition de dérivée, afin de la rendre familière aux élèves ? Activité 3. Cette activité comporte deux questions relatives à la vitesse, moyenne et instantanée. Les auteurs du manuel, sous caution d’« un ancien livre de mécanique », écrivent que : « "La vitesse instantanée au temps t0 est la limite de la vitesse moyenne entre les instants t0 et t1 , lorsque t1 tend vers t0 ." » (Ibid., p. 122) Pourquoi préciser qu’il s’agit d’un livre ancien ? Serait-ce un gage de qualité ou, au contraire, d’une certaine caducité ? Voyons au moins si les deux questions proposées dans cette dernière activité peuvent aider l’élève à accepter que la formule donnée est plausible. - 153/709 - 5.2.2. Analyse de l’ouvrage a) L’espace parcouru par un mobile est donné par la fonction f (t) = 5t2 + 3t et l’on précise que les unités sont les secondes et les mètres. On demande de déterminer l’« espace parcouru après 2 secondes et après 2,1 secondes », puis de déterminer les vitesses moyenne (« entre ces deux instants ») et instantanée (« 2 secondes après le départ ») du mobile. On ne demande notamment pas de comparer les valeurs obtenues ni d’affiner les résultats en des instants plus proches de t = 2. La seule démarche demandée à l’élève est donc d’ordre procédural : appliquer un calcul de limite. On demeure à un niveau de rationalité 0. b) La seconde question, calquée sur le modèle des dernières questions des autres activités est ainsi rédigée : « Tente de généraliser entre les instants a et a + h. Donne une formule donnant la vitesse instantanée à l’instant a en fonction de f , de a et de h. » (Ibid., p. 122) C’est la dernière tentative. Il s’agit à nouveau de généraliser mais on ne sait toujours pas quoi. S’agit-il d’exprimer la formule donnant l’espace parcouru entre deux instants, celle de la vitesse moyenne ou celle de la vitesse instantanée ? La deuxième partie de la question montre qu’il s’agit de cette dernière. Or cette formule est pratiquement donnée en français dans la définition « mécanique », et elle a déjà été appliquée à la première question. Le seul travail dévolu à l’élève est un travail d’identification et de remplacement de t0 ou 2 par a, et t1 ou 2,1 par a + h. En particulier, on ne se pose pas la question de la difficulté pour un élève de désigner un instant par les lettres a ou h qui, en physique, désignent respectivement une accélération et une hauteur. Le but des auteurs du manuel est, à l’issue de cette activité comme à celle des deux autres, de parvenir à la même expression f (a + h) − f (a) h→0 h contenant les lettres a, f et h qui seront une des deux principales notations utilisées dans la partie Notions de l’unité. lim Ainsi, cette activité d’introduction à la dérivée suppose le concept de vitesse instantanée maîtrisé par les élèves, puisque sa définition comme limite de la vitesse moyenne n’est pas même questionnée. Or notre analyse des conceptions des élèves (cf. section 4.3.4, p. 140), a montré plus haut que l’existence même de la vitesse instantanée peut poser problème à certains élèves en raison de son caractère intensif et de l’impossibilité de la mesurer expérimentalement. Conclusion quant aux Activités de l’unité Dérivées. Ainsi, les activités proposée dans cette unité d’Espace Math 56 constituent avant tout un jeu de dupes. Nous sommes loin d’une situation adidactique 6 ou même d’une situation fondamentale. 6. Une situation adidactique présuppose un problème qui ne peut être résolu sans utiliser le savoir visé par l’enseignement ; la question doit être dévoluée à l’élève, c’est-à-dire que le professeur refuse alors de transmettre le savoir directement. - 154/709 - 5.2. Espace Math 56 De plus, le niveau de rationalité atteint est exclusivement 0 (que nous avons envie d’appeler ici « nul »). Il ne correspond en rien à la pédagogie des situations dont se réclament les auteurs du manuel. 5.2.2.2 Notions développées à l’unité Dérivées. Cette partie comporte près de 80% des pages de cette unité. Elle se subdivise en deux sections : Nombre dérivé - Fonction dérivée qui comporte des définitions et des propriétés conduisant à un « formulaire de dérivation », et Interprétations diverses de la dérivée où il est question des tangentes, d’une « interprétation physique » et d’une « interprétation économique » de la dérivée. Ainsi, ce manuel suit fidèlement le programme scolaire. Nombre dérivé - Fonction dérivée. Le but affiché au début de cette première section est que la dérivée est nécessaire « pour déterminer des tangentes à des courbes, pour étudier la variation de certaines fonctions ou de certaines grandeurs physiques ». Elle n’est pas encore nommée mais il s’agit d’une « limite particulière ». Contexte. Tel est le titre de la première sous-section. Il est précisé (Ibid., p. 123) que l’on considère une fonction f ; un « intervalle I de centre a, inclus au domaine de f » ; et « le réel h tel que a + h, encore noté x, appartienne à I ». Viennent alors deux graphiques représentatifs respectivement d’une fonction continue en a et d’une autre qui ne l’est pas. Sont figurés les deux notations qui seront employées, à savoir en termes de (a, h) et en termes de (a,x). Notons que l’intervalle I, annoncé centré en a, ne l’est manifestement pas sur les graphiques. Vocabulaire. On trouve ici (Ibid., pp. 123-125) des définitions, sans que ce mot soit utilisé. À la place, les auteurs utilisent le verbe être : « Le domaine de dérivabilité de f est. . . » D’autres fois, ils emploient des expressions telles que « nous sommes amenés à dire » ; ou encore, ils s’expriment par implication (condition suffisante), sans que la réciproque soit évoquée et, par conséquent, sans équivalence : « La fonction f est dérivable en le réel a si. . . ». Comme annoncé implicitement par le titre de cette sous-section et en cohérence avec les Activités, le nombre dérivé est défini avant la fonction dérivée. En particulier, l’origine du mot « dérivée » n’est pas précisée. Par ailleurs, la définition de la fonction dérivée à partir du nombre dérivé nous semble être un tour de passe-passe : « La fonction dérivée de f ou, plus simplement, la dérivée de f , est la fonction qui, à chaque réel a en lequel f est dérivable, fait correspondre le nombre dérivé de f en a. Elle est notée f 0 : f 0 : R → R : x → f 0 (x). » (Ibid., p. 124) - 155/709 - 5.2.2. Analyse de l’ouvrage On considère donc exclusivement « chaque réel a » et, tout à coup, apparaît une formule qui ne contient pas de a mais bien des x, sans autre explication, comme si cela allait de soi ; en particulier, il n’est pas donné une expression de f 0 (x) en termes de limite. Or, par habitude, le réel a a le statut de paramètre ; au contraire, à l’instar de h, x désigne habituellement une variable : le passage de l’un à l’autre n’a donc rien de naturel ou d’évident. Enfin, ce changement de point de vue (passer de a à x, c’està-dire du nombre dérivé à la fonction dérivée), opéré comme subrepticement, masque la notion de variable de dérivation. D’ailleurs, dans ce cours, il est toujours question du nombre dérivé d’une fonction en un point (a) ou de la fonction dérivée, mais jamais de la dérivée d’une fonction par rapport à une variable, x en l’occurrence. Une telle situation pourrait expliquer ce qui a été observé à la question 4 de la Propédeutique (cf. section 1.1.2, p. 35). Après ces premières définitions, vient un exemple. Il s’agit d’une fonction du second degré f dont sont déterminés, successivement : − le « taux d’accroissement en le réel a » et sa valeur en fonction de h en deux valeurs numériques de a. − le nombre dérivé en a et le domaine de dérivabilité de f ; en revanche, on ne calcule pas la valeur de ce nombre dérivé pour les valeurs numériques données précédemment pour a, si bien que les calculs numériques du taux d’accroissement ne sont pas, un tant soit peu, mis à profit. − la fonction dérivée. Il est tenu le même discours que pour la définition : « La fonction dérivée de f fait correspondre, à tout réel a, le réel 6a − 2, nombre dérivé de f en a. En d’autres mots, la fonction dérivée de f est la fonction f 0 : R → R : x → 6x − 2. » (Ibid., p. 125) Cet exemple n’est donc pas davantage éclairant pour l’élève de ce point de vue. Un second exemple est proposé : il s’agit du calcul des dérivées à gauche et à droite de la fonction |x − 1| en x = 1. Cet exemple est purement algébrique : on applique la définition pour effectuer un calcul. En particulier il n’est pas précisé la singularité du point choisi et aucune représentation graphique n’est faite. Propriétés. On trouve ici (Ibid., pp. 126-134) énoncées et démontrées toute une série de propriétés : − La dérivabilité d’une fonction dans les deux cas où, les dérivées à gauche et à droite existant, elles sont égales ou, au contraire, elles sont distinctes. − Le caractère suffisant de la dérivabilité pour la continuité d’une fonction en un point. Une « Remarque importante » est faite pour exprimer que la « réciproque de cette propriété est fausse », en revenant sur l’exemple précédemment traité, sans aucune illustration graphique mais en se contentant d’écrire que « Nous savons que cette fonction est continue en 1 ». − La dérivée des fonctions constante et identique. Les démonstrations sont faites sur les nombres dérivés avant d’écrire, « dès lors », le résultat final en termes de fonctions dérivées de la variable x. Ici encore, il n’y a aucune illustration graphique - 156/709 - 5.2. Espace Math 56 qui ferait le lien entre le résultat numérique et l’allure rectiligne des graphes de ces fonctions. − La dérivée de la fonction inverse, qui ouvre la voie à la démonstration de la dérivée d’un quotient de fonctions. − La dérivée des fonctions somme, différence, produit et quotient de fonctions. Ici aussi, les démonstrations sont faites sur les nombres dérivés mais sans faire le saut vers les fonctions dérivées. Dans l’énoncé des propriétés, en regard des résultats en termes de nombres dérivés, on trouve l’encadré suivant (u + v)0 = u0 + v 0 (u − v)0 = u0 − v 0 (uv)0 = u0 v + uv 0 (kv)0 = kv 0 0 1 −v 0 = 2 v v 0 u0 v − uv 0 u = v v2 sans aucun commentaire explicatif quant à ces notations et tout particulièrement par rapport à quelle variable il s’agit de dériver. − La dérivée de la composée de deux fonctions. Contrairement aux autres propriétés, « cette propriété est admise ». On trouve un schéma, classique de la composition de fonctions, sur lequel est plaquée la propriété en termes de dérivée, comme si le schéma pouvait justifier ou même expliquer d’une quelconque manière la formule obtenue et, en particulier, la multiplication de v 0 (u(a)) par u0 (a). En revanche, il n’y a aucun exemple qui pourrait venir conforter que cette formule est plausible. Ainsi, la composée de la fonction 3x par la fonction x2 , égale à 9x2 , a pour dérivée directe 18x et, par application de la nouvelle propriété, (2·3x)·3 = 18x également. − La dérivée de la fonction puissance lorsque, successivement, l’exposant est naturel non nul, rationnel strictement positif et rationnel strictement négatif. Le cas d’un exposant irrationnel n’est pas évoqué. − La dérivée des fonctions trigonométriques sinus, cosinus et tangente. La démonscos h − 1 sin h tration semble complète puisque les limites en 0 de et ont été h h - 157/709 - 5.2.2. Analyse de l’ouvrage démontrées à l’unité sur les limites. Or, en réalité, cette dernière démonstration s’appuie sur le « théorème du sandwich », lequel est seulement admis. . . On retrouve ici un exemple de praxéologie à trou. − Viennent alors 11 « exemples d’utilisation », qui sont autant de calcul de dérivées. Les trois derniers exemples concernent les fonctions composées. Pour le premier, le schéma de la composition des fonctions est donné, sans toutefois être affublé des annotations étranges à propos de la formule de la dérivée. Il s’agit d’un polynôme du second degré élevé à la puissance 4. Le choix de cet exposant est judicieux si l’on veut éviter que les élèves « échappent » à la formule visée, en développant préalablement le polynôme ; néanmoins, l’exemple permet difficilement aussi de vérifier le bien-fondé de la formule. Formulaire de dérivation : tableau récapitulatif. Il s’agit d’un tableau (Ibid., p. 135), encadré, dans lequel sont mis en regard les fonctions rencontrées et leur fonction dérivée 7 . Ainsi, la section Nombre dérivé - Fonction dérivée est placée entièrement sous le signe du calcul des dérivées. Par ailleurs, alors que les auteurs d’Espace Math 56 s’efforcent de démontrer les propriétés théoriques, certaines démonstrations font appel à des propriétés ou théorèmes admis mais non rappelés comme tels, si bien que ces démonstrations semblent complètes. D’autre part, lorsqu’une propriété est admise, rien n’est mis en place pour convaincre l’élève de son bien-fondé. Enfin, que la propriété soit démontrée ou non, cette première section ne comporte aucun graphique de fonction — hormis les deux proposés dans le Contexte. On peut se demander pourquoi. Liés à cette section, on trouve à la fin du manuel 22 exercices sur les 48 que comporte l’unité. Parmi eux, • 1 seul exercice demande d’appliquer la définition du nombre dérivé (dans cinq cas différents) tandis que 15 autres exercices consistent essentiellement en des calculs de dérivées à partir des formules pour un total de 74 fonctions à dériver. Les élèves devraient vite comprendre le peu d’intérêt de travailler la définition de la dérivée puisque l’immense majorité des questions consiste à appliquer les formules de calcul algébrique. • 10 exercices s’intéressent au domaine (de définition et) de dérivabilité (dont 5 parmi les 15 exercices précités). • 1 exercice est plus théorique (dérivée d’un polynôme en une racine double). Interprétations diverses de la dérivée. Dans cette seconde section, les graphiques de fonctions sont nombreux. On y traite de la tangente (dans quatre paragraphes) avant (dans les deux derniers paragraphes) de donner une « interprétation physique » et une « interprétation économique ». Parcourons chacun de ces six paragraphes : 7. Le mot fonction n’est pas écrit mais a n’apparaît plus et c’est x qui est utilisé. - 158/709 - 5.2. Espace Math 56 Interprétation géométrique. Ce paragraphe est court. On y rappelle ce qui caractérise la tangente au cercle puis trois graphiques montrent que ces caractéristiques ne conviennent plus dans le cas de certaines courbes. Comme nous l’écrivions plus haut à propos du début de la section Nombre dérivé - Fonction dérivée, les auteurs réécrivent qu’il « est souvent utile, pour différentes raisons, de pouvoir déterminer la tangente à une courbe, en un point de celle-ci ». On ne connaît toujours pas ces raisons. D’autre part, la notion de tangente à une courbe est supposée familière alors qu’elle n’a toujours pas été définie et que seule la tangente au cercle en un point — définie comme la droite perpendiculaire au rayon du cercle au point considéré — est connue des élèves. Le rappel de la définition de la tangente à un cercle n’est pas faite explicitement mais bien implicitement, par une figure sur laquelle, entre le rayon du cercle et la tangente au point considéré, l’angle marqué est droit. Dans le texte, la tangente au cercle est seulement caractérisée, sur base d’une sorte de compromis : « Dans le cas du cercle, on s’accorde à dire qu’une tangente en un point est une droite qui coupe le cercle en un seul point sans le traverser 8 . » (Ibid., p. 135) Cette caractérisation, s’agissant d’un cercle, est redondante : en effet, si cette droite coupe le cercle en un seul point, elle ne peut le traverser. On peut également s’interroger sur la pertinence du choix du verbe « couper » dans ce cas précis où la tangente ne fait qu’effleurer le cercle. L’étape suivante consiste à montrer que la caractérisation précédente « n’est pas généralisable comme le montrent, intuitivement, [trois] situations graphiques que voici ». Comme à l’occasion des activités, il n’est pas précisé à quoi la (non) généralisation s’applique. Il n’est pas écrit non plus pourquoi, à la première figure, la droite t « pourtant est tangente » en T ; tandis qu’à la figure suivante, « manifestement, [elle] n’est pas tangente à la courbe » ; et qu’à la troisième figure elle « semble être tangente à la courbe ». De ces trois figures, les auteurs du manuel concluent ceci : « Les mathématiciens ont dû, dès lors, formaliser la notion de tangente à une courbe. 9 » (Ibid., p. 136) 8. La mise en caractères gras est faite par les auteurs du manuel. 9. En italiques dans le texte. - 159/709 - 5.2.2. Analyse de l’ouvrage Définition. C’est dans ce second paragraphe qu’est donnée la définition de la tangente, dans un encadré : « La tangente en un point A d’une courbe est la droite dont la position est la limite, si elle existe, de la position d’une sécante variable AB à cette courbe, lorsque le point variable B tend vers le point fixe A. » (Ibid., p. 136) Qu’est-ce que la limite d’une position ? Qu’est-ce que tendre vers un point ? Dans le même manuel, à l’unité traitant des limites, il n’est question que de « limite en un réel. » (Ibid., p. 65) Or, non seulement la définition donnée de la tangente est mise en valeur par un encadré, mais il lui est donné un vernis de rigueur, par la phrase classique à propos de la limite : « si elle existe ». Cette définition, au lieu de combattre l’obstacle géométrique de la limite (tel que décrit au chapitre précédent, section 4.3.2, p. 135), ne fait que renforcer ce dernier ! En guise d’explication, les auteurs proposent « un film qui, en sept images, illustre cette définition » (Ibid., p. 136). Sur trois images (numérotées de 1 à 3), on voit, sur une courbe, un point B situé après un point A et qui s’en rapproche ; à chaque fois, la trace des sécantes obtenues précédemment est conservée. En dessous, trois autres images (numérotées de 1’ à 3’) montrent la même chose lorsque B est situé avant le point A. Enfin, à droite de ces six images, une septième image (numérotée 4) montre le point A, la tangente et les traces des diverses sécantes ; le point B a disparu, sans aucune explication. Notons que cette dernière image (que nous avons agrandie un peu plus de deux fois) est incorrecte : la tangente représentée est encore sécante à la courbe. . . La définition choisie par les auteurs du manuel se veut très générale. Ainsi, la courbe représentée ci-dessus n’est pas celle d’une fonction (du moins si, dans le système d’axes non représenté, l’axe des ordonnées est vertical). On peut se demander quel est l’intérêt de ce choix alors qu’il ne sera plus question par la suite que de fonctions. De plus, une telle approche se prive nécessairement de définir la tangente à partir de la dérivée. On peut également se demander pourquoi on considère un seul point B, de part ou d’autre de A et non deux points B et C qui seraient plus ou moins symétriques par rapport au point de tangence. Quoi qu’il en soit, ce « film » montrant la tangente comme « position limite » de - 160/709 - 5.2. Espace Math 56 sécantes semble indiquer que le passage à la « limite » des sécantes à la tangente peut se faire en termes géométriques, sans nécessiter de calculer les pentes des sécantes avant d’en prendre la limite. Un tel film présente l’obstacle épistémologique de la limite comme transparent, au lieu de l’identifier comme tel et de l’affronter en le questionnant. On peut trouver ce film sur de nombreux sites Internet au travers d’applets Java où l’on voit pour de bon la même illustration. En soi, rejoindre la perception des élèves nous semble une bonne idée mais, ici, une telle approche renforce un obstacle au lieu de l’affaiblir et rien n’est fait par ailleurs en ce dernier sens. Rappelons avec Rouy (2007) que c’est d’Alembert, à des fins de vulgarisation, qui a introduit dans l’Encyclopédie (1751) cette idée de points se rapprochant du point de tangence tandis que les sécantes semblent tendre vers la tangente. Reprenons la lecture commentée du manuel. À présent, leurs auteurs font le lien entre la tangente et la dérivée. Pour ce faire, il est proposé comme première étape d’envisager le coefficient angulaire de la tangente. Hélas, la phrase que l’on trouve dans ce manuel est erronée : « Dans un repère orthonormé, la position d’une droite 10 est donnée par le coefficient angulaire de cette droite, pour autant qu’elle ne soit pas verticale. 11 » (Ibid., p. 136) Or, il ne suffit pas de connaître le coefficient angulaire pour déterminer la position de la droite : il faut aussi avoir un point. La seconde étape pour lier tangente à dérivée consiste à « particulariser » la définition donnée de tangente « dans le cas du graphe cartésien d’une fonction numérique d’une variable réelle 12 » (Ibid., p. 137). Cette fois, il n’est considéré sur la figure proposée que le cas où B est situé à droite de A. On y affirme alors que « B tend vers A signifie que h tend vers 0 » et que le coefficient angulaire de la tangente est la limite quand h tend vers 0 du coefficient angulaire de la sécante AB, cette limite étant égale à f 0 (a). Les nombres a et h sont respectivement l’abscisse de A et la différence des abscisses de B et A. La définition de tangente a été particularisée mais non améliorée : par exemple, la tangente n’est pas définie, dans le cas des fonctions dérivables, comme la droite passant par un point donné et de coefficient angulaire le nombre dérivé en ce point. Il est juste donné une technique permettant de déterminer le coefficient angulaire de la tangente grâce au nombre dérivé en ce point. Propriétés. Dans ce paragraphe, sont données trois propriétés. On peut observer que l’objet premier est ici la tangente et l’objet second la dérivée, et non le contraire. La première propriété est évidente compte tenu de ce qui précède : en substance, le coefficient angulaire de la tangente au point (a, f (a)) est égal au nombre dérivé de f en a. 10. En gras dans le texte. 11. En italiques dans le texte. 12. En italiques dans le texte. - 161/709 - 5.2.2. Analyse de l’ouvrage La deuxième donne une équation de la tangente au point (a, f (a)). Voici la troisième : « La fonction f : R → R : x → f (x) est dérivable en le réel a si et seulement si le graphe cartésien de f admet une seule tangente non verticale au point de coordonnée (a, f (a)). » (Ibid., p. 137) On peut se demander dans quelle mesure cette propriété est utile en tant que telle. En particulier, rien n’est précisé à propos de l’emploi de l’adjectif seule, qui sous entend qu’il pourrait y avoir plusieurs tangentes en un point. Par ailleurs, la figure proposée en regard de cette propriété n’apporte rien de spécifique ; sans compter que la tangente représentée n’a pas de contact avec la courbe au point A alors qu’elle traverse la courbe en un autre point où elle n’est pas tangente : Conséquences. Dans ce quatrième paragraphe, les auteurs d’Espace Math 56 tirent trois conséquences. La première, dans un encart en couleur pour souligner son importance, dresse la liste des étapes permettant de déterminer l’équation d’une tangente, avec un exemple en parallèle : « Pour déterminer l’équation de la tangente t au graphique de la fonction f au point d’abscisse a, − on calcule l’ordonnée f (a) [. . . ] − on recherche la dérivée f 0 de f [. . . ] − on calcule le nombre dérivé f 0 (a) [. . . ] − on détermine l’équation de la droite t passant par le point (a, f (a)), de coefficient angulaire f 0 (a). » (Ibid., p. 138) La deuxième conséquence expose « quelques situations graphiques où l’on constate que la fonction f n’est pas dérivable en A (a, f (a)) » (Ibid., p. 139). Il y a trois cas de tangentes verticales, dont un coïncide avec un point d’inflexion (qui n’est pas nommé comme tel) et un autre est un point de rebroussement. Il y a deux cas où il y a deux tangentes, obliques ; pour un seul de ces cas, le point est signalé comme anguleux. Le dernier cas est celui d’une fonction discontinue en A et qui n’admet aucune tangente en A. La troisième conséquence traite de l’« approximation de f par une fonction du premier degré » (Ibid., p. 139). On y affirme ceci : « La tangente en un point A d’une courbe est une droite qui "s’écarte peu" de la courbe en des points voisins de A. Certains disent que la tangente "frôle" la courbe ou que celle-ci "atterrit en douceur" sur la droite. » (Ibid., p. 139) - 162/709 - 5.2. Espace Math 56 Pourtant, ces derniers qualificatifs sont peu compatibles avec les courbes où la tangente traverse la courbe en A. Mais surtout, le fait que la tangente s’écarte peu de la courbe n’est ni prouvé ou justifié d’une quelconque manière, ni même défini. Sur la figure en regard de ce paragraphe, il est représenté un petit segment de droite verticale qui relie la courbe à la tangente en l’abscisse a + h. C’est la seule indication que l’on considère que cet écart est petit en des points voisins de A. Or, par exemple, lorsque la pente de la tangente est élevée (en valeur absolue), il faut choisir des points vraiment très voisins pour que cet écart reste petit. Et puis, il y a beaucoup d’autres droites qui s’écartent peu de la courbe en A ; pourquoi choisir la tangente plutôt qu’une autre droite ? Toujours est-il que, « pour des valeurs de h proches de 0, on peut écrire f (a + h) ' f (a) + hf 0 (a). » (Ibid., p. 139) Deux exemples viennent compléter cette troisième conséquence : √ « Calculer une valeur approchée de (2,03)3 [puis de] 24,8. . . sans calculatrice. » (Ibid., pp. 139-140) L’énoncé ne précisant pas le type d’approximation à faire, rien n’interdit de donner comme réponse 8 et 5, respectivement, sans aucun calcul de dérivée. Interprétation physique. Lorsqu’on lit ce paragraphe, on peut se demander de quelle interprétation physique il s’agit. En effet, il n’est nulle part écrit le mot dérivée. En revanche, sur base de « l’activité 3, un lien peut être établi entre l’espace parcouru par un mobile et sa vitesse instantanée » (Ibid., p. 140). Sont alors données « quelques exemples d’un tel lien ». Sont ainsi cités cinq couples : 1. « Si [. . . ] e(t) est la fonction qui donne l’espace parcouru par un mobile en fonction du temps, alors la vitesse instantanée au temps t de ce mobile est donnée par v(t) = e0 (t). 2. Si [. . . ] v(t) est la fonction qui donne la vitesse 13 d’un mobile en fonction du temps, alors l’accélération instantanée au temps t de ce mobile est donnée par a(t) = v 0 (t). 3. Si [. . . ] q(t) est la fonction qui donne la quantité de liquide traversant une section d’un tuyau en fonction du temps, alors le débit au temps t est donné par d(t) = q 0 (t). 4. Si [. . . ] q(t) est la fonction qui donne la quantité d’électricité traversant un conducteur en fonction du temps, alors la l’intensité au temps t du courant est donnée par i(t) = q 0 (t). 5. Si [. . . ] e(t) est la fonction qui donne l’énergie produite par un moteur en fonction du temps, alors la puissance de ce moteur au temps t est donnée par p(t) = e0 (t). » (Ibid., p. 140) Comme nous l’avons dit, le mot dérivée n’apparaît pas mais bien des formules : v(t) = e0 (t), a(t) = v 0 (t), etc. L’interprétation physique se termine par un exemple : 13. Il n’est pas précisé qu’il s’agit de la vitesse instantanée et non moyenne. - 163/709 - 5.2.2. Analyse de l’ouvrage « Soit un mobile dont le mouvement est décrit par la fonction e(t) "espacetemps" . . . » (Ibid., p. 140) Or l’espace-temps est un espace à quatre dimensions lié à la théorie de la relativité. . . Une fois v(t) déterminée, sont calculées v(0) = 5 et v(1) = 11, sans préciser les unités et sans aucune interprétation du résultat. Enfin, le calcul de a(t) donnant 6, la conclusion est : « Le mobile est donc animé d’un mouvement uniformément accéléré. » (Ibid., p. 140) Il faut espérer que les élèves aient leur cours de cinématique en tête ; sinon, un élève distrait pourrait croire que c’est la valeur 6 qui est nécessaire pour avoir affaire à un tel mouvement. Interprétation économique. Dans ce dernier des six paragraphes annoncés, le mot dérivée est cité deux fois et mis en caractères gras. Plus curieux, il est fait référence au temps dans cette section, sans que l’on en sache davantage : « L’idée d’instantanéité est encore rendue grâce à la dérivée dans des problèmes d’économie » (Ibid., p. 141) Il est alors question de coût de production et de coût marginal, dépendants de la quantité x. On ne sait donc pas quel est le lien entre l’instantanéité et la dérivée ni entre l’instantanéité et l’économie. Sans doute trouve-t-on ici un vestige de l’idée qu’une dérivée est un taux instantané de variation ; mais d’où vient cette idée temporelle dans des contextes non cinématiques ou physiques, voire en analyse, donc en dehors de tout contexte ? Nous pensons qu’elle nous vient notamment de Newton qui a découvert la dérivée au travers de considérations cinématiques (cf. section 3.6.3.2, p. 91). Rien n’est dit ici à ce sujet. Le coût marginal est alors défini comme le coût d’une unité supplémentaire : « Pour un nombre fixé de pièces produites, par exemple 50 000, on nomme coût marginal correspondant à 50 000 pièces fabriquées, l’augmentation de coût causé par la production d’une pièce de plus, c’est-à-dire C(50 001) − C(50 000) [. . . ] » (Ibid., p. 141) La dérivée du coût de production étant le coefficient angulaire de la tangente au point considéré et la variation étant d’une unité, sur base de ce qui a été fait à propos des approximations affines, « une bonne approximation » du coût marginal est la valeur de la dérivée au point considéré. Un exemple numérique complète cette « interprétation économique ». Cette fois, la dérivée n’est plus considérée comme une approximation du coût marginal mais égale à celui-ci : « [. . . ] le coût marginal correspondant à 50 000 unités fabriquées est donné par la valeur de C 0 (x) pour x = 50 000. » (Ibid., p. 141) L’exposé fait dans ce paragraphe par les auteurs du manuel comporte deux autres tours de passe-passe : le premier est un jeu d’écriture et le second est d’ordre graphique. Ainsi, dans un premier temps, il est écrit - 164/709 - 5.2. Espace Math 56 C(50 001) − C(50 000) » 1 à propos du coût marginal. Algébriquement, ces deux expressions sont égales ; en revanche, il n’en va pas de même en termes d’unités : dans un cas, on a affaire à des unités monétaires tandis que, dans le second cas, il s’agit d’unités monétaires par unité produite. « C(50 001) − C(50 000) ou Ensuite, pour rendre visible la cinquante mille unième unité à côté de la cinquante millième, les auteurs écrivent : « Agrandissons le graphique sur un intervalle [50 000; 50 001] ». Le résultat représenté est une courbe plus arrondie que la courbe initiale, ce qui n’est pas conforme à un vrai zoom. Nous ne critiquons pas l’idée des auteurs de rendre visibles distinctement la courbe et sa tangente, mais le procédé est utilisé sans précaution, alors même que, parfois, d’autres auteurs utilisent un zoom précisément pour montrer que la courbe semble rectiligne et que la tangente en un point semble se confondre avec la courbe. Liés à cette section, on trouve à la fin du manuel, 26 exercices sur les 48 que comporte l’unité. Parmi eux, • 5 concernent des aspects analytiques de la tangente (équation cartésienne, calcul du coefficient angulaire) tandis que 5 autres concernent des aspects graphiques de la tangente. Parmi ces derniers exercices, le rôle des graphiques est essentiellement passif, c’est-à-dire qu’il s’agit seulement de les interpréter (mesure de coefficients angulaires, étude locale de dérivabilité) ; seul un cinquième exercice invite l’élève à tracer plusieurs tangentes à une courbe et d’en déduire des résultats rendus visibles graphiquement. • 4 exercices sont relatifs aux approximations affines (dont deux dans des contextes physiques). • 12 sont des calculs de vitesse instantanée d’un mobile, d’intensité instantanée, de puissance instantanée, de coût marginal, de vitesse instantanée de variation d’un volume (ou d’une aire) ou de débit instantané. Parmi ces exercices, un seul demande de tracer une fonction et sa dérivée mais sans demander de le faire dans un même repère et moins encore de déduire le graphe du second à partir de celui du premier, ce qui permettrait de faire travailler les élèves sur le lien qui unit la pente d’une courbe (au sens des coefficients angulaires successifs des tangentes en chacun des points du graphe) et le graphe de la dérivée. Conclusion quant aux Notions de l’unité Dérivées. Ainsi, dans cette partie prépondérante de l’unité considérée, la dérivée a été définie comme un calcul de limite, d’abord en un point (nombre dérivé). La fonction dérivée apparaît ensuite mais sa définition comme transposition d’un nombre a vers une variable x ne nous semble pas convaincante. Rapidement, ce sont les calculs de fonctions dérivées qui sont visés ; les démonstrations proposées, lorsqu’elles ne sont pas évidentes, relèvent de praxéologies à trou, c’est-à-dire qu’elles sont des succédanés des praxéologies-déductions issues de l’enseignement universitaire destiné aux futurs mathématiciens (comme montré par Rouy (2007)). - 165/709 - 5.2.2. Analyse de l’ouvrage En guise d’interprétation de la dérivée, il est avant tout question de la tangente dont la définition dans le seul cas du cercle doit être remise en cause. L’approche par visualisation de sécantes se déplaçant vers une « position limite », si elle est classique depuis d’Alembert, n’en est pas moins risquée au vue des obstacles rencontrés par les élèves ; or cette difficulté n’est pas prise en compte dans ce manuel. De plus, l’absence de réflexion et de questionnement à proposer aux élèves placent cette partie théorique de l’unité à un niveau 0 de rationalité. 5.2.2.3 Un petit bout d’histoire, relatif à l’unité Dérivées. En dehors de l’aspect culturel offert aux élèves pour découvrir quels mathématiciens ont traité de la dérivée, cette partie permet-elle de découvrir ou d’entrevoir quand, comment et pourquoi le concept de dérivée s’est développé dans l’histoire de l’humanité ? Une première page est consacrée au lien entre le mouvement et la notion d’infini. Ce sont des questions intéressantes mais qui ne semblent pas directement liées au concept de dérivée, du moins telles qu’elles sont formulées, même si ce sont Galilée, Cavalieri et Pascal, tout trois concernés par le calcul infinitésimal, qui tentent de répondre. Les deux autres pages sont consacrées essentiellement à Leibniz. On y trouve des anecdotes biographiques puis, au détour d’une d’elles, on apprend qu’avec Newton, « deux génies mathématiques allaient se disputer âprement la paternité de l’invention du calcul à l’aide des infiniments petits » (Ibid., p. 143). Les auteurs du manuel frôlent alors l’erreur historique en disant : « La dérivée et l’intégrale révolutionnèrent les méthodes en sciences. Ainsi, en physique, par exemple, elles permirent une approche inédite des notions de vitesse, d’accélération, de débit. . . » (Ibid., p. 143) En effet, nous l’avons vu lors de l’analyse épistémologique des contenus visés au chapitre 3, ce sont plutôt les sciences qui, par leur développement prodigieux, ont conduit à mettre au point des méthodes de calcul plus efficaces ayant conduit à l’émergence du concept de dérivée et d’intégrale ; ce n’est qu’à partir du XIXe siècle que les sciences sont devenues des champs d’application de l’analyse. 5.2.2.4 Activités de l’unité Applications des dérivées. Dans cette seconde unité (chapitre) consacrée aux dérivées, les activités sont également au nombre de trois et occupent 3 pages sur les 32 de l’unité. Les deux premières activités ont pour but de conduire les élèves à lier le signe du coefficient angulaire de la tangente à la croissance/décroissance locale d’une fonction ; la troisième activité a pour but de conduire les élèves à lier le sens de variation des coefficients angulaires des tangentes successives à la concavité d’une courbe. Voyons cela dans le détail. - 166/709 - 5.2. Espace Math 56 Activité 1. Cette activité comporte deux parties jumelles. Dans l’une, on donne d’abord trois graphiques (appelés « situations ») sur lesquels une droite t de coefficient angulaire positif est tracée ainsi qu’un point A sur cette droite ; dans l’autre partie, la seule différence est que le coefficient angulaire est négatif. On demande alors à l’élève : « Dans chacune des situations, esquisse le tracé d’une courbe Γ, tangente à t en A et située • au dessus de t de chaque côté de A ; • en dessous de t de chaque côté de A ; • de part et d’autre de t de chaque côté de A (2 cas). » (Ibid., p. 145) Les élèves doivent donc esquisser 12 courbes différentes (pour chacune des deux parties de l’activité) ; le travail est facilité si les élèves disposent en complément du Cahier d’exercices sur lequel chaque situation est représentée 4 fois pour chaque partie. Il s’agit du premier travail graphique à réaliser par l’élève sur l’ensemble des deux unités relatives à la dérivée si l’on excepte deux exercices en fin de la première unité des deux. C’est assez rare pour être salué. Ce travail est suivi d’une question : « Comment caractériserais-tu les variations de Γ (croissance, décroissance, constance, . . . ) autour du point A ? Compare tes conclusions avec celles de tes condisciples. » (Ibid., p. 144) La question est fermée et la réponse est évidente. Ce que nous pouvons regretter c’est qu’aucune justification ne soit demandée aux élèves. Il leur suffit de donner un avis et de le confronter à celui des autres. Activité 2. Cette activité s’appuie sur un graphique donnant diverses tangentes en des points du graphe cartésien d’une fonction. Il y a des tangentes de coefficients angulaires positifs et négatifs. Viennent alors trois questions (Ibid., p. 146). • La première demande « le signe du coefficient angulaire de chaque tangente » ; il s’agit là d’un travail d’interprétation graphique de l’allure d’une droite. • La deuxième question demande d’esquisser « le tracé de la courbe tangente à ces diverses droites aux points donnés ». Alors que les auteurs du manuel prennent le soin - 167/709 - 5.2.2. Analyse de l’ouvrage d’envisager une équation cartésienne d’une droite (à l’unité précédente du manuel, dans la partie cours comme dans les exercices, par exemple aux pages 137 et 390), il est question ici de la courbe, comme s’il n’y en avait qu’une possible. Il s’agit sans doute d’un abus de langage mais, au vu du graphique proposé ici, le but est quand même d’induire un même tracé pour tous les élèves. Or il existe une infinité de tracés possibles. En particulier, les élèves ont vu à l’activité précédente qu’il y avait déjà 4 manières d’être tangent en un point donné. • Il en résulte que la troisième question qui demande quel « lien semble s’établir entre le signe des coefficients angulaires et le sens de variation de la courbe » devient caduque. Autant, l’activité précédente fait judicieusement référence au caractère local de la croissance/décroissance de la fonction puisqu’on regarde « autour du point A », autant, ici, les auteurs posent indûment une question qui ne semble plus locale. Implicitement, les auteurs considèrent qu’entre deux points donnés, les tangentes en d’autres points ont un coefficient angulaire continument intermédiaire entre ceux des tangentes correspondantes. On peut supposer que les élèves, par effet de contrat didactique, donneront néanmoins la réponse attendue. Activité 3. Deux courbes sont données dans un repère cartésien. « On dit que la première présente une concavité tournée vers le haut et que la seconde présente une concavité tournée vers le bas. » (Ibid., p. 147) La concavité n’est pas davantage définie. Cependant, on peut supposer que cette notion est familière des élèves depuis l’étude des paraboles l’année scolaire précédente. Sont alors données deux figures. Sur chacune d’elles est représentée une « série de tangentes successives au graphe cartésien de f » (Ibid., p. 147). Les coefficients angulaires de chaque tangente sont indiqués. Trois questions sont posées : • À la première, on demande de déterminer le sens de variation des coefficients angulaires des tangentes successives. Seules quelques tangentes sont représentées et on ne dispose, par conséquent, que de quelques valeurs ponctuelles de coefficients angulaires. Dans la mesure où la courbe représentative de la fonction est tracée, la question a un sens à condition que la fonction soit dérivable — ce qui n’est pas spécifié mais semble être le cas au vu de l’allure de la courbe —. En effet, il est possible d’imaginer d’autres tangentes en autant de points intermédiaires que l’on veut et leurs coefficients angulaires auront eux aussi des valeurs intermédiaires. Cette expérience de pensée fait donc appel implicitement au théorème des valeurs intermédiaires, lequel est cité et admis par le manuel, dans l’unité qui traite de la continuité. Ce que l’on peut regretter est que les élèves ne sont pas invités à justifier leur réponse ni à discuter de la continuité de la dérivée, laquelle n’est pas nécessaire pour répondre à la question (cas des points anguleux). On leur demande juste d’écrire successivement les différentes valeurs de quelques coefficients angulaires pour conclure à leur croissance/décroissance permanente. Non seulement, on ne les pousse pas à réfléchir alors qu’ils seraient en mesure de le faire (niveau de rationalité 0) mais on induit chez eux une déformation que tout enseignant observe régulièrement chez les élèves (voire les étudiants issus du secondaire), à savoir que plusieurs cas particuliers induiraient un cas général. - 168/709 - 5.2. Espace Math 56 • La deuxième question est identique, mot pour mot, à celle de l’activité précédente : on demande d’esquisser « le tracé de la courbe tangente à ces diverses droites aux points donnés » (Ibid., p. 147), alors que ces droites proviennent justement des graphes donnés par l’énoncé ! S’agit-il d’un copier-coller malheureux ? On verra plus loin quel aurait pu néanmoins être l’intérêt de cette question (cf. paragraphe 5.2.2.5, p. 173). • La dernière question demande quel « lien semble s’établir entre la manière de varier des coefficients angulaires des tangentes successives et le sens vers lequel la concavité de la courbe est tournée ? » (Ibid., p. 147) En écrivant ici « manière de varier » au lieu de sens de variation comme c’était le cas à la première question, une réponse pourrait être que, dans le premier cas, les coefficients angulaires passent de négatifs à positifs pour donner une concavité tournée vers le haut ; tandis que, dans le second cas, les coefficients angulaires passent de positifs à négatifs pour donner une concavité tournée vers le bas, ce qui n’est pas la réponse attendue. . . Conclusion quant aux Activités de l’unité Applications des dérivées. Les activités proposée pour cette unité d’Espace Math 56 ont le mérite de tenter de faire un lien graphique entre les coefficients angulaires de tangentes successives et la croissance ou la concavité des fonctions. Mais, à l’instar des activités de l’unité précédente, nous sommes loin d’y avoir rencontré ne fut-ce que l’ébauche d’une situation adidactique ou même d’une situation fondamentale. De plus, le niveau de rationalité atteint est exclusivement 0. Il ne correspond en rien à la pédagogie des situations dont se réclament les auteurs du manuel. 5.2.2.5 Notions développées à l’unité Applications des dérivées. Cette partie comporte plus de 80% des pages de l’unité. Elle se subdivise en six sections : Dérivée première et variations d’une fonction ; Dérivée seconde et concavité ; Représentation graphique d’une fonction ; Optimisation ; Résolution approchée d’une équation et Règle de l’Hospital–Bernoulli. Dérivée première et variations d’une fonction. Cette section définit les notions d’extremum et donne les propriétés qui les lient à la dérivée. Vocabulaire et définitions. Il est dit laconiquement que la « dérivée f 0 de la fonction f est aussi nommée dérivée première de la fonction f » (Ibid., p. 148). Ensuite, sont définis les minimum/maximum local/absolu d’une fonction ; chacune de ces définitions est illustrée par un graphique. Cependant, rien n’est dit sur la possibilité éventuelle qu’un minimum/maximum local soit également un minimum/maximum absolu, ni sur leurs nombres respectifs. Enfin, il est dit que les « minimums et maximums d’une fonction sont appelés extremums 14 de la fonction ». 14. Le mot est écrit extremuns au lieu de extremums. - 169/709 - 5.2.2. Analyse de l’ouvrage Propriétés. On trouve ici énoncées neuf propriétés. Toutes considèrent une fonction f continue sur un intervalle fermé [a; b] et dérivable sur l’intervalle ouvert ]a; b[. • En supposant f croissante sur [a; b], alors on aura f 0 (x) > 0 sur ]a; b[. Curieusement, nous n’avons trouvé aucune définition de croissance ou de décroissance d’une fonction dans ce manuel bien qu’elle soit supposée connue, alors que des définitions bien plus basiques sont données dans les premières unités du livre (par exemple, celles de fonction positive ou négative sur un intervalle et de somme de deux fonctions). Un graphique illustre la propriété : on y trouve une portion convexe et croissante de courbe ainsi que les tangentes en trois points. Il n’est fait aucun commentaire, alors que c’eût été l’occasion de faire le lien avec les deux premières activités de l’unité. Cette propriété est suivie d’une démonstration caractéristique des praxéologies à trous. En effet, chaque étape est justifiée et la démonstration semble complète. En particulier, « Puisqu’en tout x distinct de α, f 0 (α) = lim x→α f (x) − f (α) > 0, on déduit que x−α f (x) − f (α) > 0. » (Ibid., p. 149) x−α Dans une parenthèse, il est fait référence à une propriété rencontrée à l’unité relative aux limites ; or, à l’endroit indiqué, on apprend que cette propriété est admise (cf. Ibid., p. 84). La démonstration n’est donc pas complète, contrairement aux apparences. • La deuxième propriété est le pendant de la première dans le cas où f est décroissante. • La troisième affirme que si f (c) est un minimum ou un maximum, alors f 0 (c) = 0. Il n’est pas précisé qu’il s’agit d’un extremum local mais la démonstration, implicitement, permet de lever un doute éventuel chez l’enseignant. Nulle part nous n’avons trouvé annoncé dans ce manuel l’abus de langage qui consiste à omettre l’adjectif quand on a affaire à un extremum local. La propriété est illustrée par deux graphiques (selon qu’il s’agit d’un maximum ou d’un minimum local). En revanche, rien n’est dit quant à la non réciprocité de cette propriété alors que beaucoup d’élèves confondent précisément cette propriété (peu utile en pratique) avec sa réciproque qui, si elle est fausse en général, est néanmoins vraie dans la plupart des exemples et exercices que rencontreront les élèves. La démonstration fait référence aux deux propriétés précédentes, ce qui la rend à son tour non rigoureusement démontrée. • Théorème des accroissements finis ou de Lagrange. Les auteurs du manuel renvoient au petit bout d’histoire, en fin d’unité ; hélas, on n’y apprend rien en rapport avec ce théorème. La « propriété est admise » mais il en est proposé une interprétation graphique, ellemême illustrée par un graphique éclairant. - 170/709 - 5.2. Espace Math 56 Enfin, il est écrit l’importance du « théorème de Lagrange [pour] démontrer les théorèmes suivants, essentiels pour se servir de f 0 dans l’étude graphique d’une fonction » (Ibid., p. 151). • Le premier de ces théorèmes est celui de Rolle qui est un cas particulier du précédent lorsque f (a) = f (b). Il en est également donné une interprétation et une illustration graphique. • En supposant f 0 (x) > 0 sur ]a; b[, alors f est strictement croissante sur ]a; b[. Cette propriété semble proche de la réciproque de la première propriété considérée dans cette section. Mais aucun rapprochement n’est fait à ce sujet. En particulier, y compris dans la démonstration proposée, on ne saisit pas la nécessité de rejeter l’éventualité que f 0 (x) soit nul. La démonstration, comme annoncé par les auteurs du manuel, repose sur le théorème des accroissements finis. En guise d’illustration, on trouve pour cette propriété et pour chacune des suivantes un tableau de variations qui la résume. • Cette propriété est le pendant de la précédente dans le cas où la dérivée est strictement négative. • En supposant c ∈]a; b[ tel que f 0 (c) = 0, f 0 (x) > 0 pour x ∈]a; c[ et f 0 (x) < 0 pour x ∈]c; b[, alors f admet un maximum 15 local égal à f (c). La propriété n’est pas démontrée mais il est écrit qu’elle est : « Conséquence directe des [deux précédentes] propriétés et de la définition de maximum 16 local. » (Ibid., p. 152) • Cette dernière propriété est le pendant de la précédente dans le cas d’un minimum 17 local. Cette section se termine, d’une part, par une illustration graphique et, d’autre part, par des exemples. Illustration graphique. On y donne « le tableau de signes de f 0 et les conséquences pour la variation de la fonction f » (Ibid., p. 153). Le tableau est correctement interprété en termes des croissance/décroissance stricte de la fonction. En revanche, il est question d’extrema relatifs alors que cette notion n’a pas été définie en tant que telle. Pire, elle semble ne pas se confondre avec la notion d’extrema locaux. En effet, f (a) est donné comme minimum relatif et f (b) comme maximum relatif alors que, a et b étant les extrémités du domaine de définition de f , il n’y a pas d’extremum local en ces abscisses, d’après la définition qui a été donnée. Il y a là de quoi semer la confusion dans l’esprit des élèves. Une allure du graphe de f est donnée : 15. Il est écrit minimum dans le livre. En revanche, le tableau de variations fourni est correct. 16. Il est encore écrit minimum 17. Il est écrit maximum dans le livre. Heureusement, ici encore, le tableau de variations fourni est correct. - 171/709 - 5.2.2. Analyse de l’ouvrage En annonçant « Voici le graphe cartésien d’une telle fonction f » (Ibid., p. 153), l’accent n’est pas mis sur le fait qu’il s’agit d’une possibilité parmi une infinité. Ainsi, plusieurs tangentes y sont représentées alors que, en dehors des extrema locaux (aux abscisses m et p), le tableau fourni ne permet pas de connaître la valeur des coefficients angulaires des tangentes ni les ordonnées des points choisis autres que (a; f (a)), (m; f (m)), (p; f (p)) et (b; f (b)). Enfin, la présente section se termine par un encart donnant la procédure à suivre : « Pour déterminer les variations de la fonction f , • on calcule f 0 ; • on recherche les racines de f 0 ; • on dresse un tableau de signes de f 0 et on en déduit les variations de f . » (Ibid., p. 153) Il s’agit d’un résumé minimaliste pour résoudre les exercices qui seront proposés le plus souvent aux élèves : ils auront presque toujours affaire à des fonctions dérivables donc les seuls candidats extrema locaux seront ceux où la dérivée s’annule. Exemples. Ils sont au nombre de quatre. On y trouve une fonction du troisième degré ; une fonction inverse, une fonction trigonométrique et une fonction du second degré composée avec une fonction racine carrée positive. Pour chacune d’elle, le tableau de variations est construit et traduit en français. Aucun graphe n’est fourni. Par ailleurs, les extrema éventuels ne sont pas qualifiés. Ainsi, dans le premier exemple, il n’est pas précisé que les extrema sont locaux, ce qui est admissible en raison de l’abus de langage signalé plus haut ; en revanche, s’agissant du dernier exemple, le minimum obtenu est absolu et non local puisque les deux abscisses où il se réalise sont à des extrémités du domaine de définition de la fonction. Ainsi, la section Dérivée première et variations d’une fonction est placée entièrement sous le signe de l’étude de fonctions. Comme pour l’unité précédente, les démonstrations font appel à des propriétés ou théorèmes admis mais non rappelés comme tels, si bien que ces - 172/709 - 5.2. Espace Math 56 démonstrations semblent rigoureuses alors qu’elles ne le sont pas. D’autre part, lorsqu’une propriété est admise, rien n’est mis en place pour convaincre l’élève de son bien-fondé. Nous restons ainsi à un niveau de rationalité 0. Liés à cette section, on trouve à la fin du manuel 21 exercices sur les 95 que comporte l’unité. Parmi eux, • 5 travaillent le lien entre tableau de variations et graphe de fonction (compléter ou construire l’un à partir de l’autre ou, simplement, les associer). • 2 exercices consistent en la recherche des extrema de fonctions. • 5 exercices portent sur la détermination de fonctions (essentiellement du premier ou second degré) à partir notamment de la valeur numérique de leur dérivée en un point. • 6 exercices portent sur la détermination de fonctions (essentiellement homographiques) à partir notamment de leur sens de variation ou de l’existence d’un extremum en un point donné. • 3 exercices sont plus théoriques et demandent de construire des contre-exemples lorsque certaines hypothèses de propriétés ou théorèmes du cours ne sont pas respectées. Nous pensons que de tels contre-exemples devraient faire partie du cours en raison de l’éclairage qu’ils apportent à la compréhension des propriétés. En tant qu’exercices, ils apparaissent tardivement et ils relèvent du facultatif, comme si la connaissance par cœur des propriétés du cours était jugée suffisante Dérivée seconde et concavité. Cette section est consacrée à la concavité et aux points d’inflexion. Vocabulaire. On trouve ici trois définitions. • la dérivée seconde, comme dérivée de la dérivée première. Toujours aucun clin d’œil au qualificatif première de la dérivée. Un exemple est donné de calcul de la dérivée seconde d’un polynôme de degré 4. • la concavité d’une courbe. Il ne s’agit pas d’une définition mais d’une monstration graphique : elle « est tournée vers le haut dans la situation suivante » (Ibid., p. 155) ; un graphique sur lequel des flèches verticales, situées au dessus de la courbe, pointent vers le haut. De manière analogue est montrée ce qu’est une concavité tournée vers le bas. On aurait plutôt espéré une telle monstration à la troisième activité. D’ailleurs, aucun lien n’est fait entre l’activité 3 et la pseudo-définition proposée. Puisqu’il s’agit ici de fonctions dérivables, avant de lier la concavité à la dérivée seconde, il aurait été possible de définir la concavité à partir de la position de la courbe au dessus ou au dessous de la tangente en tout point, ce qui aurait finalement donné du sens à la deuxième question de l’activité 3 (cf. paragraphe 5.2.2.4, p. 169) • le point d’inflexion. Il est défini comme « un point en lequel une seule tangente existe [et où] la concavité change de sens » (Ibid., p. 156). Il est précisé qu’en « un tel point, la tangente à la courbe traverse celle-ci ». Trois graphiques illustrent cette définition selon que la tangente est oblique, horizontale ou verticale. En revanche, rien n’est dit en termes d’extremum de la dérivée première ou de coefficient angulaire des tangentes. - 173/709 - 5.2.2. Analyse de l’ouvrage Par ailleurs, si l’expression « une seule tangente existe » permet de rendre la définition plus compacte, en l’absence d’explication supplémentaire, elle est peu éclairante. En effet, elle permet de conserver le cas particulier où la tangente est verticale tandis que dire que la fonction doit être dérivable n’aurait pas conservé ce cas particulier. Propriétés. Elles sont au nombre de cinq, toutes admises. Sauf pour la dernière, on suppose f continue sur l’intervalle fermé [a; b] et f et f 0 dérivables sur l’intervalle ouvert ]a; b[. • Si f 00 (x) > 0 sur ]a; b[, « alors Gf tourne sa concavité vers le haut sur [a; b] » (Ibid., p. 156). Un extrait de tableau de variations est donné qui symbolise la situation. • La seconde propriété est le pendant de la précédente dans le cas où la dérivée seconde est strictement négative. • Si f 00 (c) = 0 pour c ∈]a; b[ et f 00 (x) < 0 sur ]a; c[ tandis que f 00 (x) > 0 sur ]c; b[, « alors Gf présente en (c; f (c)) un point d’inflexion à tangente non verticale » (Ibid., p. 156). Comme pour les propriétés précédentes, un extrait de tableau de variations est donné qui symbolise la situation. • La quatrième propriété est le pendant de la précédente dans le cas où les signes de la dérivée seconde sont opposés des précédents. On peut se demander quel est l’intérêt d’avoir fait ici deux propriétés pour une conclusion identique dans les deux cas tandis que les hypothèses sont très semblables. Est-ce par crainte de polluer une propriété par des mots en français plutôt que de tout écrire en langage formalisé ? Ainsi, ne suffisait-il pas d’écrire Si f 00 (c) = 0 pour c ∈]a; b[ et si f 00 (x) change de signe en c, alors. . . tout en conservant les deux tableaux de variation ? • La cinquième propriété ajoute aux hypothèses communes que f et f 0 ne sont pas dérivable en c ∈]a; b[. Dans ce cas, si « limx→c f 0 (x) est soit +∞, soit −∞ ; alors Gf présente en (c; f (c)) un point d’inflexion à tangente verticale » (Ibid., p. 157). Comme à la section précédente, cette sous-section se termine, d’une part, par une illustration graphique et, d’autre part, par des exemples. Illustration graphique. On y donne « le tableau de signes de f 00 et les conséquences pour la concavité du graphe cartésien d’une fonction f » (Ibid., p. 157). Une allure du graphe de f est donnée.Comme à la section précédente, en écrivant « Voici le graphe cartésien d’une telle fonction f » (Ibid., p. 157), on a davantage l’impression qu’il s’agit de l’unique solution et non d’une possibilité parmi une infinité d’autres. En particulier, le tableau donné ne comporte aucune indication sur le signe de f 0 et, donc, sur la croissance/décroissance de f . Enfin, le paragraphe se termine par un encart donnant la procédure à suivre, qui est analogue à celle fournie à la section précédente. Exemple. Il s’agit d’une fonction du troisième degré dont la concavité est étudiée, indépendamment des variations de f . Le graphe de la fonction n’est pas représenté. Ainsi, la section Dérivée seconde et concavité est, elle aussi, placée entièrement sous le signe de l’étude de fonctions. Toutes les propriétés sont admises et aucun lien n’est proposé entre les activités et les notions abordées. Il s’agit d’apprendre du « vocabulaire » et d’appliquer une procédure parcellaire (puisque seule la concavité est considérée, indépendamment de la variation de f 0 et, a fortiori, de celle de f ). Nous sommes bien à un niveau de rationalité 0. - 174/709 - 5.2. Espace Math 56 Liés à cette section, on trouve à la fin du manuel 14 exercices sur les 95 que comporte l’unité. Parmi eux, • 1 demande le signe de la dérivée seconde en un point, la coordonnée des points d’inflexion et une équation cartésienne des tangentes en ces points à partir du graphique de la fonction. Ce qui est frappant dans cet exercice comme dans tous ceux dont le graphique est fourni, c’est qu’il n’est jamais précisé que la fonction est dérivable, comme si l’apparence arrondie ou, au contraire, anguleuse du graphique avait valeur probante en la matière. • 3 travaillent le lien entre tableau de variations et graphe de fonction (compléter, associer ou construire l’un à partir de l’autre). • 3 portent sur le calcul de la coordonnée de points d’inflexion et, éventuellement de leurs tangentes respectives 18 . • 3 exercices sont relatifs au calcul d’une accélération à partir d’une équation horaire. Dans l’un d’eux, il est demandé de représenter graphiquement les fonctions « espace parcouru, vitesse [sans la qualifier] et accélération » (Ibid., p. 414, ex. 346). Néanmoins, comme nous l’écrivions à propos de l’unité précédente du manuel (cf. section 5.2.2.2, p. 165) , on peut regretter que les graphiques demandés s’obtiennent chacun à partir d’une expression analytique tandis qu’une simple allure du graphique des vitesse et accélération ne soit pas demandée à partir du seul graphique de la loi horaire. • 2 exercices portent sur la détermination de fonctions à partir de la coordonnée d’un point d’inflexion. • 1 exercice (situé à la rubrique Pour chercher) consiste à déterminer et à qualifier les extrema d’une fonction grâce à la condition suffisante du second ordre qui est donnée dans l’énoncé mais qu’il est demandé de démontrer. 1 autre exercice (situé à la rubrique Venus d’ailleurs) est une application de cette condition suffisante du second ordre, sans y faire référence. Ainsi, ces deux exercices sont les seuls à faire le lien avec la section précédente. On peut regretter qu’ils se présentent exclusivement sous une forme analytique (à partir du signe de la dérivée seconde) et que, par conséquent, il ne soit pas fait une mention explicite à la concavité Représentation graphique d’une fonction. En introduction, il est écrit : « Dans la pratique de la représentation graphique d’une fonction, on privilégiera la méthode des manipulations au départ du graphe cartésien d’une fonction usuelle. » (Ibid., p. 158) 18. Dans l’un d’eux, il est question de points critiques pour désigner les points d’inflexion alors que cette dénomination a un autre sens en mathématique. - 175/709 - 5.2.2. Analyse de l’ouvrage Or, dans les exemples donnés (décrits ci-dessous), il n’est plus question de manipulation de graphes ; de fait, les fonctions choisies se prêtent peu à de telles manipulations : alors, pourquoi en parler ? Tout au plus, deux exercices demandent explicitement d’analyser s’il est possible d’éviter « l’étude graphique complète » (Ibid., p. 405, ex. 315 et p. 407, ex. 336) tandis qu’un troisième demande de représenter deux nouvelles fonctions à partir du graphique d’une première, « sans réaliser de nouveaux calculs » (Ibid., p. 403, ex. 308). La suite de cette section n’est plus qu’une liste stéréotypée d’étapes à suivre : « Pour représenter graphiquement une fonction, 1. on détermine le domaine de f , ses racines et ses éventuelles asymptotes ; on détermine un éventuel domaine restreint sur lequel l’étude est suffisante pour être étendue ensuite au domaine entier de f (parité, périodicité) ; 2. on calcule la dérivée première f 0 , on étudie son signe et on en déduit le tableau de variations de f ; 3. on calcule la dérivée seconde f 00 , on étudie son signe et on en déduit la concavité de Gf ; 4. on dresse un tableau récapitulatif des opérations réalisées en 1., 2. et 3. ; 5. on construit le graphe cartésien de f 19 et on dessine les tangentes aux points remarquables. » (Ibid., p. 158) Il est notable de constater que tout le travail réalisé sur les tangentes est réduit ici à les dessiner « aux points remarquables » (Ibid., p. 158). Exemples. Ils sont au nombre de quatre. On y trouve une fonction du quatrième degré x3 (f (x) = x4 − 2x3 ) ; une fonction rationnelle (f (x) = 2 ), une fonction du troisième x − 1p degré composée avec une fonction racine cubique (f (x) = 3 x2 (x − 1)) et une fonction trigonométrique (f (x) = 2 cos2 x + cos 2x). Pour chacun de ces exemples, la procédure annoncée est développée, sans analyse de la pertinence ou non de certaines étapes (à l’exception notable du domaine de dérivabilité qui n’est déterminé que dans le seul exemple où il ne se confond pas avec le domaine de définition ; sont alors calculées les limites en ses bornes de la dérivée). Voici en substance la démarche suivie pour chacun des exemples : 1. Étude de f (a) Domaine de définition pour déceler les éventuelles asymptotes verticales ; mais quelle est la pertinence d’une telle étude dans le cas, notamment, d’un polynôme (exemple 1) ? Le cas échéant, les limites aux bornes finies du domaine sont calculées. 19. Il est écrit Gf à la place de f . - 176/709 - 5.2. Espace Math 56 (b) Parité, imparité et périodicité de la fonction pour chercher d’éventuelles symétries ou restriction du domaine d’étude. Dans le cas du polynôme, la non parité et la non imparité sont justifiées par les auteurs du manuel et non l’absence de périodicité, preuve de sa vacuité dans le cas de l’étude d’un polynôme. (c) Calcul des limites aux bornes infinies du domaine de définition à la recherche d’asymptotes horizontales. (d) Recherche des asymptotes obliques dans le cas où une limite à l’infini est infinie. (e) Calcul des racines de la fonction. (f) Détermination du signe de la fonction. 2. Étude de f 0 (a) Calcul de la dérivée. (b) Calcul de ses racines. (c) Détermination du signe de la dérivée et construction d’un tableau de variations de la fonction. On y trouve ajoutées les valeurs des éventuels extrema locaux. 3. Étude de f 00 (a) Calcul de la dérivée seconde. (b) Calcul de ses racines. (c) Détermination du signe de la dérivée seconde et construction d’un tableau de concavité de la fonction. (d) Calcul du coefficient angulaire de la tangente aux éventuels points d’inflexion . 4. Tableau récapitulatif 5. Représentation graphique de la fonction f Cette section est donc une récapitulation pratique des deux précédentes, ce qui confirme encore la priorité donnée aux études de fonctions et aux aspects procéduriers d’une telle étude. Liés à cette section, on trouve à la fin du manuel 26 exercices sur les 95 que comporte l’unité (sachant que le dernier d’entre eux consiste en l’étude de 9 fonctions, c’est comme si nous avions 35 exercices d’étude de fonction sur 104 exercices, soit le tiers des exercices). Parmi eux, • 12 exercices consistent essentiellement en des études de fonctions à faire « en se laissant guider par le schéma proposé dans la partie théorique » (Ibid., p. 403, ex. 308). Parfois, l’étude systématique n’est pas explicitement demandée (on demande seulement la représentation graphique de la fonction) • 3 exercices sont une étude de fonction mais où il est demandé de donner la priorité aux manipulations de fonctions usuelles plutôt que de réaliser cette étude. 1 autre exercice demande de représenter graphiquement une fonction (homographique en l’occurrence) sans préciser s’il faut en faire l’étude ou considérer des manipulations de fonctions usuelles - 177/709 - 5.2.2. Analyse de l’ouvrage • 2 exercices demandent d’associer l’expression analytique d’une fonction à son graphe ou le contraire. Il s’agit essentiellement de fonctions homographiques, rationnelles et trigonométriques. L’étude de la dérivée n’est pas nécessaire (d’ailleurs, elle n’est pas demandée), si bien que ces exercices auraient pu être proposés dans une autre unité. D’autre part, les associations demandées ne sont pas toujours possibles en raison d’erreurs de compatibilité entre les graphes et les fonctions proposées. Par exemple, à l’exercice 313 (Ibid., p. 404), le seul graphique qui pourrait correspondre à la fonction 1 1 f (x) = est celui portant la lettre C ; or f (0) = , ce qui ne correspond pas à x+2 2 la valeur lue sur le graphique : • 1 exercice demande le graphe d’une fonction à partir de celui de sa dérivée. Enfin ! (cf. section précédente p. 175 et section 5.2.2.2, p. 165) • 6 exercices ont trait à la résolution graphique d’une équation (soit en tant que telle, soit en termes d’intersection de deux courbes) ou d’une inéquation • 1 exercice consiste à comparer les graphes de cos2 x et de | cos x|. Il est demandé : « Sont-ils égaux ? Pour justifier ta réponse calcule le coefficient angulaire des tangentes à ces deux courbes au point d’abscisse π2 et dessine ces tangentes. » (Ibid., p. 415, ex. 352) Or il suffit de comparer les images de ces fonctions en deux fonctions n’ont pas le même graphe ! π 4 pour se convaincre que les Optimisation. En exergue de cette section, il est écrit que : « Les problèmes d’optimisation sont des problèmes dont le but est de déterminer la valeur maximale ou la valeur minimale d’une grandeur définie par une fonction. Ces problèmes sont souvent assez compliqués car ils demandent une mise en équation. » (Ibid., p. 166) À propos de la difficulté des problèmes d’optimisation, les auteurs parlent de mise en équation, ce qui est réducteur par rapport à la modélisation qui est d’ailleurs le terme employé dans le texte officiel du programme scolaire. La suite de cette section est un encart donnant la procédure à suivre pour « résoudre un problème d’optimisation » (Ibid., p. 167). En parallèle avec chacune des étapes, est traité un exemple, celui d’un tiroir obtenu à partir d’une feuille de carton rectangulaire de dimensions données ; après pliage, le volume de la boîte obtenue doit être maximal. Voici les étapes proposées, suivies de nos commentaires pour chacune : - 178/709 - 5.2. Espace Math 56 • « on distingue dans l’énoncé les données des inconnues ; » (Ibid., p. 167) Dans l’exemple, un graphique représente le carton, ses dimensions données et le tiroir avec ses dimensions repérées par les lettres L, l et h ; mais rien n’est écrit dans la procédure proprement dite pour encourager les élèves à faire un tel graphique chaque fois que c’est possible. D’autre part, les coins à retirer au carton ne sont pas représentés sur ce graphique mais seulement au graphique illustrant l’étape suivante. • « parmi les grandeurs inconnues, on choisit la variable et ses bornes de variation ; on exprime les autres grandeurs inconnues en fonction de cette variable ; » (Ibid., p. 167) L’emploi du verbe choisir et du pronom indéfini on induit l’idée que ce choix est fait par l’élève et qu’il est sans importance au sens où il reviendrait au même de choisir une autre variable. Or, si l’on choisit par exemple L, ses bornes de variation sont 0 et 20 et les valeurs obtenues finalement sont L ' 4,22 et L ' 15,77, toutes deux compatibles avec les bornes trouvées, alors que la première valeur de L conduit à une valeur négative de l. Le choix n’est donc pas arbitraire. En réalité, c’est le problème lui-même qui choisit la variable à considérer. Le travail de l’élève est d’analyser l’énoncé du problème pour en repérer la variable pertinente. De fait, dans l’exemple, on demande les dimensions du carré à découper aux quatre coins du carton pour rendre le volume maximal, ce qui fixe pratiquement le choix de la variable. • « on exprime la fonction de la variable choisie que l’on doit maximiser (recherche de la valeur maximale) ou minimiser (recherche de la valeur minimale) ; • on calcule la dérivée de la fonction ; » (Ibid., p. 167) Il n’est pas rappelé pourquoi déterminer cette dérivée alors qu’il s’agit du lien direct avec la première section. • « on recherche les racines de cette dérivée ; » (Ibid., p. 167) Même remarque que précédemment, ce qui confirme qu’on n’échappe pas au niveau 0 de rationalité. On ne trouve d’ailleurs pas d’avantage d’explication dans l’exemple traité, lequel est pourtant une sorte de modèle de rédaction pour l’élève. • « on les confronte avec les conditions exigées dans l’énoncé ; » (Ibid., p. 168) Cette étape semble être un nouveau travail de décodage de l’énoncé alors qu’il a déjà été réalisé à la deuxième étape, par l’étude des bornes de variation de la variable choisie. Cependant, l’exemple reprend correctement les bornes de variation des dimensions des coins du carton. • « on vérifie pour la (ou les) valeur(s) retenue(s) que la fonction est bien maximisée ou minimisée ; » (Ibid., p. 168) - 179/709 - 5.2.2. Analyse de l’ouvrage Il n’est pas explicitement précisé en quoi consiste cette vérification. Dans l’exemple, un tableau de variations du volume montre qu’il s’agit bien d’un maximum (local) par une flèche qui monte, puis qui descend avec, entre les deux, la lettre M en majuscule et la valeur du maximum 20 . En revanche, il n’est pas fait référence à la propriété correspondante du livre. Ainsi, dans sa rédaction, l’élève ne prendra pas l’habitude de justifier sa réponse de façon explicite. • « on conclut ! » (Ibid., p. 168) Cette fois, la phrase est en français ce qui, ici, n’a aucune valeur ajoutée par rapport à une réponse encadrée du type x ' 2,11 cm. Par ailleurs, dans leur réponse, les auteurs donnent la valeur du maximum du volume alors que l’énoncé ne le demande pas. Ainsi, dans cette section, alors que les auteurs relèvent la difficulté des problèmes d’optimisation en raison d’un travail de modélisation, la procédure qu’ils proposent à cet égard est floue par endroit. Par ailleurs, à l’endroit clé du problème, c’est-à-dire l’usage de la dérivée pour déterminer l’extremum cherché, rien n’est davantage précisé. Enfin, pour déterminer le type d’extremum « on vérifie » (Ibid., p. 168) plutôt qu’on ne justifie. On demeure au niveau 0 de rationalité. En revanche, signalons le nombre important et la variété des exercices d’optimisation proposés à la fin du livre. Liés à cette section, on trouve en effet 26 exercices 21 sur les 95 que comporte l’unité. Tous nécessitent une modélisation dans laquelle, le plus souvent, l’élève doit lui-même choisir les noms des inconnues. Parmi ces exercices, • 18 se situent dans un contexte géométrique • 2, dans un contexte algébrique • 6, dans un contexte cinématique, économique, ou les deux réunis Résolution approchée d’une équation. Les auteurs du manuel précisent bien que, contrairement aux fonctions du premier et second degré, la recherche des racines fait souvent « appel à des méthodes numériques qui donnent des valeurs approchées » (Ibid., p. 168). Cette section traite d’une d’entre elles : la méthode de Newton, appelée aussi « méthode de la tangente ». Description de la méthode. Il est écrit que cette méthode repose sur l’utilisation de la tangente comme approximation affine de la fonction. Le principe est que l’intersection de la tangente (en un point d’abscisse proche de la racine cherchée) avec Ox sera plus proche de la racine cherchée que l’abscisse du point considéré précédemment. « De cette idée, découle la technique » (Ibid., p. 168) dont les cinq étapes sont décrites dans un encart et illustrées par des graphiques. Bien que ces étapes soient rédigées sur le modèle d’une procédure à appliquer, comme le stipule d’ailleurs le titre du paragraphe, on a plutôt l’impression qu’il s’agit de la description de la méthode. Cette impression est confirmée à la lecture du paragraphe suivant : 20. La valeur donnée est 0 au lieu de 192,4 . . . indiqué à l’étape suivante. 21. Formellement, il y en a 27 mais l’un d’eux aurait plutôt sa place dans la section précédente. - 180/709 - 5.2. Espace Math 56 Remarques importantes. La première remarque signale l’importance de « choisir judicieusement la valeur de départ » (Ibid., p. 170), notamment parce que la dérivée en ce point doit être non nulle. Cette remarque est suivie d’un exemple de recherche d’une des racines d’une fonction du troisième degré. La seconde remarque présente la méthode de Newton comme « une application de la dérivée relevant plus de l’anecdote historique que de l’actualité pratique » (Ibid., p. 170), en raison de l’existence de « calculatrices très abordables techniquement et. . . financièrement » (Ibid., p. 170), capables de résoudre ce type de calcul. Cela ne revient-il pas à dire que cette section résulte de la volonté des auteurs de respecter le programme scolaire en vigueur et non celle d’offrir une occasion de réfléchir aux élèves à propos de l’utilisation des tangentes pour approximer les racines d’une fonction dérivable quelconque ? Il n’est dès lors pas surprenant de ne trouver que 3 exercices sur les 95 proposés dans cette unité ; et encore, le troisième exercice propose justement une autre méthode, graphique cette fois. Règle de l’Hospital – Bernoulli. Cette dernière section est propre au programme de maths fortes (6 heures par semaine). f (x) Les auteurs du manuel indiquent que le calcul de limites en a ou ±∞ de peut conduire à g(x) 0 ∞ des formes« rebelles » (Ibid., p. 171) d’indétermination du type ou . La règle de l’Hospital 0 ∞ est « une règle de levée de ces indéterminations, sous des hypothèses très strictes » (Ibid., p. 170). On peut se demander pourquoi les hypothèses de cette règle sont qualifiées de très strictes. La seule hypothèse qui sort de l’ordinaire n’est-elle pas que « f 0 et g 0 ne [doivent être] ni simultanément nulles, ni simultanément infinies, sauf éventuellement en a » (Ibid., p. 171) ? Or, toutes les fonctions auxquelles sont confrontés les élèves ne posent aucun problème de ce genre. Sont donc faites des précautions oratoires alors que, d’une part, la règle n’est pas démontrée et, d’autre part, aucun contre-exemple n’est proposé, si bien que cette contrainte est forcément mystérieuse autant qu’inutile aux yeux des élèves. L’énoncé de la règle est suivi de cinq exemples. Pour chacun, une phrase stéréotypée (qu’il suffira donc aux élèves de citer par cœur pour satisfaire les exigences formelles de rigueur attendue) tient lieu de justification à l’emploi de cette règle : « Par la règle de l’Hospital, les hypothèses étant vérifiées, on obtient [. . . ] » (Ibid., pp. 171-172) - 181/709 - 5.2.2. Analyse de l’ouvrage Les trois premiers exemples sont supposés « déjà résolus précédemment (voir Unité 3 22 ) par d’autres techniques de levée d’indétermination » (Ibid., p. 171). Or nous n’avons pas trouvé l’étude de ces limites, ni dans la partie théorique, ni parmi les exercices. L’idée, pourtant, aurait été bonne, donnant auprès des élèves une certaine légitimité à la règle de l’Hospital puisque conduisant à un même résultat obtenu par une méthode supposée incontestable. Les deux autres exemples sont déclarés « non résolus précédemment » (Ibid., p. 172). Outre que la réponse du premier est fausse (en raison d’une erreur dans la détermination de la dérivée du numérateur), les deux limites proposées peuvent également être trouvées sur base des connaissances acquises à l’unité sur les limites, ce qui rend peu convaincante l’idée que 0 ∞ « des formes d’indétermination du type et demeurent rebelles aux techniques de levée de 0 ∞ l’indétermination évoquées dans l’unité 3 » (Ibid., p. 171), ainsi que le formulaient les auteurs du manuel au début de la section pour justifier l’introduction de la règle de l’Hospital. Remarques sur la validité de l’emploi de la règle. Ce paragraphe est subdivisé en six points accompagnés à chaque fois d’un petit exemple. • La règle de l’Hospital peut être réitérée par dérivation successive, « pour autant que les hypothèses restent vraies pour f 0 , f 00 , . . . » (Ibid., p. 172) Une telle remarque nous semble pertinente. • Dans le cas des fonctions trigonométriques, après avoir utilisé la règle de l’Hospital, il peut être plus efficace de terminer le calcul sans réitérer l’application de la règle. Pourquoi limiter cette remarque de bon sens aux seules fonctions trigonométriques ? De plus, l’exemple fourni est peu convaincant car une application supplémentaire de la règle de l’Hospital est immédiate et conduit à la réponse. • La règle est d’application en cas de limites à gauche ou à droite. • Les cas d’indétermination 0 · ∞ et ∞ − ∞ peuvent parfois se ramener aux 0 ∞ cas ou . 0 ∞ Ici, l’exemple donné est vraiment bienvenu. • La règle de l’Hospital n’est pas toujours efficace. L’exemple donne un cas où les applications successives de la règle ramène au calcul de départ. • La dernière remarque donne un exemple où l’usage abusif de la règle conduit à une réponses erronée (cas où l’indétermination ne peut se ramener à la 0 ∞ ). forme ou 0 ∞ Pour chacun des exemples donnés dans ce paragraphe, la notation H est introduite pour signifier, entre deux écritures de limites, que « l’on a utilisé la règle de l’Hospital » (Ibid., p. 172). Si cette notation est commode, son emploi va de pair avec l’économie de toute justification de l’emploi de la règle. Liés à cette section, on trouve à la fin du manuel 3 exercices sur les 95 que comporte l’unité. Parmi eux, 22. Il s’agit du chapitre sur les limites, Ibid., pp. 57-112 - 182/709 - 5.2. Espace Math 56 • 2 demandent d’appliquer la règle « après avoir vérifié la légitimité de cette utilisation » (Ibid., pp. 406 ; 408). On y trouve 17 calculs de limites. • 1 exercice demande de montrer que la règle de l’Hospital est alors inapplicable et de faire le calcul autrement. Ainsi, ces exercices ont le mérite d’exiger la justification de l’application de la règle. En revanche, on ne trouve aucun exercice où ce serait à l’élève de choisir la méthode de calcul, la règle de l’Hospital se révélant pertinente seulement dans certains cas. Cette section est donc une nouvelle fois une invitation à appliquer une procédure sans que l’élève ait à choisir une méthode sur base de sa propre réflexion. Conclusion quant aux Notions de l’unité Applications des dérivées. Nous avons constaté tout au long de l’étude de cette partie du cours que, d’une part nous avons affaire à des praxéologies à trous, qui vont jusqu’à donner l’illusion d’une praxéologiedéduction ; d’autre part, dans la partie théorique comme dans les exercices, le niveau de rationalité est 0, en l’absence quasi permanente d’une part de réflexion ou de liberté d’action pour l’élève, lequel est systématiquement guidé pas-à-pas vers la solution, comme s’il était incapable d’en trouver le chemin tout seul et, pire, comme si ce chemin était unique. Cette dernière description n’est pas sans rappeler ce qui caractérise l’ostension déguisée, à savoir la volonté d’une lecture univoque d’un ostensif pourtant trop riche pour cela. Il existerait donc un lien de cause à effet entre l’ostension déguisée et le niveau 0 de rationalité décrit par Rouy (2007). 5.2.2.6 Un petit bout d’histoire, relatif à l’unité Applications des dérivées. Cette dernière partie de l’unité comporte 3 pages, essentiellement consacrées à Newton, de même qu’à l’unité précédente, c’est Leibniz qui avait la vedette. On y lit des anecdotes biographiques, « son apport en sciences [qui] fut tellement génial » (Ibid., p. 174) à travers notamment sa théorie de la gravitation universelle, et les causes de la querelle entre lui et Leibniz. Le dernier tiers de cette partie est plus instructive en regard du concept de dérivée et l’on peut regretter qu’il ne se trouve pas plutôt dans la partie historique de l’unité précédente. En effet, il y est indiqué que les « notions de dérivation et d’intégration étaient pour Newton conditionnées par un problème de cinématique : de l’espace parcouru, il a voulu trouver la vitesse instantanée (problème de dérivation) et, inversement, de la vitesse instantanée, il a voulu évaluer l’espace parcouru (problème d’intégration) » (Ibid., p. 175). Il est ensuite montré brièvement que « Pour comprendre les lois de la nature, depuis l’antiquité les savants ont été préoccupés par l’étude du mouvement. [. . . ] Newton reprend à son compte [l’état des connaissances sur le sujet] pour expliquer les lois de mouvement. Pour étayer ses théories physiques, il a besoin d’un outil performant de calcul. Il invente alors le calcul différentiel. Les techniques et les notations sont différentes de celles de Leibniz. Newton considère un point de coordonnée (x, y) mobile sur une courbe. Il note ẋ et ẏ, les vitesses respectives de l’abscisse x et de l’ordonnée y, pendant un temps infiniment petit ; ẍ et ÿ, les accélérations respectives de l’abscisse x et de l’ordonnée y. » (Ibid., p. 172) - 183/709 - 5.2.3. Conclusion sur Espace Math 56 Les explications s’arrêtent là mais cela montre, hélas implicitement seulement, que le calcul différentiel est né de la cinématique et non le contraire. La partie historique se termine ainsi : « Dans les développements de Newton comme dans ceux de Leibniz, la notion de limite est sous-jacente. Il faudra toutefois attendre les travaux du mathématicien français Augustin Cauchy pour voir apparaître des considérations rigoureuses sur les limites des fonctions. Le vocabulaire et les notations de la dérivée ne seront amenés que plus tard par le mathématicien Joseph-Louis Lagrange, né en Italie et ayant fait carrière dans l’enseignement français à l’École Normale Supérieure et à Polytechniques. » (Ibid., p. 176) Ici, encore, bien que cela ne soit qu’implicite, on en déduit que le concept de limite est postérieur à celui de dérivée. En revanche, on ne trouve aucun questionnement sur l’inversion didactique qui consiste désormais à enseigner généralement les limites avant les dérivées. Enfin, notons l’anachronisme qui place l’apport de Lagrange après celui de Cauchy alors que, du reste, leurs dates de naissance et décès sont correctement renseignées en dessous de leur portrait. 5.2.3 Conclusion sur Espace Math 56 Ainsi, à l’issue de l’analyse des deux unités relatives à la dérivée, il apparaît que l’on ne rencontre dans Espace Math 56 que des praxéologies à trous pour ce qui concerne les parties théoriques, avec des démonstrations qui veulent jusqu’à paraître rigoureuses alors qu’elles s’appuient sur des propriétés admises. Plus inquiétant, à nos yeux, est la généralisation d’un niveau 0 de rationalité (au sens proposé par Rouy (2007)) à la fois dans la partie théorique — les propriétés admises n’offrent que très rarement un moyen de vérifier leur validité, futce pragmatiquement, au travers d’un exemple bien choisi, et très peu de contre-exemples viennent justifier les hypothèses envisagées — et dans la partie exercices — application de procédures imposées, absence de regard critique sur les résultats obtenus. Or, ce manuel a été l’un des plus utilisés pendant de nombreuses années en Belgique, signe qu’il semblait convenir aux élèves comme aux enseignants. Les premiers auront peutêtre été rassurés d’y trouver des formules à appliquer et un cours clairement structuré. Les seconds y retrouvent la trame du cours d’analyse qu’ils ont suivi à l’université, signe apparent de la qualité mathématique de l’ouvrage. - 184/709 - 5.3. Actimath 54 5.3 Actimath 54 Ce manuel est plus récent qu’Espace Math puisque sa conception remonte à 2003. La structure choisie dans Actimath 54 est semblable à celle de l’autre manuel même si un seul chapitre regroupe les deux unités du précédent. La première unité correspond aux sections intitulées Nombre dérivé, fonction dérivée et Calcul des dérivées tandis que la seconde unité correspond à la troisième et dernière section de la partie théorique et nommée Applications diverses. Ce manuel s’adressant à des élèves ayant 4 heures de mathématiques par semaine, on n’y trouve, en accord avec le programme scolaire, ni le théorème des accroissements finis ni la règle de l’Hospital. Le chapitre « est composé d’activités d’introduction diverses, d’une partie théorique terminée par une synthèse des notions abordées (ce qui permet, notamment, une approche aisée des exercices) et d’exercices nombreux, variés et triés selon leur difficulté » (Delfeld & al. 2003, p. 3) . Notons que rien n’est dit en termes d’ambition à propos des activités, sinon qu’elles sont qualifiées « d’introduction », contrairement à Espace Math qui se réclamait de la « pédagogie des situations ». 5.3.1 Analyse de l’ouvrage Notre analyse sera ici plus brève que pour le manuel précédent. En effet, les structures étant similaires, nous nous attacherons à mettre en lumière ce qui change de l’un à l’autre. Après avoir rappelé les « compétences terminales » visées par le programme scolaire à propos des dérivées et après un encart historique sur la paternité du calcul différentiel où l’on peut lire sur deux pages un texte de d’Alembert sur la question, commencent les activités. 5.3.1.1 Activités Les activités sont au nombre de 8. • La première part du graphe d’une fonction du troisième degré sur lequel cinq tangentes (non nommées comme telles) sont représentées. Il est demandé d’en déterminer « la pente » et « les équations » (Ibid., p. 167). Notons déjà que la pente est ici préférée au coefficient angulaire et que les auteurs d’Actimath mettent un adjectif défini et non indéfini pour désigner les équations cherchées. Leur but est de rafraîchir la mémoire aux élèves sur ces sujets puisque le titre de l’activité est « Rappelons-nous. . . ». - 185/709 - 5.3.1. Analyse de l’ouvrage • La suivante s’intitule « À propos des tangentes. . . » (Ibid., p. 167) alors que le mot tangente n’apparaît pas dans l’activité et que le concept n’a pas été rappelé. Une x2 fonction du second degré est donnée par son expression analytique ( ) et on consi4 dère deux points de la courbe, un d’abscisse a = 2 et l’autre d’abscisse b = a + h « où h est un réel ». L’élève doit « représenter la fonction sur l’intervalle [0; 4] [puis] compléter le tableau [reproduit ci-après] avant et représenter chaque droite AB ». h 1,5 1 0,75 0,5 0,25 0,1 0,01 b=a+h f (b) = f (a + h) f (a + h) − f (a) f (a + h) − f (a) h pente de la droite AB La question est « Que constatez-vous quand h tend vers 0, c’est-à-dire quand le point B se rapproche du point A ? » (Ibid., p. 167). Or, même si les valeurs de h sont de plus en plus proches de 0, rien n’y indique que h tend vers 0. De plus, on sous-entend que le passage du registre algébrique (« h tend vers 0 ») au registre géométrique (« B se rapproche du point A ») est évident (« c’est-à-dire »). La réponse attendue est-elle que la pente de AB tend vers 1 ? Pourtant, il est possible de répondre tout autre chose ; par exemple, que cette pente est toujours inférieure à 2, qu’elle est décroissante, qu’elle a toujours entre deux et quatre décimales non nulles ou que la dernière décimale non nulle est 5. Enfin, après avoir demandé de « calculer la pente de la droite AB ainsi que la limite de celle-ci pour h tendant vers 0 », on demande « Qu’en concluez-vous ? » (Ibid., p. 167). Nous avons ici un exemple d’ostension déguisée dans la mesure où, sous l’apparence d’une question ouverte, les auteurs du manuel attendent une réponse unique alors que les données dont disposent les élèves sont à la fois trop riches et trop partielles pour imposer la réponse attendue. Celle-ci sera produite par l’élève qui aura compris l’intention des auteurs (effet de contrat) et non par l’observation même de l’ostensif. Le calcul de la limite donne 1. Si un élève avait conjecturé que la limité est 1, sa conclusion serait que sa conjecture était bonne. Si un élève s’était intéressé à la décroissance de la suite ou au nombre de décimales, il se sentira frustré de ne pas avoir découvert l’intention de l’auteur de la question. Pire, enfin, si un élève avait affirmé que la limite est 1 sur la seule base du tableau de valeurs, il pensera avoir bien répondu alors qu’il aura pris ce qui est une condition nécessaire (la convergence d’une sous-suite d’une suite convergente) pour une condition suffisante, ce qui est faux ; si l’on préfère, il pensera impunément qu’un exemple suffit à prouver une généralité. Cet usage faible des tableaux numériques a également été travaillé par Bloch (2000, - 186/709 - 5.3. Actimath 54 p. 179). • L’activité 3 suit le même schéma dans le cas d’une hyperbole. Cette fois, l’élève aura bien compris l’intention du professeur, donnera les réponses attendues et le professeur pourra donc se persuader que les élèves ont compris. Mais compris quoi ? Les élèves auront montré qu’ils savent calculer la limite d’une pente, ce qui provient de l’étude du chapitre sur les limites ; en revanche, les activités 2 et 3 n’apportent rien qui permette de comprendre ce que l’on peut faire de ce résultat algébrique. √ • L’activité 4 étend le calcul de ce type de limite au cas des fonctions usuelles x2 , x, x et x3 . C’est donc davantage la procédure algébrique (qui sera celle du calcul des dérivées) qui est visée qu’une certaine compréhension du concept visé. • La cinquième activité nous place dans un contexte graphico-cinématique : 4 graphes donnent « la position (y) de quatre wagonnets se déplaçant séparément sur une ligne droite en fonction du temps (t) » (Ibid., p. 169). Observons que la vitesse initiale pour le graphe (II) est infinie ; mais nous comprenons que le but des auteurs du manuel est davantage de proposer une expérience de pensée simple dans un contexte pseudo-cinématique plutôt que d’envisager une situation physique réaliste. Il est d’abord demandé à l’élève de « décrire le mouvement de chaque wagonnet » (Ibid., p. 169). L’intérêt d’une telle activité dépend de ce que l’enseignant en fait. Ainsi, se satisferat-il d’une description en termes uniquement de position ou demandera-t-il à l’élève d’envisager la vitesse et l’accélération ? Par ailleurs, demandera-t-il à l’élève de justifier ses affirmations ? Enfin, la partie théorique fera-t-elle référence à cette activité ? Ensuite, l’élève est invité à associer les graphiques avec un certain nombre de phrases relatives à la vitesse ou à l’accélération. Il n’est pas précisé s’il s’agit de vitesse/accélération moyenne ou instantanée. La pertinence de cette suite de la cinquième activité dépend, elle aussi, de l’exigence de l’enseignant en matière de justification. Par exemple, comment un élève pourra-t-il associer le graphique (I) à un wagonnet ayant « une accélération toujours positive » ? Sera-ce sur base de son cours de physique dans lequel il a étudié les mouvements rectilignes uniformément accélérés, auquel cas la question perd pratiquement tout son intérêt ; ou sur base de l’observation d’une vitesse moyenne croissante ? Or, étant données les dimensions des graphiques, il semble difficile de représenter et de comparer des vitesses moyennes successives sur des sous-intervalles de temps. Quoi qu’il en soit, cette activité et les suivantes ont trait à la dernière section du - 187/709 - 5.3.1. Analyse de l’ouvrage manuel ; elles nous semblent trop en amont de la partie théorique correspondante ; c’est l’inconvénient d’avoir fait un seul chapitre pour l’ensemble du sujet. Néanmoins, rien n’empêche l’enseignant de terminer l’étude des deux premières sections théoriques avant de demander aux élèves de faire les activités 5 à 8. • L’activité 6 est du même type que les activités 2 à 4 à la différence que le contexte est cinématique. Il est donc d’abord demandé de représenter la fonction « distance parcourue » (Ibid., p. 169) . S’agissant d’une masse ponctuelle qui tombe en chute libre, cette distance se confond avec la position ; si la masse avait été d’abord jetée en l’air avant de retomber librement, la vitesse moyenne entre les instants t1 et t2 n’aurait pas été celle qui est d(t2 ) − d(t1 ) donnée ici, à savoir . t2 − t1 Il est ensuite demandé de calculer la vitesse moyenne pour t1 et t2 donnés et de la comparer à la pente de la sécante ayant pour intersection avec le graphe les deux points d’abscisses égales aux valeurs données à t1 et t2 . Le but est donc que les élèves prennent conscience que la vitesse moyenne entre deux instants se mesure facilement par la pente de la sécante à la courbe entre ces deux instants. Mais cela confirme aussi qu’à l’activité précédente, le signe de l’accélération n’était pas supposé être justifié par les élèves à partir de vitesses moyennes successives. Enfin, il est demandé d’exprimer « vm (t) la vitesse moyenne entre les instants 1 et t (t 6= 1) » (Ibid., p. 169) puis de compléter un tableau de valeurs pour des instants t de plus en plus proches de 1, par excès et par défaut. Comme aux activités 2 à 4, on demande « vers quel nombre v la vitesse moyenne vm (t) tend-elle lorsque t tend vers 1 ? » et, bien sûr, la phrase « Que concluez-vous ? » En nommant v le résultat du calcul de la limite, on suppose implicitement (explicitement, il est seulement question d’un « nombre réel ») qu’il s’agit d’une vitesse. Mais rien ne permet de penser qu’il s’agit de la vitesse instantanée à t = 1. En effet, ce dernier concept n’a pas été travaillé jusque là ; la vitesse instantanée est tout au plus à l’état de préconstruit ; dans ce cas, même si la vitesse moyenne sur un intervalle de temps très court est sans doute proche de la vitesse instantanée, rien ne prouve, à priori, que cette dernière vaut précisément le résultat de la limite. À cela s’ajoute, comme nous l’avons souligné lors de l’Analyse des conceptions des élèves (cf. section 4.3.4, p. 140), l’obstacle du positivisme empiriste selon lequel une vitesse instantanée n’existe pas. Nous ne voyons pas dès lors quelle conclusion peuvent donner les élèves, à moins, une nouvelle fois, de deviner l’intention des auteurs à partir de la notation choisie (v comme vitesse) et des connaissance du cours de physique de l’année scolaire précédente. • L’activité 7 place l’élève dans un contexte économique. Les concepts de coût total C(x) (noté C(x) et égal ici à 200 + 0,05x + 0,0001x2 ), de coût moyen (c(x) = et x coût marginal Cm (x) = C(x + 1) − C(x) sont définis brièvement ; x est la quantité produite. - 188/709 - 5.3. Actimath 54 Dans un premier temps, on demande de calculer les trois coûts pour x = 500, puis 1000 et 5000, dans le seul but apparent de faire appliquer par les élèves les formules données. À la seconde question, il est donné « une autre formule donnant le coût marginal C(x + h) − C(x) C 0 (x) = lim » (Ibid., p. 170). On demande de comparer Cm (x) et h→0 h 0 C (x) pour des valeurs de x allant de 10 à 5000. L’intitulé même de la question pose problème : puisque les deux formules donnent le coût marginal, pourquoi comparer les valeurs calculées ? Au traditionnel « Que concluez-vous ? » final, les élèves devraient répondre qu’une des formules est fausse puisqu’il y a une différence non nulle (0,0001) entre les deux valeurs, indépendamment de x, au lieu de la réponse attendue que l’une des formules donne un bonne approximation de l’autre ! Par ailleurs, la différence de 0,0001 provient du coefficient de x2 dans l’expression du coût total. Ainsi, si la fonction de coût total avait été du premier degré, l’égalité aurait été parfaite ; si, en restant avec une fonction du second degré, le coefficient de x2 avait été de 10, la différence n’aurait pas forcément été jugée petite ; enfin, si la fonction coût total avait été d’un degré supérieur à deux, la différence obtenue aurait été variable donc pas forcément négligeable non plus. Dans d’autres cours de mathématique appliqués à l’économie, on rencontre plutôt l’idée que, dans certains contextes, h = 1 peut être considéré comme suffisamment proche de zéro pour affirmer C(x + 1) − C(x) C(x + h) − C(x) que Cm (x) = ' lim = C 0 (x). h→0 1 h • La dernière activité est un problème d’optimisation. On considère « une boîte parallélépipédique [formée à partir] d’une plaque en carton carrée de 60 cm de côté dans laquelle on découpe à chaque coin un carré de x cm de côté » (Ibid., p. 170). Il ne s’agit pas de déterminer le maximum du volume de la boîte mais de prouver qu’une valeur donnée de x correspond à ce maximum. Les deux premières questions consistent à déterminer l’intervalle de variation de x ([0; 30]) et l’expression algébrique du volume V (x). La troisième demande d’étudier le signe de V (x)−V (10) pour en déduire que le maximum est atteint pour x = 10. Or V (x) − V (10) est un polynôme du troisième degré dont la factorisation ne nous semble pas couler de source pour les élèves concernés. En effet, on peut l’écrire sous la forme (60 − 2x)2 · x − 16000 ou, après développement, 4x3 − 240x2 + 3600x − 16000 : ces expressions masquent la présence de x = 10 comme racine. Pour le voir, on peut observer que V (x) − V (10) est, par nature, un polynôme et que V (10) − V (10) = 0, si bien que x − 10 peut être mis en facteur. Nous pensons que peu d’élèves verront ce qui nous semble être de l’ordre de l’astuce et que la division euclidienne conduisant à une première factorisation n’est peut-être plus très fraîche dans l’esprit des élèves. Finalement, ce polynôme peut se factoriser en V (x) − V (10) = 4(x − 10)2 (x − 40) dont le signe est négatif pour tout x ∈ [0; 30], d’où il s’ensuit que V (10) est bien le maximum sur cet intervalle. La dernière question demande de « retrouver le résultat en étudiant les variations de V (x) » (Ibid., p. 170). Cette question suppose d’avoir entamé la dernière section de la partie théorique du chapitre. Elle ne nous semble donc pas pouvoir être considérée - 189/709 - 5.3.1. Analyse de l’ouvrage comme faisant partie d’une activité « d’introduction ». Ainsi, les idées à l’origine des ces activités nous semblent pertinentes pour introduire le chapitre, quoique non suffisantes pour permettre d’entrevoir la portée du concept qui sera étudié. En revanche, par leur formulation, ces activités (hormis les activités 1 et 5) perdent pratiquement tout l’intérêt qu’elles auraient pu avoir. En demandant à l’élève davantage de décrypter l’intention de l’auteur des questions — lequel s’exprime par monstration à travers essentiellement des tableaux numériques — que de construire un raisonnement qui puisse constituer une conjecture acceptable, ces activités relèvent du niveau 0 de rationalité. 5.3.1.2 Nombre dérivé, fonction dérivée La première section de la partie théorique propose successivement plusieurs « approches intuitives » (Ibid., pp. 171-173) de la dérivée, puis la « définition de la dérivée d’une fonction » (Ibid., pp. 174-176) et, enfin, une « interprétation géométrique » (Ibid., pp. 176-181) de la dérivée. Approches intuitives Tangente à une courbe. On trouve dans cette première approche intuitive « la courbe représentative Gf d’une fonction » (Ibid., p. 171) ainsi qu’une famille de sécantes AM qui tournent autour d’un point A. Il est écrit : « Quand M se rapproche indéfiniment du point A, la sécante AM devient tangente à la courbe Gf . Nous pouvons donc dire que la tangente à la courbe Gf au point A d’abscisse a occupe la position limite de la sécante AM quand le point M se rapproche indéfiniment du point A. Cette observation va nous permettre de définir la notion de tangente à la courbe en un de ses points et ses conditions d’existence. » (Ibid., p. 171) - 190/709 - 5.3. Actimath 54 Rien n’est précisé à ce qui est entendu par se rapprocher indéfiniment d’un point, au même titre que, dans Espace Math 56, il était question de tendre vers un point. De même, la « position limite » n’est pas définie alors que les caractères gras en soulignent l’importance. Ensuite, il est écrit que « la sécante AM devient tangente à la courbe Gf » (Ibid., p. 171). Cela suppose que la tangente ait été définie. Or, c’est à la fin du paragraphe cité qu’il est écrit que ce qui précède « va nous permettre de définir la notion de tangente » (Ibid., p. 171), le mot étant mis en caractères gras.Nous nous trouvons donc dans un cercle vicieux auquel avait échappé Espace Math 56 ! D’autre part, la définition de la tangente à un cercle est présentée comme « la position limite d’une corde » (Ibid., p. 171). Cela a le mérite d’être cohérent, mais est-ce ainsi que les élèves ont considéré la tangente à un cercle deux ans auparavant, alors que le concept de limite leur était tout à fait inconnu ? f (x) − f (a) , « pour obtenir la x−a f (x) − f (a) pente de la tangente en A, nous pouvons calculer lim » (Ibid., p. 172). x→a x−a Cette formulation est floue. D’une part elle suppose transparent le passage indu du domaine géométrique (position limite, dont la topologie n’a pas été définie) au domaine algébrique (limite d’un taux de variation). D’autre part, elle n’est pas explicitement une définition de la pente de la tangente ; d’ailleurs, en conclusion du paragraphe, les auteurs insistent : « lorsque cette limite existe dans R, il est naturel de la considérer comme la pente de la droite tangente à la courbe Gf au point A » (Ibid., p. 172). On ne peut donc pas affirmer que la tangente ait été clairement définie jusqu’à présent. Dans la suite du manuel, la tangente ne sera pas définie explicitement ; par contre, il est donné à la sous-section Interprétation géométrique « l’équation de la tangente à la courbe y = f (x) au point d’abscisse a » (Ibid., p. 178) À partir de là, puisque la pente de la droite AM est En revanche, le taux de variation est signalé être « une forme d’indétermination du type 0 » (sans que cet aspect soit interprété graphiquement et que soit soulevé un question0 nement sur cette difficulté) ; la notation f 0 est bien signalée devoir se lire « f prime » (contrairement à Espace Math 56). Vitesse instantanée. La vitesse moyenne est définie à partir de la « distance e parcourue e [qui] est une fonction du temps : e = e(t) » (Ibid., p. 172), d’abord par v = où l’on t précise que « t est la longueur de l’intervalle de temps » (Ibid., p. 172). Il est curieux de noter ainsi une vitesse moyenne. De plus, dans la même phrase, t désigne à la fois le temps (pour définir e = e(t)) et « la longueur de l’intervalle de temps ». Plus étrange, la vitesse moyenne est aussitôt redéfinie : « Nous avons vm (t) = variation d’espace parcouru ∆e = » (Ibid., p. 172) variation de temps ∆t Dans cette nouvelle définition, t (au sens de longueur de l’intervalle de temps) est désormais noté ∆t, ce qui est cohérent et supprime l’ambiguïté signalée précédemment. Le numérateur, e, est remplacé par ∆e mais il en résulte l’impression que « la distance e - 191/709 - 5.3.1. Analyse de l’ouvrage parcourue » se confond avec la « variation d’espace parcouru » ; néanmoins, il n’y a pas d’erreur car les auteurs du manuel ont précisé que e est « calculée à partir d’une certaine position initiale » ; on peut toutefois se demander si les élèves ne confondront pas les e ∆e écritures et sans prendre les précautions nécessaires. D’autre part, la notation ∆ t ∆t n’est pas définie explicitement. L’écriture vm (t) est également sujette à caution. En effet, si l’indice m est tout à fait adapté pour indiquer qu’on parle d’une vitesse moyenne, en faire une fonction de t est ambigu puisqu’une telle vitesse dépend tout autant de ∆t. Dans l’exemple qui est alors proposé, il est écrit que « la vitesse moyenne de ce véhicule 50 est de vm = = 100 km/h » (Ibid., p. 172). S’agissait-il de vm (13h) ou de vm (13h30) ? 0,5 L’ambiguïté est renforcée par l’expression « vitesse moyenne de ce véhicule » (Ibid., p. 172) , comme si la valeur obtenue caractérisait ce dernier. Ensuite, les auteurs d’Actimath 54 expliquent que la vitesse moyenne « ne donne aucune information sur la vitesse à un moment donné » (Ibid., p. 172). Cette affirmation va au delà de la pensée des auteurs et va se retourner contre eux quelques lignes plus loin. L’inexactitude de leur formulation provient de l’emploi de l’adjectif indéfini aucun dans la phrase citée : par le théorème des accroissements finis, on déduit qu’à au moins un moment, le mobile se déplaçait à 100 km/h. Même si ce théorème dépasse les ambitions du cours de math considéré (4 heures de cours par semaine), nous verrons à travers l’ingénierie didactique que nous allons proposer dans cette recherche, que ce théorème en acte est tout à fait à leur portée. Les auteurs se rattrapent en donnant un exemple : « Si, par exemple, le mouvement est tel que la vitesse du mobile très grande tout d’abord, devient plus petite ensuite, il est évident que la vitesse moyenne ne peut exprimer de telles particularités du mouvement. » (Ibid., p. 172) Dès lors, il semble naturel de s’intéresser à « la véritable vitesse du mouvement à l’instant t » (Ibid., p. 172). Hélas, la formulation employée est à son tour inexacte : « Pour exprimer, d’une manière plus précise, la véritable vitesse à l’instant t à l’aide de la vitesse moyenne, il faudrait choisir un intervalle de temps ∆t plus petit. » (Ibid., p. 172) L’idée des auteurs du manuel est sans doute que, en prenant une vitesse moyenne sur un intervalle de temps plus bref, la vitesse instantanée sera d’autant plus approchée, en vertu du théorème des accroissements finis en acte. Mais, d’une part, il s’agit d’une affirmation gratuite aux yeux des élèves : en réduisant l’intervalle de temps, puisqu’on a toujours une vitesse moyenne, en reprenant les mots mêmes des auteurs, cela « ne donne aucune information sur la vitesse à un moment donné » ; il faudrait donc trouver un moyen de corroborer cette intuition, ce que les auteurs ne font pas. D’autre part, que signifie prendre « ∆t plus petit » ? Plus petit que quoi ? Enfin, quel que soit ∆t 6= 0, sauf exception (principalement si la vitesse est constante), la vitesse à un moment donné ne peut s’exprimer à l’aide de la vitesse moyenne, du moins en termes d’égalité. Le verbe estimer aurait été plus judicieux. Le paragraphe se termine ainsi : - 192/709 - 5.3. Actimath 54 « La limite vers laquelle tend la vitesse moyenne, quand ∆t tend vers 0, caractérise au mieux la vitesse du mobile à l’instant t ∆e e(t + ∆t) − e(t) v(t) = lim = lim = e0 (t) ∆t→0 ∆t ∆t→0 ∆t Cette limite est appelée vitesse instantanée du mouvement. La vitesse à l’instant t est égale au nombre dérivé de l’espace parcouru par rapport au temps. » (Ibid., p. 172) Encore une fois, rien ne vient étayer l’affirmation que la limite de la vitesse moyenne « caractérise au mieux la vitesse du mouvement ». D’autre part, on ne se pose plus la question de savoir si une telle limite existe. Enfin, la référence appuyée (mise en caractères gras) au nombre dérivé nous semble ici spécialement forcée dans la mesure où le résultat de la limite dépend directement de la variable t : on a donc affaire davantage à une fonction qu’à un nombre. Cela est dû à l’arrivée plus tardive de la fonction dérivée dans ce manuel. Coût marginal. Après l’activité 7, il est à nouveau question du contexte économique. Le coût marginal y est à nouveau correctement défini. Un graphique montre que le coût marginal n’est pas exactement la dérivée du coût total. Les commentaires faits directement sur le graphique peuvent sembler a priori sans grand rapport avec ce qui précède puisqu’il est question de ∆C, de C 0 (x) sans que le mot marginal apparaisse. Le lien est fait quelques lignes plus loin : • « Coût marginal : Cm (x) = ∆C = C(x + 1) − C(x) » (Ibid., p. 173) D’autre part, une note de bas de page signale pertinemment que « la variable x est traitée comme un nombre réel même si, dans un tel contexte, elle ne prend le plus souvent que des valeurs entières positives » (Ibid., p. 173). En particulier, l’avertissement que, bien qu’il s’agisse d’une variable discrète, elle sera considérée comme continue, n’est pas fait dans Espace Math 56. Il nous semble néanmoins inutile d’avoir représenté des valeurs négatives de x dans la figure ci-dessus. Puis il est question de la dérivée : - 193/709 - 5.3.1. Analyse de l’ouvrage C(x + h) − C(x) . » (Ibid., p. 173) h→0 h « C 0 (x) = lim Ici encore, on ne s’interroge pas de savoir si elle existe. En revanche, il est bien écrit : « si h est petit, C(x + h) − C(x) h Les économistes considèrent, lorsque le nombre d’unités produites est grand, que C 0 (x) est une bonne approximation du coût marginal. » (Ibid., p. 173) C 0 (x) ≈ Mais, d’une part, rien n’est dit quant à l’intérêt d’évaluer le coût marginal grâce à la dérivée et, d’autre part, la conclusion de ce paragraphe retombe dans l’erreur signalée à l’activité 7 : « Dans ces conditions, le coût marginal associé à la production de x unités d’un bien approche de manière satisfaisante le coût de production d’une unité supplémentaire. Et donc, le coût marginal est donné par C 0 (x) = C(x + 1) − C(x). » (Ibid., p. 173) Or, par la définition qui a été donnée, le coût marginal n’approche pas mais est égal au coût de l’unité supplémentaire. Au contraire, dans la formule donnée, c’est le symbole ≈ qui devrait figurer et non celui de l’égalité. En conclusion, la sous-section Approches intuitives comporte des erreurs importantes, à commencer par le cercle vicieux consistant à supposer connue la notion de tangence pour justifier l’existence d’une position limite de sécantes, avant de la définir comme étant justement la position limite de ces sécantes. En particulier, il nous semble que les erreurs signalées tout au long de ces Approches intuitives ne sauraient être justifiées par le titre. En effet, autant une approche intuitive est compatible avec l’emploi de préconstruits, de définitions provisoires ou d’une moindre rigueur, autant les contradictions internes ne nous paraissent pas acceptables. Définition de la dérivée d’une fonction f Cette sous-section comporte deux paragraphes. Dans le premier, sont définis le taux d’accroissement et le nombre dérivé tandis que, dans le second, sont définis la fonction dérivée et le domaine de dérivabilité. Tangente, taux d’accroissement et nombre dérivé. Contrairement au titre, il n’est nullement question de tangente dans ce paragraphe. . . C’est ici en revanche que sont définies les notations ∆ pourtant utilisées à la sous-section précédente. Ainsi, ∆x est considéré comme un « accroissement (variation) de la variable x ». Il faut donc considérer le mot accroissement non comme une augmentation mais comme une valeur signée. Le taux d’accroissement est alors défini : - 194/709 - 5.3. Actimath 54 « Définition : on appelle taux d’accroissement, le rapport ∆f f (x + ∆x) − f (x) = ∆x ∆x Il s’agit donc du quotient de la différence des ordonnées par la différence des abscisses de deux points situées dans le même intervalle de continuité. Nous retrouvons la définition de la pente d’une droite. » (Ibid., p. 174) Ensuite, en considérant les abscisses a et x = a+h appartenant au domaine de continuité d’une fonction f (h ∈ R), le taux d’accroissement est exprimé de deux manières, selon que l’on écrit ∆x = x − a ou ∆x = h. Un problème apparaît : il est question de « l’accroissement ∆x de la variable x » (Ibid., p. 174) ; or, par définition, il s’agit de la différence entre x + ∆x et x et non entre a + ∆x et a. Quoi qu’il en soit, la limite du taux d’accroissement obtenu avec ces deux écritures est appelée « nombre dérivé de f en x = a [. . . ] pourvu que ces limites existent dans R » (Ibid., p. 174). En faisant une nouvelle fois référence à x prioritairement à a, non seulement l’ambiguïté signalée ci-dessus est renforcée, mais, puisque x = a, f (x) − f (a) l’écriture lim n’a plus de sens. x→a x−a En fait, il s’agit d’une maladresse des auteurs du manuel si l’on veut bien lire l’écriture « en x = a » comme l’abréviation de en l’abscisse a. De même, « l’accroissement ∆x de la variable x » aurait dû s’écrire l’accroissement ∆x à partir de l’abscisse a. Dans tous les cas, ce manuel étant destiné à des élèves, comment pourront-ils comprendre, en l’état, cette notation nouvelle en ∆ et une formulation écrite en caractères gras donc à étudier par cœur prioritairement ? Deux exemples de calcul sont proposés et résolus en utilisant chacune des notations (une fonction du second degré et la fonction racine carrée positive). Une remarque est ensuite faite à propos du signe de h (ou de ∆x), qui permet d’introduire le nombre dérivé à droite (h → 0+ ) et à gauche (h → 0− ). Elle est suivie de deux exemples. Dans le premier, il s’agit de trouver « le nombre dérivé en x = 0 » (Ibid., p. 175) de la fonction racine cubique ; la limite obtenue étant infinie, ce nombre n’existe pas. Dans le second, il s’agit d’une fonction composée avec la fonction valeur absolue et il faut chercher le nombre dérivé en son sommet : il y a donc le calcul des dérivées à gauche et à droite avant de conclure que le nombre dérivé n’existe pas. Notons que, bien que la remarque ne concerne explicitement que h, le second exemple est traité en termes de x − a et il s’agit donc de calculer des limites pour x → 2+ et x → 2− . Dérivée d’une fonction. Elle est définie comme limite du taux d’accroissement, sans autre lien avec ce qui précède et, en particulier avec le nombre dérivé. Plusieurs notations des dérivées sont citées mais non commentées. En revanche, les auteurs explicitent que « Dériver f (x) ou calculer la dérivée de f (x) signifie trouver l’expression de f 0 (x) » (Ibid., p. 176). Ensuite, est donnée la définition de fonction dérivable et de domaine de dérivabilité, en faisant implicitement référence à la remarque exposée plus haut sur les dérivées à gauche et à droite. - 195/709 - 5.3.1. Analyse de l’ouvrage Enfin, on trouve la propriété qu’une fonction dérivable en a est continue en a. Cette propriété est admise. Contrairement au cas d’Espace Math 56, il est écrit que la réciproque est fausse et une note de bas de page renvoie à des exemples (même si la page indiquée est erronée). Interprétation géométrique L’interprétation consiste d’une part à associer la dérivabilité en a à l’existence d’une tangente en (a; f (a)) et, d’autre part, à associer la non dérivabilité « à deux autres cas qui sont : le point anguleux [. . . et] la tangente verticale » (Ibid., p. 176). Les auteurs du manuel considèrent ici « une fonction numérique » mais oublient de préciser qu’ils se restreignent au cas des fonctions continues. La lacune est d’autant plus regrettable qu’ils viennent de signaler que la continuité est une condition nécessaire de la dérivabilité. Sont alors donnés quatre exemples graphiques 23 . L’interprétation géométrique est alors traitée algébriquement, selon que la fonction est dérivable ou non en a. Équation d’une tangente au graphique d’une fonction dérivable. On part ici d’un résultat acquis dans l’approche intuitive : le nombre dérivé en a « correspond à la pente de la tangente » (Ibid., p. 178) en (a; f (a)). L’emploi du verbe correspondre à la place du verbe être serait-il le signe d’un certain malaise quant à la définition de la tangente ? Ensuite, une équation de la tangente est déterminée. Puis vient une remarque : « Dans un repère orthonormé, on parle de coefficient angulaire de la tangente et f 0 (a) = tan α. » (Ibid., p. 178) Néanmoins, cette phrase nous semble ambiguë : à la place de quoi parle-t-on de coefficient angulaire ? Quel est ce coefficient angulaire : α ou tan α ? Comme la remarque fait suite à l’équation de la tangente, un élève ne pourrait-il pas penser qu’il s’agit d’une autre manière d’appeler l’équation d’une tangente ? Ce paragraphe se termine par un exemple : « Soit f (x) = 2x − x2 et a un réel quelconque. • Déterminons la pente de la tangente à la courbe au point P (a,2a − a2 [. . . ] • Déterminons l’équation de la tangente aux points d’abscisse −1, 1 et 2 [. . . ] • Déterminons le point où la tangente au graphe de f (x) est parallèle à la droite y = x [. . . ] » (Ibid., pp. 178-179) On semble répondre à des questions qui sont pour le moins implicites, sans en connaître l’enjeu. 23. Dans l’un des exemples, figure un point anguleux ; en regard de ce graphique, il est écrit : « Il n’existe pas de tangente en x = 2 (elle n’est pas unique) » (Ibid., p. 177), ce qui nous semble contradictoire. De fait, deux tangentes sont représentées sur le graphique. À moins de parler de demi-tangente, mieux vaudrait dire que les limites à gauche et à droite sont réelles mais ne sont pas égales, de sorte qu’il n’y a pas de tangente au point considéré ; et, dans ce cas, il ne faut pas dessiner les deux demi-tangentes. - 196/709 - 5.3. Actimath 54 Cas de non dérivabilité. Sur base d’un exemple (une fonction définie par morceau où intervient la fonction valeur absolue), le point anguleux est défini par l’existence en ce point d’une dérivée à gauche réelle mais différente de la dérivée à droite, elle aussi réelle. On affirme alors sans transition : « Le graphique admet deux "demi" tangentes de pente −1 à gauche et 1 à droite » (Ibid., p. 179) Notons la remarque judicieuse qui signale la continuité de la fonction au point considéré bien que celle-ci n’y soit pas dérivable. Le dernier cas considéré est celui où « la limite du taux d’accroissement est infinie » (Ibid., p. 180). Dans les quatre exemples donnés (Ibid., pp. 180-181), la limite calculée étant infinie, la conclusion est que « la tangente au graphique est verticale » (dans le premier exemple, il est ajouté « car la pente est infinie »). Le premier exemple donne « un point à tangente verticale » en entrée de domaine de définition de la fonction ; le deuxième aussi, mais à l’intérieur du domaine de définition (il s’agit d’un point d’inflexion ; il n’est pas nommé, sans doute pour ne pas déflorer le sujet qui sera abordé à la section Applications diverses) ; le troisième conduit à « un point de rebroussement », lequel n’est pas explicitement défini mais l’emploi du terme fait suite à la phrase « Les limites sont infinies et de signe contraire » ; le dernier exemple présente à la fois un point à tangente verticale et un point anguleux. 5.3.1.2.1 Exercices relatif à la section Nombre dérivé, fonction dérivée Liés à cette section, on trouve à la fin du chapitre 19 exercices sur les 92 qu’il comporte 24 . Parmi eux, • 6, demandent d’appliquer la définition du nombre dérivé (dans 19 cas différents), contre 1 seul exercice appliqué à 5 cas dans Espace Math 56. • 2 exercices sont relatifs au nombre dérivé à droite ou à gauche. À partir de l’expression analytique d’une fonction contenant une valeur absolue, il est demandé de tracer son graphique et de calculer les dérivées à droite et à gauche (premier exercice) ou de déterminer si elle est dérivable (second exercice) en son sommet. 5 fonctions différentes sont ainsi traitées. • 4 concernent des aspects graphiques de la tangente (contre 5 dans Espace Math 56). Pour deux d’entre eux, le rôle des graphiques est essentiellement passif, c’est-à-dire qu’il s’agit seulement de les interpréter (mesure de pentes, détermination de l’équation d’une tangente, étude locale de dérivabilité) ; 8 graphiques sont ainsi étudiés. Le troisième consiste à « esquisser un graphique plausible » de la fonction dérivée à partir de celui de la fonction et de faire le lien entre la croissance de la fonction et le signe de sa dérivée. 3 graphiques au total sont ainsi étudiés. Le quatrième, enfin, est mixte, en ce sens qu’il concerne également des aspects analytiques de la tangente : il faut tracer le graphe d’une fonction ainsi que certaines tangentes à partir de l’expression analytique de la fonction. 24. Par comparaison, souvenons-nous qu’il y avait 48 + 95 = 143 exercices dans Espace Math 56. - 197/709 - 5.3.1. Analyse de l’ouvrage • 11 concernent des aspects analytiques de la tangente (contre 5 dans Espace Math 56). Dans le premier, il s’agit simplement de « déterminer une équation de la tangente » en un point donné. Le second n’est déjà plus la simple application d’une formule car il faut déterminer une telle équation en un point où la tangente est parallèle à une droite donnée. Dans huit autres exercices, les questions sont plus subtiles. Il s’agit par exemple, de trouver les tangentes à un graphique passant par un point qui, naturellement n’appartient pas au graphique (malheureusement, on ne demande pas de représenter le graphique de la situation) ; de déterminer une tangente en un point du graphique d’une fonction du troisième degré, puis déterminer une autre tangente au graphique comprenant ce point (ici encore, un graphique illustratif demandé à l’élève aurait été le bienvenu) ; de construire les graphiques de deux fonctions dans un même repère et démontrer qu’ils sont tangents en l’un de leurs points d’intersection ; de déterminer les abscisses de points des graphiques de deux fonctions où les tangentes sont parallèles ; de déterminer un paramètre d’une fonction rationnelle de telle sorte que la tangente en un point donné soit parallèle à une droite donnée. • 3 exercices dirigés sur les 4 proposés concernent la section Nombre dérivé, fonction dérivée. L’un consiste à calculer des limites indéterminées en y reconnaissant la définition de nombres dérivés. Un autre consiste à déterminer les tangentes communes à deux paraboles et, le dernier, à construire géométriquement la tangente à la fonction x3 . Ainsi, les exercices proposés pour cette section d’Actimath 54 nous semblent mettre en valeur la partie théorique de cette section du cours. Mieux, plusieurs d’entre eux invitent l’élève à construire un véritable raisonnement. Nous ne pouvions malheureusement pas en dire autant des exercices proposés dans Espace Math 56. 5.3.1.3 Calcul des dérivées L’ambition de cette section est affichée dès sa première ligne : Pour éviter de toujours recalculer les mêmes dérivées à partir de la définition de la fonction dérivée, construisons une table des dérivées afin d’utiliser immédiatement les résultats. Suivent quatre sous-sections : Dérivée des fonctions usuelles, Dérivées et opérations, Dérivée de la composée de deux fonctions et Dérivées des fonctions trigonométriques. Ce découpage a le mérite de la clarté. En revanche, sauf exceptions qui seront signalées ci-dessous, les démonstrations sont faites implicitement en termes de nombres dérivés (calcul de f 0 (a)) puis le résultat est généralisé subrepticement en termes fonctionnels (« Donc » f 0 (x) = . . .), à l’instar d’Espace Math 56. De même, chaque formule est écrite symboliquement et encadrée, de la manière la plus compacte et, si possible, sans référence à la variable x ; par exemple, pour la dérivée d’une somme de fonction on trouvera (f + g)0 = f 0 + g 0 mais (xn )0 = nxn−1 . - 198/709 - 5.3. Actimath 54 Dérivée des fonctions usuelles On trouve ici la dérivée des fonctions constante, identique, puissance à exposant rationnel, racine carrée et inverse. Pour chacune des fonctions sont donnés les domaines de définition et de dérivabilité. À propos de la dérivée des fonctions constante et identique, on peut regretter qu’il ne soit pas fait de lien entre le résultat trouvé et la pente de la courbe qui est une droite. À la place, dans le cas de la fonction constante, il est écrit qu’il s’agit d’un « résultat prévisible car le fonction constante n’est, par définition, ni croissante ni décroissante » (Ibid., p. 182) ; or le lien entre la croissance/décroissance d’une fonction et sa dérivée n’est envisagé qu’à partir de la section suivante. À propos de la fonction puissance à exposant rationnel, sont traités, à titre d’exemples, les fonctions carrée, cube et puissance à exposant naturel non nul. La formule pour un exposant rationnel non nul est admise ; ici, comme nous l’écrivions dans le cas d’Espace Math 56, on peut se demander pourquoi ne pas admettre directement la formule quand l’exposant est réel. Les dérivées des fonctions racine carrée (positive) et inverse sont déterminées à partir de leur expression algébrique. Ensuite, les auteurs du manuels indiquent judicieusement que le résultat trouvé est identique à celui obtenu en considérant qu’il s’agit dans les deux cas 1 d’une fonction puissance dont l’exposant vaut ou −1. Par cette même considération, ils 2 écrivent de manière générale l’expression de la dérivée d’une fonction racine n-ième. Quelques exemples sont donnés, sans doute pour montrer la simplicité des calculs mais rien n’est écrit explicitement à ce sujet. Dérivées et opérations On trouve ici les formules donnant la dérivée d’une somme, différence, produit et quotient de deux fonctions, ainsi que de l’inverse d’une fonction. À propos de la limite d’une somme ou d’un produit, il est écrit succinctement en marge : « La limite d’une somme [resp. produit] est égale à la somme [resp. produit] des limites et, f et g sont dérivables en x = a. » (Ibid., pp. 185 et 187) Cette justification est plus complète que celle que l’on trouve dans Espace Math 56 (« (limite d’une somme) » pour l’une, « (propriétés des limites) » pour l’autre). Cependant, nulle part ailleurs dans Actimath 5 il n’est question ni de la limite d’une somme ni de celle d’un produit ni, par conséquent, de la démonstration de ces propriétés des limites et de leurs conditions d’application. Chaque formule est appliquée dans un ou deux exemples simples. Arrêtons-nous un moment à la démonstration de la dérivée d’un quotient de deux fonctions. En effet, elle constitue une des exceptions signalées au début de l’analyse de cette sous-section : elle n’est pas traitée en termes de nombres dérivés mais de fonctions dérivées. Cela s’explique par le fait que cette démonstration est l’application conjointe de la formule donnant la dérivée d’un produit de fonctions et de celle donnant la dérivée de l’inverse d’une fonction. La démonstration commence ainsi : - 199/709 - 5.3.1. Analyse de l’ouvrage 0 f g (x) = f (x) g(x) 0 = f (x) · 1 g(x) 0 Or, si le premier terme de l’égalité s’accommoderait bien de a en lieu et place de x, il n’en va pas ainsi des deux autres termes de l’égalité : y remplacer x par a donnerait 0 comme résultat (en considérant a comme un paramètre et non comme une variable). Dans le premier terme, on considère la dérivée de la fonction quotient ; cette fonction a aussi bien x que a pour antécédent. Dans les deux suivants, on considère la dérivée de ce qui est dans la grande parenthèse, x inclus. S’agissant de x, on a bien une fonction dans la grande parenthèse, donc le calcul peut être poursuivi ; par contre, s’il est substitué par a, on a affaire à la dérivée de f (a) la constante . g(a) Or, rien n’est signalé par les auteurs du manuel à ce sujet. Dans ces conditions, nous pensons qu’une telle subtilité échappera aux élèves, qu’ils aient 4 ou 6 heures de mathématiques par semaine. Ils risquent donc (et nous l’avons observé à de nombreuses reprises en secondaire comme dans le supérieur) d’utiliser la notation prime sans discernement, donc de faire des erreurs qui, elles, seront sanctionnées par leur professeur. . . On retrouvera une situation similaire pour le calcul de la dérivée de la tangente et de la cotangente, qui sont également des quotients de fonctions. Enfin, tous les exemples donnés, puisqu’ils consistent à appliquer les formules, utilisent la notation prime comme d’un simple opérateur de dérivation. Dérivée de la composée de deux fonctions Comme dans Espace Math 56, la propriété est admise mais on n’y trouve pas de schéma tel que celui dont nous avions dénoncé l’inanité. En revanche, on n’y trouve pas davantage un exemple d’une dérivée qui serait déterminée de deux manières, l’une étant démontrable, pour se convaincre de la plausibilité de la formule admise. Par contre, on trouve ici des applications de cette formule dans le cas de puissance d’une fonction (il est seulement précisé que l’exposant est non nul) et de racine carrée positive d’une fonction. Dérivées des fonctions trigonométriques Toutes les propriétés abordées ici sont fondées sur le calcul de la dérivée de la fonction sinus. Or la démonstration de celle-ci, comme c’était le cas dans Espace Math 56, renvoie à un résultat du chapitre sur les calculs de limites. Mais ici, le théorème du sandwich n’est même pas cité ; il est appliqué « en passant à la limite pour x tendant vers 0+ » (Ibid., p. 121) : sin x ainsi, la double inégalité stricte cos x < < 1 devient, comme par enchantement et sans x sin x plus d’explication, la double inégalité désormais non stricte 1 6 6 1. x Nous avons ici un exemple de praxéologie à trou, non assumée qui plus est. - 200/709 - 5.3. Actimath 54 Exercices relatifs à la section Calcul des dérivées Liés à cette section, on trouve à la fin du chapitre, 10 exercices sur les 92 qu’il comporte. Parmi eux, • Tous les 10 consistent essentiellement en des calculs de dérivées (y compris secondes, pour l’un d’eux) à partir des formules pour un total de 129 fonctions à dériver. Il y est également demandé de factoriser ou simplifier le résultat obtenu, sans doute pour que les élèves, ainsi formatés, aient davantage de facilités pour étudier le signe de la dérivée. À titre de comparaison, dans Espace Math 56, il y avait 15 exercices de ce type pour un total de 74 fonctions à dériver. • Parmi eux, 3 exercices s’intéressent au domaine (de définition et) de dérivabilité. Il y a donc davantage encore d’exercices de drill dans Actimath 54 que dans Espace Math 56 mais, faisant suite à un nombre conséquent d’exercices plus théoriques, nous n’y voyons aucun inconvénient et nous pensons qu’un élève aura ici moins le sentiment que la théorie ne sert à rien que là. 5.3.1.4 Applications diverses Cette troisième et dernière section de la partie théorique comprend sept sous-sections intitulées successivement Rôles de la dérivée première ; Rôles de la dérivée seconde ; Modélisation de problèmes liés à la physique, l’économie, les sciences humaines. . . ; Approximation locale d’une fonction par une fonction du premier degré ; Recherche d’une valeur approchée d’une racine d’une équation ; Problèmes d’optimisation et Représentation graphique de quelques fonctions. Les théorèmes cités sont au nombre de six. Quatre font partie du cours et sont mis en valeur par une texture grisée ; un cinquième (théorème des valeurs extrêmes) est donné au détour d’une note de bas de page, comme s’il était bien connu des élèves. Aucun théorème n’est formellement démontré et seul le sixième (théorème de Bolzano) est qualifié d’admis. Jusqu’à présent, les propriétés rencontrées étaient démontrées (du moins partiellement) ou déclarées admises ; pourquoi n’en est-il pas ainsi des théorèmes ? Rôles de la dérivée première Le qualificatif première n’est pas expliqué dans cette soussection. On y trouve deux paragraphes, l’un relatif au lien entre la croissance/décroissance d’une fonction dérivable et le signe de la dérivée, l’autre relatif aux valeurs extrêmes d’une fonction Dérivée première et croissance d’une fonction. On trouve ici le théorème 1. Il est introduit à partir de la description du « graphique d’une fonction f (x) continue » (Ibid., p. 191) : - 201/709 - 5.3.1. Analyse de l’ouvrage Passons sur certains détails, comme cette demi tangente à droite au point anguleux qui ne semble précisément pas tangente ou ce point d’abscisse a qui ne correspond à aucun point particulier de la courbe, contrairement aux autres abscisses considérées. Il est alors écrit : « Rappelons, tout d’abord, que le nombre dérivé de f en x0 , c’est-à-dire la valeur de la dérivée de f en x0 est la pente de la tangente au graphique de f au point d’abscisse x0 . » (Ibid., p. 191) Ensuite, le lien est fait entre la croissance de la fonction et le signe de la pente de la tangente : « nous constatons que la pente de chacune des tangentes au graphique f en un réel quelconque x0 de ]a, b[ ou de ]c, +∞[ est positive. Donc la dérivée de f est positive sur ]a, b[ et sur ]c, +∞[ » (Ibid., p. 191) Si la conclusion est exacte, la justification des hypothèses semble insuffisante. En effet, d’une part, seules trois tangentes sont représentées pour ces intervalles, ce qui ne cadre pas, en soi, avec un réel quelconque x0 ; d’autre part, avant de parler de pente positive, il nous semble qu’il aurait fallu écrire que les tangentes sont des droites qui montent (en regardant de la gauche vers la droite). Un raisonnement similaire est fait à propos de l’intervalle ]b, c[ sur lequel la fonction est décroissante et sa dérivée, négative. Puis, il est écrit que « la fonction passe par un maximum local en b » (Ibid., p. 191), sans que ce concept soit défini à ce stade du cours (sur le graphique, il est écrit maximum, sans plus de précision). Il est écrit, pertinemment cette fois, que « la tangente y est horizontale donc de pente nulle. La dérivée de f s’annule en b » (Ibid., p. 191). Enfin, en c, il est écrit que « la fonction passe par un minimum local particulier » (Ibid., p. 191). Il est rappelé qu’un tel point où la dérivée n’existe pas — car les dérivées à gauche et à droite ne sont pas égales —, est un point anguleux. Il nous semble que la référence aux - 202/709 - 5.3. Actimath 54 extrema et leur qualification est hors sujet, ce que confirme la conclusion faite alors par les auteurs du manuel : « Il existe donc une relation entre le sens de variation d’une fonction et le signe de la dérivée de cette fonction. » (Ibid., p. 191) Cette relation est traduite par le Théorème 1. Le paragraphe se termine par la définition d’un point stationnaire et sa qualification possible : maximum, minimum ou point d’inflexion (accompagnée dans chaque cas par un graphique), trois termes qui ne sont pas définis pour le moment. Valeurs extrêmes. Les deux premiers termes qui viennent d’être évoqués vont à présent être définis, mais sans référence à ce qui précède puisque, dans les définitions de minimum/maximum absolu/(relatif ou local), il n’est pas question de dérivée. Une Remarque est faite pour justifier l’emploi des qualificatifs absolu et local : « On ne doit pas confondre le maximum et le minimum d’une fonction respectivement avec sa plus grande valeur et sa plus petite valeur sur un intervalle considéré. [. . . ] » (Ibid., p. 192) Cette remarque nous semble ambiguë : tout dépend précisément du type d’extrema dont il est question. La phrase n’a de sens que si l’on considère les extrema locaux. Au contraire, comme les auteurs l’écrivent eux-mêmes à la fin de la remarque, le « maximum (minimum) absolu [. . . est] la plus grande — petite — valeur sur le domaine de définition de la fonction » (Ibid., p. 192). Après un exemple de graphique de fonction sur lequel sont qualifiés les différents extrema, il est indiqué que, « par abus de langage nous parlerons de maximum ou de minimum pour désigner un maximum local ou un minimum local. » (Ibid., p. 192) Cela nous éclaire sur l’origine de l’ambiguïté signalée ci-dessus. C’est alors qu’est énoncé le Théorème 2, qui est la conditions suffisante du premier ordre pour avoir un extremum local en x0 . Il n’est pas rappelé ce qui a été observé au paragraphe précédent où un maximum local et un minimum local avaient été décelés prématurément. De toute façon, le changement de signe de la dérivée n’y avait pas été observé. L’énoncé du théorème est suivi de deux tableaux de variation illustrant les deux cas possibles, tableaux qui préfigurent implicitement ceux qui seront fait lors des études de fonctions. Deux remarques sont faites à propos du théorème 2. L’une montre (implicitement, mais c’est déjà ça) que sa réciproque est fausse, en prenant les cas d’un point anguleux et d’un point de rebroussement : on y trouve un extremum alors même que la dérivée ne s’annule pas (mais change bien de signe). L’autre dit ceci : « La dérivée peut s’annuler pour x = x0 ou même devenir infinie sans changement de signe. Ce point (x0 , f (x0 )) n’est pas un maximum ou un minimum. » (Ibid., p. 193) - 203/709 - 5.3.1. Analyse de l’ouvrage La conclusion est abusive (en toute abscisse d’une fonction constante, l’image correspondante est à la fois maximum et minimum alors que la dérivée s’annule et ne change pas de signe). Néanmoins, l’exemple donné de x3 en 0 est aussi classique que pertinent pour, plus modestement, montrer que l’annulation de la dérivée en x0 n’est pas suffisante pour avoir un extremum local. Ensuite, est donnée la définition d’un point critique. Elle sert à réduire un tout petit peu la « Marche à suivre pour l’étude des extrema d’une fonction dérivable à l’aide de sa dérivée première » (Ibid., p. 194) qui est donnée juste après. Le mot dérivable est de trop si l’on veut justifier la définition de point critique par rapport à celle de point stationnaire. . . Vient alors une remarque avec une note de bas de page : « Pour rechercher la plus grande valeur et le plus petite valeur[1] d’une fonction sur un intervalle fermé [a, b] la marche à suivre précédente reste valable. Il faut lui adjoindre le calcul de la valeur de la fonction aux extrémités de l’intervalle, c’est-à-dire f (a) et f (b). » (Ibid., p. 194) Comme l’indique le [1], on trouve en note en bas de page : « elles existent toujours en vertu du théorème des valeurs extrêmes : "si f (x) est une fonction continue sur un intervalle fermé [a, b], alors f admet au moins un maximum et un minimum." » (Ibid., p. 194) La mise en note de bas de page de l’énoncé du théorème des valeurs extrêmes indique sans doute que ce théorème n’est pas au programme, ce qui justifie qu’il ne soit pas démontré. Il est méritoire aux auteurs du manuel d’avoir cité ce théorème, ne serait-ce que pour ne pas faire un trou supplémentaire dans les praxéologies qui sont les leurs. En revanche, le qualificatif absolu est nécessaire pour qualifier les extrema considérés dans l’énoncé. Le paragraphe se termine par deux exemples : Dans le premier, on donne une fonction polynomiale du quatrième degré. Aucune question n’est formulée mais il s’agit d’une étude de la fonction. Le tableau de variations fourni semble avoir valeur de rédaction et le graphique 25 donné in fine, celui de conclusion. Dans le second, on demande de rechercher les valeurs extrêmes d’un polynôme du troisième degré sur un intervalle fermé. Comme à l’exemple précédent, la rédaction est réduite au minimum jusqu’au tracé du graphe de la fonction. En revanche, la conclusion est rédigée en français. Rôles de la dérivée seconde Dans cette sous-section, il est question du lien entre la dérivée seconde et la concavité, et de point d’inflexion. 25. Ce graphique semble incorrect en (0, 0) où l’axe Ox n’est pas tangent à la courbe alors que la dérivée est alors nulle pour x = 0. - 204/709 - 5.3. Actimath 54 Dérivée seconde et concavité. Contrairement à ce qui est fait dans Espace Math 56, la concavité est réellement décrite : « On dit que la courbe représentative d’une fonction tourne sa concavité vers les y positifs (vers le haut) dans l’intervalle ]a, b[ si toutes les tangentes en l’un quelconque des points de cette courbe dans cet intervalle se trouvent en dessous de la courbe. On parle alors de courbe convexe. » (Ibid., p. 195) En plus d’un graphique illustratif, les auteurs ajoutent : « Constatons que les pentes des tangentes aux points de la courbe dans ]a, b[ deviennent de plus en plus grande » (Ibid., p. 195) Un exemple présente un tableau de valeurs négatives et positives mais croissante de la dérivée première de x2 . En parallèle, on trouve traité de la même façon le cas contraire. En faisant le lien entre la pente de la tangente et la dérivée (les auteurs supposent ici que f est dérivable sur ]a, b[), le lien est également fait entre la croissance de la dérivée et la concavité : • « si la fonction x → f 0 (x) est strictement croissante, le graphique tourne sa concavité "vers le haut" • si la fonction x → f 0 (x) est strictement décroissante, le graphique tourne sa concavité "vers le bas" On en déduit le théorème [. . . ] » (Ibid., p. 195) Il s’agit du Théorème 3 qui lie la concavité au signe de la dérivée seconde dans le cas où « la fonction f est deux fois dérivable dans ]a, b[ » (Ibid., p. 195). Il nous semble que le passage de la croissance de f 0 au signe de f 00 devrait être expliqué, d’autant que la dérivée seconde n’a toujours pas été définie. Par ailleurs, l’hypothèse que la fonction doit être deux fois dérivable n’est pas justifiée par les auteurs du manuel. Précisément, c’est à présent que la notation f 00 est expliquée : « f 00 (x) = (f 0 (x))0[1] la dérivée seconde est la dérivée de la dérivée (première). » (Ibid., p. 195) Comme définition du qualificatif première, c’est également un peu court. Point d’inflexion. La définition de point d’inflexion est immédiatement donnée. Il s’agit d’une définition plus large que celle qu’on trouve dans Espace Math 56 (qui exclut les points anguleux). Elle est judicieusement illustrée par trois graphiques : dans l’un, la tangente au point d’inflexion est oblique, signe que la dérivée première y existe ; dans un autre, la tangente est verticale, signe que la fonction n’y est pas dérivable ; le dernier donne l’exemple d’un point d’inflexion en un point anguleux. Cette définition est commentée : - 205/709 - 5.3.1. Analyse de l’ouvrage « En d’autres termes, la concavité change de sens au point d’inflexion (c,f (c)). Il est évident qu’en un point d’inflexion, la tangente, si elle est unique, traverse la courbe puisque d’un côté de ce point la courbe est disposée au-dessus de la tangente et de l’autre côté en dessous. » (Ibid., p. 196) En revanche, rien n’est dit en terme d’extremum de la dérivée première en un point d’inflexion (en lequel la dérivée existerait), alors qu’il a été observé plus haut le lien entre la croissance (stricte) de la dérivée première et le sens de la concavité. Vient alors le Théorème 4 qui lie le point d’inflexion au changement strict 26 du signe de la dérivée seconde. Une des hypothèses est que « f 00 (c) = 0 ou f 00 (c) n’existe pas » (Ibid., p. 196) ; il nous semble que cette hypothèse aurait pu être commentée, du moins illustrée par un exemple où la dérivée seconde n’existe pas au point d’inflexion alors que la dérivée première existe bien (par exemple la fonction x2 pour x ∈ [0; 2] et −(x − 4)2 + 8 pour x ∈]2; 4] en x = 2). De ce théorème est déduit une Marche à suivre pour la recherche des points d’inflexion d’une fonction dérivable. Une des étapes consiste à chercher « les valeurs critiques de x et on établit le tableau de signes de f 00 (x) » (Ibid., p. 196). Le contexte permet de comprendre que les valeurs critiques cherchées concernent f 00 mais la formulation de cette partie de la phrase, identique à celle relative au tableau de signes de f 0 de la procédure donnée à la sous-section précédente, nous paraît peu claire pour un élève. Le paragraphe se termine par trois exemples d’application de la procédure donnée : dans un cas, le point d’inflexion trouvé correspond à une tangente oblique (dérivée première définie) ; dans un autre cas, le point d’inflexion est à tangente verticale ; dans un dernier cas, la dérivée seconde s’annule sans changer de signe si bien qu’il n’y a pas de point d’inflexion. Modélisation de problèmes liés à la physique, l’économie, les sciences humaines. . . Cette sous-section ne comporte aucun nouvel élément de théorie mathématique. Il est écrit : La dérivée d’une fonction porte parfois un nom précis qui évoque la signification concrète de la notion. En voici quelques exemples. Suit un tableau où sont mis en regard une liste de noms de fonctions issues de divers contextes, la variable indépendante associée et le nom spécifique de la dérivée. Par exemple, l’« espace parcouru par un mobile [est associé à la variable] temps [et sa dérivée est la] vitesse » (Ibid., p. 197). Mais, contrairement à ce qui est annoncé au début de la sous-section, le nom de la dérivée n’est pas « précis » puisque, en aucun cas, la dénomination n’est qualifiée d’instantanée. Un exemple est proposé : on donne le graphique de la taille d’un individu en fonction du temps, de sa naissance à l’âge de 20 ans. Quelques tangentes sont représentées (dont la première est grossièrement fausse). Il est écrit : 26. C’est ce caractère strict qui manquait au théorème 2 pour écarter, le cas échéant, de parler d’extrema locaux dans le cas d’une fonction constante (cf. p. 204). - 206/709 - 5.3. Actimath 54 « La fonction est la taille. La variable est le temps. La dérivée est le taux de croissance. » (Ibid., p. 198) La sous-section se termine par deux exemples d’exercices. Dans les questions posées, la vitesse n’est pas qualifiée d’instantanée mais, cette fois, le contexte est assez explicite pour qu’il soit évident qu’il est question de vitesse instantanée : « À quelle vitesse les pieds [d’une échelle articulée] se rapprochent-ils ? [. . . ] Quelle est en fonction du temps la vitesse de descente du niveau d’eau [d’une piscine] ? » (Ibid., p. 197) En revanche, malgré le titre de la sous-section, rien n’est dit sur ce qu’est une modélisation. Étant donné son contenu, on pourrait croire qu’il s’agit de donner des noms spécifiques à la dérivée utilisée dans un contexte particulier. . . Approximation locale d’une fonction par une fonction du premier degré Voici comment le début de cette sous-section est rédigé : « Lorsqu’il s’agit de travailler avec une fonction y = f (x) non linéaire, on a souvent tendance, pour simplifier les calculs, à remplacer la fonction considérée par une fonction du premier degré dont le graphique est proche de celui de y. » (Ibid., p. 200) Cette rédaction nous semble insuffisante et parfois ambiguë. Ainsi, l’expression « on a souvent tendance » a, dans le langage ordinaire, une connotation péjorative ; de plus, nous pouvons nous demander qui est ce « on » : les mathématiciens, les élèves ? Enfin, cette formulation masque l’enjeu de l’approximation affine. Ensuite, il est écrit : « On peut "linéariser" 27 y = f (x) au voisinage d’un point x0 en remplaçant la fonction f (x) par une fonction du premier degré qui, dans un intervalle suffisamment petit autour de x0 , donne une bonne approximation de f (x). Géométriquement, il suffit de remplacer la courbe représentative de la fonction considérée par sa tangente au point x0 L’équation de la tangente à la courbe Gf au point d’abscisse x = x0 est donnée par y = f 0 (x0 ) · (x − x0 ) + f (x0 ) » (Ibid., p. 200) De quelle « fonction du premier degré » s’agit-il ? Comment savoir si le voisinage de x0 est « suffisamment petit » ? Qu’est-ce qu’une bonne approximation ? Finalement, on lit qu’il s’agit de la tangente, mais sans qu’on sache pourquoi. En revanche, la linéarisation est indiquée : 27. Les guillemets apposés au mot linéariser en constituent la seule définition donnée par les auteurs. - 207/709 - 5.3.1. Analyse de l’ouvrage « La fonction du premier degré "tangente" donnant une approximation de f au voisinage de x0 est | {z } f (x0 ) + f 0 (x0 ) · h ≈ f (x0 + h) ordonnée du point de la courbe | {z } ordonnée du point de la tangente pour h suffisamment petit. » (Ibid., p. 200) La formule donnée a le mérite d’être annotée judicieusement pour donner un sens géométrique aux différents termes qui interviennent. Néanmoins, un graphique illustratif aurait été bienvenu. La suite de la sous-section consiste en un exemple d’application directe de la formule pour x3 au voisinage de x0 = 2. On y trouve un graphique avec la partie utile de la courbe de la fonction et la tangente en 1. Ce graphique n’est pas complété, par exemple, d’une abscisse 2 + h et des images par la fonction et par la fonction du premier degré privilégiée. En revanche, l’erreur (absolue) commise est exprimée en fonction de a 28 et de h, avant l’application numérique. Enfin, une Remarque donne, sans explication, les approximations affines de (1 + h)2 , √ 1 (1 + h)3 , et de 1 + h. 1+h Ainsi, cette sous-section ne nous semble présenter qu’un intérêt calculatoire et passer à côté d’une interprétation — même seulement graphique — de l’approximation affine. Recherche d’une valeur approchée d’une racine d’une équation Cette sous-section est plus développée que dans Espace Math 56 : on y trouve deux méthodes de résolution approchée : celle de Newton et celle de dichotomie. En introduction, les auteurs du manuel signalent ceci : « L’équation f (x) = 0 d’inconnue x est parfois impossible à résoudre par les méthodes algébriques. L’analyse permet de prouver l’existence de solutions et d’en calculer des approximations de bonne précision. » (Ibid., p. 201) C’est une des trop rares fois que l’intérêt de l’analyse est signalé explicitement. À cette occasion, est cité « le théorème de Bolzano (que nous admettons) » relatif à l’unicité d’une racine dans les conditions requises ; il en est déduit une procédure pour trouver un intervalle ad hoc. Les deux méthodes de résolution sont alors expliquées et illustrées chacune par un exemple. À propos de la méthode de dichotomie, il est question d’un processus itératif « que l’on peut mettre en œuvre avec une calculatrice programmable ou un ordinateur » (Ibid., p. 202, note de bas de page) et du calcul des images qui « se fera naturellement au moyen de la calculatrice (mode table) ou de l’ordinateur » (Ibid., p. 201). On se demande, dès lors, quel est l’intérêt réel d’appliquer cette méthode à la main, ce que les auteurs reconnaissent eux mêmes : « Remarque : les puissants moyens de calcul dont nous disposons actuellement (calculatrice graphique, ordinateur) donnent des résultats plus rapides et plus précis. » (Ibid., p. 204) 28. Sur le graphique, c’est x0 qui apparaît ; dans les calculs algébriques, c’est a. - 208/709 - 5.3. Actimath 54 Problèmes d’optimisation Le terme optimisation, contrairement à celui de modélisation, est bien défini. Le corps de cette sous-section est « une marche à suivre pour la résolution d’un tel problème » (Ibid., p. 204). La procédure nous semble mieux exprimée que dans Espace Math 56. Néanmoins, il y est question de « la quantité variable Q à rendre optimale » (Ibid., p. 204), alors que ce peut être tout autre chose qu’une quantité : une température, une vitesse initiale, etc. Sont alors traités trois exemples : maximisation d’une « surface » (Ibid., p. 205), d’un « temps de parcours » (Ibid., p. 205) et, à nouveau, d’une « surface » (Ibid., p. 206). Dans les deux premiers exemples, une figure illustre la situation et permet de visualiser et de nommer les inconnues du problème ; par ailleurs, la justification de l’optimum fait référence à une propriété des paraboles dans l’un et au tableau de variations dans l’autre, quand il est difficile de s’en passer. Par contre, dans le troisième exemple, il n’y a ni figure ni justification de l’optimum, celui-ci étant simplement affirmé comme tel. Représentation graphique de quelques fonctions Dans cette dernière sous-section, aucune introduction. L’objectif est clair : « Voici la marche à suivre pour étudier les variations d’une fonction. » (Ibid., p. 206) Nous la donnons ci-après (en caractères gras, comme dans le manuel) et, le cas échéant, nous la commentons au fur et à mesure : 1) Domaine de définition de f Il y est question de « chercher » (Ibid., p. 206) le domaine et, à l’instar d’Espace Math 56, il n’est pas fait référence à l’appartenance éventuelle de la fonction à une classe connue qui permettrait de réduire cette recherche à sa plus simple expression et de sauter plusieurs des étapes suivantes. 2) Symétrie Il est indiqué que, « avant d’étudier la parité de la fonction, il est utile de regarder si le domaine de définition de la fonction est symétrique par rapport à 0 ou non » (Ibid., p. 206). Nous pensons qu’il s’agit davantage d’une astuce et qu’elle ne sert pas souvent. En revanche, il serait plus utile aux élèves de connaître (après les avoir démontrées) les propriétés des exposants pairs/impairs en termes de parité/imparité pour répondre presque immédiatement à la question. D’autre part, l’économie faite en cas de symétrie justifie-t-elle que cette étude soit menée systématiquement ? Enfin, contrairement à Espace Math 56, il n’est pas fait référence à la périodicité. Cela nous semble judicieux car, en pratique, les seules fonctions périodiques que les élèves sont amenés à rencontrer dans le Secondaire (et souvent au delà) sont les fonctions trigonométriques qu’il suffit de reconnaître comme telles (on retrouve l’intérêt de l’étude par classe de fonctions ; cf. Krisinska (2007)). - 209/709 - 5.3.1. Analyse de l’ouvrage 3) Intersection avec l’axe des abscisses et des ordonnées Si f (0) est facile à calculer, il n’en va pas toujours de même pour les racines de la fonction. Qu’est censé faire un élève qui ne trouverait pas ces racines ? 4) Étude du signe de la fonction Il est écrit : « À l’aide du 2) établir le tableau de signes de la fonction. » (Ibid., p. 207) 5) 6) 7) 8) 9) C’est plutôt le 3) qui serait utile, encore que non suffisant à ce stade de l’étude. Cette étape devrait plutôt venir après l’étude de la croissance/décroissance de la fonction. Asymptotes Ici encore, à quoi bon « rechercher les asymptotes verticales, horizontales ou obliques » dans le cas où l’on aurait affaire, par exemple, à une fonction polynomiale ? Croissance et points critiques La description de cette étape nous semble claire. Néanmoins, pourquoi considérer la construction d’un tableau qui sera repris intégralement dans le tableau final alors que, en pratique, seul le tableau final est construit ? Concavité et points d’inflexion Nos commentaires sont les mêmes qu’à l’étape précédente. Nous y ajoutons ce que nous avions signalé plus haut au sujet des points critiques : comme la formulation qui est faite à leur sujet semble associer le mot critique à la seule variable x et non à la fonction f , il n’est plus possible de parler de point critique quand on s’intéresse à l’existence et à l’annulation de f 00 , alors qu’il s’agit des points critiques de f 0 . Tableau de variations Représentation graphique Cette sous-section est suivie de cinq exemples d’application de la procédure précédente. On y trouve une « fonction polynomiale » (Ibid., pp. 208-209) du troisième degré, une « fonction homographique » (Ibid., pp. 210-211), une « fonction rationnelle » (Ibid., pp. 212-214), une « fonction irrationnelle simple » (Ibid., pp. 214-216) et une « fonction trigonométrique » (Ibid., pp. 216-218). L’emploi de cette typologie montre la conscience des auteurs de l’existence de classes de fonctions ; hélas, ils n’en font rien et les études de fonction sont faites au rythme de la procédure standard. Exercices relatifs à la section Applications diverses Liés à cette section, on trouve à la fin du chapitre, 55 exercices sur les 92 qu’il comporte. Parmi eux, • 16 sont relatifs au rôle de la dérivée première. Parmi les six exercices d’application directe, aucun n’est identique aux autres. Le point de départ est parfois l’expression analytique de la fonction ou celle de sa dérivée ; d’autres fois, c’est le graphique de l’une ou celui de l’autre, ou un tableau de variations. À partir de là, il s’agit de compléter ou de construire un tableau de variations, d’associer un graphique à celui de sa dérivée ou à un tableau de variations ; de trouver des intervalles de (dé)croissance ou des extrema locaux ; d’esquisser « un graphique plausible » (Ibid., pp. 243-246, ex. 38-41) de la fonction ; de compléter l’expression analytique d’une fonction selon qu’elle possède tel ou tel extremum en tel ou tel point donné. - 210/709 - 5.3. Actimath 54 • 5 sont relatifs au rôle de la dérivée seconde. Ici, le point de départ peut être aussi bien l’expression analytique de la fonction, son graphique ou un tableau de variations comprenant les signes des dérivées première et seconde. Il est alors demandé de compléter ou construire un tableau de variations, de déterminer des points d’inflexion, d’associer des graphiques de fonctions à des tableaux de variations ou d’esquisser un graphique plausible d’une fonction à partir d’un tableau de variations. • 3 consistent en des approximations affines. Dans les énoncés, on demande simplement de calculer ou de donner « une valeur approchée » (Ibid., p. 248), sans référence à l’approximation affine. Seul le titre précédant les trois exercices est explicite : « Approximation locale d’une fonction par une fonction du premier degré » (Ibid., p. 248) • • • • La pauvreté relative de ces exercices montre le peu d’intérêt porté à ce sujet par les auteurs du manuel. 3 ont pour but la recherche d’une valeur approchée d’une racine d’une équation. Dans les trois cas, les élèves sont libres de choisir la méthode de résolution. Comme dans le cas des approximations affines et comme annoncé par les auteurs eux-mêmes dans la partie théorique, cette question n’est pas primordiale à leurs yeux. 9 exercices sont placés dans un contexte, essentiellement physique ou économique. Pour deux d’entre eux, le contexte n’a qu’un rôle décoratif dans la résolution du problème et les auteurs ne s’en cachent pas puisque ces deux exercices sont situés juste avant le paragraphe « Problèmes liés à la physique, à l’économie, . . . » (Ibid., p. 256). Pour les sept autres, on demande de calculer des vitesses (instantanées, sans que le mot soit explicite) — vitesse et accélération d’un mobile ou vitesse de croissance d’une aire — ; une intensité ; un coût et une recette marginale. Parfois, il est demandé à quel instant un mobile a une vitesse nulle (ou égale à une valeur donnée) mais sans que la question soit explicitement liée à celle d’un extremum de la loi de mouvement. 14 sont des problèmes d’optimisation. Il s’agit le plus souvent de problème de maximisation, que ce soit d’un périmètre, d’une aire ou d’un volume. Les problèmes de minimisation concernent une aire, une distance ou un coût. 5 sont des études de fonctions, pour un total de 29 fonctions étudiées. Il y a donc, ici aussi, davantage encore d’exercices de drill dans Actimath 54 que dans Espace Math 56 mais ces exercices font suite à un nombre conséquent d’exercices plus théoriques si bien que nous pensons qu’un élève utilisant Actimath 54 aura moins le sentiment que la théorie ne sert à rien que celui qui utilise l’autre manuel. 5.3.1.5 Dérivées : synthèse La synthèse proposée (Ibid., pp. 219-223) est exclusivement procédurale. Elle n’est pas un survol ou un retour sur le concept de dérivée mais la reprise de toutes les formules et marches à suivre pour calculer une dérivée et, finalement, faire l’étude d’une fonction. Cette synthèse est subdivisée en sept rubriques : - 211/709 - 5.3.2. Conclusion sur Actimath 54 Définitions. On y lit simplement f 0 (x) = lim h→0 f (x + h) − f (x) h f 0 (a) = lim x→a f (x) − f (a) x−a Signification géométrique. On y lie le nombre dérivé à la pente de la tangente et on rappelle l’équation de celle-ci. Calcul des dérivées. On y trouve toutes les formules de dérivation des fonctions usuelles et les propriétés rencontrées (pour ces dernières, il n’est pas fait référence à la variable de dérivation : par exemple, on aura (f + g)0 plutôt que (f + g)0 (x)). En parallèle avec les dérivées des fonctions usuelles, on trouve les dérivées des composées d’une fonction par une fonction usuelle (par exemple, (xn )0 = n · xn−1 et (f n )0 = n · f n−1 · f 0 ). Rôle de la dérivée première. Ce qui était une condition nécessaire et suffisante de croissance/décroissance dans le théorème 1 du cours qui traitait d’une fonction dérivable, devient une condition suffisante, la seule réellement utile en pratique pour l’étude des fonctions. Il est ensuite question des extrema locaux (on ne traite plus les valeurs extrêmes qui, de fait, n’entrent pas en ligne de compte dans l’étude des fonctions) et des points particuliers (anguleux et de rebroussement) : ils ne sont pas définis mais apparaissent au moyen d’un tableau de signes de f 0 et de variation de f ; pour les extrema, les deux tableaux fournis correspondent précisément à leur définition tandis que pour les points anguleux et de rebroussement, les deux tableaux ne sont qu’illustratifs car ils ne décrivent qu’une situation possible parmi plusieurs. Ce changement de statut non annoncé des tableaux de variation nous semble préjudiciable aux élèves. Rôle de la dérivée seconde. À propos de la concavité, on trouve ici un ersatz du théorème 3 aux mêmes conditions que décrites ci-dessus. D’autre part, on retrouve le théorème 4 relatif au point d’inflexion mais amputé des deux hypothèses que nous avions critiquées plus haut (f 00 (c) = 0 ou qui n’existe pas), si bien qu’il en devient correct. + + % + − % − + & − − & ) ( ) x f0 f 00 croissance concavité ( Variations de f . On y trouve le tableau symbolique de tous les cas possibles à partir des signes de f 0 et de f 00 : variations Étude des variations d’une fonction : synthèse. On y trouve mot à mot « la marche à suivre » de la sous-section Représentation graphique de quelques fonctions analysée plus haut (p. 209) ! 5.3.2 Conclusion sur Actimath 54 On trouve dans Actimath 54 de nombreuses améliorations par rapport à ce qui a été observé dans Espace Math 56. S’agissant d’un éditeur concurrent et le second manuel étant - 212/709 - 5.4. Conclusion : formulation de l’hypothèse mise à l’épreuve très répandu, les auteurs d’Actimath 54 se devaient de se distinguer manifestement de l’autre manuel. Sans doute se sont-ils également inspirés d’autres manuels existant sur le marché. En particulier, nous avons trouvé Actimath 54 beaucoup plus complet et riche (notamment de par les exercices proposés) qu’Espace Math 56, alors que ce dernier s’adresse à des élèves ayant 6 heures de math par semaine et non seulement 4. En revanche, l’absence d’index permettant de rechercher facilement un concept à l’intérieur du manuel est à mettre au débit du seul Actimath 54. Néanmoins, sur le fond, c’est-à-dire en termes de praxéologies, Actimath 54 suit la même logique qu’Espace Math 56. Le concept de dérivée reste peu travaillé et la finalité reste l’étude des fonctions. 5.4 Conclusion : formulation de l’hypothèse mise à l’épreuve Nous retiendrons, dans le cadre de notre propos, que les pratiques enseignantes standard en secondaire semblent orientées vers un exercice majeur qui consiste à déterminer l’allure graphique d’une fonction à partir de son expression analytique, sur base de renseignements multiples liés, entre autres, au signe de la dérivée première et à celui de la dérivée seconde. Si les manuels scolaires proposent en général une interprétation cinématique de la dérivée, cette interprétation y tient néanmoins une place assez anecdotique, peu d’exercices lui étant consacrés. Le thème de la tangente, quant à lui, sert d’introduction au calcul des dérivées mais il n’est guère approché dans une perspective d’approximation numérique locale. En revanche, une grosse partie du cours est consacrée au calcul même des fonctions dérivées. Quant à l’enseignement de physique reçu par les élèves concernés, il semble qu’un passage obligé soit l’étude des mouvements rectilignes uniformes et des mouvements rectilignes uniformément accélérés, étude à l’occasion de laquelle sont dessinés et interprétés des graphiques de lois de mouvement, de lois de vitesse et de lois d’accélération. Au total, nous pensons que la piètre performance des élèves questionnés (cf. section 1.1, p. 30) serait imputable, en grande partie, au rapport entretenu par l’institution cours de mathématique dans l’enseignement secondaire avec le savoir dérivées. Sans chercher ici à prouver une telle interprétation, nous nous interrogeons sur la possibilité de travailler, au cycle secondaire, un ou des sens possibles du concept de dérivée, au delà des calculs. Cette possibilité est questionnée par d’aucuns. Ainsi, voici l’avis d’un professeur d’université : « Je pense que, dans le secondaire, les élèves n’ont aucun intérêt, aucun désir de maîtriser les dérivées. » 29 29. Propos recueillis par Schneider et non publiés, de même que les deux citations qui suivent. - 213/709 - Quant aux propos suivants, venant de deux professeurs du secondaire, ils sont assez pessimistes pour des raisons diverses : « On nous dit qu’il faut évaluer selon trois compétences : connaître, appliquer et résoudre des problèmes. Mais il vaut mieux mettre le maximum de points pour la deuxième rubrique si l’on veut ne pas avoir trop d’échecs. » « Tout ce qu’on nous demande, c’est de préparer les élèves à bien calculer pour la suite. » Nous retrouvons le fait que l’absence de réel niveau de rationalité dans le secondaire implique un repli sur ce qui touche au procédural (cf. Rouy 2007). A contrario de ces avis, nous pensons qu’il est possible de travailler avec les élèves du secondaire le sens même du concept de dérivée et, ce, dans des contextes appropriés, même si nous ne pensons pas qu’une telle démarche remédie forcément au problème de transition secondaire-université. C’est ainsi que, dans la partie suivante, nous nous intéresserons à une ingénierie didactique qui va dans ce sens : nous y analyserons les choix qui ont présidé à sa conception ainsi que les réactions que l’on peut attendre des élèves. En effet, nous faisons l’hypothèse qu’il existe un travail possible au niveau de la modélisation en Analyse (un travail sur les grandeurs) au cours duquel les obstacles d’apprentissage sont susceptibles d’apparaître, d’être travaillés par les élèves, sans pour autant que cela suffise à les aplanir. Autrement dit, nous voulons montrer qu’il est possible de faire autrement que l’enseignement classique tel qu’il est pratiqué habituellement en secondaire aujourd’hui ; que cet autrement permet de travailler des obstacles loupés ou soigneusement évités par les pratiques enseignantes communes ; mais nous ne prétendons pas que notre ingénierie soit une panacée ni, a fortiori, qu’elle puisse constituer une séquence d’enseignement qui viendrait se substituer à l’enseignement classique. - 214/709 - Troisième partie Conception de l’ingénierie didactique 215 Nous allons traiter ici des choix didactiques majeurs (que nous appellerons bientôt les variables didactiques globales) qui ont présidé au développement de notre ingénierie et de l’étude de leur pertinence au vu de travaux antérieurs, en particulier ceux de Schneider sur le vase conique (1988). Tel est l’objet du chapitre 7, p. 231). Auparavant, nous rappellerons certains concepts fondamentaux de la didactique des mathématiques tels que contrat didactique, situation adidactique, situation fondamentale, milieu, etc. (Chapitre 6, p. 219). Enfin, nous présenterons notre ingénierie : nous décrirons en détail son contenu et nous tâcherons de justifier les choix plus circonstanciés opérés pour chacune des situations proposées (Chapitre 8, p. 245). Cette justification sera faite en imaginant a priori quelles peuvent être les attitudes et les réactions des élèves visés face aux questions qui leur seront posées dans l’ingénierie. - 217/709 - - 218/709 - Chapitre 6 Précisions relatives à la question didactique traitée Dans ce chapitre, nous allons compléter notre cadre théorique en nous appuyant notamment sur la Théorie des Situations Didactiques (T.S.D.) de Guy Brousseau (1986 et 1998). Nous y préciserons plusieurs concepts de la didactique des mathématiques qui nous permettront de décrire pertinemment notre ingénierie et ses enjeux. 6.1 Du contrat didactique à la situation adidactique Brousseau (1986) a une vision systémique de l’enseignement : « Dans une approche systémique nous sommes donc conduits à identifier, et si possible définir, un système composé : • d’un sous-système "ÉDUCATIF" (ou son représentant) qui est porteur de l’intention d’enseigner et d’une certaine connaissance du savoir désigné • d’un sous-système "ENSEIGNÉ" susceptible de s’approprier ce savoir. • Ces deux sous-systèmes sont liés par un ensemble de relations et de contraintes réciproques : la SITUATION DIDACTIQUE proprement dite. La situation didactique est formée seulement de celles de ces relations qui sont spécifiques du "savoir" visé et bien entendu de celles qui permettent de les définir. Il faut entendre par spécifiques les caractères et relations de ces deux sous-systèmes qui changeraient si le savoir visé changeait ou qui, étant changés, modifieraient le savoir acquis. » (Op. cité, p. 54) La volonté affichée d’une vision systémique n’est pas le propre de la didactique des mathématiques : on retrouve le triangle didactique — enseignant-enseigné-savoir — notamment en psycho-pédagogie ; mais une caractéristique de la T.S.D. et, par suite, de la didactique des mathématiques est la place occupée par le savoir mathématique lui-même, l’analyse de ses enjeux et sa réelle prise en compte d’emblée dans le système à étudier : « [La] singularité originaire [de la T.S.D.] consiste à prendre comme objet premier à étudier (et donc à questionner, à modéliser et à problématiser selon les règles de l’activité scientifique), non pas le sujet apprenant ou le sujet enseignant, mais le savoir mathématique qu’ils sont censés étudier ensemble, ainsi que l’activité mathématique que leur projet commun d’étude les portera à réaliser. Pour expliquer les faits d’enseignement auxquels elle se voit confrontée, la didactique postule que le "mystère" est dans les mathématiques, et non pas dans les sujets qui ont à apprendre et enseigner les mathématiques. » (Bosch & Chevallard 1999, p. 79) Dans cette même théorie, les rapports entre l’enseignant et l’enseigné sont vus comme obéissant à des règles, en partie explicites (par exemple, les consignes données par le professeur) et en partie implicites (par exemple, ce que l’élève perçoit de la rigueur de l’enseignant, ou le niveau moyen des élèves de la classe qui peut influer sur la manière de corriger de l’enseignant). Ces règles ne sont pas régies par les seuls enseignant/enseignés car « conditionnées par un projet social extérieur » (Brousseau 1988a, p. 321), à commencer par le projet d’enseignement de l’école. Il s’opère donc une négociation entre les différents protagonistes, laquelle nous conduit au concept de contrat didactique : « Nous appellerons "CONTRAT DIDACTIQUE" cette négociation. » (Brousseau 1986, p. 56) Dans un premier temps, ces règles doivent sembler stables à l’élève pour lui donner une certaine confiance en lui, nécessaire au travail d’apprentissage : « Cette négociation produit une sorte de jeu, dont les règles provisoirement stables, permettent aux protagonistes et notamment à l’élève de prendre des décisions dans une certaine sécurité, nécessaire pour lui assurer l’indépendance caractéristique de l’appropriation. » (Ibid., p. 56) Or le contrat didactique est spécifique du savoir enseigné. Il en résulte une instabilité récurrente : « Le contrat [didactique] est spécifique des connaissances en jeu et donc nécessairement périssable : les connaissances et même les savoirs évoluent et se transforment, tandis que le contrat pédagogique a tendance à être stable. » (Brousseau 1988, p. 322) Cette instabilité se traduit par une succession de rupture et de rétablissement du contrat didactique. Mais ce rétablissement n’est pas prévisible a priori en raison de l’ignorance provisoire dans laquelle se trouve l’élève à l’heure d’aborder un nouvel apprentissage : « En réalité, le jeu du maître et de l’élève, dès lors qu’il est spécifique du savoir, ne peut être défini a priori, puisque l’élève ne peut en connaître que les règles non spécifiques lorsqu’il entreprend un nouvel apprentissage. Le jeu s’établit, change, se rompt et se renoue au fur et à mesure des acquisitions, de l’évolution des deux protagonistes et de l’histoire qu’ils produisent. » (Brousseau 1986, p. 56) - 220/709 - 6.1. Du contrat didactique à la situation adidactique La rupture du contrat didactique n’est pas un accident regrettable mais un objectif du projet d’enseignement : « Dans le cas général, la situation didactique ne peut être modélisée comme une simple communication et ni comme une simple interaction sociale. Il est nécessaire de faire intervenir un autre système 1 . Cette nécessité découle d’une des clauses du contrat didactique lui-même qui implique le projet de son extinction : il est sous-entendu, dès le début de la relation didactique, qu’un moment doit arriver où elle se rompra. À ce moment, le système enseigné sera supposé pouvoir faire face, à l’aide du savoir appris, à des systèmes dénués d’intentions didactiques. » (Ibid., p. 57) Ce moment est celui où l’élève se trouve face à un nouveau savoir, tout en étant suffisamment armé(e) par le savoir (ou, plus généralement, le système) précédemment enseigné pour pénétrer efficacement dans ce terrain partiellement inconnu : « Le savoir enseigné à l’élève est supposé lui donner alors la possibilité de LIRE ses relations avec ces systèmes comme de nouvelles SITUATIONS, et par ce moyen, de leur apporter une réponse appropriée. Nous appellerons A-DIDACTIQUES ces situations et MILIEU 2 le sous- système antagoniste du système enseigné ou plutôt précédemment enseigné. » (Ibid., p. 58) Naturellement, toute situation, prise au sens large, n’est pas à même de produire l’effet escompté : « [Une situation adidactique] suppose au minimum : • de comporter une question, un "problème" (au sens commun du terme) qui ne puisse être résolu sans impliquer la construction d’un savoir, celui précisément visé par l’enseignement en cours ; une situation adidactique est donc toujours spécifique d’un savoir donné ; • de "dévoluer" cette question à l’élève, le professeur se refusant à transmettre le savoir directement en abdiquant, pour un temps, de son intention d’enseigner : d’où le "alpha privatif" qui débute le mot adidactique. » (Schneider 2008, p. 143) Lorsque la première caractéristique d’une situation adidactique est vérifiée, c’est-à-dire lorsque « le savoir mathématique [visé] apporte une réponse optimale à la question posée » (Ibid., p. 50), on parle de situation fondamentale. Nous y reviendrons à la section suivante. Quant à la seconde caractéristique d’une situation adidactique, elle renvoie au concept de dévolution. Dévoluer à l’élève ne revient pas, pour le professeur, à disparaître de la classe ou à abandonner totalement les élèves à leur sort : 1. Ce système supplémentaire sera appelé milieu au paragraphe 6.3 (p. 224). 2. Comme annoncé plus haut, nous consacrerons à ce concept le prochain paragraphe. - 221/709 - « Dans la situation de classe, le professeur doit donc établir puis maintenir la relation des élèves avec la situation adidactique choisie (Brousseau parle de processus de dévolution). Il est clair que le professeur ne se contente pas de livrer le problème aux élèves, mais qu’il soutient également leurs efforts, par exemple en rappelant les règles du jeu (c’est vous qui devez trouver mais pour cela il faut chercher, vous devez travailler sur le problème que je vous ai donné et pas sur un autre, etc.). D’autre part, il observe le travail des élèves, et cette observation lui est nécessaire pour gérer l’avancement du travail (activer les élèves les plus lents, par exemple), mais également pour prendre des décisions sur l’opportunité d’introduction d’une nouvelle valeur de variable dans la suite des situations, ou, plus généralement, de l’opportunité d’une nouvelle situation. C’est également cette observation qui lui permet de constituer une mémoire du travail des élèves qui pourra être utile par la suite, pour le rappel des difficultés rencontrées et de la façon de les dépasser. » (Margolinas 1998, p. 3) Il ne s’agit donc pas d’une non assistance à personne en danger mais plutôt d’un acte de confiance en la capacité des élèves à se dépasser eux-mêmes pour acquérir un nouveau savoir. Le rôle du professeur reste doublement capital car c’est lui qui propose la situation adidactique et il lui revient de gérer les interactions pertinentes avec les élèves : « [Le professeur] cherche par là à ce que l’action de l’élève ne soit produite et justifiée que par les nécessités du milieu et par ses connaissances, et non par l’interprétation des procédés didactiques du professeur. La dévolution consiste pour l’enseignant, non seulement, à proposer à l’élève une situation qui doit susciter chez lui une activité non convenue, mais aussi à faire en sorte qu’il se sente responsable de l’obtention du résultat proposé, et qu’il accepte l’idée que la solution ne dépend que de l’exercice des connaissances qu’il possède déjà. L’élève accepte une responsabilité dans des conditions qu’un adulte refuserait puisque s’il y a problème puis création de connaissance, c’est parce qu’il d’abord doute et ignorance. C’est pourquoi la dévolution créée une responsabilité mais pas une culpabilité en cas d’échec. » (Brousseau 1998a, p. 5) Or, spécialement dans ces moments, les élèves ont d’abord le sentiment d’être livrés à eux mêmes. Ils cherchent alors à décoder, jusque dans l’attitude du professeur, ce qui leur permettrait d’avancer à moindre frais dans la résolution du problème. Dans le même temps, le professeur, consciemment ou non, est lui-même tenté de lire dans les réactions des élèves les traces de la progression des élèves, fussent-elles trompeuses. À ce jeu là, les uns pensent avoir compris le problème et l’autre pense que les premiers ont effectivement compris ; il s’agit d’un jeu de dupes que l’on nomme effets de contrat (didactique). Les plus connus sont l’effet Topaze et l’effet Jourdain, le second étant un cas particulier du premier : « 16. Effet Topaze. La première scène du célèbre "Topaze" de Marcel Pagnol illustre un des processus fondamentaux dans le contrôle de l’incertitude : le maître fait une dictée à un mauvais élève ; ne pouvant pas accepter trop d’erreurs trop grossières et ne pouvant pas non plus donner directement l’orthographe demandée, il "suggère" la réponse en la dissimulant sous des codages didactiques de plus en plus transparents. Le problème est complètement changé, l’enseignant mendie une marque - 222/709 - 6.2. Caractère fondamental d’une situation d’adhésion et négocie à la baisse les conditions dans lesquelles l’élève finira par donner la réponse attendue, le professeur a fini par prendre à sa charge l’essentiel du travail. La réponse que doit donner l’élève est déterminée à l’avance, le maître choisit les questions auxquelles cette réponse peut être donnée. Évidemment les connaissances nécessaires pour produire ces réponses changent leur signification aussi. En prenant des questions de plus en plus faciles, il essaie de conserver la signification maximum pour le maximum d’élèves. Si les connaissances visées disparaissent complètement, c’est "l’effet Topaze". 17. Effet Jourdain Ainsi nommé par référence à la scène du "Bourgeois Gentilhomme" où le maître de philosophie révèle à Jourdain ce que sont la prose ou les voyelles. Tout le comique de la scène est basé sur le ridicule de cette sacralisation répétée d’activités familières dans un discours savant. Le professeur, pour éviter le débat de connaissance avec l’élève et éventuellement le constat d’échec, admet de reconnaître l’indice d’une connaissance savante dans les comportements ou dans les réponses de l’élève, bien qu’elles soient en fait motivées par des causes et des significations banales. » (Brousseau 1998a, p. 7) 6.2 Caractère fondamental d’une situation Nous avons vu plus haut que le caractère fondamental d’une situation est nécessaire à son adidacticité. Le lien entre une situation adidactique et une situation fondamentale s’arrête là. Une situation fondamentale est une situation dans laquelle le savoir à enseigner est la manière optimale de résoudre le problème posé dans la situation. On doit cette définition à Brousseau (1998). Une telle définition revêt peut-être un sens trop strict dans la mesure où il existe des situations dont l’enjeu n’est pas la construction d’un savoir particulier mais une « évolution souhaitée du rapport des élèves à de mêmes objets » (Schneider 2008) : cela peut se produire notamment lors d’un changement d’institution. Schneider donne l’exemple du passage du collège au lycée où la même représentation graphique des médiatrices d’un triangle passera du statut de simple dessin illustratif à celui de « véritable figure géométrique dont les propriétés donnent prise au raisonnement déductif » (Ibid., p. 54). Schneider donne ainsi un sens large au caractère fondamental d’une situation. Il en résulte, comme le montre Job (2011), une certaine relativité institutionnelle des savoirs : « Différentes institutions peuvent apporter des réponses différentes à une même question. Un savoir n’est donc plus la réponse optimale apportée à une question mais la réponse considérée comme telle par une institution donnée. Par exemple, l’analyse classique fondée sur le concept de limite se construit historiquement dans le rejet des considérations infinitésimales. Or on sait depuis les années 60, avec les travaux de Robinson, que les notions infinitésimales peuvent être définies de manière logiquement irréprochable, dans le cadre des hyperréels. » (Op. cité, p. 62) Revenons au concept de praxéologie décrit au chapitre 3 (p. 47). Nous avons distingué deux types de praxéologies complémentaires : les praxéologies-modélisation et les praxéologiesdéduction. Ce sont les deux types de praxéologies auxquels Schneider reconnaît le caractère - 223/709 - fondamental, c’est-à-dire qu’elle y reconnaît une activité mathématique authentique lorsque celle-ci a trait à des savoirs qui se situent dans l’un ou dans l’autre type de praxéologies précité. Après avoir vu les écueils possibles qui feraient perdre à la dévolution tout son sens, voyons ce qui la rendrait réaliste, c’est-à-dire ce qui permettrait aux élèves de questionner et de résoudre un problème nouveau qui mobilise un savoir également nouveau et dont ils ne disposent pas encore. C’est l’idée qu’une situation adidactique ne saurait être totalement étrangère à la situation didactique qui la précède. Tel est le rôle du « milieu » qui fait l’objet du paragraphe suivant. 6.3 Le concept de milieu À l’instar de Krysinska et Schneider (2001), nous prendrons pour le concept de milieu son sens large : « Il n’est pas aisé de choisir une définition du concept de milieu tant les points de vue sont multiples a priori, ainsi que le montre l’article de M.J. Perrin (1999), choisi comme référence pour l’école d’été. Nous optons d’emblée pour une formulation souple, inspirée d’un propos oral d’A. Rouchier, qui permettra plusieurs élargissements successifs : le milieu est ce sur quoi peut s’appuyer le professeur pour dévoluer à l’élève la construction d’une part de savoir qui sera ultérieurement institutionnalisée comme telle. » (Op. cité) Dans la définition donnée plus haut par Brousseau (1986), le milieu est « le sous-système antagoniste du système enseigné ou plutôt précédemment enseigné » (Op. cité, p. 58). Ce caractère antagoniste est important : le "problème" doit être réel, effectif. Fregona (1995) insiste sur le qualificatif antagoniste « Pour agir, pour apprendre, l’élève doit trouver insuffisant ses moyens de contrôle, donc le sous-système avec lequel il négocie ne doit pas pour lui être un allié mais un concurrent [. . . ] L’interaction que nous appelons effective est celle qui ne dépend pas entièrement de l’acteur. Il reçoit de l’extérieur des sanctions non prévues de sa part. Le contrôle de ses actions est assumé, en partie, par un système extérieur » (Op. cité, pp. 45 et 62) Créer un milieu qui réunisse ces conditions ne s’improvise pas. Il y a des facteurs internes et externes à gérer. Les facteurs externes du milieu sont ceux qui sont extérieurs à la recherche. Ainsi, l’ingénierie sera expérimentée dans une classe qui n’est pas celle d’à côté, auprès d’élèves ayant chacun leur vécu particulier, qui ont accumulé un certain savoir mathématique, qui maîtrisent certaines techniques mais pas d’autres, etc. Le chercheur-expérimentateur ne connaît pas le détail de ce passé de la classe. Mais il n’en ignore pas tout non plus. Sur base des programmes scolaires, les élèves sont supposés connaître les concepts mathématiques abordés les années précédentes. Si nous nous plaçons dans le cadre de notre ingénierie, nous avons par exemple supposées connues certaines notions de cinématique. - 224/709 - 6.4. Le préconstruit vitesse Quant aux facteurs internes, ce sont ceux qui dépendent directement du savoir visé par la situation adidactique. C’est au chercheur de les dépister et de les réunir pour atteindre ce point d’équilibre, probablement instable, qui permet à la fois aux élèves d’avancer dans le problème et à ces mêmes élèves d’être confrontés à une difficulté inattendue (au sens propre) que le savoir visé permet de vaincre de façon optimale. Ainsi, le milieu au sens de la T.S.D. est ce qui autorise une déclinaison adidactique d’une situation fondamentale modélisant un savoir donné. Cependant, nous appuyant également sur la Théorie Anthropologique du Didactique (T.A.D.), nous considèrerons le milieu en un sens très large, tout comme le font Laborde et Capponi (1994) qui parlent de Cabri-géomètre comme « constituant d’un milieu pour l’apprentissage de la notion de figure géométrique ». Sans minimiser le caractère « antagoniste » du milieu, en tant que système mettant à l’épreuve des connaissances devenues inopérationnelles, nous devons également reconnaître que le milieu comporte aussi des aspects « alliés ». Ceux-ci sont précisément liés au milieu de la théorie anthropologique que Perrin-Glorian (1999) assimile à ce qu’elle appelle le milieu potentiel, soit « l’ensemble des objets pour lesquels le rapport personnel est stable et conforme au rapport institutionnel, lui-même stable ». Ainsi, pensons-nous montrer qu’un certain rapport des élèves aux vitesses telles qu’appréhendées à travers des graphiques favorise une première approche du concept de dérivée. Après ces considérations théoriques, nous allons continuer à explorer le contexte qui a donné naissance à notre ingénierie didactique. Nous allons donc étudier en quoi consiste le préconstruit vitesse ; faire une parenthèse théorique pour exposer en quoi consiste le concept de variable didactique afin de présenter pertinemment le problème référent de notre ingénierie, celui du vase conique proposé par Schneider (1988) dans sa thèse. 6.4 Le préconstruit vitesse En quoi consiste le préconstruit vitesse dans le cadre de notre étude ? Les élèves concernés sont en seconde année de Lycée et ont environ 16-17 ans. On peut donc faire l’hypothèse qu’ils ont atteint le stade des opérations formelles au sens de Piaget (1972. cf. section 4.1, p. 128) et que, par conséquent, ils maîtrisent depuis longtemps la vitesse comme grandeurquotient espace/durée, qu’elle soit constante ou moyenne sur un intervalle de temps donné. Ce qui suppose, au-delà d’une élaboration qualitative de la vitesse, que l’étude de mouvements successifs aussi bien que simultanés puisse être quantifiée en reposant à la fois sur une mesure physique et non plus subjective du temps et sur l’intervention de proportions telles que e1 /e2 = t1 /t2 . L’enjeu est ici de passer à l’instantané. Mais la nature même de la grandeur "vitesse" la rend particulière par rapport à cet objectif, ainsi que Maggy Schneider (1988 et 1992) l’a analysé. Résumons ci-dessous quelques points de cette analyse. Contrairement à l’aire, la vitesse est une grandeur intensive c’est-à-dire une « espèce de grandeur pour laquelle l’addition n’est pas définie, mais où l’on peut définir la relation d’inégalité (plus grand que) » (Lalande 1932). De cela découle que la vitesse ne se prête pas aisément à une mesure directe, par rapport à une autre grandeur de même espèce prise comme unité. Si mesures il y a, elles portent la plupart du temps sur l’espace parcouru et le temps écoulé et, par conséquent, la détermination d’une vitesse suppose, de plus, un calcul portant - 225/709 - sur ces mesures. Le problème est que, dans cette perspective, le calcul devient sujet à caution dans le cas d’une vitesse instantanée puisqu’il revient à diviser 0 par 0. Quant aux actes de mesurages, ils s’accommodent mal de l’instantané, puisqu’ils requièrent immanquablement un certain temps d’observation et de lecture, fût-il petit. Du point de vue de la perception sensorielle, il existe également un clivage très net entre une vitesse instantanée et une vitesse moyenne sur un intervalle de temps. C’est que la perception d’une vitesse suppose la coordination de deux sensations : l’observation d’images changeantes, d’une part, et le "sentiment de durée", d’autre part. Mais, à nouveau, l’enregistrement de toute perception au niveau du cerveau suppose un laps de temps minimal. Dans le monde des sens et des mesures existe donc un fossé important entre vitesses moyennes et vitesses instantanées, plus important par exemple qu’entre aires rectilignes et aires curvilignes lesquelles peuvent être comparées les unes aux autres du seul regard et se prêter toutes également à la technique du pesage qui en fournit une mesure. Or, comme l’a montré Schneider (1988) dans plusieurs contextes, une vision positiviste des mathématiques constitue un obstacle épistémologique majeur : dans le cas présent, il s’exprime par un déni du concept de vitesse instantanée que les élèves ne parviennent pas à concevoir comme concept imaginé par l’esprit humain mais qu’ils pensent plutôt comme prolongement ou copie d’une "expérience sensible" dans laquelle l’instantané n’a pas droit de cité : « Une vitesse instantanée, ça n’existe pas, il n’y a pas moyen de le mesurer, car le temps de regarder sa montre et du temps s’est déjà écoulé. » (Propos d’un élève rapporté par Schneider 1992, p. 321) Dans l’histoire des mathématiques, c’est également une telle vision qu’exprime Berkeley (XVIIe siècle) lorsqu’il critique, lui aussi en référence à la difficulté de mesurer, le concept d’ultima ratio de Newton qui préfigure d’une certaine façon notre concept de limite : « [. . . ] comment peut-on concevoir une vitesse au moyen de telles limites ? Une vitesse dépend du temps et de l’espace, et ne peut être conçue sans eux [. . . ] car, considérer le rapport de deux choses suppose que ces choses aient une grandeur et que cette grandeur puisse être mesurée. » (Berkeley 1734, cité par Schneider 1992, p. 321) Comme l’indique ce dernier mot, c’est bien là un propos où le point de vue adopté est celui de la mesure et non celui d’une grandeur définie par l’entremise d’un concept mathématique. Notre propos est d’étudier certaines conditions d’émergence de la vitesse instantanée telle que définie par le biais du concept de dérivée et, en particulier d’analyser en quoi un milieu de type graphico-cinématique peut nourrir cette conceptualisation de connaissances plus qualitatives. Nous utiliserons ce dernier qualificatif, plus largement que Piaget, dans une acception commune voulant simplement signifier par là que, en certaines circonstances, on peut savoir, par exemple, si la vitesse variable d’un mobile est "de plus en plus grande" ou "plus grande que" celle d’un autre sans avoir quantifié la vitesse instantanée comme calcul de limite. - 226/709 - 6.6. Un problème référent, ses variables didactiques et leur impact 6.5 Le concept de variable didactique Il existe un sens plus ou moins large au concept de variable didactique. Pour Robert (1999), « [Une variable didactique est un] paramètre, numérique ou non, qui peut prendre des valeurs différentes (numériques ou autres), que l’enseignant peut choisir (sans changer le problème), et tel que différentes valeurs peuvent induire des procédures différentes chez les élèves. » (Op. cité) Une telle variable sera plus souvent ce que Artigue (1988) appelle « micro-didactique ou locale » car elle concerne « l’organisation locale de l’ingénierie, c’est-à-dire l’organisation d’une séance ou d’une phase » (Op. cité, p. 291). Les variables didactiques locales de notre ingénierie seront décrites plus loin, lorsque nous analyserons l’ingénierie situation par situation. Schneider (2008) propose une acception plus globale du concept de variable didactique : « Au-delà de cette perception plutôt locale, je souhaite intégrer un point de vue plus global qui ferait du choix même des problèmes une variable didactique capitale. » (Op. cité, p. 145) Elle rejoint Artigue (1988) qui parle alors de « variables macro-didactiques ou globales qui concernent l’organisation globale de l’ingénierie » (Op. cité, p .291). Nous expliciterons les variables didactiques globales de notre ingénierie dès le prochain chapitre. Mais, auparavant, il est essentiel ici de situer notre ingénierie par rapport à un problème référent, celui du vase conique tel que décrit et analysé par Schneider (1988) dans sa thèse de doctorat, car c’est par rapport à ce problème que nous avons conçu notre ingénierie. 6.6 Un problème référent, ses variables didactiques et leur impact Comme le montre l’analyse faite à la section 6.4 (p. 225), il y a du chemin à parcourir entre une première appréhension des vitesses variables et leur modélisation au moyen des dérivées. En quoi pourrait consister un tel chemin et quelles situations pourraient y mener les élèves ? Pour répondre à cette question, Schneider (1988, 1992) a proposé à des élèves de Lycée un problème de taux liés dont elle analyse les variables didactiques et leur impact. Nous reprenons ici quelques éléments de son analyse. Le problème, dit du vase conique, mobilise un débit qui est une vitesse particulière jouant le rôle de préconstruit avec les mêmes caractéristiques que celles relevées à la section précitée (6.4, p. 225). En voici l’énoncé : Une pompe alimente un vase conique (figure ci-dessous). Elle est réglée de telle manière que le niveau de l’eau y monte régulièrement de 1 cm/min. L’angle au sommet du cône vaut 90◦ . Jusqu’à quand le débit de la pompe sera-t-il inférieur à 100 cm3 /min ? - 227/709 - Dans ce problème, deux grandeurs sont mobilisées et liées l’une à l’autre : la hauteur h de l’eau dans le vase, d’une part et son volume V , d’autre part. Connaissant la vitesse de variation de h, on pose une question relative à la vitesse de variation de V , soit le débit. Ce problème fait donc partie de la classe des problèmes appelés problèmes de taux liés ou de vitesses liées. En outre, dans le cas présent, h évolue à vitesse constante et, dans le contexte considéré d’un vase s’élargissant, ce fait induit l’intuition que le débit augmente constamment. Et, selon une hypothèse implicite de continuité, ce débit ne peut que passer par toutes les valeurs et vaudra donc 100 à un moment donné, sous entendu bien sûr que l’eau n’aura pas débordé jusque-là. Ces variables didactiques ont pour effet d’enclencher un investissement des élèves dans la résolution du problème, ceux-ci percevant d’emblée la nature de la difficulté relative à la variabilité du débit mais ne doutant pas de l’existence d’une solution. Une autre variable didactique de cette situation tient en ceci : la question n’est pas de savoir ce que vaut le débit en un instant donné mais de déterminer le moment précis où le débit aura telle ou telle valeur. C’est là une manière d’éviter, dans un premier temps, de faire référence au concept savant de débit en t = 2, par exemple, pour laisser les élèves se polariser sur la globalité du phénomène et sur la variation du débit. Cela a deux effets. D’abord les élèves engagent spontanément le concept de débit moyen, le seul qu’ils connaissent. Ensuite, après avoir fait quelques approximations de la réponse demandée, ils débattent de la nécessité d’algébriser non seulement la variable temps mais aussi sa variation pour arriver in fine, avec l’aide du professeur, à l’égalité : πt2 + πt∆t + π(∆t)2 /3 = 100, dans laquelle le premier membre est l’expression simplifiée du débit moyen sur l’intervalle [t; t + ∆t]. La vue globale de cette équation à deux variables et le désir de ne garder que l’inconnue principale t poussent alors certains élèves à identifier une action possible : annuler ∆t, ce qui conduit à l’équation πt2 = 100 dont la solution serait la réponse à la question posée. Ainsi, le choix de t comme inconnue conduit à l’émergence non pas du nombre dérivé, savoir d’ordre numérique et local mais de la fonction dérivée qui se situe dans l’algébrique et le global et qui fait l’efficacité du calcul infinitésimal. Mais la suppression des termes en ∆t soulève un débat collectif au cours duquel certains élèves récusent le concept de débit instantané : « En un temps nul, aucun volume n’est versé et on ne peut pas avoir un débit avec un volume nul. » (Propos d’un élève rapporté par Schneider 1992, p. 321) Un tel propos fait souvent référence à l’impossibilité de prendre des mesures en un temps nul ce qui est révélateur, comme décrit plus haut, de leur vision positiviste des mathématiques. Le contexte précis du vase s’élargissant joue à nouveau un rôle bien spécifique car il se prête à une preuve pragmatique qui se formule comme suit (Schneider 1992, p. 342) : - 228/709 - 6.7. Conclusion du chapitre « Posons à côté du vase conique un vase cylindrique de base 100 cm2 (voir figure suivante). Au lieu de considérer une seule pompe, on en prend deux qui alimentent chacune un des vases, de telle manière que le niveau de l’eau y monte régulièrement et simultanément de 1 cm/min. La pompe qui alimente le cylindre a évidemment un débit constant de 100 cm3 /min. L’autre pompe devra verser moins vite que la première tant que le cône est plus étroit que le cylindre, et plus vite que celle-ci après. Les deux pompes ont donc un même débit égal à 100 cm3 /min à l’instant précis où la superficie de l’eau dans le cône vaut 100 cm2 , ce qui donne : πh2 = πt2 = 100, √ t = 10/ π » Au terme de ce travail, le professeur institutionnalise le débit instantané comme le résultat obtenu en supprimant les termes contenant ∆t dans l’expression du débit moyen sur l’intervalle [t; t + ∆t], après avoir fait toutes les simplifications algébriques standard. Le qualificatif instantané se justifie alors par le fait que ce calcul permet de répondre avec exactitude à une question qui relève de l’instantané, la preuve en étant fournie par l’expérience de pensée reprise plus haut. 6.7 Conclusion du chapitre Au cours de ce chapitre, nous sommes partis d’une vision systémique de l’enseignement des mathématiques qui conduit « à prendre comme objet premier à étudier (et donc à questionner, à modéliser et à problématiser selon les règles de l’activité scientifique), non pas le sujet apprenant ou le sujet enseignant, mais le savoir mathématique qu’ils sont censés étudier ensemble, ainsi que l’activité mathématique que leur projet commun d’étude les portera à réaliser » (Bosch & Chevallard 1999). Nous avons désigné par contrat didactique la négociation des règles qui régissent les rapports entre enseignant et enseignés à propos d’un savoir enseigné spécifique. Ce contrat, stable au départ pour favoriser une certaine confiance en lui de l’élève, est destiné à être rompu au moment d’aborder un nouvel apprentissage. Cela se produit lorsque l’élève est confronté à de nouvelles situations pour lesquelles le savoir enseigné précédemment ne suffit plus mais dans lesquelles l’élève parvient néanmoins à entrer, c’est-à-dire qu’elles ne lui sont pas totalement étrangères et cela pour lui permettre une certaine dévolution. De telles situations sont appelées a-didactiques, car elles sont dénuées d’intention didactique, tandis qu’on appellera milieu (en un sens large) « ce sur quoi peut s’appuyer le professeur pour dévoluer à l’élève la construction d’une part de savoir qui sera ultérieurement institutionnalisée comme telle » (Krysinska & Schneider 2001). Au prochain chapitre, à l’heure de choisir les variables didactiques globales, c’est-à-dire à l’heure d’opérer - 229/709 - les choix didactiques principaux pour notre ingénierie, nous nous interrogerons sur le caractère adidactique des situations envisagées et de la pertinence du milieu choisi pour permettre la dévolution souhaitée aux élèves. Nous avons également étudié ce qui donne à une situation un caractère fondamental. Au sens strict, c’est lorsque le savoir visé est la manière optimale de résoudre le problème posé. Schneider (2008) élargit ce concept aux situations dont l’enjeu n’est pas un savoir particulier mais « une évolution souhaitée du rapport des élèves à de mêmes objets ». C’est sur cette base que Schneider reconnaît un caractère fondamental aussi bien aux praxéologies-déduction qu’aux praxéologies-modélisation. Ensuite, nous avons caractérisé le préconstruit vitesse, grandeur intensive qui se prête peu à une mesure directe par rapport à une autre grandeur de même espèce prise comme unité. Pour mesurer une vitesse, il faut considérer un rapport entre un espace parcouru et le temps écoulé pour parcourir cet espace, ce qui, dans le cas d’une vitesse instantanée reviendrait à diviser 0 par 0 ! On retrouve un clivage important entre une vitesse moyenne et une vitesse instantanée en termes de perception sensorielle, en raison de la nécessaire coordination de deux perceptions fugitives : l’observation d’images changeantes et le sentiment de durée que le cerveau humain ne parvient pas à enregistrer sans que s’écoule déjà un laps de temps minimum. Néanmoins, notre ambition dans cette recherche est d’étudier certaines conditions d’émergence de la vitesse instantanée telle que définie par le biais du concept de dérivée et, en particulier d’analyser en quoi un milieu de type graphico-cinématique peut nourrir cette conceptualisation de connaissances plus qualitatives. Enfin, nous avons situé notre projet par rapport à un problème référent, à savoir celui du vase conique décrit et analysé par Schneider (1988). De l’eau est versée à un débit variable tel que le niveau d’eau dans le cône monte régulièrement de 1 cm/mn ; il est demandé jusqu’à quand le débit sera inférieur à 100 cm3 /mn. Nous avons tâché d’identifier les variables didactiques principales de ce problème pour nous en inspirer ou, au contraire, pour nous en distinguer. En effet, le défaut du problème du vase conique est qu’il se prête peu au travail graphique, même si certains élèves ébauchent le graphique du volume d’eau en fonction du temps ou celui du débit. Ce problème nécessite donc la mise en œuvre d’un autre travail qui donne l’occasion aux élèves de rapprocher vitesse ou débit instantané, d’une part, et pente de tangente, d’autre part, pour tenter de rejoindre ce qui est enseigné classiquement. Dans un souci d’économie didactique, se pose ainsi la question d’un dispositif didactique qui conjuguerait à la fois une interprétation cinématique de la dérivée et son interprétation graphique. Telle est la démarche qui a présidé à la conception de notre ingénierie didactique. - 230/709 - Chapitre 7 Variables didactiques globales Dans ce chapitre, nous allons décrire à grands traits quels ont été les principaux choix opérés dans notre ingénierie, qui sont autant de variables didactiques globales (par opposition aux variables didactiques locales qui seront analysées au prochain chapitre). L’objectif d’une telle analyse est de rendre crédible l’hypothèse que l’ingénierie proposée constituera un milieu propice à l’émergence du concept de vitesse instantanée, ouvrant la voie à celle du concept de dérivée. En particulier, l’ingénierie ainsi construite prétend proposer en son noyau (à savoir les situations II et III considérées dans leur ensemble indissociable et qui sont présentées ciaprès) une situation adidactique, c’est-à-dire pour laquelle, d’une part, le savoir visé apporte une réponse optimale au problème posé et, d’autre part, le milieu permet de dévoluer à l’élève la question posée. Auparavant, nous vous proposons un aperçu des différentes situations que nous avons envisagées pour composer notre ingénierie. 7.1 Survol rapide de l’ingénierie proposée Pour aider le lecteur à se repérer, nous lui proposons de faire un rapide survol de l’ensemble des situations qui composent notre ingénierie. Ces situations sont au nombre de six et sont numérotées de I à VI : • Situation I : on propose le graphique d’une loi de mouvement et on demande d’en faire la description. • Situation II : on propose les graphiques de deux lois de mouvement et on demande à quel instant les deux mobiles ont la même vitesse ; ensuite, on donne les expressions analytiques des lois de mouvement et on demande de calculer l’instant cherché. • Situation III : très semblable à la situation II, elle en diffère par le degré supérieur d’une des lois de mouvement (de t2 à la situation II, on passe à t3 ) ; on demande ensuite la valeur de la vitesse à un instant donné. • Situation IV : semblable à la situation I, elle en diffère par l’ajout d’une partie décroissante au graphique. • Situation V : il s’agit d’un problème d’optimisation, d’abord dans un contexte cinématique, puis dans un autre contexte. • Situation VI : on propose la description d’une loi de mouvement et on demande d’en faire la représentation graphique ; ensuite, on s’intéresse à une question d’approximation affine. Nous commençons par commenter les différentes situations mais le lecteur est invité à se référer par lui-même à ces situations (cf. respectivement pp. 246 ; 251 ; 258 ; 263 ; 268 et 272). C’est la logique globale qui a présidé à l’élaboration de cet ensemble de situations que nous allons tâcher de décrire à présent. 7.2 Un contexte cinématique Il existe de nombreux contextes possibles pour introduire la dérivée : « vitesse d’un mobile ; taux de diminution instantané de la température en fonction de l’altitude ; taux de variation instantané de la quantité de déchets accumulés sur terre ; vitesse d’une réaction chimique ; taux de diminution dans le temps du nombre de microbes chez un patient ; taux de croissance d’une population ; coût marginal en économie 1 . Dans bon nombre de ces contextes, c’est le temps qui joue le rôle de variable indépendante. Cependant, même dans le cas contraire, les auteurs conservent la locution « taux de variation instantané », comme si le qualificatif « instantané » créait une sorte de filiation entre les taux instantanés où le temps est bien la variable indépendante et les taux « instantanés » où c’est une toute autre variable qui joue ce rôle. Pour cette raison, nous pensons que les vitesses peuvent constituer des formes embryonnaires du concept de dérivée, susceptibles de donner naissance à des formes plus générales, au-delà de contextes temporels » (Gantois & Schneider 2009). L’association entre l’idée de variation et le temps est naturelle dans notre culture puisque le temps est précisément la mesure du changement. De plus, suivant en cela Newton, nous pensons qu’une imagerie cinématique aide à penser en termes de variation là où ce n’est pas spontané. Enfin, nous adressant à des jeunes d’environ 16 ans, le préconstruit vitesse leur est familier, non seulement par la banalité de la vie (tachymètre des voitures, mobilité presque universelle (des nuages, des oiseaux, des avions, etc.)) mais aussi grâce à l’enseignement reçu au cours de physique : l’année scolaire précédent l’enseignement de la dérivée, les mouvements rectilignes uniformes et uniformément accélérés sont au programme du cours de sciences. Les élèves visés possèdent ainsi des connaissances de cinématique au moment d’aborder notre ingénierie. Le contexte cinématique qui sera proposé est un prétexte à découvrir et approfondir le contexte de vitesse instantanée. Nous prendrons donc des modèles simplifiés et hypothétiques, donc non nécessairement réalistes ou tirés de phénomènes physiques connus ou de la vie quotidienne. Entre autres, à l’instar de Galilée, nous ne nous prononcerons pas sur les causes du mouvement, par exemple les forces en présence. Dans la mécanique galiléenne, le mouvement « est caractérisé par ses trajectoire, vitesse et accélération » (Guillaud 2000). Il s’agit donc d’un contexte cinématique et non dynamique. 1. Contextes relevés par le manuel Mathécrit (1978). - 232/709 - 7.3. Des lois de mouvement avant tout données graphiquement 7.3 Des lois de mouvement avant tout données graphiquement Comme indiqué à la fin du chapitre précédent, nous faisons l’hypothèse qu’un milieu graphique permettra une économie didactique en associant, en termes de préconstruits, vitesse d’un mobile et pente de la courbe, ce qui deviendra les concepts de vitesse instantanée (puis de dérivée) et de pente de tangente. Afin d’immerger les élèves dans l’univers graphique et le rendre incontournable en termes de stratégies de résolution du problème posé, l’approche graphique précèdera l’étude algébrique des lois de mouvement dans laquelle les élèves peuvent facilement se perdre dans le labeur des calculs ou la gestion de difficultés bien réelles liées à la symbolisation algébrique. Avant d’aborder les variables didactiques suivantes, il nous paraît important de faire une parenthèse théorique sur l’intérêt d’un milieu graphique en analyse. 7.3.1 Milieu graphique Isabelle Bloch (2000) rapporte l’intérêt didactique du registre graphique : « c’est le caractère extrêmement riche de la graphie de ce registre, qui le rend à la fois propice à l’ostension, et en même temps, susceptible d’interprétations multiformes. » (Op. cité, p. 192) Le choix de recourir à un milieu graphique s’appuie notamment sur les caractères producteurs d’un tel milieu énoncés par Bloch : • « la représentation graphique fait apparaître la fonction comme un objet, contrairement à un tableau de valeurs par exemple ; • elle permet de visualiser des propriétés qui n’apparaissent pas dans le registre algébrique ou formel (sens de variations, intersections de courbes, points d’inflexion, maximums et minimums, majorations de tracés par d’autres. . . ). Mais, comme le remarque J. Rogalski, c’est en admettant des propriétés infinitésimales implicites, non représentées et en général non stipulées, que le graphique permet ce fonctionnement opératoire. » (Ibid., p. 193) Pourtant, le plus souvent, le rôle attribué au graphique est pauvre en comparaison de ses potentialités : « Le graphique [. . . ] est perçu comme devant servir à l’illustration des phénomènes mathématiques, mais sans but opératoire ; [. . . ] Artigue 2 parle même de statut infra-mathématique. » (Ibid., p. 194) 2. (1995) - 233/709 - 7.3.1. Milieu graphique Au contraire, ses recherches conduisent Bloch à affirmer que « le registre graphique est, au même titre que les autres, un registre symbolique » (Ibid., p. 194). Le registre graphique est spécialement intéressant à propos des fonctions : « Les possibilités du registre graphique, relativement à la représentation de propriétés non prises en compte dans les autres registres [. . . ] en font [. . . ] un candidat intéressant pour un milieu d’une situation destinée à l’apprentissage de la notion de fonction. » (Ibid., p. 194) En particulier, nous intéressant à la dérivée d’une fonction, il aurait été dommage de se priver du registre graphique dans notre ingénierie. Pour cela, nous nous appuyons spécialement sur deux potentialités majeures du milieu graphique mises en lumière par Bloch (Ibid.). Notons bien qu’il s’agit de potentialités, c’est-à-dire de capacités non nécessairement atteintes ou réalisées par le fait même de disposer d’un milieu graphique. • La première potentialité a trait au mode spatial du registre graphique : « Le registre graphique s’exprime dans un mode spatial (dessin à deux dimensions). Les élèves ont une expérience du mode spatial depuis l’école élémentaire, ils y ont donc construit des connaissances. Y a-t-il possibilité de récupérer ces connaissances pour le fonctionnement dans le registre graphique ? De plus les élèves ont déjà, au début de la Seconde [la Quatrième belge], des connaissances relatives aux graphiques de fonctions linéaires ; pour une situation prévue en classe de Première [la Cinquième belge], ils possèdent aussi des connaissances sur les fonctions de référence et leur représentation graphique » (Ibid., p. 194). Un contre-exemple est donné par cet élève-professeur, observé par Maggy Schneider (non publié), qui considère un axe sur lequel il place des points A et B et qui y indique que le mobile part de A à 11h et arrive en B à 12h. L’axe a ici la double signification de lieu et de temps. Un tel graphique ne se suffit pas à lui-même mais nécessite un discours verbal complémentaire tel que « le mobile commence par accélérer, etc. ». Dans la situation I de notre ingénierie, nous proposons un graphique qui prétend ne raconter qu’une seule histoire, c’est-à-dire être susceptible d’être décodé sans ambiguïté par le public visé. En l’occurrence, nous donnons la position d’un mobile en fonction du temps tandis que le sens de la concavité et la croissance de la courbe donnent des informations (essentiellement non quantitatives) sur la vitesse du mobile. • La seconde potentialité a trait au mode opératoire du registre graphique. Il est réalisé lorsque le graphique est « complété par des outils de validation » (Ibid., p. 194). « Ce fonctionnement, dit Lacasta (1995, p. 133), a lieu lorsque le graphique fonctionne "comme moyen de contrôle de la communication et comme moyen de détermination d’un autre objet. Ce fonctionnement a lieu lorsque la réponse à un problème est obtenue par un rapport effectif 3 avec le graphique". »(Bloch 2000, p. 195) 3. Sur le rapport effectif à un savoir, Bloch renvoie ici à Fregona 1995, p. 62 et suivantes. - 234/709 - 7.4. Comparer un mouvement uniforme et un qui ne l’est pas C’est ainsi que, par exemple, aux situations II et III, l’instant cherché peut être déterminé grâce à la comparaison des graphiques proposés et, une fois le calcul algébrique fait, il est possible de vérifier que le résultat obtenu est plausible. Finalement, une ingénierie didactique relative aux fonctions s’enrichit largement en faisant appel à un milieu graphique : « Il ne faut pas se priver de l’outil algébrique, mais par contre il semble raisonnable de le mettre en relation avec un outil plus riche quant aux possibilités d’action autonome des élèves ; le registre graphique est intéressant pour les connaissances sur lesquelles il s’appuie, et pour les possibilités de traitement de l’objet global fonction, ainsi que pour ses possibilités de fonctionnement opératoire non exploitées dans le contrat [didactique] classique. » (Op. cité, p. 197) Dans le cas de notre ingénierie, il s’agirait de faire en sorte que non seulement la résolution de certains problèmes puisse se faire graphiquement mais encore que la résolution algébrique puisse être corroborée graphiquement. C’est ce qui est visé notamment aux situations II et III, comme nous l’avons précisé ci-dessus. 7.4 Comparer un mouvement uniforme et un qui ne l’est pas Pour autant que les élèves sachent interpréter correctement le graphique d’une loi de mouvement (voir section 7.5, p. 236), ce qui distingue immédiatement un mouvement à vitesse constante d’un autre mouvement est que le premier est représenté par une droite tandis que le second est représenté par une courbe quelconque (mais néanmoins continue). C’est ce contraste qui, a priori, devrait permettre aux élèves de résoudre le problème central qui leur sera posé (situations II et III). Ainsi, en leur donnant le graphique suivant, - 235/709 - on peut s’attendre à ce qu’ils déduisent que le mobile P1 va d’abord moins vite puis plus vite que P2 , puisqu’il le rattrape et le dépasse. De cette analyse, pourront germer des stratégies de résolution graphique du problème qui leur sera posé ; nous détaillerons les stratégies envisagées au chapitre suivant (voir paragraphe 8.2.2.3, p. 254). La variable didactique de comparer un mouvement uniforme et un qui ne l’est pas peut sembler identique à une variable didactique du problème du vase conique, à savoir que le débit y était variable. Cependant, les problèmes comparés ici nous paraissent fort différents du point de vue de cette variable didactique, surtout si l’on considère non pas la variabilité elle-même de la vitesse ou du débit en jeu mais bien la perception que les élèves pourraient en avoir. Dans le problème du vase conique, c’est le contexte de vitesses liées qui est source de cette intuition : comme déjà dit plus haut, vu que la montée de l’eau se fait à vitesse constante et que le vase est de plus en plus large, le débit ne peut que croître et c’est bien ce qu’expriment les élèves. Dans le problème des mouvements, nous misons sur le contraste entre un graphique rectiligne et un qui ne l’est pas, c’est-à-dire entre un mouvement uniforme et un à vitesse variable. Mais l’accès à ces mouvements est ici plus symbolisé que dans le problème du vase conique où le mouvement est décrit de manière brute. En effet, dans le cas présent, les mouvements sont décrits d’abord par des graphiques puis par des expressions analytiques et l’on sait que cela peut poser problème aux élèves. En particulier, plusieurs chercheurs (dont Janvier 1978 et Rouchier 1980) ont pu observer une confusion chez certains élèves entre la trajectoire d’un mobile et le graphique de sa loi de mouvement. 7.5 S’assurer que les élèves seront capables d’interpréter les graphiques Comme annoncé à la fin de la section 7.4, p. 236, l’interprétation correcte du graphique d’une loi de mouvement n’est pas nécessairement évidente pour les élèves. Il faut donc prévoir une situation en amont des autres (situation II et suivantes) et qui en constitue le milieu. Une telle situation (situation I) doit donc préparer les élèves à lire pertinemment le graphique de lois de mouvement telles que décrites plus haut. Le graphique proposé doit avoir des parties courbes car il doit permettre avant tout de traduire le caractère intensif (par opposition à son caractère extensif comme une valeur numérique) de la vitesse : en dehors des périodes où le mobile est à l’arrêt et a, par conséquent, une vitesse nulle, on peut décrire que la vitesse augmente ou diminue. Le but de la situation I est donc de permettre aux élèves de s’approprier le graphique d’une loi de mouvement, qu’ils en aient déjà rencontré de semblables ou non au cours de physique. C’est là un premier contact avec des graphiques partiellement courbes qui représentent des mouvements rectilignes ce qui, comme écrit plus haut, peut déjà poser problème à certains élèves (par exemple, la confusion entre la trajectoire du mobile et sa loi de mouvement). - 236/709 - 7.7. Permettre la validation pragmatique de la procédure infinitésimale en jeu 7.6 Poser une question relative au temps plutôt qu’à la vitesse du mobile qui accélère Aux situations II et III, on demande aux élèves à quel instant deux mobiles ont la même vitesse. Il s’agit de la même variable didactique que dans le cas du vase conique. En paraphrasant ce qui a été écrit plus haut au sujet de ce dernier, le fait que la question ne soit pas de savoir ce que vaut la vitesse à un instant donné mais de déterminer le moment précis où la vitesse aura telle ou telle valeur permet d’éviter, dans un premier temps, de faire référence au concept savant de vitesse instantanée à un instant donné pour laisser les élèves se polariser sur la globalité du phénomène et sur la variation de la vitesse. On peut donc espérer que les effets seront semblables à ceux produits dans l’étude du vase conique : d’abord, que les élèves engageront spontanément le concept de vitesse moyenne, le seul qu’ils connaissent ; ensuite, une fois connues les expressions algébriques des lois de mouvement, qu’ils débattront de la nécessité d’algébriser non seulement la variable temps mais aussi sa variation. De plus, parmi les stratégies annoncées plus haut et que nous décrivons au paragraphe 8.2.2.3, p. 254, il faudra qu’au moins l’une d’elles conduise à un calcul infinitésimal. Parmi les élèves qui suivront cette stratégie, à l’instar de ce qui a été observé dans le cas du vase conique, on peut penser que certains parviendront à une égalité qui aura dans un membre l’expression simplifiée de la vitesse moyenne sur un intervalle [t; t + ∆t] (et dans l’autre membre, la vitesse constante de l’autre mobile), puis à annuler ∆t pour obtenir la réponse cherchée. Le choix de la variable t et non d’une valeur numérique telle que t = 2 permet de conduire à l’émergence non pas du nombre dérivé, savoir d’ordre numérique et local, mais de la fonction dérivée, savoir d’ordre algébrique et global et qui fait l’efficacité du calcul infinitésimal. Par ailleurs, il se peut que la question puisse également être résolue graphiquement et/ou algébriquement par des stratégies non infinitésimales, ce qui pourrait faire perdre à la situation le caractère fondamental qui est visé. Nous y reviendrons dans l’analyse a priori de cette situation (paragraphe 8.2.2.3, p. 254). 7.7 Permettre la validation pragmatique de la procédure infinitésimale en jeu Nous trouvons ici une autre variable didactique commune avec le problème du vase conique, à savoir la possibilité d’une validation pragmatique par les élèves. En effet, les élèves qui auront choisi la stratégie de type infinitésimal n’obtiennent une réponse que par l’annulation de ∆t. Or, on s’attend à ce que réduire ∆t à zéro soit sujet à caution aux yeux des élèves, comme observé dans le cas du vase conique. Cependant, pour autant que la loi de mouvement soit du second degré (nous y reviendrons dans l’analyse a priori au paragraphe 8.2.2.5, p. 257), les stratégies non infinitésimales conduisent à la même réponse par des moyens que les élèves ne devraient pas mettre en doute, s’agissant de la résolution d’une équation du second degré ou de la détermination du sommet d’une parabole. Il est donc ainsi possible de valider de façon pragmatique un calcul nouveau qui pourrait sembler suspect, à condition, par exemple, de considérer une fonction du second degré. - 237/709 - Dans le cas de notre ingénierie, nous visons que le milieu graphique soit un outil de validation pragmatique, c’est-à-dire que l’élève, s’appuyant sur le seul graphique, puisse apporter des « preuves » de ses affirmations. Nous mettons le mot entre guillemets car il n’est pas certain que tous les mathématiciens et enseignants considèrent ce type d’argumentation comme constitutifs d’une preuve au sens institutionnel du terme. Cette éventuelle réticence est liée à ce que Bloch considère comme des obstacles au fonctionnement opératoire des graphiques. Elle constate notamment : « Une organisation didactique qui pourrait présider à un fonctionnement opératoire du graphique, n’est pas apparue dans le contrat [didactique] classique ; il en résulte que lorsque le professeur fait appel à ce type de fonctionnement opératoire (ce qui n’est pas très fréquent mais peut néanmoins se produire), il ne peut pas le signaler explicitement. Ainsi le professeur se réserve des moments, par exemple au tableau, où il peut prouver effectivement sur une courbe l’existence d’un unique antécédent d’un nombre réel par une fonction, ou l’existence d’une racine d’une équation par intersection de deux courbes ; mais l’élève n’a pas droit à ce type de validation, car celui-ci n’étant pas explicitement prévu dans le fonctionnement didactique du graphique, reste plus ou moins clandestin ; ainsi les professeurs, répondant à des questionnaires sur le graphique, sont extrêmement réticents à reconnaître aux élèves le droit à une telle procédure de preuve. » (Bloch 2000, pp. 196-197) 7.8 Rendre le savoir visé optimal La procédure de type infinitésimale utilisée à la situation II ayant été validée pragmatiquement à l’aide de stratégies non infinitésimales, se pose la question auprès des élèves de la pertinence de faire appel à une procédure nouvelle (infinitésimale) alors que d’autres procédures algébriques fonctionnent très bien. Il faut donc leur proposer une nouvelle situation dans laquelle les autres procédures ne fonctionnent plus. Or, ce qui permet la validation pragmatique à la situation II est la présence d’une fonction du second degré car on sait calculer les racines et l’extremum d’une telle fonction. Il s’agit donc de choisir une nouvelle fonction dont il soit suffisamment compliqué de calculer les racines ou les extrema, de sorte que seule la procédure de type infinitésimale soit jugée optimale par les élèves. Nous avons choisi une fonction du troisième degré, à l’instar du problème du vase conique. Tel est l’objet de la situation III. Dans le cas du vase conique, on disposait immédiatement d’une fonction du troisième degré, ce qui rendait la procédure infinitésimale directement optimale pour résoudre le problème mais interdisait une validation pragmatique de la procédure par comparaison avec d’autres procédures algébriques non infinitésimales. Dans notre ingénierie, nous avons fait le choix didactique de procéder en deux étapes, l’une (situation II) permettant de justifier la procédure infinitésimale et l’autre (situation III) permettant de rendre cette procédure (donc le savoir visé) optimale. - 238/709 - 7.10. Une même procédure pour la vitesse et l’accélération, positive et négative 7.9 Justifier la définition du concept de vitesse instantanée en termes de calcul infinitésimal Une fois les élèves en mesure de déterminer à quel instant deux mobiles ont la même vitesse, un travail est nécessaire pour justifier la définition du concept de vitesse instantanée en termes de calcul infinitésimal. C’est pourquoi nous nous proposons dès lors de demander aux élèves ce que vaut la vitesse du mobile doté d’un mouvement accéléré à un instant donné (fin de la situation III). En effet, au terme de la situation II, la stratégie infinitésimale a été rendue publique à toute la classe et institutionnalisée ; l’expression de la vitesse instantanée est alors accessible mais non encore identifiée comme telle. En effet, on a obtenu une équation qui, une fois simplifiée algébriquement et une fois ∆t annulé, permet de trouver l’instant où deux mobiles ont même vitesse. Il n’est pas évident pour autant d’y voir une égalité, non plus entre deux vitesses moyennes (comme c’était le cas avant les simplifications précédentes) mais entre deux vitesses instantanées (dont l’une est connue d’avance, s’agissant du mobile ayant une vitesse constante). Il faut donc un changement de point de vue pour regarder la formule obtenue non pas comme un des membres d’une équation mais comme une fonction de t, ce qui ne va pas de soi ainsi que montré par plusieurs chercheurs (cf. par exemple Sierpinska 1992). La situation III reste également une référence pour justifier que, à une loi de position de la forme t3 , correspond une loi de vitesse de la forme 3t2 . Par exemple, on peut affirmer que la vitesse du mobile concerné, en t = 1/2, vaut 3/4 car, en cherchant l’instant où ce mobile a même vitesse qu’un mobile à vitesse uniforme de 3/4 comme dans le problème précédent, on tombe sur 1/2. Et cet argument, qui s’appuie sur l’intuition formalisée lors de la situation précédente (situation II), vaut pour toute valeur de t. Évidemment, cela suppose une référence implicite à la bijectivité de la fonction-vitesse en jeu. Qui plus est, on travaille sur un exemple particulier. Mais, il nous semble suffisamment probant pour pouvoir conclure que l’expression de la vitesse instantanée d’un mobile, en un instant t, est obtenue en annulant ∆t de l’expression de sa vitesse moyenne sur [t; t + ∆t], une fois faites les simplifications algébriques. On est là en mesure de définir, au moyen d’un tel calcul, le concept de vitesse instantanée. C’est un tournant au cours duquel on passe du préconstruit vitesse à un concept proprement mathématique et qui est typique, comme nous l’avons dit plus haut, de la transition entre une praxéologie modélisation et une praxéologie déduction. Évidemment, le concept en question est encore défini à ce stade par l’acte de suppression de termes, comme chez Lagrange, et du chemin reste à parcourir avant de le subordonner au concept de limite formalisé en termes de quantificateurs et d’inégalités. Mais cette forme embryonnaire de définition peut vivre pendant un certain temps et son application à plusieurs exemples peut suffire à faire émerger, chez les élèves, l’idée de certaines régularités dans les résultats et celle de l’existence d’un calcul plus rapide qui s’apparente à notre calcul des dérivées. 7.10 Une même procédure pour la vitesse et l’accélération, positive et négative Aux situations I, II et III, les courbes proposées comme lois de mouvement sont croissantes, si bien que seules des vitesses positives ou nulles sont envisagées. La situation IV se - 239/709 - propose d’élargir le cas à des lois de mouvement non monotones, ce qui conduit à considérer des vitesses négatives. Or il n’est pas certain que les élèves acceptent l’idée d’une vitesse négative : n’entend-on pas souvent les élèves dire que la vitesse est une distance divisée par un temps ? Faire travailler les élèves sur un tel graphique peut permettre de montrer les avantages du nouveau point de vue sur la vitesse : l’unicité d’une définition et du type de calcul la déterminant, que la loi de mouvement soit croissante ou décroissante, ainsi qu’une information donnée par le signe de la vitesse sur le sens de parcours du mobile. La même situation IV est également l’occasion de définir l’accélération instantanée comme résultat d’un même type de calcul infinitésimal appliqué cette fois à la vitesse et non à la position du mobile. On peut penser que le respect de cette définition pourra avoir des conséquences cocasses, en particulier lorsqu’il faudra considérer une accélération positive sur un intervalle où le graphique de la loi de position est décroissant avec une concavité tournée vers le haut alors que l’on a envie, dans ce cas, de parler de décélération, la courbe étant de moins en moins pentue. . . C’est le prix de la mathématisation des grandeurs. 7.11 De la vitesse instantanée au taux instantané de variation Avec la situation V, l’objectif est désormais de faire évoluer la notion de vitesse instantanée vers celle, plus large mais plus abstraite de dérivée. Contrairement à la situation centrale de notre ingénierie (situation II et III, cf. section 7.4, p. 235), nous ne prétendrons pas créer une situation à caractère adidactique. Nous nous sommes contentés de formuler deux problèmes d’optimisation mobilisant une même fonction mais situés, le premier dans un contexte graphico-cinématique et, le second, dans un contexte géométrique, à savoir la détermination des dimensions d’une boîte rectangulaire pour en maximiser le volume. Ce dispositif est dicté par une observation antérieure (Schneider 1988) : aux prises avec un problème d’optimisation de ce type, peu d’élèves ayant reçu un enseignement standard des dérivées lient le maximum du volume au point où la dérivée est nulle et, lorsqu’ils parlent de tangente, c’est pour évoquer une translation de l’axe Ox jusqu’à la hauteur où il frôle le maximum. Nous estimons que le contexte cinématique du premier problème peut aider les élèves à associer l’idée de maximum à l’annulation d’un taux instantané de variation, ici une vitesse. Quant au deuxième problème, il mobilise la même fonction que le premier. Cela peut conduire les élèves à transférer de l’un à l’autre soit la réponse, soit la technique. L’enjeu est d’arriver à faire émerger l’idée que ces deux problèmes font partie de la même classe et ce qui nous intéresse ici c’est l’intelligibilité que les élèves expriment des résolutions de chacun des problèmes et de ce que ces résolutions ont en commun. Au final, c’est une fonction « dérivée » qui est définie et non des nombres dérivés au potentiel infiniment plus limité, comme nous l’avons analysé à la section 5.2.2.2, p. 155. 7.12 La tangente et les approximations affines Une dernière situation a été créée pour faire intervenir les champs de tangentes et les approximations affines. Dans les deux cas, c’est le concept de tangente qui est à l’honneur, - 240/709 - 7.12. La tangente et les approximations affines ce qui a justifié de mettre un seul numéro pour les deux questions qui, par ailleurs, sont indépendantes. Par rapport au reste de l’ingénierie, il s’agit d’un complément, utile dans la mesure où, nous l’avons observé au chapitre 5 (à partir de la p. 145), ces aspects sont inscrits au programme de Cinquième en Belgique (Première en France) mais sont peu traités en pratique. Ainsi, nous avons observé au chapitre 5 (pp. 162 et 207) que les auteurs des manuels Espace Math 56 et Actimath 5 désignent respectivement la tangente en un point A comme « une droite qui "s’écarte peu" de la courbe en des points voisins de A » (Adam & Lousberg 1999, p. 139) et comme donnant « une bonne approximation » (Delfeld et al. 2003, p. 200) de la fonction « dans un intervalle suffisamment petit autour de [l’abscisse du point] » (Ibid., p. 200). Or, en analyse, on démontre que la tangente est la meilleure approximation affine d’une fonction f dérivable en x0 en partant de la définition de meilleure : « Soit f une fonction définie sur un intervalle D, x0 un réel de D et C la représentation graphique de f dans un plan rapporté à un repère (O;~i; ~j). On appelle approximation affine de la fonction f en x0 toute fonction affine g telle que g(x0 ) = f (x0 ) . Soit g1 et g2 deux approximations affines de la fonction f en x0 . On dit que g1 est meilleure que g2 s’il existe un intervalle I contenant x0 tel que, pour tout x de I ⊂ D, on ait |f (x) − g1 (x)| 6 |f (x) − g2 (x)| (c’est-à-dire lorsque g1 est plus proche de f que g2 sur I) » (Académie de Bordeaux non daté, p. 1) Le document en ligne se termine par un théorème (et sa démonstration) affirmant que la meilleure approximation affine d’une fonction dérivable en x0 au voisinage de ce point est la tangente : « Théorème f étant une fonction numérique dérivable en x0 , la fonction affine tangente à f en x0 , Φx0 , est la meilleure approximation affine de f au voisinage de x0 . En d’autres termes, pour toute fonction affine Ψ telle que Ψ(x0 ) = f (x0 ), il existe un intervalle IΨ ouvert, non vide, centré en x0 , tel que, pour tout réel x élément de IΨ , on ait : |f (x) − Φx0 (x)| 6 |f (x) − Ψ(x)|. » (Ibid., p. 4) Une autre définition de la tangente permet d’illustrer l’idée de meilleure approximation affine : « La tangente en un point A du graphique y(x) [figure ci-après] est définie en tant que droite α menée par le point A et telle que la courbe y(x), en s’approchant du point A, pénètre dans tout angle de sommet A contenant la droite α et y reste, aussi petit que soit cet angle. » (Chilov 1974) - 241/709 - Schneider (1988) observe que cette définition géométrique permet d’éviter la confusion entre les sécantes et la tangente, contrairement à ce qu’on a pu observer dans les manuels Espace Math 56 et Actimath 5 : « Cette définition est, elle aussi, purement géométrique, en ce sens qu’elle ne suppose aucun détour par les pentes, mais, contrairement à la perception des élèves, elle évoque plus une "possibilité de dépassement" qu’une réalisation effective. Elle revient à dire qu’on peut trouver une sécante aussi "près" que l’on veut de la tangente. En effet, le fait que la courbe y(x) pénètre dans tout angle de sommet A signifie qu’on peut trouver une sécante β et une sécante β 0 qui forment cet angle autour de la droite α : en pénétrant dans l’angle, la courbe coupe effectivement chacune de ces droites en A et un autre point. Mais cette définition maintient comme une sorte de séparation entre la tangente d’une part et les sécantes d’autre part : une tangente n’est pas une sécante et vice-versa. Rien de tel chez les élèves ou chez les auteurs de manuels cités plus haut : la sécante devient tangente (qu’elle tourne autour d’un point fixe ou que ses deux points d’intersection avec la courbe se rapprochent l’un de l’autre). Le passage à la limite devient ainsi actuel au sens philosophique du terme, c’est-à-dire qu’il est accompli effectivement. Le mouvement (vu ou du moins imaginé) joue un rôle dans cet accomplissement : un point de la courbe que l’on voit se rapprocher d’un autre n’a aucune raison de ne pouvoir rejoindre cet autre effectivement ; de même une sécante qu’on voit tourner autour d’un point ne s’arrête pas avant d’occuper la position de la tangente. » (Op. cité, p. 327) Néanmoins, par rapport aux enjeux de notre ingénierie didactique, cette situation VI est très en aval des situations centrales (situations II et III). Son analyse a priori sera faite au prochain chapitre ; en revanche, nous n’en ferons pas l’analyse a posteriori en l’espace limité de cette thèse. - 242/709 - 7.14. Conclusion du chapitre Cette situation peut permettre aux élèves d’une part, d’approfondir le lien qui existe entre l’allure d’une courbe et la dérivée de la fonction correspondant, ce qui nous situe dans un certain niveau d’abstraction ; et, d’autre part, de pouvoir interpréter les approximations affines en termes cinématiques. Nous pensons qu’un tel va-et-vient entre le concept mathématique et la cinématique, qui aura été le chemin d’accès à ce concept, peut aider les élèves dans le difficile travail d’abstraction mathématique. 7.13 Synthèse rapide quant aux variables didactiques globales Nous allons reprendre ici les différentes situations de l’ingénierie et faire la liste de leurs principaux enjeux didactiques : • Situation I : préparation à la lecture de graphiques pour aborder la situation II (et les suivantes) de manière optimale. • Situation II : au cœur de l’ingénierie, avec la situation III : − Émergence du préconstruit vitesse instantanée − Mise au point d’une nouvelle technique de calcul de type infinitésimale − Validation pragmatique grâce à deux techniques non infinitésimales. • Situation III : complète le cœur de l’ingénierie avec la situation II : − Invalidation des procédures non infinitésimales pour rendre le savoir visé optimal (situation fondamentale) − Formulation de la vitesse instantanée en tant que fonction. • Situation IV : élargissement de la même procédure infinitésimale au calcul de l’accélération et aux vitesses négatives. • Situation V : utilisation du calcul infinitésimal dans un problème d’optimisation et élargissement à un nouveau contexte, prélude à une future abstraction vers le concept de dérivée. • Situation VI : complément sur l’intérêt des tangentes (champs de tangentes et approximations affines). 7.14 Conclusion du chapitre Dans ce chapitre, nous avons cherché à comparer les variables didactiques globales de notre ingénierie à celles du problème du vase conique, ce qui nous a conduit à mettre en avant la richesse supposée (par l’analyse a priori) du milieu graphique que nous proposons. L’importance didactique d’un tel milieu, spécialement quand il jouit d’un fonctionnement opératoire a été rapporté par Bloch (2000) et ce serait là une originalité majeure de notre ingénierie par rapport à celle du problème référent. Aux situations II et III, on trouve deux variables didactiques identiques à celles du problème du vase conique. La première est de demander aux élèves à quel instant deux mobiles ont la même vitesse et non quelle est la vitesse d’un mobile à un instant donné ; dans le problème du vase conique, la question posée revenait à demander à quel instant le débit valait telle valeur et non quel est le débit à un instant donné. En effet, ce choix permet - 243/709 - d’éviter, dans un premier temps, de faire référence au concept savant de vitesse instantanée à un instant donné pour laisser les élèves se polariser sur la globalité du phénomène et sur la variation de la vitesse. On peut donc espérer que les effets seront semblables à ceux produits dans l’étude du vase conique : d’abord, que les élèves engageront spontanément le concept de vitesse moyenne, le seul qu’ils connaissent ; ensuite, une fois connues les expressions algébriques des lois de mouvement, qu’ils débattront de la nécessité d’algébriser non seulement la variable temps mais aussi sa variation. La deuxième variable didactique commune avec celles du problème référent est de permettre une validation pragmatique par les élèves. Rappelons-en l’intérêt. La situation II peut être résolue algébriquement par au moins trois techniques : une de type infinitésimal et deux de type non infinitésimal — à savoir la résolution d’une équation du second degré ou la détermination du sommet d’une parabole. La technique de type infinitésimal conduit à une procédure dont on s’attend qu’elle soit sujette à caution aux yeux des élèves, comme observé dans le cas du vase conique, car elle suppose, à un moment donné, de considérer un terme ∆t comme non nul puis, finalement, de le poser égal à 0. La présence des deux techniques non infinitésimale permettrait donc une première validation pragmatique. Auparavant, la situation I vise à introduire le milieu graphique dans lequel les élèves seront plongés dans chacune des situations suivantes. Cette situation doit donc préparer les élèves à lire pertinemment le graphique d’une loi de mouvement. Grâce au milieu graphique proposé à la situation II — à savoir, sur un même graphique, les courbe d’une loi de mouvement à vitesse constante contrastant avec la courbe d’une loi de mouvement à vitesse variable —, nous visons que les élèves auront potentiellement accès à une seconde validation pragmatique en comparant la valeur numérique trouvée à son estimation sur le graphique. Cela distinguerait à nouveau notre ingénierie de celle du problème du vase conique. Notre ambition est donc de permettre un rôle opératoire des graphiques, ce que Bloch (2000) signale ne pas être « très fréquent » dans les pratiques enseignantes ; elle ajoute que ces mêmes enseignants « sont extrêmement réticents à reconnaître aux élèves le droit à une telle procédure de preuve ». Or, précisément, dans le cas de notre ingénierie, à la situation III — similaire à la situation II sauf que la loi de mouvement du mobile à vitesse variable est du troisième degré à la place du second degré —, la validation pragmatique ne peut être que graphique. En effet, les techniques non infinitésimales utilisées précédemment ne fonctionnent plus : les élèves ne savent ni résoudre une équation du troisième degré (pour autant qu’elle n’ait pas une racine évidente) ni déterminer les extrema d’une fonction du troisième degré. Cette situation permet donc de rendre optimal la procédure de type infinitésimal visée, ce qui confère à l’ensemble composé des situations II et III — qui est le cœur de notre ingénierie — son caractère fondamental. Une dernière question est posée dans la situation III : celle de déterminer la vitesse d’un mobile à un instant donné. Répondre à cette question revient à isoler la formule donnant la vitesse instantanée comme la limite en acte (au sens de la procédure mise en place) de la vitesse moyenne. Les situations IV, V et VI ne sont pas au cœur de notre ingénierie, non que leur objet soit peu important mais parce qu’il nous fallait faire des choix dans le cadre de notre recherche, celle-ci s’intéressant prioritairement à une modélisation du préconstruit vitesse instantanée. - 244/709 - Chapitre 8 Analyse a priori, situation par situation Après avoir justifié dans les grandes lignes les choix didactiques qui ont présidé à l’élaboration de notre ingénierie didactique, nous allons tâcher de justifier, également a priori, les choix didactiques plus locaux opérés dans les différentes situations de notre ingénierie didactique. Nous allons décrire puis faire l’analyse a priori de ces situations dans l’ordre chronologique tel que proposé aux élèves. 8.1 Situation I Comme nous l’avons dit au chapitre précédent, l’objectif principal de cette première situation est d’installer chez les élèves une lecture efficace du graphique de la loi de mouvement, c’est-à-dire de créer un milieu qui sera propice à l’heure d’aborder les situations suivantes. En particulier, à l’issue de l’étude de cette première situation, les élèves devraient savoir distinguer le graphique d’une loi de mouvement à vitesse constante de celui d’une loi de mouvement à vitesse variable ; ils devraient savoir justifier la croissance/décroissance d’une vitesse instantanée (même s’ils n’auront de celle-ci qu’une idée intuitive) en ayant recours à un raisonnement sur les vitesses moyennes ; si possible, les élèves devraient être familiarisés avec l’intuition que la pente d’une courbe donne des informations pertinentes sur la vitesse instantanée. En effet, ce que devrait permettre ici une praxéologie-modélisation est de montrer l’opérationalité du préconstruit pente d’une courbe. 8.1.1. Description 8.1.1 Description Voici l’énoncé de la première situation. Elle s’intitule « Étude du mouvement d’une particule » : « Soit une particule (un point) qui se déplace arbitrairement sur un axe muni d’une origine et d’une unité (Figure 1). Figure 1 On considère que l’on peut connaître ce mouvement par le graphique qui représente la position p du mobile en fonction du temps t. On nous propose ainsi le graphique de la figure 2, où les unités sont, par exemple, le mètre pour la position et la minute pour le temps. Figure 2 Décrire par des phrases en français et le plus complètement possible le mouvement du mobile décrit par le graphique de la figure 2 ». 8.1.2 8.1.2.1 Variables didactiques locales Différents niveaux de lecture du graphique : position, vitesse et accélération Position. Dans un premier temps, en particulier du fait que le graphique proposé exprime explicitement la position d’une particule en fonction du temps, on peut s’attendre à ce que les élèves décrivent le mouvement uniquement en termes de positions, sans envisager - 246/709 - 8.1. Situation I de considérer la vitesse et l’accélération du mobile. Par exemple, il est possible de décrire ainsi la position : elle ne change pas pendant les 2 premières secondes, puis elle change. On peut préciser qu’elle augmente avant de redevenir constante. On peut également compléter une telle description en donnant les valeurs des positions observées du mobile : il reste à la position −1 mètre pendant les 2 premières secondes, puis la position augmente pour atteindre 3 mètres après 6 secondes, position qui est alors conservée. Il est également possible que les élèves précisent que le signe de la position permet de savoir si la particule se trouve à gauche (ou avant) ou à droite de (ou après) l’origine de l’axe de la trajectoire. Ainsi, au départ, la particule était à 1 m à gauche de l’origine et, à la fin, il se trouve à 3 m à droite de l’origine. Vitesse. Un second niveau de lecture du graphique concerne la vitesse. En effet, au début, la position est fixe alors que le temps s’écoule ; donc la vitesse est nulle. Ensuite, la vitesse augmente. Une argumentation possible serait de dire que la position augmente tandis que le temps s’écoule. Mais cette justification ne permet pas d’expliquer que la vitesse diminue plus loin car, avant que le mobile ne soit à nouveau à l’arrêt, la position continue à augmenter. . . Suite aux premières expérimentations, la figure 2 proposée aux élèves a été modifiée en la figure 2b suivante, pour faire apparaître un intervalle où la vitesse est constante sans être nulle. Figure 2b Mais c’est bien la configuration première (Figure 2) qui correspondra à l’essentiel de notre analyse puisque c’est celle que les élèves prioritairement observés ont travaillé. Les axes étant gradués, il est possible que les élèves disposant de la figure 2b calculent la valeur numérique de la vitesse lorsque celle-ci est constante. Dans tous les cas, une autre façon de justifier l’augmentation de la vitesse suppose d’abord de bien distinguer les deux types de vitesse : la vitesse instantanée et la vitesse moyenne (le concept de vitesse moyenne et le préconstruits vitesse instantanée sont connus des élèves visés, au moins depuis l’année scolaire précédente). En effet, c’est l’augmentation de la vitesse instantanée qui est en jeu ; mais, celle-ci n’étant pas mesurable par les élèves et les élèves ne disposant pas du moyen de la calculer mathématiquement, c’est à l’aide de la vitesse moyenne considérée sur de petits intervalles - 247/709 - 8.1.2. Variables didactiques locales de temps successifs qu’ils pourront procéder. La vitesse moyenne, pour le physicien, est la variation de position par unité de temps. Mathématiquement, dans le cadre de la situation I, la fonction p(t) est monotone si bien que, comme indiqué plus haut, il n’y a pas d’ambiguïté entre distance parcourue et variation de position ; nous pourrons suivre la définition du physicien. Ainsi, sur un intervalle de temps [t; t + ∆t] pendant lequel la distance parcourue est la variation de la position p entre les deux instants t et t + ∆t, alors la vitesse moyenne sur cet intervalle s’écrit vm = p (t + ∆t) − p (t) ∆p ou encore vm = . ∆t ∆t Graphiquement, la vitesse moyenne correspond à la pente de la droite qui passe par les points (t; p (t)) et (t + ∆t; p (t + ∆t)). La variation de la vitesse se justifie alors en observant que, dans la première partie où la courbe croît, la distance parcourue augmente d’un petit intervalle de temps à l’autre, ce qui signifie que la particule, en moyenne sur ces petits intervalles, va de plus en plus vite. Plus tard, au contraire, la distance parcourue diminue d’un petit intervalle de temps à l’autre, ce qui signifie que la particule, en moyenne, va de moins en moins vite. Pour être acceptable, ce raisonnement suppose d’accepter le caractère continu des grandeurs considérées (notamment la position, la vitesse instantanée et le temps) et la monotonie de la vitesse sur plusieurs petits intervalles de temps successifs. Accélération. Un troisième niveau de lecture du graphique est relatif à l’accélération. Celleci peut apparaître par exemple en tant que justification de l’augmentation de la vitesse (puis de sa diminution) : puisque le mobile était à l’arrêt et qu’il s’est mis en mouvement, c’est qu’il a accéléré ou que son accélération était positive (puis, plus tard, puisque le mobile était en mouvement et qu’il s’est arrêté, c’est qu’il a décéléré ou que son accélération était négative). Cet argument sera débattu à la situation IV. Chez les élèves ayant des connaissances de cinématique (qu’ils étudient l’année scolaire précédente), l’accélération pourra également être perçue grâce à la courbure de la courbe. En effet, ils auront étudié principalement deux mouvements : le MRU (mouvement rectiligne uniforme) et le MRUA (mouvement rectiligne uniformément accéléré). Le MRU se caractérise par une vitesse constante et un graphique rectiligne ; le MRUA se caractérise par une accélération constante et un graphique parabolique. La simple vue d’une courbe non rectiligne pourrait donc leur donner l’intuition d’une accélération, sans même devoir considérer la vitesse en elle-même. Enfin, il sera possible de justifier graphiquement l’accélération et la décélération en considérant de petits intervalles de temps successifs et de même durée et en représentant les petites variations de position correspondantes, obtenant ainsi une sorte d’escalier : lorsque les contremarches sont de plus en plus grandes, c’est que le mobile accélère ; lorsqu’elles sont de plus en plus petites, c’est qu’il décélère. Ici encore, ce raisonnement deviendra contestable à la situation IV. Néanmoins, il sera utile pour aborder la situation centrale de notre ingénierie, comme nous le verrons lors de l’analyse a priori des situations II et III. Puisque la question est ouverte dans son énoncé, il est possible que, livrés à eux-mêmes, certains élèves se limitent à ne décrire par exemple que la position et la vitesse du mobile. C’est alors au professeur ou à l’expérimentateur d’intervenir auprès de ces élèves pour leur demander de considérer également son accélération. - 248/709 - 8.1. Situation I 8.1.2.2 Pas de vitesses négatives Nous aurions pu considérer des positions qui augmentent puis qui diminuent, si bien que nous aurions eu des vitesses positives et négatives. Cependant, nous avons estimé que la présence de vitesses négatives compliquerait prématurément les choses pour les élèves et nous avons décidé de reporter la question à la situation IV. Ainsi, la loi de mouvement proposée aux élèves dans la situation I ne présente que des vitesses positives (ou nulles). Une conséquence de ce choix didactique est que la variation de position est égale à la distance parcourue. On peut le voir comme un avantage, puisqu’on pourra parler indistinctement de distance parcourue ou de position. On peut aussi le voir comme un inconvénient puisqu’une variation de position peut être négative (elle le sera par moment dans la situation IV) tandis qu’une distance est toujours positive. En particulier, chez certains élèves qui ont pris l’habitude d’écrire que la vitesse est la distance parcourue divisée par le temps, outre la question de savoir de quelle vitesse il s’agit, se posera le problème de son signe qui serait dès lors toujours positif. 8.1.2.3 Pente d’une courbe Pour le moment, la seule pente institutionnalisée comme telle auprès des élèves est celle d’une droite ; encore lui préfère-t-on le nom de coefficient angulaire. Pourtant, même s’il ne peut s’agir que d’une intuition, la notion de pente d’une courbe (et non plus seulement d’une droite) peut renseigner valablement sur la vitesse instantanée du mobile. Par exemple, lorsque la pente est nulle, c’est que la vitesse est nulle ; il serait intéressant d’observer que plus la pente est forte, plus la vitesse est grande et, inversement, que plus la pente est faible, plus la vitesse est faible. La pente d’une courbe aurait ainsi un rôle opérationnel dans l’évaluation d’une vitesse instantanée. Dans une version de référence de la situation I (Figure 2 ci-dessus), les seuls segments de droites que présente la loi de mouvement sont horizontaux. Autrement dit, le seul cas où la vitesse est constante est lorsque la vitesse est nulle. Les élèves ont alors une occasion de moins de saisir la nuance entre l’existence d’une pente à la courbe et le caractère éventuellement changeant de la vitesse : comment distinguer une vitesse constante mais non nulle d’une vitesse également non nulle mais changeant à tout instant ? Dans la version ultérieure de la situation I (Figure 2b ci-dessus), le segment de droite entre les instants t = 5 et t = 7 peut permettre d’installer plus facilement chez les élèves le fait que lorsque la pente de la courbe est constante, la vitesse l’est également. Cela se justifie facilement : si l’on découpe l’intervalle [5; 7] en petits sous intervalles de même longueur, la distance parcourue est à chaque fois la même. Réciproquement, si la vitesse est constante sur un intervalle de temps, la loi de mouvement sera une droite de pente égale à cette vitesse. Par conséquent, là où le graphique de la loi de mouvement n’est pas une droite, c’est que la vitesse de la particule n’est pas constante. Elle change tout le temps. Avant même de définir le concept de vitesse instantanée, force est de reconnaître qu’une telle vitesse existe. L’usage de la notion intuitive de pente à une courbe, visualisée par exemple avec la tranche de la main, permettra d’indiquer à tel endroit (c’est-à-dire à tel instant et à la position correspondante) la manière dont la courbe monte (ou descend, ce qui sera le cas à partir de la situation IV). Puisque la courbe monte, c’est que la position augmente ; - 249/709 - 8.1.2. Variables didactiques locales on pourra donc convenir que la vitesse à cet instant est positive. Cela est cohérent avec le fait que la vitesse moyenne est également positive sur tout intervalle de temps pendant lequel la position augmente (∆p et ∆t sont positifs). Inversement, lorsque la pente sera négative (voir situation IV), on pourra dire que la vitesse instantanée du mobile est négative. Par un raisonnement similaire, on peut convenir de dire que, lorsque la pente est de plus en plus positive (la concavité de la courbe est alors tournée vers le haut), c’est que la vitesse instantanée augmente tandis que, lorsque la pente est de moins en moins positive (la concavité est tournée vers le bas), c’est que la vitesse instantanée diminue. On verra avec la situation IV que le sens de la concavité donne le même résultat lorsque la pente est négative, mais que l’intuition peut être mise à mal. Enfin, à l’instant correspondant à endroit où la concavité cesse d’être tournée vers le haut pour se tourner vers le bas, la vitesse instantanée est maximale (ici encore, pour ne pas compliquer les choses prématurément, le cas où l’on passe d’une courbe concave à convexe n’est abordé qu’à partir de la situation IV ; la vitesse est alors minimale). Cas particulier : lorsque la pente est nulle, c’est que la vitesse à cet instant est nulle. Ainsi, le préconstruit pente de la courbe peut jouer un rôle important dans la lecture du graphique d’une loi de mouvement en donnant non seulement le signe de la vitesse instantanée, mais aussi le sens de sa croissance, voire une estimation (au moins) de sa valeur numérique. 8.1.2.4 Position initiale non nulle Nous avons choisi de donner à la position initiale une valeur non nulle, d’abord pour une raison pratique : en partant d’une position nulle, pendant les premières secondes, le graphique de la loi de mouvement se confondrait avec l’axe du temps, si bien que l’on pourrait se demander pourquoi ne pas avoir choisi comme instant initial celui où le graphique commence à se distinguer de l’axe du temps. Ensuite, nous avons choisi une position initiale négative pour ne pas la prendre positive. En effet, la loi de mouvement proposée aux élèves ne présentant que des vitesses positives (ou nulles), en prenant une position de départ positive, les positions auraient toutes été positives. Notre crainte, dès lors, était que cela puisse induire chez les élèves une confusion entre le signe de la position et celui de la vitesse. Ainsi, en considérant des positions négatives et positives tandis que la vitesse reste positive, nous pensons réduire le risque d’une telle confusion. 8.1.2.5 Lecture spatiale Le temps, variable indépendante s’il en est, est placé sur l’axe des abscisses, tandis que la position est donnée sur l’axe vertical des ordonnées. Il est possible que certains élèves considèrent le graphique comme s’il s’agissait d’une carte géographique, en particulier s’ils sont peu habitués à des graphiques où le temps est en abscisse. Dans ce cas, l’élève dira par exemple que la particule « monte » ou qu’elle « tourne à gauche ». Ce type d’erreur a été rencontré en Propédeutique (à l’entrée à l’université ; voir à la section 1.1, p. 30). - 250/709 - 8.2. Situation II 8.1.2.6 Institutionnalisation de la vitesse moyenne À la fin de l’étude de la situation I, il sera utile d’institutionnaliser la notion de vitesse moyenne comme le taux de variation de la position par rapport à la variation du temps, non seulement parce que ce concept aura été abordé et permettra de le distinguer plus clairement du concept embryonnaire de vitesse instantanée, mais aussi parce que les élèves, dans les situations II et III, seront amenés à la calculer analytiquement. Mais l’institutionnalisation ne s’arrête pas là. La mise en commun faite à la fin de la situation I permet d’informer l’ensemble des élèves des démarches qui ont été observées et qui sont jugées pertinentes ou symptomatiques par le professeur, ainsi que d’autres raisonnements ou intuitions qui n’auraient pas été observées dans la classe mais qui sont nécessaires ou du moins utiles avant d’aborder les situations suivantes. 8.1.2.7 Conclusion À l’issue de cette première situation, non seulement sur base du travail effectué par les élèves, mais aussi, suite à l’institutionnalisation faite par le professeur, nous pouvons faire l’hypothèse que les élèves sauront désormais décrypter le caractère uniforme (au sens de la vitesse) ou non d’une loi de mouvement selon que son graphique est rectiligne ou non. De plus, nous faisons l’hypothèse que la justification qui aura été faite graphiquement de l’accélération/décélération par la construction d’un ou plusieurs escaliers aura une influence sur certains élèves quant à la mise au point d’une stratégie pour résoudre les situations II et III. La situation I doit permettre de créer un milieu, c’est-à-dire de rendre intelligible les graphiques d’autres lois de mouvement, du moins jusqu’à un certain point ; autrement dit, de permettre que les élèves soient en mesure d’aborder la nouvelle situation en terrain connu, donc avec un certain degré d’autonomie. En particulier, les élèves auront été amenés à analyser la courbe d’une loi de mouvement pour en extraire des informations quant à la variation de la vitesse et au signe de l’accélération. En revanche, en dehors du cas trivial où la particule est à l’arrêt et, éventuellement, du cas où la vitesse est constante, il est délicat de mesurer la vitesse de la particule à un instant quelconque donné : même si le préconstruit pente d’une courbe était bien accepté par les élèves, comment déterminer précisément cette pente à un instant donné ? Tel est l’objectif visé par les situations II et III. 8.2 Situation II 8.2.1 Description La situation II s’intitule « Deux particules et une vitesse ». Elle s’articule en deux parties : une « Approche graphique » et une « Approche analytique ». En voici l’énoncé : - 251/709 - 8.2.2. Variables didactiques locales II.1 Approche graphique « Considérons à présent deux particules P1 et P2 qui se déplacent sur un axe orienté comme à la figure 1. Leurs positions respectives p1 et p2 en fonction du temps sont données par les graphiques de la figure 3. Figure 3 Décrire les mouvements de ces deux particules. Y a-t-il un ou des moments où ces deux particules ont la même vitesse ? Justifier. Estimer ce ou ces moments ». II.2 Approche analytique « Considérons deux particules P1 et P2 qui se déplacent sur un axe orienté comme à la figure 1. Leurs positions respectives p1 et p2 en fonction du temps sont données par les fonctions p1 (t) = t√2 p2 (t) = 3·t Décrire les mouvements de ces deux particules. À quel moment ces deux particules ont-elles la même vitesse ? Justifier. Quel est l’avantage de connaître les expressions analytiques des positions de P1 et P2 ? » 8.2.2 Variables didactiques locales Comme annoncé au chapitre précédent, la première question posée n’est pas, de manière directe, de demander quelle est la vitesse d’un mobile à un instant donné mais, de manière détournée, de demander à quel instant les deux mobiles ont la même vitesse. Nous n’y reviendrons pas. En revanche, le principal enjeu de notre analyse a priori de cette situation, inséparablement unie à la situation III, est d’en montrer le caractère adidactique et fondamental, c’est-à-dire que seul le savoir visé (un calcul de type infinitésimal) doit permettre de résoudre le problème proposé. - 252/709 - 8.2. Situation II 8.2.2.1 Deux parties successives Tout d’abord, non seulement la situation II a été scindée en deux parties mais ces parties sont successives, c’est-à-dire que l’énoncé de la deuxième n’est connu des élèves qu’une fois la première partie terminée. En effet, il est possible de résoudre la question posée dès l’approche graphique, avant même de connaître les expressions algébriques des lois de mouvement. Cette résolution n’est pas numérique, ce qui ne retire rien à la précision formelle de la réponse : même si la résolution graphique ne permet pas de donner la valeur numérique de l’instant où les deux mobiles ont la même vitesse, il est possible de montrer qu’il existe un unique instant où les vitesses sont égales, de visualiser (approximativement) cet instant et de qualifier avec précision cet instant : par exemple, en disant que c’est l’instant où l’écart entre les deux particules est maximum. D’autre part, connaître prématurément les lois de mouvement priverait les élèves de s’investir dans le milieu graphique. D’ailleurs, résoudre la deuxième partie sans avoir résolu la première nous semble une gageure : en effet, les élèves ne connaissent pas nécessairement l’expression de la vitesse pour une loi de mouvement donnée ; certes, au cours de physique, il arrive qu’ils rencontrent les expressions toutes faites de la vitesse, notamment pour les mouvements rectilignes uniformes et, comme ce sera le cas ici, les mouvement rectilignes uniformément accélérés. Dans le meilleur des cas, ils emploieraient une formule sans en connaître la raison d’être. Au contraire, une fois la première partie résolue, connaître les expressions algébriques permet d’appliquer analytiquement les stratégies envisagées lors de la première partie. Enfin, la résolution graphique, en plus de suggérer le mode de résolution analytique, offre la possibilité de vérifier que le résultat obtenu par calcul est plausible : pour cela, il suffit de graduer l’axe du temps. Par exemple, si l’instant estimé est un peu avant l’instant 1 et que le résultat numérique est 2, il y aura des raisons de penser qu’une erreur s’est glissée quelque part. 8.2.2.2 Deux points d’intersection Sur base de la situation I, la description des mouvements proposés ne devrait pas poser de problème majeur. À l’instant initial, les deux mobiles occupent la même position. À partir de là, l’un évolue à vitesse constante (graphique rectiligne) tandis que l’autre a une vitesse variable (courbe arrondie), d’abord nulle, puis croissante, au point que ce second mobile finit par rattraper et dépasser le premier. La présence du second point d’intersection, seul point saillant de la figure, et l’habitude que pourraient avoir les élèves d’un contrat didactique trop classique font que l’on peut s’attendre à ce que certains élèves pensent que l’instant cherché correspond à ce point d’intersection. Une fois cet écueil surmonté sur base de l’expérience acquise à la situation I — en considérant la vitesse moyenne des deux mobiles (égale au moment de la seconde intersection), la vitesse constante de P2 (donc égale à la vitesse moyenne) et la croissance permanente de la vitesse de P1 —, plusieurs stratégies nous semblent envisageables par les élèves. - 253/709 - 8.2.2. Variables didactiques locales 8.2.2.3 Plusieurs stratégies envisageables Stratégie des marches d’escalier. Plusieurs approches graphiques conduisent à déterminer l’instant où les particules ont la même vitesse. Cependant, une seule d’entre elles peut conduire à un calcul de type infinitésimal. Cette stratégie s’appuie sur la dernière façon de justifier l’accélération que nous avons indiquée lors de l’analyse a priori de la situation I (cf. section 8.1.2.1, p. 248). L’idée est d’observer les variations de position respectives des particules sur de petits intervalles de temps identiques, ainsi que suggéré à la figure suivante : Plusieurs variantes de cette stratégie sont possibles. Par exemple, on peut dire que, lorsque le déplacement est identique pour les deux mobiles (c’est-à-dire lorsque les hauteurs des contremarches de ces escaliers imaginaires sont égales pour un même intervalle de temps), c’est qu’on n’est pas loin de l’instant où les vitesses instantanées sont les mêmes. Et, plus on diminue l’intervalle de temps fixé, meilleure sera la précision pour repérer l’instant cherché. Néanmoins, cette stratégie ne permet pas de visualiser avec précision l’instant cherché. Une autre variante est de s’exprimer en termes de vitesses moyennes plutôt qu’en termes de distances parcourues : lorsque la vitesse moyenne est identique (c’est-à-dire lorsque les pentes des segments qui relient une marche à sa contremarche sont égales pour un même intervalle de temps), c’est qu’on n’est pas loin de l’instant où les vitesses instantanées sont égales. Ici aussi, plus on diminue l’intervalle de temps fixé, meilleure sera la précision pour repérer l’instant cherché mais il n’est toujours pas possible de visualiser exactement l’instant cherché. Stratégie des droites parallèles. La deuxième approche correspond davantage à l’un des objectifs visés par la situation I : considérer la vitesse instantanée en termes de pente à la courbe de la loi de mouvement. Dans ce cas, l’instant t0 cherché est celui pour lequel la courbe relative à P1 possède une pente égale à la vitesse constante de P2 , c’est-à-dire égale à la pente de la droite correspondant à P2 . On voit bien ici l’intérêt annoncé au chapitre précédent de comparer un mouvement à vitesse variable à un mouvement à vitesse constante. - 254/709 - 8.2. Situation II Plusieurs variantes de cette stratégie sont envisageables : On peut, par exemple, prendre une latte 1 et la déplacer parallèlement à la droite p = p2 (t) jusqu’à ce qu’elle représente la pente à la courbe, c’est-à-dire jusqu’à ce qu’il ne reste, dans le cas présent, qu’un point de contact avec la courbe de P1 . L’abscisse de ce point est l’instant cherché. Une seconde variante consiste à placer une latte qui matérialise la pente de la courbe de P1 : cette droite est d’abord horizontale, puisque la vitesse de ce mobile est initialement nulle ; puis cette droite se déplace tangentiellement à la courbe, avec une pente de plus en plus importante. L’instant cherché est celui où la pente est précisément la même que la pente de la droite p = p2 (t). Voici une troisième variante : considérons des droites de même coefficient angulaire que la droite p = p2 (t), comme suggéré à la figure suivante. Si l’une de ces droites est sécante à la courbe de p1 (t), ses points d’intersection avec celle-ci déterminent un intervalle de temps sur lequel la vitesse moyenne de P1 vaut celle de P2 . Étant donné que P1 accélère sans cesse, sa vitesse instantanée sur cet intervalle croît à partir d’une valeur inférieure à celle de P2 jusqu’à une valeur qui lui est supérieure. Elle sera donc égale à celle de P2 à un instant donné de cet intervalle. L’idée est alors de réduire l’intervalle à un point, en déterminant une droite de même pente que p = p2 (t) qui ne rencontre la courbe p = p1 (t) qu’en un seul point. Quelle que soit la variante envisagée, cette stratégie permet de trouver l’instant cherché avec précision et non un intervalle, même petit, proche de l’instant cherché. 1. une règle, en France - 255/709 - 8.2.2. Variables didactiques locales Stratégie de l’écart maximum. Cette stratégie consiste à observer l’écart entre les deux particules. Il se matérialise, à n’importe quel instant, par le segment perpendiculaire à l’axe des temps et qui va d’une courbe à l’autre. L’instant cherché est celui où l’écart entre les positions est maximal. En effet, à t = 0, les deux particules sont au même endroit. Ensuite, l’écart entre elles croît : P1 évolue donc à une vitesse inférieure à celle de P2 qui est constante. Dès le moment où l’écart diminue, c’est le contraire, c’est-à-dire que la vitesse de P1 devient supérieure à celle de P2 . Donc la vitesse de P1 est égale à celle de P2 à l’instant t0 où l’écart cesse de croître pour commencer à décroître. Ici aussi, on a trouvé un instant précis et non un intervalle petit proche de l’instant cherché. Ainsi, les deux dernières stratégies envisagées sont optimales dans la mesure où elle permettent d’isoler l’instant cherché, tandis que la première stratégie (celle des marches d’escalier) ne permet que de trouver un intervalle dans lequel se trouve l’instant cherché. 8.2.2.4 Un coefficient angulaire irrationnel Introduire un irrationnel, en l’occurrence le coefficient angulaire de la loi de mouvement p2 (t), a pour but d’éviter que les élèves, souvent enclins à utiliser leur calculette, cherchent la réponse au problème par tâtonnement numérique ; spécialement ceux qui auront choisi la stratégie des marches d’escalier. hAinsi, si l’on avait pris p2 (t) = 34 · t, les vitesses moyennes i des deux mobiles sur l’intervalle 1 1 4; 2 auraient été égales ce qui conduit à conjecturer que la 3 8, réponse cherchée est t = sans devoir recourir au savoir visé. Cette conjecture est correcte pour une loi de mouvement du second degré mais, de même que dans le cas de la quadrature de la parabole par Archimède où le découpage opéré n’était valable que dans le cas d’une parabole (cf. paragraphe 3.3.1.2, p. 56), elle ne l’est plus avec une loi de mouvement de degré différent de 2. - 256/709 - 8.2. Situation II 8.2.2.5 Un calcul simplifié par le choix d’une fonction du second degré Les stratégies précédentes peuvent être mise en œuvre graphiquement pour pratiquement n’importe quelle configuration dans laquelle une loi de mouvement est uniforme (au sens de la vitesse) tandis que l’autre est à vitesse variable. Pour simplifier le travail des élèves, on garantit l’unicité de l’instant cherché en prenant une loi de mouvement strictement monotone. En particulier, il n’est pas nécessaire de considérer une fonction du second degré pour modéliser le mouvement à vitesse variable. Néanmoins, algébriquement, nous allons voir que les stratégies des droites parallèles et de l’écart maximum ne sont plus à la portée des élèves visés au-delà du second degré. Calcul par la stratégie des droites parallèles. Une fois les expressions analytiques des lois de mouvement données aux élèves, la stratégie des droites parallèles, du moins dans la dernière variante que nous avons envisagée, revient à exprimer qu’une droite dont le coefficient angulaire est connu (c’est la vitesse constante de l’autre mobile), a un unique point d’intersection avec la courbe représentative de la loi de mouvement à vitesse variable. En appelant k l’ordonnée à l’origine de la droite cherchée, l’intersection est donnée par l’équation √ 3 · t + k = p1 (t). Dans le cas où p1 (t) est une fonction du second degré, les élèves sont supposés être en mesure de la résoudre. Nous avons, dans la cadre de la situation II, p1 (t) = t2 , √ ce qui nous donne l’équation : 3 · t + k = t2 . Elle a une unique solution si et seulement si le réalisant/discriminant vaut zéro, c’est-à-dire 3 + 4k = 0. La valeur de t correspondante vaut √ 3 alors 2 . Calcul par la stratégie de l’écart maximum. Avec la stratégie de l’écart maximum, il √ convient d’exprimer l’écart de position à un instant t quelconque. Cet écart est e(t) = 3 · t − p1 (t). Ici encore, le public visé n’est en mesure de déterminer un maximum (ou un minimum) que dans le cas où il a affaire à une parabole car il en connait alors le sommet, du √ b moins théoriquement, à « − ». Comme précédemment, on obtient l’instant cherché t0 = 23 . 2a 8.2.2.6 Validation pragmatique Calcul par la stratégie des marches d’escalier. Il nous reste à traiter du calcul algébrique qui peut être fait par les élèves qui feraient appel à la stratégie des marches d’escalier. Prenons par exemple la variante qui consiste à égaler les vitesses moyennes pour les deux mobiles. Appelons ∆p1 la variation de position de p1 et ∆p2 la variation de position de p2 entre les instants t et t + ∆t. On a vm1 = (t + ∆t)2 − t2 2t · ∆t + (∆t)2 ∆p1 = = ∆t ∆t ∆t et vm2 ∆p2 = = ∆t √ 3 (t + ∆t) − ∆t - 257/709 - √ 3·t √ = 3 · ∆t . ∆t On cherche le moment où les vitesses moyennes sont égales. On égale donc vm1 à vm2 : √ √ 2t · ∆t + (∆t)2 3 · ∆t vm1 = vm2 ⇔ = ⇔ 2t + ∆t = 3. ∆t ∆t Ces calculs sont théoriquement à la portée des élèves. En revanche, l’étape suivante n’est peut-être pas aussi acceptable à leurs yeux. Il s’agit d’une version très semblable à la méthode d’adégalisation de Pierre de Fermat (cf. section 3.5.2, p. 79) : Puisque l’égalité doit être vérifiée pour des ∆t √ aussi petits soient-ils, pourquoi ne pas envisager de rendre ∆t nul, ce qui donne alors t = 23 . Une telle procédure risque de paraître bizarre aux élèves puisqu’il s’agirait de supprimer un terme (∆t) dans un des membres de l’équation, sans compensation dans l’autre membre. Avant son annulation, en prenant le terme ∆t très proche de zéro, ne commettrait-on pas qu’une très petite erreur. Oui, mais une erreur quand même alors. . . Il y a là un passage en acte à la limite qui peut conduire à un √ débat dans la classe. En particulier, si erreur il y a, même minime, le résultat obtenu, t = 23 , est-il bien √ l’instant exact où la particule P1 a une vitesse égale 3 ? D’où la nécessité de pouvoir vérifier le résultat par d’autres moyens, à savoir les autres stratégies envisagées, lesquelles fournissent bien la même réponse, sans être entachées d’un doute méthodologique. 8.2.2.7 Conclusion Ainsi, la situation II permet d’introduire une stratégie (celle des marches d’escalier) conduisant à la mise en place d’une procédure à caractère infinitésimal, qui est le savoir visé. Graphiquement, cette stratégie conduit à obtenir un intervalle contenant l’instant cherché au lieu de pointer un instant bien identifié. De plus, algébriquement, la procédure mise en place revient à annuler un terme qui, d’abord non nul (sinon, l’égalité de départ n’a aucun sens), est ensuite (une fois faites toutes les simplifications algébriques) pris égal à zéro ! Sans parler de l’écriture algébrique proprement dite qui n’est pas légère. Cette stratégie n’est donc manifestement pas optimale comparée aux deux autres (celles des droites parallèles et de l’écart maximum, grâce au choix d’une fonction du second degré pour modéliser la loi de mouvement à vitesse variée). Ainsi, la situation II n’a pas le caractère fondamental que l’on pourrait espérer. Néanmoins, grâce à la validation pragmatique fournie par les deux autres stratégies envisagées, la procédure mise en place par la stratégie des marches d’escalier a de l’avenir. Pour la rendre optimale et donner ainsi son caractère fondamental au problème posé, il reste à rendre caduque les deux autres stratégies. C’est l’objet de la situation III. 8.3 8.3.1 Situation III Description La situation III s’intitule « Deux autres particules et une vitesse ». Les approches graphique et analytique y sont fusionnées. - 258/709 - 8.3. Situation III « Considérons à présent deux particules P1 et P2 qui se déplacent sur un axe orienté comme à la figure 1. Leurs positions respectives p1 et p2 en fonction du temps sont données par les fonctions p1 (t) = p2 (t) = t3 3 4 ·t selon les graphiques de la figure 4. Figure 4 À quel moment ces deux particules ont-elles la même vitesse instantanée ? Justifier. Quelle est la vitesse de P1 à t = 1, 5 ? » 8.3.2 8.3.2.1 Variables didactiques locales Une loi de mouvement du troisième degré : invalidation des stratégies non infinitésimales Les graphiques proposés ressemblent fort aux graphiques de la situation précédente. C’est pourquoi toutes les stratégies graphiques précédentes restent valables. Ce qui change principalement 2 ici est que la particule P1 a pour loi de mouvement une fonction du troisième degré. On pourrait légitimement se demander si une loi de mouvement du troisième degré a un sens concret en physique. En effet, un corps en chute libre ou un boulet tiré par un canon sont modélisés par une fonction du second degré. Il y a peu de lois de mouvement régies par une fonction du troisième degré. Cependant, un exemple, et non des moindres, est celui du vase √ 2. Pour faciliter les calculs ultérieurs, la vitesse de P2 est de 3/4 au lieu de 3 ; avec une fonction du troisième degré, l’écueil envisagé à la situation II (section 8.2.2.4, p. 256) n’est plus d’actualité, la procédure infinitésimale ayant déjà été construite. - 259/709 - 8.3.2. Variables didactiques locales conique. C’est d’ailleurs un défaut du problème homonyme de mettre en place dès le départ un calcul difficile et lourd pour les élèves. Par ailleurs, à l’instar de Galilée, comme nous l’avons dit plus haut (section 7.2, p. 232), nous ne nous prononcerons pas sur les « causes » du mouvement, par exemple les forces en présence ; c’est le propre de la cinématique. Nous faisons ici une expérience de pensée, dans un contexte cinématique, mais qui ne prétend pas être un résultat de physique expérimentale. Les mouvements considérés ici sont symbolisés et modélisés par des graphiques ou des expressions analytiques de fonctions simples 3 . L’étude de ces mouvements est un prétexte à développer un savoir autre. Il s’agit à présent de considérer ce que deviennent les calculs analytiques fait précédemment pour chacune des stratégies envisagées. Stratégie des droites parallèles. La recherche d’une droite de pente 43 n’ayant qu’un point commun avec p1 (t) = t3 conduit à exprimer que l’équation 43 t + k = t3 , du troisième degré, possède une solution unique ; les élèves ne savent pas résoudre une telle équation 4 Stratégie de l’écart maximum. Les écarts de position sont exprimés par la fonction 3 3 4 t − t . Or, à ce stade des connaissances des élèves, on ne sait si une telle fonction a ou non un maximum local et, si oui, à quel instant. Stratégie des marches d’escalier. Égaler les vitesses des deux particules sur des intervalles de temps identiques de durée ∆t revient 5 , on l’a vu plus haut, à écrire que vm1 = vm2 , ∆p2 1 c’est-à-dire que ∆p ∆t = ∆t . Sachant que ∆p1 (t + ∆t)3 − t3 3t2 · ∆t + 3t · (∆t)2 + (∆t)3 = = ∆t ∆t ∆t et que ∆p2 3 ∆t = · , ∆t 4 ∆t cette égalité conduit à 3 3t2 + 3t · ∆t + (∆t)2 = . 4 Si l’on prend ∆t = 0, on obtient t = 12 . 3. Le problème du vase conique est également une expérience de pensée mais qui part de données plus brutes, à savoir un schéma où l’on voit un cône et, au-dessus, l’arrivée d’un tuyau d’où coule l’eau qui remplit le cône. 4. En réalité, il existe un autre moyen de résoudre la question en considérant l’entièreté des courbes des fonctions ; alors il y a deux intersections (dont une double) entre la droite et la fonction cube et l’instant cherché est la racine double de la fonction t3 − 43 t − k. Cette fonction peut donc s’écrire (t − a)2 (t − b) où a est la racine double cherchée et b l’autre racine ; par identification terme à terme on détermine a, b et k. Néanmoins, la considération de racines doubles n’appartient a priori pas à la culture des élèves en secondaire. 5. Il est également possible de considérer t2 − t1 où t1 est la borne inférieure de l’intervalle de temps considéré et t2 en est la borne supérieure. Dans ce cas, on considère t2 très proche de t1 et, une fois faite les simplifications algébriques possibles des termes t2 − t1 , on prend t2 = t1 pour obtenir l’instant cherché (t1 remplaçant t). - 260/709 - 8.3. Situation III 8.3.2.2 Validation Contrairement à la situation II, il nous est désormais difficile de contrôler la validité du résultat qui vient d’être obtenu puisque, analytiquement, les stratégies non infinitésimales ne fonctionnent plus. On peut juste se dire que, d’une part, la stratégie des marches d’escaliers a été validée précédemment et que rien n’a changé en termes de méthode en passant d’un second à un troisième degré ; d’autre part, puisque ∆t est aussi proche de 0 qu’on le veut, le résultat trouvé n’est pas absurde. Enfin, les graphiques, sans apporter une preuve définitive, donnent une indication de la cohérence de la réponse. Tout cela est néanmoins faible en regard des canons modernes de rigueur. C’est pourtant ainsi qu’ont procédé de nombreuses générations de mathématiciens jusqu’au XVIIIe siècle inclus, comme nous l’avons vu dans les Éléments d’histoire de l’analyse au début de notre travail (par exemple Fermat : cf. section 3.5.2, p. 79). C’est que nous nous situons ici dans le cadre de praxéologies-modélisation pour lesquelles une validation pragmatique est loin d’être négligeable. 8.3.3 La valeur d’une vitesse à un instant donné Vient alors une seconde question : celle de connaître la vitesse de la particule P1 à l’instant t = 1, 5. C’est là un tournant majeur dans le temps didactique puisqu’il s’agira bientôt d’écrire l’expression d’une vitesse instantanée ! Reprenons la Situation II et la particule dont la loi de mouvement est la fonction p (t) = t2 . Le travail précédent nous donne une idée pour évaluer sa vitesse en un instant donné t, que nous noterons v (t). Elle consiste à annuler ∆t dans l’expression de sa vitesse moyenne sur [t; t + ∆t] : (t + ∆t)2 − t2 vm = = 2t + ∆t, ∆t ! √ √ 3 ce qui donne v (t) = 2t et, en particulier v = 3. 2 On peut ainsi tester la légitimité de ce calcul sur le résultat trouvé précédemment : on √ √ 3 avait obtenu à la situation II que la vitesse de la particule P1 valait 3 à t = 2 . Pour ce qui est de la particule dont la loi de mouvement est p (t) = t3 , nous appliquons la même procédure : on part de (t + ∆t)3 − t3 = 3t2 + 3t∆t + (∆t)2 , ∆t 1 3 pour arriver à v (t) = 3t2 . En particulier, v = . 2 4 De nouveau, on constate que ce calcul corrobore le résultat trouvé dans la première partie de la Situation III : la vitesse du mobile P1 valait 34 à t = 21 . Cette façon de calculer une vitesse variable en un instant donné possède une certaine légitimité du seul fait qu’elle donne des résultats probants dans des cas particuliers significatifs. Par exemple, pour p (t) = t2 , nous pouvons imaginer une validation semblable à celle développée avec la Situation II pour n’importe quelle valeur de t : par exemple, on prouvera que la vitesse vaut 2 en t = 1 en prouvant que l’instant auquel la vitesse vaut 2 est effectivement t = 1. vm = - 261/709 - 8.3.3. La valeur d’une vitesse à un instant donné 8.3.3.1 Validation par double réduction à l’absurde Pour terminer, proposons un argument supplémentaire, à la manière des Anciens, par double réduction à l’absurde. Cet argument est basé sur l’intuition que le mobile correspondant à p (t) = t3 accélère à tout instant. Prenons t = 1 : la vitesse supposée, donnée par v (t) = 3t2 , serait donc égale à 3. Supposons par l’absurde que cette vitesse est strictement supérieure à 3, c’est-à-dire égale à 3 + ε où ε > 0. Alors, en choisissant une valeur de ∆t suffisamment petite, on pourrait rendre 3 + 3∆t + (∆t)2 , c’est-à-dire vm entre t = 1 et t = 1 + ∆t, inférieure à 3 + ε, ce qui contredirait le fait que le mobile accélère et donc que sa vitesse moyenne sur [1; 1 + ∆t] ne peut être que supérieure à sa vitesse en t = 1. Comme ce raisonnement peut être fait pour toute valeur de ε, si petite et positive soit-elle, cela signifie que la vitesse du mobile ne peut être strictement supérieure à 3. On justifie de la même manière qu’elle ne peut être strictement inférieure à 3 en prenant ∆t < 0 suffisamment petit et en rendant 3+3∆t+(∆t)2 plus grand que 3−ε. En outre, rien n’empêche de faire un tel raisonnement pour d’autres valeurs de t. Fort de ces raisons, il est possible alors d’officialiser — c’est-à-dire de définir — la formule donnant la vitesse instantané à un instant t d’un mobile ayant p (t) pour loi de mouvement. 8.3.3.2 Vitesse instantanée d’un mobile Soit un mobile P dont la loi de mouvement est donnée par la fonction p (t). Nous avons ∆p vu que sa vitesse moyenne sur l’intervalle de temps [t; t + ∆t] est donnée par ; on l’appelle ∆t aussi taux moyen de variation de la position de P . Le résultat obtenu en supprimant de cette expression les termes contenant ∆t, une fois faites toutes les simplifications algébriques classiques, s’appelle vitesse instantanée de P à l’instant t ou taux instantané de variation 6 de la position de P par rapport au temps à l’instant t. On dit qu’il s’agit de la limite lorsque ∆t tend vers 0 du taux de variation moyen de la position de P et on l’écrit ∆p . ∆t→0 ∆t v(t) = lim Cette nouvelle loi s’appelle loi de vitesse du mobile P . Telle est l’institutionnalisation qui peut être faite à l’issue de la situation III. Bien entendu, on ne remplace pas ∆t par 0 avant les simplifications algébriques car, sinon, on ne verrait rien du tout : on aurait 0 au numérateur et au dénominateur. On remarquera aussi que l’expression « lim » n’est pas ici une définition complète de la limite mais que cette définition provisoire convient déjà pour beaucoup de fonctions. Le concept institutionnalisé de limite n’est définitivement pas nécessaire pour traiter de vitesse et, plus loin, de dérivée. Cela est conforme à l’histoire des mathématiques qui a vu le concept de dérivée émerger avant même celui de limite. Il s’agit d’une limite en acte. Bien entendu, par la suite, lorsque viendra le temps (didactique) de mettre en ordre les concepts rencontrés, à l’instar de Cauchy, la limite sera définie et, à partir d’elle, la dérivée également. Nous serons retourné dans le cadre de praxéologies-déduction, ce qui sort du cadre de notre étude. 6. Par abus de langage, on dit habituellement « taux de variation instantané. . . » et nous suivrons habituellement cet usage. - 262/709 - 8.4. Situation IV 8.3.4 Conclusion En passant d’une fonction du second degré à une fonction du troisième degré, nous avons donné au savoir visé un caractère fondamental puisque le seul moyen de résoudre le problème analytiquement aura été d’utiliser la stratégie — de type infinitésimale — des marches d’escalier. Nous en serons également venus à définir la vitesse instantanée. Il ne s’agit pas, nous l’avons signalé ci-dessus, d’une définition canonique, mais d’une décision : celle que, en prenant ∆t = 0 dans l’expression de la vitesse moyenne, une fois faite toutes les simplifications algébrique, on obtient ce qu’on appellera désormais la vitesse instantanée. Une définition peut être arbitraire. Cependant, une définition n’est utile que si elle facilite la communication entre les personnes qui en font usage. Ici, la définition proposée reste conforme à la définition physique de la vitesse instantanée. L’institutionnalisation de la vitesse instantanée qui aura ainsi été faite ne signifie pas nécessairement que tous les élèves accepteront facilement sa définition et son champ d’opérationnalité. C’est du moins l’avis du groupe AHA (1999a, pp. 74-77) pour plusieurs raisons que nous avons déjà abordées dans notre recherche : la vitesse est une grandeur intensive et elle échappe à l’univers des sens et des mesures (cf. section 6.4, p. 225) alors que l’esprit humain se refuse souvent à« circonscrire avec précision quelque chose que les sens n’appréhendent que très imparfaitement » (Groupe AHA 1999a, p. 76). En particulier, aucun instrument n’est capable de mesurer une vitesse instantanée. « Seul l’esprit peut dépasser l’expérience : c’est une décision d’appeler vitesse instantanée l’expression obtenue en posant purement et simplement ∆t égal à 0 dans l’expression simplifiée de la vitesse moyenne. C’est là un concept imaginé par l’être humain pour répondre à une question qui relève de l’instantané (si insaisissable pratiquement que les mesures ne peuvent que s’en approcher sans l’atteindre). Cette démarche paraîtra sans doute inhabituelle au lecteur. Car on s’imagine souvent qu’il suffit d’observer « les choses de la nature » pour en tirer des concepts immédiatement disponibles pour raisonner » (Groupe AHA 1999, p. 112). 8.4 Situation IV 8.4.1 Description La situation IV s’intitule « Un mouvement plus complet ». Nous y rencontrons une loi de mouvement qui n’est plus monotone. En voici l’énoncé : « Nous allons nous intéresser au mouvement (plus compliqué qu’à la première section) d’une particule sur un axe comme à la figure 1. On pourra considérer par exemple que les unités sont le mètre pour la position et la minute pour le temps. Décrire par des phrases en français et le plus complètement possible le mouvement du mobile spécifié par le graphique de la figure 5. En particulier, donner des indications quant à la position, la vitesse et l’accélération du mobile ». - 263/709 - 8.4.2. Variables didactiques locales Figure 5 8.4.2 8.4.2.1 Variables didactiques locales Une copie partielle de la situation I La première moitié de la courbe est semblable à celle qui a été proposée à la situation I. En effet, les élèves pourront ainsi reprendre le raisonnement qu’ils auront alors utilisé. On peut également penser que des élèves, parmi les plus avancés, auront recours à une lecture plus symbolique de la courbe, à savoir en termes de pente (pour y voir une vitesse positive) et de concavité (pour y voir une accélération ou une décélération) ; le fait que l’allure de la première moitié de la courbe soit connue peut les aider à valider de tels outils. Notons que la position initiale a été choisie nulle, cette fois et que, la vitesse initiale étant nulle pendant plusieurs secondes, la courbe se confond un temps avec l’axe des abscisses : en effet, on peut penser que les élèves seront désormais familiers de ce type de décodage du graphique. 8.4.2.2 Des vitesses négatives La seconde moitié de la courbe est décroissante. Qu’est-ce que cela signifie en termes de vitesse ? Prenons un exemple, celui d’une balle lancée verticalement vers le haut. En simplifiant les lois de la physique à la seule force de gravitation, nous obtenons que la loi de mouvement est une fonction du second degré, représentée par une parabole dont le graphique est du type que voici : - 264/709 - 8.4. Situation IV Soit, par exemple, h (t) = −5t2 + 15t (t en secondes et h en mètres par exemple). Suivant un calcul analogue à ceux qui ont été faits aux situations II et III, nous pouvons exprimer la vitesse de cette balle : ∆h = lim (−10t − 5∆t + 15) , ∆t→0 ∆t ∆t→0 v(t) = lim soit v (t) = −10t + 15. Mais un tel résultat nous oblige à considérer des vitesses négatives. Loin de nous gêner, cette conséquence est commode. Ainsi, lorsque v (t) est positive, ici pour des valeurs de t comprises entre 0 et 23 , cela signifie que la balle monte ; quand cette vitesse est négative, c’est-à-dire pour des valeurs de t comprises entre 32 et 3, c’est que la balle redescend. Par exemple, si t = 1, la vitesse vaut 5 m/s ; si t = 2, la vitesse vaut −5 m/s. Le signe de la vitesse nous renseigne donc sur le sens du parcours, que ce soit celui d’une balle qui monte et qui descend, ou celui d’un mobile sur un axe gradué qui va vers la droite ou vers la gauche. Lorsque la hauteur de la balle est maximale, sa vitesse est nulle (dans notre exemple, en t = 23 ). Graphiquement, la vitesse est positive si et seulement si la courbe de la loi de mouvement est croissante ; elle est négative si et seulement si la courbe de la loi de mouvement est décroissante. Une telle interprétation du signe de la vitesse est très commode. 8.4.2.3 De l’interprétation de l’accélération Dans cette même seconde moitié du graphique proposée à la situation IV, la courbe est concave puis convexe. Que peut-on dire de l’accélération ? Le mathématicien n’a pas de problème pour répondre : c’est le sens de la concavité qui donne la réponse, à savoir que l’accélération est positive lorsque la courbe est convexe et elle est négative lorsque la courbe est concave, que la courbe soit croissante ou décroissante. À quoi peut-on s’attendre chez les élèves ? Nous pensons qu’il y aura débat en raison de leur expérience sensorielle, mais aussi d’une certaine dose de bon sens. Expliquons-nous. Dans le langage ordinaire, on parle plus souvent en termes d’accélération et de décélération qu’en termes d’accélération positive et d’accélération négative. Cela ne pose pas de problème d’interprétation lorsque l’on a affaire à une vitesse positive, mais bien lorsque la vitesse est négative. Ainsi, sur l’intervalle [7, 5; 10], le mobile accélère-t-il ou décélère-t-il ? Puisqu’avant il était à l’arrêt, on peut penser qu’il accélère... Mais, en termes de vitesse, puisque la pente est de plus en plus négative, c’est que la vitesse diminue ; alors, si l’accélération correspond à une variation de la vitesse comme la vitesse correspond à une variation de la position, l’accélération est négative... Qu’en disent les spécialistes que sont les physiciens ? Généralement, les physiciens considèrent l’accélération comme une grandeur vectorielle. Elle a donc une direction, un sens et une intensité (ou module ou norme). L’intensité est toujours positive ou nulle. Cependant, quand ils ont affaire à une question de cinématique unidimensionnelle comme c’est notre cas, les physiciens se passent des vecteurs ; ils sont alors confrontés - 265/709 - 8.4.2. Variables didactiques locales à la difficulté suivante : que représente une accélération négative ? Si l’on en croit le Dr. David P. Stern de la Nasa 7 , « le ralentissement est une accélération négative, également appelée décélération ». Pour Marc de Montigny, Associate Professor of Physics at Campus Saint-Jean, University of Alberta 8 , « un ralentissement, ou décélération, signifie une réduction de la grandeur de la vitesse. Ceci se produit lorsque le signe de [l’accélération] est opposé au signe de [la vitesse]. Ainsi, accélération négative n’est pas synonyme de ralentissement ». D’après le premier point de vue (celui du physicien américain), le signe de l’accélération indique la croissance/décroissance de la vitesse, que celle-ci soit positive ou non. Si l’accélération est positive et que la vitesse est positive, celle-ci deviendra de plus en plus positive, donc le mobile verra sa position augmenter de plus en plus vite ; si l’accélération est positive et que la vitesse est négative, celle-ci deviendra de moins en moins négative, donc le mobile (qui fait marche arrière) voit sa position diminuer de moins en moins vite. C’est ce « de moins en moins vite » qui est choquant : comment peut-on parler d’accélérer alors que l’on « va » de moins en moins vite ? De même, si l’accélération est négative et que la vitesse est positive, la vitesse sera de moins en moins positive, donc la position augmentera de moins en moins ; si l’accélération est négative et que la vitesse est également négative, la vitesse deviendra de plus en plus négative, donc la position diminuera de plus en plus vite. Ici, c’est le « de plus en plus vite » qui est choquant : comment peut-on parler de décélérer alors que l’on « va » de plus en plus vite ? Le point de vue choisi par le professeur américain est de voir avant tout l’accélération comme la « vitesse instantanée de la vitesse instantanée », sans se préoccuper de l’évolution de la position du mobile. Le professeur canadien considère l’accélération en fonction de l’évolution de la position : si l’accélération et la vitesse sont positives, la position augmente de plus en plus vite ; si l’accélération et la vitesse sont négatives, la position du mobile (qui fait marche arrière) diminue de plus en plus vite. Dans ces deux cas, la position du mobile évolue « de plus en plus vite », ce qui correspond mieux au sens commun. Si l’accélération est négative et la vitesse positive, la position augmente de moins en moins vite ; si l’accélération est positive et la vitesse négative, la position du mobile diminue de moins en moins vite. Dans ces deux derniers cas, le sens commun est également respecté. Ce point de vue permet également de donner des instructions du type « accélère » ou « freine » (décélération) au conducteur d’une automobile, qu’il soit en marche avant (vitesse positive) ou en marche arrière (vitesse négative). Il y a bien une pédale d’accélération et une pédale de frein sur toutes les voitures. Nous allons montrer que, néanmoins, le point de vue du physicien américain se défend aussi : lorsque que l’on est passager d’une voiture, observons ce que l’on ressent lorsque le conducteur accélère ou freine en marche arrière, et comparons cela à chaque fois avec ce que l’on ressent lorsque la voiture va en marche avant. Plaçons-nous d’abord dans le cas où la position diminue de plus en plus vite, donc lorsque, ayant enclenché la marche arrière, on appuie fortement sur l’accélérateur : on est comme projeté vers le pare-brise, exactement comme cela se produit lorsque, roulant en marche avant, on freine brusquement. Il n’est donc pas absurde dans ces deux cas de parler de décélération. De même, lorsque l’on freine alors qu’on fait marche arrière (la position diminue de moins en moins vite), on se trouve plaqué contre le dossier de son siège, exactement comme cela se produit lorsque, roulant en marche avant, on accélère fortement. 7. http://www-spof.gsfc.nasa.gov/stargaze/Fgloss.htm 8. http://www.phys.ualberta.ca/\char126\relaxmontigny/cours/physq124/manuel/cine-1d.pdf - 266/709 - 8.4. Situation IV Dans le cadre de cette étude, nous traitons de particules ponctuelles qui n’ont ni avant ni arrière ; cependant, un discours tel que celui qui précède, basé sur une expérience sensorielle banale, peut permettre de convaincre les élèves du caractère raisonnable du choix fait par les mathématiciens et qui rejoint le point de vue du physicien américain. En particulier, ce choix permet d’interpréter la concavité d’une courbe en termes de signe de l’accélération au même titre que nous pouvons interpréter la croissance d’une courbe en termes de signe de la vitesse. De plus, puisque l’accélération y est vue comme la « vitesse instantanée de la vitesse instantanée », l’accélération a (t) se définit facilement à partir de la loi de vitesse de la même manière que nous avons défini la vitesse instantanée à partir de la loi de mouvement : a (t) = lim ∆t→0 ∆v . ∆t Si l’on reprend l’exemple de la balle lancée verticalement selon la loi h (t) = −5t2 + 15t, on a vu que la loi de vitesse est v (t) = −10t + 15. L’accélération sera alors a (t) = −10. Dans ce premier exemple, l’accélération est toujours négative. Donc la vitesse de la particule diminue sans cesse. Puisque la vitesse du mobile à un instant t correspond à la pente de la courbe à cet instant, le graphique de la loi de mouvement aura sa concavité tournée vers le bas, ce que nous savions déjà. De fait, la loi de mouvement h (t) est une fonction du second degré et le coefficient de t2 est négatif : il est alors bien connu depuis la Quatrième (c’est-à-dire la classe de Seconde, en France) que la concavité de la courbe est tournée vers le bas. Prenons un autre exemple. Soit une particule dont la loi de mouvement est p (t) = 2t3 − 18t2 + 15t + 17. Sa loi de vitesse est alors v (t) = 6t2 − 36t + 15 et, par conséquent, son accélération est a (t) = 12t − 36. Dans cet exemple, on observe que lorsque t est supérieur à 3, l’accélération est positive, donc la vitesse est croissante et la courbe est convexe. Au contraire, si t est inférieur à 3, l’accélération est négative, donc la vitesse décroît et la courbe est concave. À t = 3, puisque la concavité change, on a un point d’inflexion ; plus intéressant cinématiquement, puisque la concavité passe de tournée vers le bas à tournée vers le haut, c’est que la vitesse atteint à cet instant un minimum. Observons également que la croissance ou la décroissance de la vitesse ne donne aucune indication quant au signe de la vitesse. Ainsi, par exemple à t = 4, la vitesse est croissante (puisque t > 3) et elle est négative (elle vaut −33) ; tandis que, par exemple à t = 7, la vitesse est toujours croissante (t > 3) mais elle est positive (elle vaut 57). De même, à t = 0, la vitesse est décroissante (puisque t < 3) et elle est positive (elle vaut 15), tandis que, par exemple à t = 1, la vitesse est toujours décroissante (puisque t < 3) mais elle est négative (elle vaut −15). Des exemples de ce genre peuvent aider à réduire la confusion possible entre le signe d’une grandeur et sa croissance. Dans la situation IV, nous retrouvons une situation similaire puisque nous y retrouvons successivement les quatre binômes (vitesse croissante et positive), (vitesse décroissante et positive), (vitesse décroissante et négative) et (vitesse croissante et négative). En choisissant délibérément de considérer l’accélération comme la dérivée seconde de la position (même si on ne l’exprime pas encore ainsi) au détriment d’une modélisation qui correspondait mieux au sens commun, on passe d’une praxéologie-modélisation à une praxéologiedéduction dans un but d’économie de pensée. - 267/709 - 8.4.2.4 Conclusion Au terme de cette situation, il est possible de définir l’accélération (instantanée) au même titre que la vitesse instantanée a été définie à la fin de la situation précédente. D’autre part, les élèves ont l’occasion de se convaincre que le choix des définitions mathématiques est commode et qu’il n’est pas nécessairement contraire aux perceptions des sens, bien que ce ne soit pas le but visé par ce choix. Cette situation n’est pas centrale dans notre ingénierie mais, en s’intéressant à la « vitesse instantanée d’une vitesse instantanée », elle ouvre une porte vers une certaine abstraction en vue de l’émergence du concept de dérivée. 8.5 Situation V 8.5.1 Description La situation V s’intitule « Deux problèmes et une solution ». Elle s’articule en deux parties successives : un problème d’optimisation dans un contexte cinématique et un problème d’optimisation dans un contexte géométrique. En voici l’énoncé : V.1 Un mobile en mouvement « Considérons un mobile sur une trajectoire rectiligne et dont la loi de mouvement est donnée par la fonction p (t) = 4 t3 − 25t2 + 150t Entre t = 0 et t = 10, à quel(s) instant(s) la distance du mobile à l’origine est maximale ? Que vaut alors sa vitesse ? » V.2 Un volume à optimiser « On considère à présent une plaque en tôle dont on a retiré les coins selon la figure 6. Figure 6 - 268/709 - 8.5. Situation V En pliant les bords de cette plaque, on obtient une boîte rectangulaire et ouverte dont la profondeur est x. Déterminer la valeur de x telle que le volume de la boîte soit maximum ». 8.5.2 Variables didactiques locales Comme nous l’avons écrit à propos des variables didactiques globales, l’enjeu de cette situation est de faire évoluer la notion de vitesse instantanée vers celle, plus large mais plus abstraite de dérivée. Nous proposerons aux élèves deux problèmes d’optimisation mobilisant une même fonction mais situés, le premier dans un contexte graphico-cinématique et, le second, dans un contexte géométrique, à savoir la détermination des dimensions d’une boîte rectangulaire pour en maximiser le volume. 8.5.2.1 Une fonction du troisième degré Dans le problème cinématique, la loi de mouvement est donnée par p (t) = 4 t3 − 25t2 + 150t . Il s’agit d’en trouver le maximum sur l’intervalle [0; 10]. Le choix d’une fonction du troisième degré devrait inciter les élèves, suite à ce qui a été travaillé aux situations II et III, à recourir à la procédure infinitésimale désormais installée 9 . p (t) = 4 t3 − 25t2 + 150t sur l’intervalle [0; 10] 9. Comme signalé lors de l’étude de la situation III, le fait que la fonction soit du troisième degré n’interdit pas totalement le recours à une procédure non infinitésimale : en effet, le maximum est situé en un point où la droite p = k a deux intersections avec la courbe, dont une double à l’endroit du maximum ; cela conduit à écrire que la fonction p(t) − k peut aussi s’écrire 4(t − a)2 (t − b) où a est la racine double de la fonction et b l’autre racine. Par identification terme à terme des deux polynômes, on déduit la valeur cherchée t = a. - 269/709 - 8.5.2. Variables didactiques locales Par ailleurs, la courbe représentative d’une fonction du troisième degré ne présente aucune symétrie par rapport à une droite verticale passant par l’un de ses extrema locaux. Or, si les élèves dessinent à la main la courbe représentative de la fonction p (t) = 4 t3 − 25t2 + 150t sur l’intervalle donné, ils obtiennent une figure qui ressemble néanmoins à un arc de parabole retournée. Ils peuvent donc être tentés de considérer que le maximum se trouve au milieu des racines, à l’instar d’une fonction du second degré. Enfin 10 , la résolution du problème revient à chercher l’instant où la vitesse du mobile s’annule, donc à déterminer les racines de la fonction-vitesse. Celle-ci étant d’un degré inférieur d’une unité au degré de la loi de mouvement (pour autant qu’elle soit polynomiale), une fonction du troisième degré assure de pouvoir déterminer facilement de telles racines. 8.5.2.2 L’annulation du taux instantané de variation d’une fonction dérivable comme condition nécessaire d’un extremum Le tracé du graphique de la fonction du troisième degré doit aider les élèves à résoudre le problème, pour autant qu’ils répondent d’abord à la seconde question, à savoir « Que vaut alors la vitesse ? » Pour éviter les effets de contrat, nous avons placé cette question après la première de sorte que ces questions semblent successives. Notre but, ici, est de favoriser chez les élèves l’association de l’idée de maximum (ou de minimum) d’une fonction à l’annulation d’un taux de variation instantané (pour autant que la fonction soit dérivable, bien entendu). Cette fonction est ici une vitesse : si la distance demandée est maximale, c’est que le mobile cesse de s’éloigner de sa position de référence pour commencer à y revenir ; à cet instant, la vitesse cesse donc d’être positive pour devenir négative : elle est donc nulle. À partir de là, le problème cinématique se résout facilement en déterminant l’expression de la vitesse et en cherchant les racines de la fonction√du second degré obtenue. Dans 25 − 5 7 l’intervalle considéré, une seule racine convient : t = ' 3, 92. 3 8.5.2.3 Vers une classe de fonctions L’expression de la loi de mouvement du problème cinématique a été choisie pour être celle de la fonction qui donne le volume de la boîte décrite dans le problème géométrique (situation V.2) et qui respecte en tout point le cahier des charges de l’analyse a priori du premier problème. Outre les variables qui sont, dans l’un, p et t et, dans l’autre, V et x, les expressions analytiques peuvent légèrement différer en apparence si les élèves ne factorisent pas l’expression du volume de la boîte. Si les élèves dessinent la courbe représentative de la fonction-volume, ils augmentent encore leurs chances de prendre conscience qu’il s’agit de la même fonction qu’à la situation V.1. On peut alors s’interroger sur ce que les élèves feront de cette similitude entre les deux problèmes, non dans la résolution du second mais dans la justification d’une telle résolution selon le mode de la copie conforme. En effet, ils peuvent, dans un premier temps, se contenter de déduire la réponse cherchée de la similitude des deux expressions analytiques ou des deux 10. Pour autant que les élèves empruntent la procédure de type infinitésimale. - 270/709 - 8.5. Situation V graphiques, se contentant de traduire les variables d’un problème à l’autre, la réponse étant alors x ' 3, 92 quand on avait obtenu précédemment t ' 3, 92. Iront-ils jusqu’à penser le nouveau problème en termes de vitesse de variation du volume en fonction de la variation de la dimension des coins de la boîte, quitte à lier cette variation géométrique à celle du temps de déroulement de l’expérience de pensée ? Nous répondrons à cette question dans l’analyse a posteriori de cette situation (section C.8.2, à partir de la p. 702). Cependant, un enjeu important de cette situation est de faire émerger chez les élèves l’idée que ces deux problèmes font partie de la même classe et que, par conséquent, un concept unificateur comme la dérivée permet une formidable économie de pensée puisqu’un seul calcul permet de répondre non plus à deux mais à une multitude de problèmes. 8.5.2.4 Conclusion Ce travail sur les similitudes formelles de nature algébrique n’est pas à négliger en termes d’impact sur les élèves : « De telles similitudes formelles impressionnent les élèves autant que les mathématiciens dans l’histoire. Elles semblent avoir joué un rôle dans la constitution de l’analyse mathématique comme discipline autonome des mathématiques. En effet, ce sont des problèmes de géométrie et de physique qui ont motivé les premières procédures que nous reconnaissons aujourd’hui comme faisant partie des applications de l’analyse : des calculs d’aires et de volumes curvilignes, des déterminations de tangentes à une courbe, des problèmes de vitesses et des problèmes d’optimisation. Ces divers problèmes ont d’abord été résolus de manière ad hoc, spécifique, sans que des liens entre eux apparaissent d’entrée de jeu. L’algébrisation des méthodes a rendu possible une prise de conscience progressive de parentés formelles tant au niveau des résultats obtenus qu’à celui des méthodes [. . . ] Ainsi, peu à peu, est née une nouvelle discipline, le calcul infinitésimal, résumant les règles propres à ces méthodes et les objets qu’elles permettent de cerner. » (Groupe AHA 1999a, p. 85) Nous pensons qu’une seule (double) situation telle que la situation V ne suffit pas à faire le saut vers l’abstraction que représente l’accès au concept de dérivée. Mais la question ne se pose pas seulement en terme de quantité : ce n’est pas en multipliant les exemples que l’on peut être certain que chaque élève atteindra le nirvana de l’abstraction mathématique. Le passage du concret à l’abstrait est une difficulté qui dépasse largement le cadre de notre étude. Cependant, nous avons vu au chapitre 5 (p. 145) que cet obstacle n’est que trop rarement travaillé dans l’enseignement classique et que la situation proposée est un premier pas dans cette direction. Quoi qu’il en soit, à l’issue de cette situation, la fonction dérivée d’une autre fonction est définie, par analogie à la définition qui a été faite de la vitesse instantanée puis de l’accélération et, enfin, du taux de variation instantané d’un volume en fonction de la dimension x, comme la limite (au sens de la procédure mise en place depuis la situation II) du quotient différentiel : si f est une fonction (dérivable) de la variable x, alors sa fonction dérivée est f 0 (x) = lim ∆x→0 f (x + ∆x) − f (x) ∆x - 271/709 - 8.6 Situation VI 8.6.1 Description La situation VI s’intitule « Prendre la tangente ? ». Elle s’articule en deux parties : on demande de construire un graphique à partir d’un champ de tangentes, puis il est question d’approximation affine. Ces deux parties sont indépendantes en dehors du fait que c’est la tangente qui y tient le rôle principal. En voici l’énoncé : VI.1 Touch and Go « Considérons un mobile sur une trajectoire rectiligne. Il démarre à l’instant t = 0 de la position p = 2. Il accélère jusqu’à l’instant t = 3. À cet instant, il occupe la position p = 6 et sa vitesse instantanée vaut 2. Il décélère ensuite jusqu’à l’arrêt qui se produit à l’instant t = 6 et à la position p = 10. Il fait alors demi-tour et atteint la position p = 8, 25 à l’instant t = 7, 5. Sa vitesse vaut alors −2, 5. Il continue à décélérer jusqu’à l’instant t = 9 et la position p = 2. Sa vitesse devient alors constante et vaut −6. Dessiner le plus précisément possible la loi de mouvement de ce mobile sur la figure 7 ». Figure 7 - 272/709 - 8.6. Situation VI VI.2 Approximation par une droite √ « On suppose ici que la loi de mouvement d’un certain mobile est p = t. Ainsi, à l’instant t = 9 = 32 , la position du mobile sera 3. Sans calculatrice, il n’est pas évident de connaître la valeur numérique de la position du mobile aux instants qui ne sont pas des carrés parfaits. Ainsi, à t = 8, 46, on peut seulement dire que, grossièrement, la position est de l’ordre de 3. On voudrait trouver une approximation plus fine de cette position. Quel(s) moyen(s) proposez-vous (en excluant le recours à une calculette) pour donner une telle approximation ? Soit un mobile qui suit la loi de position p = t17 +3t−1. Donner une approximation plus fine que p (1) = 3 de la position du mobile à l’instant t = 1, 127 ». 8.6.2 8.6.2.1 Variables didactiques locales Droites-guide Jusqu’à présent, par leur cursus scolaire, les élèves visés par nos expérimentations ont été habitués à tracer des courbes à partir d’un tableau de valeurs, donc à partir d’une série de points qu’il s’agit alors de relier. Dans le meilleur des cas, s’ils savent à quelle classe de fonctions appartient la fonction à représenter, ils bénéficient d’un garde-fou pour éviter des erreurs grossières. L’enjeu de la première partie de la situation VI est de leur faire utiliser la tangente comme outil de construction graphique, aspect qui est peu travaillé dans l’enseignement classique, comme nous l’avons constaté plus haut (section 5.2.2.5, p. 176). Ainsi est-il demandé, dans la première partie de la situation VI, de tracer l’allure d’une loi de mouvement à partir de quelques informations ponctuelles quant à la position, la vitesse et l’accélération d’un mobile. Les informations de position sont numériques et consistent en quelques points à placer dans le repère, ce qui revient à disposer d’un tableau de valeurs. Les informations de vitesse sont également numériques mais il est moins facile de les représenter graphiquement. En effet, comment visualiser qu’à un instant donné, la vitesse vaut une valeur donnée ? Les élèves savent que la vitesse instantanée correspond à la pente de la courbe à cet instant. Seulement la courbe n’est pas encore dessinée. On demande donc de dessiner une pente — jusque là, les élèves l’ont peut-être matérialisée par le tranchant d’une main, d’une latte ou par un crayon — à une courbe qui n’existe pas ! Cependant, nous faisons l’hypothèse que l’expérience accumulée par l’étude des situations précédentes doit permettre de résoudre le problème. En restant dans le contexte cinématique qui est le nôtre (rappelons que la tangente en tant qu’objet géométrique lié à la dérivée n’a pas encore été définie à ce stade l’expérimentation), une manière de procéder consiste à imaginer un autre mobile (plus imaginaire que celui dont on étudie la loi de mouvement) qui, à l’instant considéré, a la même position mais évolue à la vitesse constante égale à celle du mobile étudié. La loi de mouvement du mobile ainsi imaginé a pour graphique une droite de pente égale à la vitesse considérée et passant par le point donné. Ayant même vitesse instantanée à l’instant donné que notre mobile, leurs lois de mouvement ont bien la même - 273/709 - 8.6.2. Variables didactiques locales pente. D’un point de vue pratique, on se contente de ne représenter qu’un petit morceau de la droite, autour du point qui nous intéresse pour matérialiser la pente de la courbe. Quel est l’intérêt de tracer les pentes du graphique aux instants donnés par l’énoncé ? N’aurait-on pas pu se contenter de placer les points (p; t) et de les relier ? Il s’agit donc de saisir en quoi la pente de la courbe aux points considérés aide à représenter la courbe demandée. Tout d’abord, il y a de trop nombreuses manières de passer par une série de points. Les élèves en sont rarement convaincus parce que les fonctions rencontrées dans leur cursus scolaire sont souvent élémentaires et que, dans de nombreux cas, ce sont les enseignants euxmêmes qui, parce que cela s’y prêtait, leur ont appris à relier les points, par des segments de droites ou par des segments courbes. Mais, sans précaution, une telle technique peut être désastreuse (par exemple, la fonction sin(πx) vaut zéro en toute valeur entière de x ; son graphique n’est pas pour autant confondu avec l’axe des abscisses). En disposant d’un certain nombre de points pour lesquels on connaît la vitesse — donc la pente de la courbe — on dispose d’autant de droites-guide qui aident à donner une allure plus fiable de la courbe. La figure suivante donne les droites-guides obtenues dans le cas de la situation VI.1 : Si, de plus, comme c’est le cas ici, on connait le signe de l’accélération, donc la concavité, on peut encore éliminer la moitié des manières de passer par chacun des points. Finalement, on peut obtenir le graphique suivant : - 274/709 - 8.6. Situation VI Typiquement, après avoir tracé la tangente au point considéré, la courbe va comme « atterrir » au point considéré, avant d’aussitôt en décoller, comme dans la figure suivante : C’est le Touch and Go, un exercice pratiqué par les élèves-pilotes d’avion et qui consiste à poser leur appareil sur la piste pour en décoller aussitôt. Cette image, bien que parlante, n’est sans doute pas à conserver sans précaution car elle peut prêter à confusion : l’idée selon laquelle la tangente est une droite qui frôle une courbe n’est pas correcte. En effet, en un point d’inflexion par exemple, la courbe se pose effectivement d’un côté de la tangente, mais le décollage se déroule de l’autre côté de celle-ci, comme si l’avion atterrissant sur la piste, en décollait aussitôt par en-dessous ! Ainsi, en un point d’inflexion, la courbe traverse la tangente précisément en ce point (c’est ce qui se produit au point d’abscisse 3 de la figure obtenue dans la première partie de cette situation VI). 8.6.2.2 La tangente à une courbe À l’issue de cette situation VI.1, il est possible non seulement de définir la tangente mais encore de lui donner une interprétation cinématique que nous croyons éclairante. En - 275/709 - 8.6.2. Variables didactiques locales particulier, une telle interprétation peut aider à rejeter l’idée première que gardent les élèves de la définition de tangente vue quelques années auparavant, à savoir celle de la tangente à un cercle. Comme les élèves retiennent plus profondément ce qu’ils ont appris en premier, ils ont souvent du mal à se détacher de l’idée qu’une tangente puisse être autre chose qu’une droite qui ne touche la courbe qu’en un point et sans la traverser. L’usage de la tangente en analyse est différent et l’abandon de cette vision première est difficile car très ancrée dans l’esprit des élèves. À cet égard, j’ai souvent observé la relative inefficacité de la monstration souvent proposée pour convaincre les élèves que leur conception de la tangente devait évoluer : on voit dans l’exemple suivant que la tangente peut avoir deux intersections avec la courbe : Pourtant, notre expérience à l’université et en haute école de niveau universitaire est que l’exhibition de cas semblables n’empêche pas la persistance de cette erreur conceptuelle chez les étudiants : leur réaction va jusqu’à affirmer qu’il ne s’agit dès lors pas d’une tangente. Quoi qu’il en soit, en analyse mathématique, la tangente à une courbe en un point est définie comme la droite qui passe par ce point et dont le coefficient angulaire est égal à la dérivée de la fonction en ce point. Ainsi, la notion intuitive de pente à une courbe, que nous avons jusqu’à présent mise en italiques, obtient un statut institutionnalisé : elle est d’abord la valeur de la dérivée en ce point. Ensuite, une fois définie la tangente (par un point et la valeur de la dérivée en ce point), la pente à une courbe devient également le coefficient angulaire de la tangente en ce point. On peut alors écrire que, si une fonction f est dérivable en x = x0 , c’est-à-dire que sa dérivée est définie en ce point, alors la tangente à la courbe y = f (x) au point x0 est la droite d’équation y = f (x0 ) + f 0 (x0 ) · (x − x0 ) Une telle définition nous semble malheureusement peu éclairante pour les élèves. Le recours à l’interprétation cinématique pourrait pallier ce défaut. Nous l’avons rencontrée plus haut mais reprenons-la dans le cas où nous interprétons la courbe y = f (x) comme étant la loi de mouvement p = f (t) d’un mobile A se déplaçant sur une trajectoire rectiligne en fonction du temps. Alors, la tangente en un point (x0 ; f (x0 )), devenu (t0 ; f (t0 )), peut s’interpréter comme la loi de mouvement d’un mobile B qui se déplace à la vitesse constante égale à celle du mobile A à l’instant t0 et qui se trouve lui aussi à la position f (t0 ) à cet instant. Cette interprétation peut également permettre une interprétation éclairante des approximations affines, lesquelles sont abordées avec la situation VI.2. - 276/709 - 8.6. Situation VI 8.6.2.3 Droites-estimatives Quelle est cette interprétation annoncée au paragraphe précédent ? La voici. Considérons deux mobiles, A et B, qui suivent une trajectoire rectiligne ; la loi de mouvement du mobile A est quelconque, voire compliquée et celle du mobile B est uniforme (vitesse constante). Alors, si à un instant t0 , les deux mobiles ont la même position et la même vitesse instantanée, leurs positions respectives resteront proches l’une de l’autre pendant un certain temps. Ainsi, si cette position commune à l’instant t0 est connue, quand bien même la position du mobile A serait difficile à déterminer à un instant t1 proche de t0 , celle du mobile B sera facile à déterminer (fonction du premier degré) et donnera une approximation (affine) de celle de A au même instant. Nous faisons l’hypothèse qu’une telle interprétation, en termes de vitesse, peut contribuer à justifier auprès des élèves que la tangente est la droite qui donne la meilleure approximation de la courbe autour du point considéré. Cette interprétation est compatible avec le concept mathématique de meilleure approximation affine donné à la section 7.12 (p. 241). En effet, la vitesse constante du mobile B vaut la dérivée de la loi de mouvement du mobile A à t0 si bien que, d’après le théorème énoncé page 241, on tient là la meilleure approximation affine de la loi de mouvement. Rappelons que l’enseignement classique, bien que l’approximation affine soit au programme des études de l’année scolaire considérée, ne propose aucune justification de sa pertinence (cf. paragraphes 5.2.2.2, p. 162 et 5.3.1.4, p. 207). Un exemple probant C’est ainsi que, dans la seconde partie√de la Situation VI, on cherche la position d’un mobile dont la loi de mouvement est p = t à l’instant t = 8, 46. Sans √ calculatrice, il n’est pas évident de calculer 8, 46. C’est pourquoi on se contentera d’une estimation de √ cette position. Une première estimation est 3. En effet, 8, 46 n’est pas très éloigné de 9 et 9 = 3. Dans la question proposée aux élèves, on demande une approximation plus fine. On peut imaginer que certains élèves essaieront de déterminer ce nombre par tâtonnement, ce qui est possible ici en prenant la réciproque de la fonction racine carrée positive : il suffit de calculer les carrés des candidats et de les comparer à 8, 46. Voilà pourquoi on propose ensuite une autre fonction, suffisamment compliquée (p (t) = t17 + 3t − 1) pour empêcher ce genre de manipulation et rendre le savoir visé optimal. Avec le premier exemple, on obtient 8, 46 ≈ p (9) + p0 (9) · (8, 46 − 9) = 3 + p −0, 54 = 3 − 0, 09 = 2, 91. 2·3 Cette approximation est très correcte puisque la valeur donnée par une calculatrice est : p 8, 46 ≈ 2, 9086 · · · La figure suivante montre combien la tangente reste longtemps très proche de la courbe aux alentours de t = 9. Autrement dit, il n’est pas surprenant que l’estimation proposée soit √ très proche de la valeur exacte de 8, 46 : - 277/709 - 8.6.2. Variables didactiques locales Les limites de l’approximation affine, ouverture vers la formule de Taylor Avec le second exemple, on obtient p (1, 127) ≈ p (1) + p0 (1) · (1, 127 − 1) = 3 + 20 · (0, 127) = 5, 54 Cette fois, l’approximation semble peu satisfaisante puisque la valeur donnée par la calculatrice est : p (1, 127) ≈ 10, 014 · · · C’est d’autant plus surprenant que l’écart entre 1, 127 et 1 est plus petit que l’écart entre 8, 46 et 9 précédemment considéré. Voici le graphique de l’autre loi de mouvement (pour rendre le graphique lisible, nous n’avons pas pris un repère normé) : La tangente ne reste pas longtemps proche de la courbe. Cinématiquement, cela signifie que la pente de la courbe a évolué rapidement, c’est-à-dire que la vitesse instantanée à changé rapidement, ce qui signifie que l’accélération est plus importante. Dans le premier cas, - 278/709 - 8.6. Situation VI 1 l’accélération est donnée par a (t) = − 4x1√x , d’où a (9) = − 108 ≈ 0, 01. Dans le deuxième cas, 15 a (t) = 17 · 16 · t , d’où a (1) = 272 ! Si l’on veut une meilleure approximation pour p (1, 127), on pourrait considérer un mobile C qui, non seulement aurait la même position et la même vitesse, mais aussi la même accélération que le mobile qui nous intéresse. Un MRU ne convient pas mais bien un MRUA. La loi de mouvement n’est plus une fonction du premier degré, représentée par une droite mais une fonction du second degré, représentée par une parabole. Une telle parabole collera donc un peu plus longtemps à la courbe donnée. La détermination de la loi de mouvement du mobile C conduit à p (t) ≈ p (t0 ) + p0 (t0 ) · (t − t0 ) + p00 (t0 ) · (t − t0 )2 2 Le calcul de l’approximation, dite quadratique (à cause du second degré), reste facile à faire en comparaison avec celui d’une fonction de degré 17 ! On obtient p (1, 127) ≈ 7, 447 · · · C’est mieux, mais ça ne semble pas encore satisfaisant. On peut poursuivre le raisonnement et considérer un mobile D qui aurait, en plus, la même vitesse de variation de l’accélération[. . . ] Il n’existe pas de terme en physique pour désigner la dérivée troisième de la loi de mouvement, mais on peut concevoir de quoi il s’agit. On peut ainsi construire des polynômes, qui ont reçu le nom de polynômes de Taylor, et qui sont étudiés en première année d’université. Les polynômes ainsi construits collent de mieux en mieux à la courbe, autour du point considéré, à mesure que leur degré augmente. Ainsi, loin de nous gêner, les limites avérées de l’approximation affine nous donne non seulement l’occasion d’une interprétation cinématique mais encore il peut permettre une ouverture pertinente vers les polynômes de Taylor, puisque l’on peut les interpréter cinématiquement, tout au moins quant au principe. - 279/709 - 8.6.2.4 Conclusion La situation VI est la plus périphérique au noyau dur de notre ingénierie que sont les situations II et III. Comme annoncé lors de l’analyse des variables didactiques globales, cette dernière situation ne fera pas l’objet d’une analyse a posteriori au sein de cette thèse en raison précisément de sa situation périphérique, sachant que nous devions faire des choix. 8.7 Conclusion du chapitre Au chapitre précédent, nous avons tâché de mettre en avant les choix majeurs (correspondants aux variables didactiques globales) opérés pour construire l’ingénierie didactique proposée. Dans le présent chapitre, nous avons tâché de justifier les choix plus circonstanciés relatifs aux différentes situations qui constituent notre ingénierie ; ces choix correspondent aux variables didactiques locales. La situation I propose le graphique simplifié d’une loi de mouvement : il s’agit d’une courbe croissante dont la concavité est successivement orientée vers le haut et vers le bas et les élèves sont invités à décrire en français le mouvement du mobile. À l’issue de cette première situation, non seulement sur base du travail effectué par les élèves, mais aussi, suite à l’institutionnalisation faite par le professeur, nous pouvons faire l’hypothèse que les élèves sauront désormais décrypter le caractère uniforme (au sens de la vitesse) ou non d’une loi de mouvement selon que son graphique est rectiligne ou non. De plus, nous faisons l’hypothèse que la justification qui aura été faite graphiquement de l’accélération/décélération par la construction d’un ou plusieurs escaliers aura une influence sur certains élèves quant à la mise au point d’une stratégie pour résoudre les situations II et III. Le rôle de la situation I est de créer un milieu allié pour permettre aux élèves d’être en mesure d’aborder les situations suivantes en terrain connu, donc avec un certain degré d’autonomie. La situation II présente sur un même graphique les lois de mouvement d’un mobile animé d’un mouvement à vitesse constante et d’un autre mobile dont la vitesse est variable. Dans un premier temps, l’expression algébrique de la loi de mouvement n’est pas connue. Cette situation permet d’introduire une stratégie (celle dite des marches d’escalier où il s’agit d’affirmer que l’instant cherché se situe dans un intervalle où l’espace parcouru ou la vitesse moyenne des deux mobiles est égale ; plus l’intervalle est petit, plus l’estimation de l’instant cherché est bonne) conduisant à la mise en place d’une procédure à caractère infinitésimal, qui est le savoir visé. Graphiquement, cette stratégie conduit à obtenir un intervalle contenant l’instant cherché au lieu de pointer un instant bien identifié. De plus, algébriquement, la procédure mise en place revient à annuler un terme qui, d’abord non nul (sinon, l’égalité de départ n’a aucun sens), est ensuite (une fois faites toutes les simplifications algébriques) pris égal à zéro ! L’écriture algébrique de cette procédure n’est pas légère. Cette stratégie n’est donc manifestement pas optimale comparée aux deux autres (celle des droites parallèles (cf. pp. 254 et 257) — qui revient par exemple à déplacer parallèlement la droite représentant la loi de mouvement du mobile ayant une vitesse constante jusqu’à obtenir un seul point d’intersection avec la courbe de la loi de mouvement de l’autre mobile ; algébriquement, cela conduit à résoudre une équation du second degré —, et celle de l’écart maximum (cf. pp. 256 et 257) — qui revient à chercher l’instant où l’écart entre les deux courbes est maximum ; algébriquement, - 280/709 - 8.7. Conclusion du chapitre cela conduire à déterminer le sommet d’une parabole). La résolution algébrique des deux dernières stratégies citées suppose que la loi de mouvement du mobile ayant une vitesse variée est du second degré. La situation III est similaire à la précédente mais on y considère une fonction du troisième degré à la place d’une fonction du second degré. Ce changement suffit à écarter les stratégies non infinitésimales, rendant dès lors optimal le savoir visé, ce qui confère à l’ensemble constitué des situations II et III un caractère fondamental. La vitesse instantanée est également définie lors de la situation III. Il ne s’agit pas d’une définition canonique mais d’une décision : celle que, en prenant ∆t = 0 dans l’expression de la vitesse moyenne, une fois faite toutes les simplifications algébrique, on obtient ce qu’on appellera désormais la vitesse instantanée. Cette définition reste conforme à la définition physique de la vitesse instantanée. Une telle définition ne signifie pas pour autant que tous les élèves l’accepteront facilement, ainsi que son champ d’opérationnalité, pour plusieurs raisons que nous avons déjà abordées dans notre recherche : la vitesse est une grandeur intensive et elle échappe à l’univers des sens et des mesures (cf. section 6.4, p. 225) alors que l’esprit humain se refuse souvent à« circonscrire avec précision quelque chose que les sens n’appréhendent que très imparfaitement » (Groupe AHA 1999a, p. 76). La situation IV généralise la situation I au cas où la courbe de la loi de mouvement est décroissante. Au terme de cette situation, il est possible de définir l’accélération (instantanée) au même titre que la vitesse instantanée a été définie à la fin de la situation précédente. Une telle définition pourrait ne pas aller de soi puisque les physiciens ne sont pas d’accord entre eux. Néanmoins, le choix opéré ici, qui est celui des mathématiciens, à savoir de calquer la définition de l’accélération par rapport à la vitesse comme celle-ci est définie par rapport à la loi de mouvement est commode et cette situation pourrait contribuer à le faire entendre aux élèves. La situation V permet de travailler les similitudes formelles de nature algébrique et l’on peut prévoir que son impact n’est pas négligeable auprès des élèves (cf. Groupe AHA 1999a, p. 85). En effet, cette situation propose successivement deux problèmes, l’un d’ordre graphico-cinématique et l’autre d’ordre géométrique dont les expressions algébriques sont identiques aux variables près. Sans prétendre qu’une telle situation suffirait à faire le saut vers l’abstraction que représente l’accès au concept de dérivée, une telle difficulté dépassant largement le cadre de notre étude, nous estimons cependant que cet obstacle n’est que trop rarement travaillé dans l’enseignement classique (cf. chapitre 5, p. 145) et que la situation proposée est un premier pas dans cette direction. Quoi qu’il en soit, à l’issue de cette situation, la fonction dérivée d’une autre fonction est définie, par analogie à la définition qui a été faite de la vitesse instantanée puis de l’accélération et, enfin, du taux de variation instantané d’un volume en fonction de la dimension x, comme la limite (au sens de la procédure mise en place depuis la situation II) du quotient différentiel : si f est une fonction (dérivable) de la variable x, alors sa fonction dérivée est f (x + ∆x) − f (x) ∆x La situation VI s’intéresse aux champs de tangentes et aux approximations affines, donc met en valeur le rôle de la tangente. Néanmoins, cette situation est la plus périphérique par rapport au cœur de notre ingénierie que constituent les situations II et III. Comme annoncé lors de l’analyse des variables didactiques globales, cette dernière situation ne fera pas l’objet d’une analyse a posteriori au sein de cette thèse en raison précisément de sa situation périphérique, sachant que nous devions faire des choix. f 0 (x) = lim ∆x→0 - 281/709 - - 282/709 - Quatrième partie Expérimentations et analyse a posteriori 283 Une fois l’ingénierie construite et analysée a priori, il nous faut la confronter à une certaine réalité, à savoir en l’expérimentant auprès d’élèves. Nous avons choisi de le faire en classe, ce qui permet de faire travailler les élèves en groupes et de profiter ainsi des synergies induites. Dans un premier chapitre, nous allons décrire les expérimentations réalisées en nous centrant sur l’une d’elles qui servira d’expérimentation principale ; les autres expérimentations permettront, le cas échéant, de la compléter. Nous résumerons dans ce même chapitre le déroulement chronologique de la séquence d’enseignement constituée par cette expérimentation principale. Ce résumé sera structuré en épisodes que nous avons jugés significatifs. Quant aux dialogues qui ont été enregistrés en classe, ils ont été retranscrits par nous 11 et se trouvent à l’Annexe A (p. 403). De même, une annexe rapporte certaines observations faites sur des copies d’élèves (Annexe B, p. 575). Nous avons réservé l’analyse a posteriori à un second chapitre. Cette analyse nous permettra de valider ou non les hypothèses engagées dans notre recherche (Chapitre 10, p. 353). 11. La retranscription est partielle en raison de passages inaudibles et de bavardages, mais ce qui n’a pas été retranscrit ne contredit pas le reste. - 285/709 - - 286/709 - Chapitre 9 Déroulement et narration de l’expérimentation Dans ce chapitre, nous allons décrire succinctement comment se sont déroulées les expérimentations en classe et pourquoi nous avons choisi une expérimentation à titre principal. Ensuite, nous préciserons la légende et les notations choisies pour désigner les intervenants qui s’expriment et situer les dialogues et épisodes narratifs dans le temps. Cette légende et ces notations seront d’application non seulement dans le présent chapitre mais dans toute la suite de notre travail. Enfin, pour chacune des situations I à V, on trouvera l’énoncé proposé aux élèves et les résumés des dialogues enregistrés en classe. Rappelons que les retranscriptions des dialogues enregistrés se trouvent à l’Annexe A (p. 403). 9.1 Le public de l’expérimentation Plusieurs expérimentations ont été réalisées. Parmi elles, nous en avons choisi une à titre principal. Elle s’est déroulée au Collège St Michel (Bruxelles) en 2008, dans une classe de l’enseignement général de transition, classe composées d’élèves réputés forts en mathématiques (8 périodes de 50 minutes par semaine, ce qui est le maximum en Belgique). Pourquoi un tel choix ? Tout d’abord, en raison du type de validation de notre ingénierie : « Le processus de validation interne [des hypothèses engagées dans la recherche] qui est [. . . ] en jeu, ne tombe certes pas dans le piège usuel des validations statistiques associées à des expérimentations en classe qui consiste à se fonder implicitement sur le principe que les différences mesurables constatées sont liées aux variables de commande sur lesquelles on a joué pour différencier classes expérimentales et classes témoins. » (Artigue 1988, p. 297) De ce fait, nous n’avions pas besoin de réaliser l’expérimentation dans plusieurs classes. Nous pouvions également prévoir qu’en réalisant une expérimentation dans une classe d’élèves forts en mathématiques, les obstacles rencontrés par eux le seraient a fortiori par des élèves moins forts. Ensuite, parce que la dynamique du groupe filmé dans cette classe et la complémentarité des élèves qui le composaient ont rendu les dialogues particulièrement riches. C’est donc cette expérimentation qui sera décrite en détail ci-après. Néanmoins, les autres expérimentations effectuées ne sont pas dénuées d’intérêt. La première, réalisée à l’Institut St Joseph en 2007 dans des classes de technique de transition, a permis de constater que des élèves de l’enseignement technique de transition parviennent tout autant que ceux de l’enseignement général à s’engager efficacement dans l’étude des situations proposées ; nous noterons cependant des différences comme, par exemple, certaines difficultés dans les manipulations du calcul algébrique. La dernière expérimentation, faite en 2009, avait un rôle de parachute au sens où l’expérimentation de 2008 s’était déroulée dans une classe ayant préalablement étudié les tangentes aux fonctions polynomiales 1 et nous craignions que ces connaissances puissent perturber l’expérimentation. Pour en avoir le cœur net, nous avons effectué une nouvelle expérimentation au Collège St Michel, avec le même professeur qu’en 2008, mais avec des élèves n’ayant pas encore abordé le chapitre sur la tangente. Ces expérimentations supplémentaires ne seront pas décrites en détail ici mais serviront, le cas échéant, de complément aux observations faites lors de l’expérimentation principale. Dans la suite de ce chapitre, nous rappellerons pour chaque situation son énoncé puis nous résumerons les épisodes que nous estimons significatifs de ce qui a constitué la pensée des élèves du groupe filmé lors de l’expérimentation principale. On trouvera aux Annexes A et B les transcriptions des dialogues enregistrés par vidéo en classe ainsi que le résumé des écrits des élèves. Lors de cette expérimentation, les élèves étaient répartis en 7 groupes de 4 ou 3 élèves ; le groupe 1 est celui qui a été filmé ; ce groupe comprenaient quatre élèves choisis par le professeur qui les connaissait bien, a priori pour leur spontanéité supposée pour s’exprimer et pour débattre ; ils n’étaient pas pour autant les élèves obtenant les meilleurs résultats aux examens aux dires du professeur ; notons enfin que ces élèves ont été très peu gênés par la présence de la caméra au point, le plus souvent, d’en oublier la présence. Le groupe 7 comprenait les deux doubleurs 2 de la classe. Par ailleurs, nous disposions également d’un petit enregistreur audio qui accompagnait principalement le titulaire du cours dans ses déplacements de groupe en groupe et qui nous a 1. Le professeur de mathématiques de cette classe venait de terminer son cours sur les tangentes, élaboré à partir du manuel du groupe AHA (1999). En substance, il n’est nullement fait recours dans ce chapitre à des considérations infinitésimales et donc à la dérivée. La tangente à la courbe y = x2 en x = 0 est déterminée à partir de l’idée qu’une tangente doit « frôler » la courbe. Si y = 0 convient, les autres droites passant par l’origine doivent être éliminées puisqu’elles coupent la parabole en deux points d’autant plus manifestement distincts que l’on agrandit la courbe aux alentours de l’origine. Sur base de ce principe, sont déterminées la tangente à l’origine à la courbe y = kx2 , la tangente à l’origine à la courbe d’une fonction somme d’une fonction plus quelconque du second degré (par manipulation graphique de la courbe de cette fonction vue comme la somme d’une fonction du premier degré et de la fonction kx2 ). Ensuite, il est question de la tangente à l’origine à la courbe de la fonction x3 et d’une généralisation de la tangente à l’origine de n’importe quelle fonction polynomiale. L’étape suivante est la recherche de la tangente en un point quelconque à la courbe y = x2 puis y = x3 . La suite du chapitre montre l’utilité des tangentes pour dessiner certaines courbes et pour déterminer approximativement les racines d’une fonction par la méthode de Newton. 2. redoublants, pour les lecteurs français - 288/709 - 9.3. Situation I permis çà et là de compléter encore nos observations. Enfin, le cas échéant, nous comparerons les faits observés lors de cette expérimentation avec ceux des autres expérimentations. Auparavant, il nous faut préciser rapidement la légende choisie pour nommer les élèves et référencer les dialogues. 9.2 Légende et notations choisies La légende donnée ici s’applique non seulement à ce chapitre mais à toute la suite de notre travail (y compris aux Annexes A et B). M1. Les élèves sont désignés par une initiale (deux, en cas d’ambiguïté ; par exemple Ma4 et Me4) suivie du numéro du groupe (de 1 à 7). Généralement, lorsqu’il s’agit d’un élève féminin, nous avons employé le pronom elle pour la désigner. [. . . ] Les points de suspension entre crochets signifient qu’une ou plusieurs personnes ont parlé mais que le passage n’est pas assez audible pour être retranscrit. . . . Les points de suspension à la suite d’un mot, sans crochets, signifient que la personne n’a pas terminé sa phrase et, au début d’un mot, qu’elle complète une phrase, la sienne si elle avait été coupée, ou celle de quelqu’un d’autre. [Texte entre crochets]. Le texte entre crochets est un commentaire fait par l’expérimentateur. JY. Ces initiales désignent l’expérimentateur. BM. Ces initiales désignent le professeur de mathématique de la classe observée. {4-55’07}. Ce type de numérotation permet de situer le discours dans le temps. Ainsi, {455’07} signifie que la transcription est extraite de la cassette vidéo 4, à partir de l’instant 55’07" (il y a 10 cassettes vidéo). {A4-55’07}. Lorsque la numérotation commence par une lettre, c’est qu’elle correspond à un enregistrement audio et non vidéo. Ainsi, {A4-55’07} signifie que la transcription est extraite du quatrième fichier audio, à partir de l’instant 55’07" (il y a 6 fichiers audio). 9.3 9.3.1 Situation I Énoncé proposé aux élèves I. Étude du mouvement d’une particule Soit une particule (un point) qui se déplace arbitrairement sur un axe muni d’une origine et d’une unité (Figure 1). - 289/709 - 9.3.2. Résumé des enregistrements filmés dans le groupe 1 Figure 1 On considère que l’on peut connaître ce mouvement par le graphique qui représente la position p du mobile en fonction du temps t. On nous propose ainsi le graphique de la figure 2, où les unités sont, par exemple, le mètre pour la position et la minute pour le temps. Figure 2 Décrire par des phrases en français et le plus complètement possible le mouvement du mobile décrit par le graphique de la igure 2. 9.3.2 Résumé des enregistrements filmés dans le groupe 1 L’expérimentation de cette situation s’est déroulée le lundi 7 janvier 2008 après-midi et a duré un peu plus d’une période de cours. Le travail demandé semble abordable {1-4’12}. La première impression des élèves est que le travail demandé n’est pas difficile, du moins en apparence. - 290/709 - 9.3. Situation I Débat sur la position initiale du mobile {1-4’23}. Très vite, un élève (M1) manifeste sa surprise du choix d’une position initiale négative. {1-5’05}. À l’arrivée de JY, M1 lui pose sa question et, par sa réponse, JY renvoie le débat au sein du groupe. Une tactique d’élève vis-à-vis du professeur est de tenter de déceler en temps réel une approbation ou une désapprobation, dans sa réponse verbale ou sur une mimique, afin de pouvoir rectifier ou adapter la réponse au fur et à mesure. Pour contrer cette stratégie de devinettes, JY tâche, dans la mesure du possible, de rester impassible. Les élèves sont déstabilisés, ce qui se traduit par des réponses souvent hésitantes. M1 insiste à propos de sa question sur la position initiale : il ne comprend pas qu’on prenne des conditions initiales non nulles. JY recentre le travail des élèves du groupe sur la description du mouvement. Justification de l’arrêt du mouvement {1-5’52}. E1 veut montrer qu’elle a bien compris les consignes en commençant oralement la description justifiée du mouvement. La justification donnée par E1 de l’arrêt de la particule est correcte mais, quand JY le lui fait remarquer, elle donne une autre réponse, hors sujet. Or JY lui répète sa réponse sous forme affirmative, sans vérifier si elle ou un autre élève du groupe est en mesure de la confirmer. Il y a donc ici un mélange d’effet Jourdain et d’effet Topaze involontaires dans le chef de JY. L’accélération apparaît avant la vitesse Juste avant {1-5’05}, JY ne les ayant pas encore rejoint, les élèves du groupe 1 parlent entre eux d’accélération. L’arrivée de JY dans le groupe et la question de M1 sur la position initiale font que ce sujet ne reprend qu’à partir de {1-6’45}. Les élèves voient le graphique comme deux arcs de parabole, l’un convexe, l’autre concave. La concavité n’est pas nommée (les élèves parlent de parabole et de parabole inversée). En tout cas, les élèves interprètent le graphique correctement en termes d’accélération et de décélération. Les élèves de ce groupe ont donc considéré l’accélération de la particule avant même l’étude de la vitesse. - 291/709 - 9.3.2. Résumé des enregistrements filmés dans le groupe 1 Trois puis quatre tronçons Également à {1-6’45}, des élèves du groupe 1 ont eu l’idée de découper la courbe en trois tronçons qu’ils appellent d’abord A, B et C, correspondant respectivement à l’arrêt du mobile, son déplacement et son nouvel arrêt. Cela a échappé à M1 qui demande aux autres des explications. Le début de discussion sur l’accélération conduit à distinguer la phase d’accélération de celle de décélération, donc à former un nouveau découpage, en 4 tronçons désormais : zone A (arrêt), zone B (accélération), zone C (décélération) et zone D (arrêt). Il faudra attendre {1-8’39} pour que tous les élèves du groupe 1 se mettent d’accord sur les instants qui séparent les 4 tronçons. Ainsi, le premier réflexe des élèves aura été de lire le graphique en termes d’arrêt et de mouvement de la particule, donc de positions fixes et de positions variables. Ensuite, en réfléchissant davantage, ils affinent leur lecture en termes d’arrêts, de mouvement accéléré et de mouvement décéléré. Dans les copies des élèves des autres groupes, on retrouve ce même découpage de la courbe en quatre tronçons. Début de la justification de l’accélération À {1-8’05}, dans le groupe 1, alors que chacun était occupé depuis une minute à rédiger en silence le début de sa réponse, un élève pose la question de la justification de l’accélération. Cette exigence ne rencontre un écho qu’à {1-8’58}. Il s’en suit une discussion sur l’allure de la courbe (voir le point Parabole ou exponentielle ? ci-dessous, p. 294) qui se conclut en termes de non-linéarité de la courbe. C’est donc bien le fait que le graphique est courbe qui permet à ces élèves de comprendre qu’il y a une accélération. Une élève (E1) découpe un intervalle de temps en plusieurs plus petits et de même amplitude et observe que la position augmente de plus en plus, ce qui lui semble justifier qu’il y a accélération. Un autre élève explique que « Au fur et à mesure que le temps avance, la position augmente de plus en plus vite ». E1 considère des intervalles de temps de plus en plus petits. Or elle prend la position initiale de la particule (-1) comme référence et a tracé des segments perpendiculaire à l’axe des temps qui vont de celui-ci jusqu’à la courbe ; ainsi, ces segments sont chaque fois plus longs, ce qui montre la croissance de la courbe mais pas l’accélération. Pour ce faire, elle aurait dû tracer des segments qui représentent les écarts de positions sur l’intervalle de temps considéré. Quoi qu’il en soit, la justification de l’accélération n’est pas terminée. - 292/709 - 9.3. Situation I La vitesse non qualifiée {1-10’07}. C’est à ce moment que, pour la première fois, les élèves parlent explicitement de vitesse. C1 parle de vitesse, sans préciser davantage ce qu’il entend par vitesse. JY questionne C1 et le groupe à ce sujet. C1 propose de définir la vitesse comme étant « t divisé par. . . ». Il hésite et JY rectifie en suggérant que ce serait « la position divisée par le temps ? » Les élèves acquiescent. JY veut voir si les élèves ont bien compris cette formule de la vitesse (moyenne) en prenant au mot la proposition qu’il a faite : il choisit une valeur de la position et propose de la diviser par différentes valeurs du temps. Les élèves protestent et affinent leur définition. {1-11’11}. Sans avoir encore précisé de quelle vitesse il est question ici, les élèves se sont mis d’accord sur ce qu’elle représente : une variation de position divisée par un temps. Ce dernier vaut la longueur de l’intervalle de temps considéré. Aussitôt, en prenant des intervalles de temps identiques, ils observent que la différence de position augmente et que, par conséquent, la vitesse augmente. JY demande alors aux élèves du groupe 1 de qualifier la vitesse dont ils parlent (question ouverte). Plusieurs réponses sont données parmi lesquelles celle de vitesse instantanée et celle de vitesse moyenne. {1-11’46}. JY ne réagit pas aux réponses données pour laisser le groupe en débattre plus longuement. Il demande ce que « pourrait être la vitesse instantanée ». Bien que le concept de vitesse instantanée soit très abstrait à définir, l’existence d’une vitesse du mobile à tout instant tient de l’évidence. E1 en donne la définition du sens commun : « C’est à chaque moment la vitesse qu’on a ». M1 précise « Sur un petit intervalle, quoi ». {1-12’03}. M1, sans doute imprégné par l’idée qu’une vitesse est une distance divisée par un temps, est peut-être gêné intuitivement par l’expression « à chaque moment », lequel revient à considérer des intervalles de temps nuls, c’est-à-dire inexistants, et à faire une division par zéro. Quoi qu’il en soit, M1 parle si peu fort par rapport au bruit ambiant que JY n’a pas entendu sa réponse. JY ne peut donc pas prendre la balle au bond pour lancer un débat à ce sujet parmi les élèves. Les élèves prennent conscience que, si l’on considère la vitesse à tout instant, cela revient à avoir une infinité d’intervalles (de longueurs implicitement nulles), ce qui leur poserait problème dans l’état actuel de leurs connaissances. Inversement, E1 définit la vitesse moyenne comme « la moyenne de toutes les vitesses instantanées ». Cette définition sonne comme une formule institutionnalisée. En revanche, elle ne tient pas compte de ce qui précède, à savoir que la vitesse moyenne est la distance parcourue par unité de temps. JY veut entendre l’avis de l’ensemble du groupe. C’est sur base des vitesses moyennes que les élèves vont justifier qu’il y a une accélération, mais pas la vitesse moyenne sur l’ensemble de l’intervalle ; au contraire, ils pressentent l’importance de considérer des petits intervalles de temps. La confusion entre vitesse moyenne et vitesse instantanée reste encore assez marquée dans le discours des élèves et ils font peu l’effort d’employer les qualificatifs instantanée/moyenne, comme si l’imprécision pouvait leur permettre cependant d’avancer dans leur raisonnement. - 293/709 - 9.3.2. Résumé des enregistrements filmés dans le groupe 1 Parabole ou exponentielle ? Revenons un instant à {1-08’58}. Nous avons vu que l’accélération a été perçue grâce au fait que la courbe n’est pas une droite. Mais qu’est-elle au juste ? Lors du débat entre les élèves du groupe 1, la courbe a été considérée comme étant deux morceaux de paraboles ou d’exponentielles alors que, rappelons-le, aucune expression analytique n’est précisée à ce stade. E1 fait avec son bic un dessin trop peu explicite et dans le vide ; comme JY n’y a pas prêté attention sur le moment, il n’est plus possible de comprendre ce qu’elle voulait dire. Il est cependant probable que les élèves de cette classe ont étudié les phénomènes de croissance exponentielle, ne fût-ce qu’à travers l’étude des progressions géométriques ; ils ont donc déjà quelque idée de l’allure du graphique correspondant. En allant puiser dans leur bibliothèque de fonctions usuelles connues, ce sont donc la parabole et l’exponentielle qui leur semblent correspondre le mieux au graphique donné. L’accélération est justifiée via les vitesses moyennes {1-13’17}. M1 recentre le débat sur la question posée par JY, à savoir la justification de l’accélération. E1 propose de dire que le mobile « a parcouru plus de distance dans le même temps, donc ça accélère ». N1 dit que la vitesse augmente. JY demande de quelle vitesse il s’agit et M1 répond qu’il s’agit de la vitesse instantanée, ce qui n’est pas compatible avec l’idée de considérer des intervalles de temps comme le fait E1. M1 rectifie en parlant de « vitesse moyenne pour un très petit intervalle ». Expliquer et savoir expliquer {1-14’16}. JY quitte le groupe 1. Les élèves semblent désormais en mesure de justifier le fait qu’il y a une accélération dans la zone B. Ils pensent avoir compris les explications construites en présence de JY mais ils vont faire l’expérience de la difficulté de l’expliquer à leur tour à une personne exigeante, à savoir leur professeur (BM) qui est appelée à lire le rapport individuel qu’ils doivent rédiger de leur travail. {1-16’44}. Le temps passe plus lentement quand les élèves sont laissés à eux-mêmes pour rédiger une réponse cohérente qui devra se suffire à elle-même. La vitesse est qualifiée {1-18’24}. Désormais, E1 et N1 ne laissent plus le mot vitesse sans qualification (« vitesse moyenne » ici) - 294/709 - 9.3. Situation I Débat avorté sur la vitesse instantanée {1-18’57}. La phase de rédaction s’interrompt en raison d’un nouveau débat sur la vitesse instantanée. En effet, M1 demande aux autres élèves de son groupe pourquoi ils ne parlent pas ici en termes de vitesses instantanées. Sa réaction est d’autant plus légitime que N1 et E1 parlent d’une vitesse moyenne qui augmente à chaque instant. N’ayant pas été entendu une première fois, M1 insiste. E1 renvoie la question au moment où JY reviendra dans le groupe (à partir de {128’36}). Cependant, à {1-20’47}, il est brièvement question de vitesse instantanée. Chacun reprend la rédaction de sa réponse. Peut-être les élèves du groupe 1 échangent-ils encore mais le bruit de fond dans la classe est désormais trop important pour entendre ce qu’ils se disent. . . Quoi qu’il en soit, sans être encore en mesure de se faire une idée de la valeur de la vitesse instantanée, les élèves associent désormais la vitesse à un instant donné à la vitesse instantanée. Quelle distance parcourue ? Au cours de la rédaction de leur réponse, les élèves du groupe 1 vont faire une erreur qu’on ne retrouve dans aucun autre groupe. Est-ce parce qu’ils ont mal compris la situation lors du débat en présence de JY (cf. sous-section Début de la justification de l’accélération, p. 292) ? Toujours est-il que, dans leur découpage en petits intervalles de temps, au lieu de considérer la distance parcourue dans chaque intervalle, ils vont considérer une distance totale parcourue : pour la zone B, celle où la particule accélère, ce sera la distance entre la position initiale de la particule (-1) jusqu’à la position atteinte à la fin de l’intervalle considéré ; pour la zone C, celle où la particule décélère, c’est la distance totale entre la position de la particule en début d’intervalle de temps jusqu’à la position atteinte lorsqu’elle s’arrête (+3). La figure suivante provient de la copie de M1 ; on y voit l’erreur qui vient d’être décrite et sa rectification postérieure : C’est N1 qui semble avoir eu cette idée. Il y a un débat entre eux. N1 reconnaît qu’il fait quelque chose de bizarre mais que ça ne change pas grand chose au raisonnement. - 295/709 - 9.3.2. Résumé des enregistrements filmés dans le groupe 1 {1-24’12}. JY revient dans le groupe 1. E1 explique qu’elle ne comprend pas le choix opéré par N1 de prendre pour référence la position finale du mobile dans la zone C. JY lui explique sans plus attendre où réside l’erreur. Tandis que JY s’adresse à E1, les trois autres élèves du groupe 1 débattent sans les écouter et M1 parvient à expliciter leur erreur. JY s’adresse à tout le groupe 1 et parle des variations de position en termes de marches d’escalier. Un peu plus tard, E1 veut être certaine d’avoir bien compris. Elle met en évidence les contre-marches pour signifier la variation de position. Nouveau débat à propos de la vitesse instantanée {1-28’36}. N1, en reprenant son argumentation pour justifier l’accélération, s’exprime en termes de vitesses moyennes. Cela donne à M1 l’occasion de revenir avec sa question sur la vitesse instantanée. JY explique qu’une vitesse instantanée se conçoit abstraitement comme la vitesse d’un mobile à un instant donné mais qu’elle ne peut être mesurée avec exactitude. Cela conduit les élèves à considérer « un intervalle de temps très très réduit » sur lequel la vitesse moyenne sera d’autant plus proche de la vitesse instantanée. E1 précise que « Comme ça, on peut aller à l’infini. . . ». {1-29’57}. JY explique l’abus de langage lorsque l’on dit qu’un radar mesure une vitesse instantanée : il s’agit d’une vitesse moyenne mesurée sur un tout petit intervalle de temps. C1 et N1 acquiescent. Ce dernier emploie le mot « approximation » pour qualifier la mesure d’une vitesse instantanée à l’aide de la vitesse moyenne sur un petit intervalle. Intervention de BM dans le groupe 1 Les élèves travaillent à la rédaction de leurs réponses de {1-30’48} (JY quitte le groupe 1 peu après) à {1-34’53}, lorsque BM rejoint le groupe 1 en restant debout. {1-35’17}. BM lit la feuille de E1 et demande si ce sont eux-mêmes qui ont eu l’idée de dessiner des « escaliers ». E1 répond par l’affirmative. BM lit une nouvelle fois la feuille d’E1. E1 demande si « c’est bon ». BM taquine les élèves qui cherchent avant tout à obtenir l’approbation du professeur. Elle les invite à relire les consignes pour vérifier eux-mêmes s’ils ont terminé leur travail. {1-36’38}. BM cherche néanmoins à leur faire approfondir davantage la question. Le bruit de fond couvre pratiquement la réaction de E1 et M1 qui estiment, en substance, avoir déjà accompli ce travail. BM tourne la feuille d’E1 vers elle pour la relire. BM se fait expliquer la légende employée par E1 pour décrire ses marches d’escalier. De fait, les marches d’escalier sont au crayon (noir) et les bâtons sont en rouge, tandis que la légende, appelée « ∆ position », est en noir chargée de rouge (ou le contraire ; on voit déjà cette écriture surchargée dans la vidéo vers la minute 24, donc bien avant l’intervention de BM) ; l’autre légende, en bleu, est appelée « ∆ temps ». BM a donc préféré voir le noir qui dépasserait du rouge que le contraire. On voit sur la vidéo que E1 entreprend de faire un zoom sur la courbe pour décrire plus précisément une marche d’escalier. BM est satisfaite. {1-37’22}. BM quitte le groupe 1 tandis que JY le rejoint. Il laisse encore quelques minutes aux élèves pour qu’ils terminent de rédiger. - 296/709 - 9.3. Situation I Objectif de la rédaction {1-38’10}. Dans le groupe 1, JY revient sur la question de la qualité de la rédaction. E1 comprend le but qui est d’arriver « à faire passer ton idée ». Un terrain connu Le milieu choisi est familier des élèves qui ont l’impression de faire de la physique telle qu’ils la pratiquaient l’année scolaire précédente. On rencontre des commentaires des élèves en ce sens à {1-16’05} et {1-23’55}. Les commentaires précédents ont été faits par les élèves du groupe 1 en l’absence de JY. En sa présence, ils n’hésitent pas à les lui répéter ( {1-37’36}). Mise en commun Pour commencer, JY donne une nouvelle consigne : si les élèves veulent prendre des notes de la mise en commun, ils ne doivent pas le faire sur la feuille sur laquelle ils viennent de travailler pour bien distinguer leur production des apports et compléments du professeur. {1-44’15}. La sonnerie indique la fin de la première heure de cours. JY entre dans le vif du sujet. Il commence par parler de la forme de la courbe qui pouvait faire penser à une parabole mais pour laquelle on ne pouvait rien affirmer sans information supplémentaire. Il prend l’exemple de la partie positive de x3 qui ressemble à une parabole sans en être une. JY raconte ensuite ce qu’il a vu et entendu au sujet de la description du mouvement de la particule et, parfois, ce qu’il aurait pu voir ou entendre. Ainsi, à {1-45’59}, après avoir justifié, à l’instar des élèves, l’arrêt du mobile en disant que la position est fixe tandis que le temps s’écoule, JY propose une justification de l’accélération qui repose sur le sens commun et à laquelle les élèves n’ont pas pensé : au début, la particule est à l’arrêt ; plus tard sa position augmente ; la particule s’est donc mise en mouvement ; il y a donc accélération. De même, à la fin, la particule est à nouveau à l’arrêt ; or elle était en mouvement ; elle a donc dû décélérer. JY précise qu’il s’agit d’un argument de bon sens mais que les élèves verront plus tard (en l’occurrence, à la situation IV) que cet argument « peut-être trompeur ». Pour justifier qu’il y a une accélération, ce que JY a entendu le plus fréquemment est que, « pour des mêmes intervalles de temps, la distance parcourue augmente ». JY accompagne son discours d’un graphique de la courbe comme avaient fait les élèves du groupe 1. Il pose alors une question à la classe : « Alors, qu’est-ce que ça veut dire ça que, pour un même intervalle de temps, la distance parcourue augmente ? » Un élève répond que la vitesse augmente (Me4, {1-47’28}). JY se fait préciser qu’il s’agit ici d’une vitesse moyenne. Ayant nommé une loi de position p (t), JY demande à la classe comment s’écrit la vitesse p(t + ∆t) − p(t) moyenne entre les instants t et t + ∆t. M2 lui répond : vm = . JY insiste alors ∆t - 297/709 - sur le fait qu’une vitesse moyenne fait toujours référence à un intervalle de temps. Ainsi est institutionnalisée la formule algébrique de la vitesse moyenne. {1-49’58}. JY va aborder la notion intuitive de pente d’une courbe même si cet argument n’a pas été avancé tel quel par les élèves. Il commence par citer des élèves (du groupe 7) qui se sont exprimés en termes de pente de la tangente : le mot est jugé trop technique pour le moment par JY qui propose de parler plus simplement de la pente de la courbe. Il considère l’intuition qui lierait cette pente à la vitesse instantanée. JY ne veut pas, a priori, forcer la main des élèves et leur imposer une intuition qui ne serait pas la leur. JY veut approfondir le sujet en rappelant qu’aucun instrument de mesure ne donne une vitesse instantanée ; il cite en particulier le cas du compteur de vitesse dans une voiture et le radar, tous deux censés mesurer une vitesse instantanée. {1-52’06}. Un élève estime que le lien entre pente et vitesse est manifeste si l’on considère la pente sur un petit intervalle de temps. JY reconnaît que cette pente vaut la vitesse moyenne sur le petit intervalle de temps mais pas la vitesse instantanée. Un élève du groupe 6 (F6) a mobilisé ses connaissances sur la tangente (même inefficacement) pour résoudre la situation I (voir Annexe B.1, p. 576). Il intervient à {1-52’33} pour demander si leur emploi serait efficace pour résoudre la question. JY demande aux élèves d’ignorer provisoirement leurs connaissances à ce sujet. Il termine la mise en commun en résumant ce que la pente de la courbe permet d’observer en termes d’accélération. 9.4 9.4.1 Situation II.1 Énoncé proposé aux élèves II. Deux particules et une vitesse II.1 Approche graphique Considérons à présent deux particules P1 et P2 qui se déplacent sur un axe orienté comme à la figure 1. Leurs positions respectives p1 et p2 en fonction du temps sont données par les graphiques de la figure 3. - 298/709 - 9.4. Situation II.1 Figure 3 Décrire les mouvements de ces deux particules. Y a-t-il un ou des moments où ces deux particules ont la même vitesse ? Justifier. Estimer ce ou ces moments. 9.4.2 Résumé des enregistrements filmés dans le groupe 1 L’expérimentation de cette situation s’est déroulée le lundi 7 janvier 2008 après-midi et a duré un peu moins d’une période de cours. Naturel des élèves face à la caméra {1-54’21}. Au moment de la distribution de la feuille relative à la Situation II.1, c’està-dire au début de la seconde heure de cours, la caméra était dirigée vers le tableau, car JY venait de faire la synthèse de ce qui s’était passé la première heure. Les élèves du groupe 1 pensent ne pas être filmés, « sauf si c’est un grand angle » dit l’un d’eux. Ils bougent et constatent, sur l’écran tourné vers eux, qu’ils sont effectivement filmés. Cela ne les empêche pas d’être naturels dans leurs réactions. JY va alors vers le tableau pour poser une question à la classe. Ce faisant, il passe non loin d’eux ; ils arrêtent leur discussion et commencent à lire leur deuxième feuille. - 299/709 - 9.4.2. Résumé des enregistrements filmés dans le groupe 1 La concavité est connue des élèves {1-55’00}. JY s’adresse à toute la classe pour savoir s’ils savent reconnaître une courbe concave d’une courbe convexe. Les élèves l’affirment. On peut se douter que la portée du concept de concavité/convexité leur échappe et qu’ils n’ont peut-être jamais explicité le fait intuitif que la courbe est dite convexe lorsque le segment de droite liant deux points quelconques de la courbe est situé au-dessus de celle-ci tandis qu’elle est dite concave lorsqu’un tel segment est situé en dessous de la courbe. Toujours est-il que les élèves emploient judicieusement le mot convexe lorsque la concavité est tournée vers les ordonnées positives et concave lorsque la concavité est tournée vers les ordonnées négatives. Ces précautions prises, JY fait le lien entre, d’une part, ce qui a été observé lors de l’étude de la situation I quant à la croissance/décroissance de la vitesse et, d’autre part, la convexité/concavité de la courbe. Vitesse constante et marches d’escalier {1-55’52}. JY recadre la caméra vers le groupe 1 mais ne reste pas. Ayant justifié le mouvement de la situation I grâce aux marches d’escalier, N1 et C1 continuent dans cette voie. Néanmoins, ce n’est toujours pas la pente de la courbe qui suffit à faire dire à C1 que la vitesse de la particule P2 est constante : il justifie la constance de la vitesse par la constance de la forme des marches d’escalier. {1-56’23}. E1 voyant N1 et C1 représenter les marches d’escalier sur leur feuille se lance à son tour dans cette voie. {1-59’01}. M1 trouve la méthode des marches d’escalier compliquée et E1 lui fait une réponse résignée : « Ben écoute, du moment que tu dois le faire. . . » {1-60’17}. C1 et N1 raisonnent à voix haute à propos de la constance de la vitesse de P2 tandis que E1, au fur et à mesure, raconte également ce qu’elle a compris à ce sujet et conclut qu’il n’y a pas d’accélération dans ce cas. Droite, donc vitesse constante et accélération nulle {1-61’53}. JY revient dans le groupe 1. Lorsqu’il demande au groupe de lier l’absence d’accélération à la vitesse, les élèves parlent d’abord de la constance de la variation de position puis de MRU (mouvement rectiligne uniforme), puis de la linéarité du graphique de la loi de mouvement et, enfin, de vitesse constante. Une loi de mouvement plus facile que l’autre {1-62’27}. M1 pose une question partiellement inaudible à E1 à propos de la loi de mouvement de P1 . E1 lui répond qu’elle s’occupe d’abord de « P2 : c’est plus facile ». E1 se demande si parler de pente constante suffit à justifier la constance de la vitesse. - 300/709 - 9.4. Situation II.1 Vitesse moyenne ou instantanée ? {2-0’38}. M1 dit quelque chose de quasi-inaudible comme : « Donc. . . on peut dire que la vitesse moyenne est. . . ». JY prend la balle au bond et demande de « quelle sorte de vitesse » il s’agit. Le but est de préparer les élèves à spécifier habituellement la vitesse même si, dans le cas de P2 , la vitesse moyenne et la vitesse instantanée se confondent. M1 puis C1 font un commentaire inaudible. On entend C1 parler de vitesse instantanée. Finalement ({2-1’03}), JY valide l’idée que, lorsque la vitesse moyenne est constante sur n’importe quel intervalle de temps, la vitesse instantanée est égale à cette constante. Les élèves reconnaissent des éléments de la situation I {2-1’50}. Les élèves reconnaissent dans la courbe de P1 une partie de la courbe proposée à la situation I. {2-2’02}. JY se retourne pour placer la caméra plus proche du groupe 1. Désormais, la qualité du son sera meilleure. Intersection des graphiques des lois de mouvement {2-2’24}. Lorsque JY évoque la question de l’instant où les deux mobiles ont la même vitesse, E1 répond aussitôt qu’elle pense que l’instant cherché correspond au point d’intersection des graphiques proposés. Revenons un petit peu en arrière. À {1-56’41}, E1, en l’absence de JY, évoque au reste du groupe l’idée que l’instant cherché pourrait être celui de l’intersection des graphiques des lois de mouvement. C1 et N1 rejettent l’idée de E1 sans préciser tout de suite pourquoi le point d’intersection des graphiques des lois de mouvement ne convient pas. {1-56’57}. Après réflexion, C1 se justifie en disant qu’en ce point, les deux mobiles « ont la même vitesse moyenne depuis le départ ». Maintenant ({2-2’24}), en présence de JY, E1 propose à nouveau sa solution. C1 expose à nouveau son argument en termes de vitesses moyennes. {2-3’00}. M1 n’a pas compris l’explication ; E1 et C1 lui répondent en même temps. Tout le monde tombe d’accord. - 301/709 - 9.4.2. Résumé des enregistrements filmés dans le groupe 1 Un petit intervalle de temps où les vitesses moyennes sont les mêmes {2-3’22}. Ce débat a inspiré C1. La caméra ne le filme pas au moment de sa première explication mais JY recadre la prise de vue lorsque C1 la répète. Il propose de comparer les deux lois de mouvement, non plus entre les instants correspondant aux deux points d’intersection (« c’est pas très intéressant », dit-il), mais sur un même petit intervalle de temps : lorsqu’une (contre-)marche d’escalier pour un des graphiques est la même (ou a la même hauteur) que pour l’autre, les vitesses moyennes sur ce petit intervalle commun de temps sont égales. Est-ce que ça répond à la question ? {2-4’00}. JY demande aux élèves si l’idée de C1 répond à la question posée et leur demande de relire celle-ci. Une vitesse initiale forcément nulle {2-4’36}. JY revient sur les conditions initiales de la situation I et demande aux élèves du groupe 1 quelles étaient les vitesses initiales. Le premier réflexe des élèves consiste à les supposer nulles, peut-être parce qu’ils associent le mot initial à la valeur nulle ; quoi qu’il en soit, l’instant initial est bien nul. Voir la vitesse initiale {2-4’50}. L’absence d’expression analytique ou de toute autre donnée chiffrée donne l’impression aux élèves qu’il n’est pas possible de connaître les vitesses initiales. JY, sans vendre la mèche, les pousse à trouver la réponse sur les graphiques des lois de mouvement en utilisant le verbe voir. Cela ne suffit pas. {2-5’55}. JY fait alors référence au travail réalisé lors de l’étude de la situation précédente pour tenter de donner une réponse ; en vain. Pente nulle = vitesse nulle {2-6’28}. C1 a une réponse numérique : la vitesse initiale de P1 est nulle. Il emploie à son tour le verbe voir. Tentative d’installation d’une lecture graphique d’une vitesse instantanée {2-6’46}. JY tente alors d’installer chez les élèves une lecture graphique directe de la vitesse instantanée en termes de pente. Il le fait dans le cas particulier d’une vitesse instantanée nulle. - 302/709 - 9.4. Situation II.1 Vitesse constante non nulle et vitesse initiale {2-7’10}. JY expose aux élèves du groupe 1 que, s’agissant de P2 , puisque sa vitesse est constante, elle vaut cette constante à tout instant et, en particulier, à l’instant initial. {2-7’25}. M1 a du mal à admettre qu’une vitesse initiale puisse être non nulle. Résistance de l’installation de la lecture graphique d’une vitesse instantanée dans le groupe 1 {2-7’40}. JY, conscient que la digression relative aux vitesses initiales a été un peu longue, clôt le débat en invitant les élèves à rédiger leurs observations sur leur copie. Retour au petit intervalle où les vitesses moyennes sont les mêmes {2-7’55}. Les élèves identifient qu’il n’y a qu’un instant où les deux mobiles ont la même vitesse instantanée. Ils précisent que c’est « plus ou moins à cet endroit ». {2-8’10}. À N1 qui lui montre un autre intervalle où, pense-t-il, les deux mobiles ont la même vitesse, C1 montre que sur cet intervalle de temps, la contre-marche pour P1 est plus longue que celle pour P2 . Son argument pour justifier l’unicité de l’instant cherché est que le mobile P1 « va toujours accélérer, tandis que [la vitesse de P2 ] va être constante ». On n’obtient pas un instant précis {2-9’03}. Les élèves prennent conscience qu’avec la méthode des marches d’escalier, ils trouvent un intervalle de temps — fût-il tout petit — sur lequel les vitesses moyennes des particules sont égales, et non un instant précis comme le demande pourtant l’énoncé du problème. Un greffier par groupe ? {2-9’28}. JY fait remarquer le contraste qui existe entre la richesse des discussions qu’ils ont et la pauvreté des traces écrites sur leurs feuilles. En particulier, ce que les élèves écrivent est le raisonnement conduisant à répondre au problème posé et non le reflet fidèle de ce qui s’est produit au sein du groupe. La difficulté des élèves à réfléchir tout en prenant des notes obligerait à placer un preneur de notes extérieur (neutre) et efficace dans chaque groupe. - 303/709 - 9.4.2. Résumé des enregistrements filmés dans le groupe 1 La volonté de cadrer à tout prix avec la question posée {2-10’03}. E1, qui n’a pas tout suivi du raisonnement de C1, ne voit pas très clair pour rédiger sa réponse. En particulier, elle a entendu que l’instant cherché serait t égal à 1, ce qui n’a pas été dit : au mieux a-t-il été question d’une solution « aux environs de 1 » (N1 à {2-9’03}). Ce serait une « conclusion » qui répondrait à la question posée. N1 et C1 ne réagissent pas aux propos de E1. JY doit intervenir pour faire expliciter aux élèves que ce qu’ils ont trouvé est un intervalle qui contient l’instant cherché et non celui-ci. Des intervalles de temps de plus en plus petits {2-11’24}. L’idée de réduire les intervalles de temps vient à l’esprit des élèves spontanément. Phase de rédaction {2-11’36}. Nouvelle mise au point rédactionnelle : il faut tâcher de raconter ce qui s’est passé dans le groupe et non seulement de répondre à la question posée. {2-12’03}. JY quitte le groupe 1. JY remet la caméra sur le pied, si bien que la qualité du son redevient très médiocre en raison du bruit ambiant dans la classe. Les élèves du groupe 1 rédigent leurs réponses. Lorsque le besoin s’en fait sentir, l’un ou l’autre élève demande aux autres des compléments. La qualité du son ne permet pas leur retranscription. {2-23’40}. M1 semble faire une remarque sur le fait qu’ils sont en maths et que, pourtant, ils écrivent beaucoup de français. E1 répond qu’elle aime bien ça. Ici aussi, le dialogue n’est pas assez audible pour être retranscrit. Intervention de BM {2-25’18}. BM vient dans le groupe 1. Cette fois, lorsque E1 dit que « c’est à l’instant 1 » que les particules ont la même vitesse, N1 rectifie aussitôt : « plus ou moins à l’instant 1 ». BM demande si c’est « avec votre escalier » qu’ils ont trouvé leur réponse. Mise en commun {2-26’22}. JY est au tableau. Il dessine les lois de mouvement des deux particules. Il fait ensuite la synthèse de ce qui a été fait dans les différents groupes. Il a observé l’emploi de la stratégie des marches d’escalier et la stratégie des droites parallèles ; il les décrit. Il ajoute une troisième stratégie, celle de l’écart maximum, même si aucun groupe n’y a songé dans cette classe. {2-30’56}. (La sonnerie de la fin du cours retentit.) - 304/709 - 9.5. Situation II.2 9.5 9.5.1 Situation II.2 Énoncé proposé aux élèves La seconde partie de la situation II est consécutive à la première. Elle en est la traduction analytique. Les élèves ne prennent connaissance de cette deuxième partie qu’après avoirs terminé de répondre à la première. II.2 Approche analytique Considérons deux particules P1 et P2 qui se déplacent sur un axe orienté comme à la figure 1. Leurs positions respectives p1 et p2 en fonction du temps sont données par les fonctions p1 (t) = t√2 p2 (t) = 3·t Décrire les mouvements de ces deux particules. À quel moment ces deux particules ont-elles la même vitesse ? Justifier. Quel est l’avantage de connaître les expressions analytiques des positions de P1 et P2 ? 9.5.2 Résumé des enregistrements filmés dans le groupe 1 L’expérimentation de cette situation s’est déroulée le mercredi 9 au matin (une période de cours) et le vendredi 11 janvier 2008 (un peu moins d’une demi période de cours). Rappel des consignes rédactionnelles {3-0’00}. BM commence par rappeler aux élèves la consigne de garder trace de tout leur raisonnement. Cette consigne est généralement peu suivie, les élèves ayant l’habitude, au contraire, d’avoir des notes propres et cohérentes. Ils ont le réflexe de gommer ce qui est faux ou provisoire pour ne garder qu’un raisonnement déjà construit. Conservation des stratégies utilisées dans la situation II.1 {3-1’06}. JY invite les groupes parvenus à résoudre l’approche graphique à garder la même stratégie dans l’approche analytique, à savoir celle des marches d’escalier ou celle des droites parallèles ; quant aux groupes qui n’étaient pas parvenu à résoudre l’approche graphique, JY leur laisse le choix de prendre la stratégie des marches d’escalier ou celle de l’écart maximum. - 305/709 - 9.5.2. Résumé des enregistrements filmés dans le groupe 1 Seule la zone autour de t = 1 est utile {3-2’24}. Dans un premier temps, JY n’est pas présent dans le groupe 1. L’idée des trois élèves présents (C1 arrivera en retard, à {3-11’53}) est de calculer les distances parcourues sur des intervalles de temps d’un quart d’unité (l’axe du temps est gradué ainsi) autour de t = 1, pour en déduire la vitesse moyenne sur ces intervalles. M1 se demande pourquoi s’intéresser à t proche de 1. Vérification que la situations II.2 correspond à la situation II.1 {3-2’42}. E1 interrompt N1. Elle veut s’assurer que les expressions analytiques données correspondent aux graphiques des lois de mouvement étudiés précédemment. Calculer ou égaler des vitesses moyennes ? {3-2’52}. N1 et E1 veulent calculer les vitesses moyennes en calculant les distances parcourues. Mais l’idée d’égaler les vitesses moyennes ou les distances parcourues par les deux particules n’est pas explicitée. {3-3’10}. M1 n’était pas satisfait des explications de N1 et E1 à propos du choix de s’intéresser à t proche de 1, mais n’a pas pour autant l’intention de calculer indéfiniment les vitesses moyennes sur tous les intervalles possibles. Suit une discussion entre les trois élèves mais la qualité du son ne permet pas leur transcription intégrale. N1 indique à M1 qu’il est pertinent de calculer les vitesses moyennes autour de t = 1 et non autour de t = 0, mais sans être explicite quant aux raisons de procéder ainsi. {3-3’37}. E1 estime que « ça ne change rien si on prend la position de zéro ». Sa phrase est ambiguë : N1 comprend que la mesure de la position au début de l’intervalle n’aurait pas d’influence sur le calcul de la vitesse moyenne sur un intervalle autour de t = 1 et il conteste un tel point de vue. En fait, E1 veut dire que la démarche de calculer les vitesses moyennes peut tout autant se faire autour de t = 0 qu’autour de t = 1. Trouver une vitesse instantanée ou moyenne ? {3-3’54}. M1 est conscient que l’objectif est de trouver une vitesse instantanée ; il parle de considérer de petits intervalles mais sa remarque ne rencontre pas d’écho chez N1 ni E1 ; contrairement à son habitude, M1 n’insiste pas. JY explique à nouveau à la classe la stratégie de l’écart maximum {3-4’22}. JY s’adresse à toute la classe pour expliquer à nouveau en quoi consiste la stratégie de l’écart maximum. - 306/709 - 9.5. Situation II.2 La calculette rassure {3-5’57}. E1 appelle JY qui rejoint alors le groupe 1. Elle demande l’autorisation d’utiliser une calculette. JY ne voit pas l’intérêt d’utiliser la calculette, puis se ravise de le leur dire, afin de voir ce qu’ils vont faire avec. Les élèves veulent calculer des variations de position ou des vitesses moyennes sur divers intervalles. Chacun fait ses calculs en silence. À {3-8’16}, JY pose la caméra sur la table et quitte le groupe 1. √ 3 pose problème √ {3-8’27}. M1, préoccupé par la 3, envisage d’arrondir les résultats obtenus et N1 lui rétorque que le résultat obtenu ne sera alors pas très précis. E1 résume — « en gros », ditelle — ce qu’il faut faire : à partir des diverses positions, calculer des vitesses (moyennes) et les comparer. Ce résumé, approuvé par N1, est imprécis et manifeste sans doute que ces élèves ne savent pas très bien pourquoi ils vont faire ces calculs. {3-9’00}. N1, conscient du manque d’inspiration du groupe, regrette que C1 ne soit pas encore arrivé. Pendant ce temps, M1 continue à chipoter avec la calculette. À défaut de voir clair, N1 et E1 essayent de comprendre la démarche de M1. Les élèves passent plusieurs minutes (de {3-9’25} à {3-11’53}) à se débattre avec ces calculs. Reculer pour mieux sauter {3-11’53}. C1 arrive en classe. N1 lui explique où ils en sont. L’arrivée de C1 permet, paradoxalement, de remettre les pendules à l’heure : in fine, c’est bien les vitesses instantanées qui doivent être égales ; néanmoins, dans un premier temps, ce sont des vitesses moyennes que les élèves veulent égaler. E1, M1 et N1 se rendent compte qu’ils sont encore loin d’avoir trouvé la solution. Chacun raconte où il en est de ses calculs. Le doute s’insinue {3-13’16}. Les élèves commencent à douter de leur méthode. Ce doute est d’autant plus pénible que la calculette tombe en panne et qu’un autre groupe (le groupe 6) se vante d’avoir trouvé la solution. - 307/709 - 9.5.2. Résumé des enregistrements filmés dans le groupe 1 Poursuite du calcul {3-14’09}. Les élèves du groupe 1 poursuivent leurs calculs. {3-14’32}. JY rejoint le groupe 1 et salue C1. JY résume à celui-ci la démarche en cours au sein du groupe. Les trois autres élèves ne se sentent pas concernés et poursuivent leurs calculs. À {3-15’16}, JY quitte le groupe 1 pour rejoindre le groupe qui a terminé et propose à ce dernier de résoudre le problème par la méthode des marches d’escalier. Les élèves du groupe 1 poursuivent le calcul des vitesses moyennes sur les intervalles de longueur 1/4 d’unité de temps pour la particule P2 , sans anticiper qu’il s’agit de la particule dont la vitesse est constante. Ils en prennent conscience à la fin du calcul. {3-16’25}. JY rejoint le groupe 1. Les élèves terminent leurs calculs. {3-17’00}. N1 montre à JY que son groupe a également calculé des vitesses moyennes pour P1 . JY fait remarquer que le calcul multiple des vitesses moyennes pour P2 était inutile. Les vitesses moyennes des deux particules sont-elles égales ? {3-17’34}. JY demande aux élèves si les vitesses moyennes des deux particules, calculées sur l’un et l’autre intervalle, sont égales. La réponse est non. Impasse du calcul numérique {3-17’53}. Les élèves proposent de faire les calculs pour des intervalles plus petits. {3-18’03}. Les élèves prennent conscience qu’il faudrait beaucoup de temps pour calculer les nombreuses vitesses moyennes sur les petits intervalles de temps, voire que cela serait impossible. JY leur demande alors d’imaginer une autre méthode que celle du calcul numérique. Établir une équation entre les vitesses moyennes {3-18’38}. Pour gagner du temps (au moins un autre groupe a déjà résolu la question), JY les recentre sur la question posée en lien avec la méthode des escaliers. Les élèves en déduisent assez rapidement qu’il doivent écrire une équation JY les provoque pour préciser qu’ils devront se contenter d’une équation entre les vitesses moyennes et non instantanées. - 308/709 - 9.5. Situation II.2 Compter sur la chance ? {3-19’30}. JY montre que l’efficacité du calcul numérique est une affaire de chance. Le statut de t en question {3-19’53}. E1 pose la question du statut de t à prendre dans l’équation : un nombre fixé ou une variable ? Il n’est pas impossible que l’idée lui soit venue en entendant, quelques dizaines de secondes plus tôt, JY nommer explicitement le temps par la variable t qui le représente. N1 a compris que le calcul numérique est désormais à écarter. Débat sur l’expression algébrique d’une vitesse moyenne {3-20’13}. E1 propose une formule de la vitesse instantanée de la forme v = p/t. S’ensuit toute une digression sur la différence entre la position et la distance parcourue. {3-22’16}. La digression se termine par l’interprétation correcte de l’expression étant la vitesse moyenne depuis l’instant 0 et la position 0, autrement dit p−0 t−0 . p t comme Le statut de t est d’être une inconnue {3-23’12}. JY reconsidère le statut à donner à t. Cette fois, N1 va explicitement rejeter le caractère numérique fixé donné à t jusque là. t devient une inconnue du problème. Confusion entre inconnue et inconnaissable ; opposition entre variabilité et unicité {3-24’27}. Il reste alors à écrire l’équation entre les vitesses moyennes des deux particules. L’expression p = t2 conduit à une discussion fonctionnelle : à quel instant la position de la particule P1 est-elle égale à t2 ? t étant variable, les élèves ont du mal à concevoir qu’il n’y a qu’en t « égale t » que p1 (t) = t2 . Une seconde variable temporelle {3-25’06}. Puisqu’une vitesse moyenne se calcule sur un intervalle, se pose la question des bornes de l’intervalle. Ainsi, on va passer d’une variable, t, à deux variables : l’instant au début de l’intervalle et l’instant à la fin de l’intervalle. {3-25’44}. Par analogie avec les calculs numériques qu’ils ont fait auparavant, JY suggère aux élèves du groupe 1 d’appeler t l’instant initial et t + ∆t l’instant final. On verra plus loin que ce n’est pas la notation que les élèves choisiront finalement. JY leur demande de tirer un trait sur leur feuille et de continuer en dessous de ce trait pour signifier qu’il y a eu une intervention d’un enseignant. En consultant les copies, on constate que E1 et N1 ont tiré ce trait. M1 demande si « on peut vraiment calculer la différence de position ». Cette question est ambiguë : M1 parle-t-il d’un calcul numérique ou de la formalisation algébrique de cette différence ? On ne le saura pas tout de suite car personne ne l’entend. - 309/709 - 9.5.2. Résumé des enregistrements filmés dans le groupe 1 La durée de l’intervalle de temps : du numérique à l’algébrique {3-26’26}. N1 propose de choisir un intervalle de temps de durée égale à 10−3 . E1 trouve 10−3 très petit. {3-26’57}. M1 revient sur sa question du calcul de la différence de position. Il y répond lui-même. Il l’exprime à l’aide des instant t1 et t2 dont il ne précise pas qu’ils sont respectivement l’instant initial et l’instant final de l’intervalle considéré. {3-27’37}. M1 parlant très bas de manière habituelle, JY n’a pas entendu le contenu de son intervention. Il revient donc à la question de E1 et propose à nouveau de considérer t et ∆t. M1 utilise les notations t1 et t2 et non t et ∆t suggérées par JY. Au départ, il considère t1 et t2 comme les valeurs non numériques aux bornes d’un intervalle où se trouve t. La notation algébrique finit par s’imposer {3-28’07}. E1 a du mal avec les écritures algébriques et leur préfère toujours les valeurs numériques. N1 intervient pour rappeler la nécessité des notations algébriques et M1 explique que le but est de ne pas dépendre de la chance. {3-28’46}. JY montre l’intérêt initial du calcul numérique, pour se faire une idée de la situation, afin de soutenir E1 qui lui semble en difficulté. N1 et E1 reprennent les notations de M1 pour désigner les instants initial et final de l’intervalle de temps. Une expression simplifiable de la vitesse moyenne de P1 {3-29’44}. M1 a écrit sur sa feuille : v1 = t22 − t21 . Il exprime la nécessité de simplifier t2 − t1 ce quotient. C1 propose une expression incorrecte pour ∆p1 : (t2 − t1 )2 . En raison du prestige de C1 dans le groupe, N1 et E1 se rangent à son avis sans discussion. {3-30’01}. M1 poursuit son raisonnement, toujours à voix très basse, si bien que personne ne lui prête attention. Suite à une remarque de C1, N1 fait usage de sa gomme pour effacer ce qui était caduque. JY lui rappelle les consignes de rédaction à ce sujet : il ne faut rien effacer. {3-30’25}. JY oppose M1 aux autres élèves qui ont suivi C1 dans sa nouvelle formulation pour susciter un débat. E1 exprime la formulation correcte de la variation de position. {3-30’39}. M1, qui n’a pas vraiment écouté la réponse de E1, justifie sa formule. {3-30’55}. M1 montre qu’il sait passer des notations (t1 , t2 ) à (t, ∆t). C1 dit avoir compris mais JY ne le perçoit pas ainsi et il insiste. Pendant que JY donne son explication à C1, M1 et E1 continuent à dialoguer à propos t2 − t21 de la simplification du quotient trouvé par M1 : v1 = 2 . Leur dialogue est couvert par t2 − t1 les voix de JY et C1. {3-31’38}. Une fois que JY a fini de s’adresser à C1, le dialogue entre M1 et E1 redevient audible. Sur base de ce que E1 et M1 ont écrit sur leurs feuilles, on peut supposer que M1 reproche à E1, ayant écrit une égalité, de ne pas avoir simplifié directement les dénominateurs alors qu’ils sont identiques dans les deux membres. - 310/709 - 9.5. Situation II.2 Le doute revient {3-32’01}. JY quitte le groupe 1. Les élèves n’ont pas tous l’impression d’avoir vraiment avancé. Une équation simple mais à deux variables {3-32’24}. M1 simplifie son quotient différentiel en reconnaissant un produit remarquable. {3-32’36}. E1 et M1 obtiennent une √ équation simple mais à deux inconnues (N1 le dit explicitement à {3-34’36}) : t2 + t1 = 3. E1 observe qu’ils n’ont « quand même pas t à ce moment là ». √ {3-32’56}. E1 explique à N1 comment elle a obtenu l’équation t2 + t1 = 3. E1 et M1 ont beau écrire cette équation de toutes les manières possibles, il reste toujours une seconde inconnue. {3-33’52}. M1 et E1 filment N1 en train de recopier ce qu’ils ont mis en commun. Mais l’instant t cherché n’apparaît toujours pas. Deux inconnues : trouver une seconde équation ? {3-34’36}. N1 propose de constituer un système de deux équations à deux inconnues. Mais quelle serait une seconde équation ? De plus, N1 ne se demande pas quel serait l’intérêt de calculer t1 et t2 . {3-34’51}. C1 exprime son raisonnement et parvient à la même réponse que les autres : √ t2 + t1 = 3. L’herbe est plus verte ailleurs {3-35’00}. En même temps que C1 et E1 s’expliquent, M1 parle de la tangente comme méthode plus avantageuse. Mais on voit plus loin que M1 parle en réalité de la stratégie de la droite parallèle au graphique de p2 (t) et déplacée jusqu’à n’avoir plus qu’un point d’intersection avec p1 (t) et non de ses éventuelles connaissances sur la tangente elle-même. N1 semble déçu de ne pas encore avoir trouvé l’instant cherché. {3-35’12}. E1 rappelle qu’il ne faut pas utiliser la tangente (la stratégie des droites parallèles) pour respecter la consigne de répartition des stratégies à employer selon les groupes. M1 et E1 se plaignent de leur sort (avec le sourire). {3-35’42}. Revient alors la tentation de trouver la solution par tâtonnement, en donnant à t des valeurs numériques. E1 rejette cette option en rappelant que t est précisément l’inconnue cherchée. On entend des soupirs sonores. C1, désabusé, propose à M1 de changer de stratégie : « Tu fais leur tangente ». M1 comme les autres élèves du groupe 1 ne réagit pas. - 311/709 - 9.5.2. Résumé des enregistrements filmés dans le groupe 1 Un seul t pour une vitesse instantanée {3-36’27}. Se basant sur le fait qu’une vitesse instantanée est celle d’un seul instant, N1 propose de ne prendre qu’un seul t plutôt que t1 et t2 . Cet argument leur donne l’idée de prendre t1 = t2 . {3-36’50}. Il s’en suit un petit quiproquo entre N1 et M1, le premier disant « sur ? » au sens de divisé par combien ? tandis que le second comprend sûr ? au sens de certain de ta réponse ? E1 veut vérifier si elle a bien compris, ce qui n’est pas encore le cas. Peut-on écrire t2 (plus ou moins) égal à t1 ? {3-37’08}. M1 et N1, simultanément, expliquent leur raisonnement à E1. En substance, N1 égalise t1 à t2 pour réduire son intervalle à un point, tandis que M1 considère t1 presque égal à t2 , mais pas exactement égal. Ils ont l’impression de dire exactement la même chose. Cela « paraît bizarre [à E1] d’égaliser t2 et t1 » mais elle ne précise pas pourquoi. Une auto-vérification possible {3-37’46}. Une plaisanterie inaudible de M1 provoque les sourires de N1 et E1 et détourne l’attention du débat. E1 propose de faire appel au professeur pour obtenir son aval. Les autres préfèrent rédiger ce qu’ils viennent de faire auparavant. E1 compare la valeur numérique obtenue avec son estimation sur le graphique pour se conforter dans l’idée qu’ils ont bien trouvé la solution du problème. Vérification auprès d’autres groupes {3-38’16}. Les élèves du groupe 1 rédigent leurs réponses tout en parlant de temps à autre. {3-38’49}. Les élèves du groupe 1, assez sûrs de leur réponse, envisagent de comparer leur réponse à celle d’autres groupes. {3-39’45}. Les élèves du groupe 1 ont terminé et se distraient en jouant avec la caméra. {3-40’50}. M1 s’impatiente et demande à un élève du groupe 6 (nous supposons qu’il s’agit de A6) s’ils ont trouvé la réponse. A6 donne comme réponse « Racine de 3 demi ». {3-41’01}. La réponse de A6 est ambiguë : est-ce groupe 1 y voient immédiatement leur réponse. - 312/709 - q 3 2 √ ou 3 2 ? En tout cas, les élèves du 9.5. Situation II.2 Intervention de BM {3-41’11}. BM demande à F6 d’ouvrir la fenêtre « pour aérer, parce qu’il commence à faire très chaud ». Du coup elle s’approche du groupe 1 et les élèves lui demandent si leur raisonnement est « juste ». BM les écoute. {3-41’45}. Les élèves justifient pourquoi t2 est presque égal à t1 . N1 parle d’une différence infiniment petite. E1 parle d’une différence tellement petite que les instants sont les mêmes, puis hésite entre l’égalité et la « presque » égalité. Elle en vient à se demander si le résultat obtenu sera exact. N1 justifie l’égalisation des instants par la réduction « à fond » de l’intervalle de temps. {3-42’06}. BM demande aux élèves de vérifier leur résultat en utilisant la méthode de l’écart maximum. Sa demande ne sera pas suivie d’effet. {3-42’29}. Pour échapper à un travail supplémentaire, E1 et M1 expliquent qu’ils se sont concentrés sur la méthode des marches d’escalier depuis le début. BM leur répond avec humour. {3-42’42}. Les élèves découvrent une dernière question au problème (sur l’avantage de posséder les expressions analytiques des lois de mouvement) et y répondent directement par N1 : « on peut être plus précis » grâce aux expressions analytiques des lois de mouvement. {3-43’01}. BM quitte le groupe 1. Les élèves continuent leur discussion relative à la question subsidiaire. {3-43’36}. M1 parle ensuite des cours qui suivront (anglais et néerlandais). E1 puis C1 lui répondent. N1 continue à rédiger sa réponse en essayant de rester concentré. {3-44’41}. N1 veut inciter les autres à se remettre au travail. En vain : E1 prend la caméra en main et s’approche de N1 pour filmer sa feuille et lire sa réponse. C1 précise qu’il ne reste que deux minutes avant la fin du cours. Les élèves du groupe 1 expliquent leur raisonnement à JY {3-44’50}. JY vient vers le groupe. N1 explique à JY comment le groupe est arrivé à la réponse cherchée. {3-45’30}. N1 montre à JY sa feuille, sur laquelle il a écrit t1 ≈ t2 et non t1 = t2 . {3-45’38}. JY, absent lorsque les élèves hésitaient entre t1 ≈ t2 et t1 = t2 , ne relance pas le débat sur ce sujet. Il parle plutôt du choix des notations. {3-46’11}. JY annonce aux élèves du groupe 1 que le prochain cours débutera par une mise en commun des travaux réalisés dans les différents groupes ; ce qui conduira à la critique de la méthode des escaliers et à l’éloge des deux autres méthodes proposées : celle de l’écart maximum et celle de la droite déplacée parallèlement à elle-même. Par ailleurs, il rappelle qu’il n’est pas opposé à l’utilisation de la tangente mais qu’elle n’est pas nécessaire pour résoudre le problème. {3-47’06}. JY quitte le groupe 1 et communique à toute la classe que le cours suivant (vendredi 11 janvier) commencera par une mise en commun de ce qui a été fait. - 313/709 - Mise en commun {4-1’25}. JY reprend les trois stratégies qui ont été prises par les différents groupes et raconte comment les élèves sont parvenu au résultat cherché. Il commence par la stratégie de l’écart maximum ({4-2’01}) et celle des droites parallèles ({4-3’48}) avant d’aborder celle des marches d’escalier ({4-8’09}). {4-12’51}. JY prépare le débat sur l’élimination future de ∆t en faisant prendre conscience aux élèves qu’il est non nul dans un premier temps. {4-13’56}. L’égalité obtenue en comparant les vitesses moyennes une fois faites les simplifications algébriques contient à la fois t et ∆t : on n’obtient donc pas une réponse précise. JY propose de barrer ∆t purement et simplement. {4-14’49}. Les élèves justifient l’élimination de ∆t par le fait qu’il est « négligeable ». JY leur oppose la règle algébrique de simplification dans une égalité. Un élève le reconnaît : « On n’a pas une égalité parfaite ». {4-16’35}. JY met en relief le paradoxe entre le statut initial de ∆t qui était non nul puis qui est annulé finalement. JY valide pragmatiquement la « bizarrerie » grâce au résultat obtenu par les deux autres stratégies, celle de l’écart maximum et celle des droites parallèles. JY cite l’exemple de Fermat — dont la méthode était fort semblable à celle obtenue par la stratégie des marches d’escaliers — pour marquer le caractère mathématique d’une telle validation. {4-20’18}. Un élève ne comprend pas pourquoi on peut se permettre de barrer ∆t « si vous dites que c’est pas bon ». {4-21’20}. Un autre élève intervient qui explicite l’intérêt des deux méthodes « faciles » pour « débloquer » la méthode des marches d’escalier. JY lui donne raison tout en montrant que les groupes qui ont cherché selon la stratégie des marches d’escalier n’ont pas été si bloqués que ça. 9.6 9.6.1 Situation III Énoncé proposé aux élèves III. Deux autres particules et une vitesse Considérons à présent deux particules P1 et P2 qui se déplacent sur un axe orienté comme à la figure 1. Leurs positions respectives p1 et p2 en fonction du temps sont données par les fonctions p1 (t) = t3 p2 (t) = 34 · t - 314/709 - 9.6. Situation III selon les graphiques de la figure 4. Figure 4 À quel moment ces deux particules ont-elles la même vitesse instantanée ? Justifier. Quelle est la vitesse de P1 à t = 1, 5 ? 9.6.2 Résumé des enregistrements filmés dans le groupe 1 L’expérimentation de cette situation s’est déroulée le vendredi 11 janvier 2008 (pendant une période de cours). Éviter la stratégie des marches d’escalier {4-23’00}. JY et BM distribuent la quatrième feuille de l’expérimentation, à savoir la situation III. E1 soupire en voyant son contenu. C1 lui sourit puis se rend compte que la question, ici, est semblable à celle de la situation II. Ils espèrent pouvoir changer de méthode mais JY leur demande de conserver la méthode des « marches d’escalier ». {4-23’55}. Les élèves demandent s’ils peuvent continuer à utiliser t1 et t2 . JY ne s’y oppose pas. Le dialogue est peu audible en raison du bruit ambiant de mise en route dans la classe. {4-25’00}. JY rejoint le groupe 1. Les élèves expliquent qu’ils vont remplacer p1 et p2 par leurs nouvelles expressions dans le calcul de v1 et v2 . Le dialogue n’est pas assez compréhensible pour être retranscrit ici. - 315/709 - 9.6.2. Résumé des enregistrements filmés dans le groupe 1 La notation (t1 , t2 ) devient marginale {4-25’14}. Le choix des notations à propos du temps fait débat entre les élèves. JY n’intervient pas. Très vite, seule E1 préfère garder la notation t1 et t2 . {4-25’36}. Les élèves se rendent comptent que la difficulté sera du même ordre avec la notation (t, ∆t) : il s’agira dans tous les cas de développer le cube d’une somme. Une substitution abusive 3 3 −∆t {4-26’01}. JY approche la caméra de la feuille de E1. E1 termine d’écrire v1 = t t−∆t . En entendant ce que fait M1, elle se rend compte de son erreur. JY intervient pour qu’elle n’efface pas ce qu’elle a écrit. {4-26’33}. N1 se trompe également quant à l’expression de v1 . JY explique l’origine de l’erreur de E1 et N1 : avoir cherché une formule du type de celle obtenue à la situation II sans revenir à la définition de la vitesse moyenne. Le cube d’une somme {4-27’13}. En mettant leurs souvenirs en commun, les élèves retrouvent l’expression développée du cube d’une somme. {4-27’35}. JY demande pourquoi, dans l’expression de la vitesse moyenne, le dénominateur est le même dans les situations II et III. E1 s’embrouille entre les notations (t1 , t2 ) et (t, ∆t). La notation (t1 , t2 ) ne se rend pas {4-27’50}. E1 attribue ses difficultés aux notations en (t, ∆t) choisies par le reste du groupe. JY l’encourage à faire les calculs les notations qui l’arrangent, avec t1 et t2 . C1 ne veut pas changer une nouvelle fois de notation. JY ne voit pas d’inconvénient à la dualité des notations au sein du groupe. La vitesse v1 est trouvée mais pas par tous les élèves du groupe ; manque de solidarité {4-28’14}. C1 et N1 terminent le calcul de la vitesse moyenne pour la particule P1 . M1 essaye de les suivre. {4-28’24}. JY quitte le groupe ce qui ne perturbe ni C1 ni N1. En revanche, M1 se distrait ce qui perturbe le groupe quelques minutes (ils jouent avec la caméra et se disent que JY va bien rigoler en voyant ce qui aura été enregistré). {4-29’14}. M1 interpelle encore C1 qui, cette fois, réagit ; mais c’est N1 qui répond à M1. Celui-ci veut savoir comment simplifier l’expression de la vitesse moyenne de P1 . C1 est agacé de devoir attendre M1 et E1. - 316/709 - 9.6. Situation III La vitesse v2 est trouvée {4-29’33}. C1 s’intéresse désormais à v2 qu’il trouve facilement, sans préciser comment. {4-29’47}. C1 estime la méthode des « marches d’escalier » pas si longue à mettre en œuvre. Du coup, M1 propose de recommencer les calculs avec les notations t1 et t2 . C1 refuse : il estime avoir « déjà fini, presque ». {4-29’54}. N1 a exprimé la variation de position de P2 tandis que C1 a directement exprimé la vitesse moyenne de P2 . M1 explique comment obtenir la simplification, non en termes conceptuels (distance parcourue à diviser par le temps écoulé), mais par un jeu d’écriture : « on fait sur ∆t ». ∆t 6= 0 n’est pas oublié {4-30’04}. M1 est désormais en phase avec C1 et N1. N1 rappelle qu’il « faut dire ∆t différent de zéro ». Cela semble davantage une contrainte imposée par le professeur qu’une conviction personnelle. Égalisation des vitesses moyennes {4-30’20}. Les élèves du groupe 1 en viennent à égaler les vitesses moyennes. {4-30’26}. E1 est encore un peu en retrait par rapport au groupe et essaye de combler son retard. On n’entend pas sa première question mais bien la réponse de M1 qui lui explique comment les t3 se simplifient. Pendant ce temps, C1 continue la simplification de l’égalisation des vitesses moyennes. À présent, ∆t = 0 : contradictoire ? {4-30’33}. C1 applique la même technique que pour la situation II en posant finalement ∆t = 0. E1 réagit à l’affirmation de C1, puisque ∆t 6= 0, puis reprend avec M1 la simplification de l’égalité entre les vitesses moyennes. C1, à une erreur d’attention près, trouve la réponse finale. L’instant cherché est trouvé {4-30’57}. M1 entend C1 et essaye de prendre le train en marche. C1 se contente d’approuver le raisonnement que fait M1. {4-31’18}. N1 donne la réponse correcte. Il a dit : « C’est racine de 1 sur 2 ». On p pourrait penser qu’il veut dire 1/2 mais, en réalité, on le voit sur sa feuille et à la réaction √ 1 ultérieure de C1 (à {4-32’06}), N1 veut dire 2 . C1 réagit, croyant que l’équation de N1 n’est pas correcte. N1 envisage s’être trompé. {4-31’33}. N1 divise également membre à membre par 3 mais sans simplifier le second 3 membre de l’égalité : il obtient alors 12 , puis 41 . C1 est déstabilisé un moment. Ils finissent par se rendre compte qu’ils obtiennent tous les deux l’égalité t2 = 41 et que l’erreur se situe simplement dans le calcul de la racine carrée d’un quart. {4-31’54}. M1 essaye d’être mis au courant par N1 et C1. {4-32’06}. N1 regarde sa feuille est hoche la tête affirmativement. N1 et C1 se mettent d’accord pour une réponse finale t = 1/2. M1 puis E1 protestent contre le manque de solidarité dans le groupe. - 317/709 - 9.6.2. Résumé des enregistrements filmés dans le groupe 1 Retour à la solidarité {4-32’22}. N1 se rend disponible pour répondre aux questions de M1. Parallèlement, C1 répond à celles de E1. Un résultat jugé trop facilement trouvé {4-32’44}. C1 se pose des questions en raison de la facilité avec laquelle ils sont parvenus à une réponse qui semble peut-être trop simple. Élimination de la solution négative {4-32’54}. C1 rejette la solution t = −1/2. N1 se demande si le résultat trouvé est plausible. {4-32’59}. Pendant ce temps, M1 raconte à voix haute ce qu’il écrit. Il obtient une autre √ 3 valeur pour t, ce qui fait réagir C1. La valeur annoncée par M1 est 6 . C1 pense que M1 q n’a pas terminé de simplifier la fraction 63 car il comprend que M1 dit 36 . Cela dit, ça ne donnerait quand même pas 1/2, ce qui échappe à C1. {4-33’19}. C1 n’identifie pas formellement l’erreur de M1 mais lui dit de simplifier le 3 dans les deux membres de l’égalité pour obtenir le bon résultat. Sa manière approximative de s’exprimer ne facilite pas la tâche de M1. N1 intervient pour compléter l’explication de C1. Compatibilité de la solution trouvée avec le graphique {4-33’47}. N1 lève la main pour appeler JY. C1 reprend l’idée de N1 de voir si la réponse trouvée est plausible. Ils regardent sur le graphique des lois de mouvement si leur résultat est plausible. Mais le graphique qui leur a été proposé n’était pas cohérent avec les expressions analytiques données. En effet, par erreur et sans que JY en soit conscient à ce moment là, la figure 4 proposée réellement aux élèves le jour de l’expérimentation n’était pas celle prévue (cf. p. 315) mais la suivante : Figure 4 - 318/709 - 9.6. Situation III Les élèves en déduisent que leur résultat n’est pas plausible. Des doutes quant au résultat {4-33’57}. Pendant ce temps, M1 refait ses calculs. C1 est sûr du√résultat t = 1/2 ; en revanche, N1 demande à M1 de calculer numériquement la valeur de 63 pour voir si son résultat serait cohérent avec le graphique des lois de mouvement. M1 ne fait pas le calcul numérique. Par ailleurs, si l’on regarde la feuille de√ M1, on ne voit plus que la réponse correcte : il a remplacé le 3 par un 9 et il écrit t = 0±6 9 . {4-34’04}. M1 n’a pas suivi l’élimination de la valeur négative de t. E1 et C1 lui expliquent. N1 demande à JY de venir. Étant occupé dans un autre groupe, JY ne vient pas immédiatement. {4-34’13}. C1, de manière assez imprécise, explique graphiquement l’unicité de l’instant cherché, implicitement en termes d’accélération. M1 demande en quoi la valeur 1/2 n’est pas plausible. C1 et N1 doutent mais ne sont pas certains de s’être trompés. C1 regrette finalement de ne pas avoir pu choisir une des méthodes réputées plus faciles (écart maximum ou droite parallèle). {4-34’30}. M1 propose de résoudre l’équation du second degré à l’aide de ρ. C1 ne voit pas l’intérêt de faire un nouveau calcul mais il l’accepte devant l’insistance de M1. Il retrouve la même réponse puisque, dit-il, « Ça ne pouvait qu’être la même chose ». M1 trouve son erreur et tout le monde est donc d’accord avec la valeur t = 1/2. Intervention de JY : incohérence confirmée entre la solution trouvée et le graphique proposé {4-35’09}. N1 retend son bras pour appeler JY. Pendant ce temps, C1 passe à la question suivante : déterminer la vitesse de P1 à t = 1, 5. C1 et N1 pensent qu’y répondre est facile car ils ont « l’équation », et qu’il suffit de « remplacer ». L’arrivée de JY dans le groupe interrompt provisoirement leur recherche. {4-35’29}. N1 raconte à JY qu’ils ont trouvé l’instant cherché mais que la réponse n’est pas cohérente avec le graphique des lois de mouvement. JY est d’accord que le calcul n’est pas cohérent avec le graphique. M1 et E1 ne sont pas tout de suite d’accord. JY leur montre l’incohérence. Des élèves sûrs de leur calcul {4-36’02}. JY, qui ne s’est pas encore rendu compte que le graphique fourni aux élèves n’est pas celui des lois de mouvement proposées, envisage une erreur dans le calcul. C1 est catégorique : « Ce n’est pas possible ça ». Les autres le confirment. {4-36’07}. C1 montre ses calculs à JY. JY a du mal à lire la feuille de C1. Le calcul lui semble correct. - 319/709 - 9.6.2. Résumé des enregistrements filmés dans le groupe 1 C’est donc le graphique qui est incorrect {4-37’27}. C1 propose de refaire la vérification graphique mais il se convainc une nouvelle fois que le résultat est incompatible avec le graphique des lois de mouvement. JY, pense donc que c’est le graphique qui n’est pas correct. Recours à une calculatrice graphique {4-37’41}. C1 propose d’utiliser la calculatrice graphique de N1 pour visualiser le graphique en direct. M1 se demande si ce n’est pas le graphique de P2 qui est incorrect, mais, en l’absence de graduation sur l’axe des ordonnées (« vous n’avez pas donné de [. . . ] de repère ici »), il ne peut le vérifier. JY se souvient s’être déjà fait prendre par un graphique incorrect lors d’une précédente expérimentation. Les élèves ont confiance en leurs calculs. {4-38’27}. M1 propose de comparer le résultat obtenu avec celui des autres groupes. Il ne sait pas encore que, par les deux autres méthodes proposées, on ne peut obtenir de réponse. N1 veut voir l’intersection des graphiques sur sa calculatrice. JY lui fait comprendre que l’intersection des graphiques ne donnerait pas l’instant cherché. √ {4-39’00}. JY pense que la droite tracée est p(t) = 3t. Il montre à l’aide d’une équerre une droite moins inclinée. E1 et M1 restent concentrées sur la calculatrice pour obtenir une vue utile du graphique, sans succès. E1 et M1 s’agacent mutuellement. {4-39’17}. Pendant que E1 et M1 se disputent, JY explique aux autres que l’absence de graduations sur l’axe vertical empêche de vérifier davantage où est l’erreur dans le graphique donné aux élèves. 3 Débat sur la méthode des marches d’escalier {4-39’25}. JY s’apprête à nouveau à quitter le groupe lorsque N1 s’interroge sur la validité de la méthode mise en œuvre. Implicitement, il semble gêné par l’insistance mise par JY lors de la mise en commun précédente à propos du paradoxe de poser ∆t = 0 alors qu’il a été explicitement considéré non nul jusqu’alors dans le calcul. Les autres élèves parlent en termes de difficulté de mise en œuvre et non de validité : C1 trouve que « ça va encore assez vite », tandis que E1 trouve que « c’est moins facile » et « moins rigoureux ». Les autres stratégies désormais caduques {4-39’44}. JY révèle aux élèves du groupe 1 que les autres méthodes ne marchent plus avec t3 . Les élèves sont contents que leurs efforts aient payé. 3. En réalité, on aurait pu avoir la certitude que les deux graphiques ne correspondaient pas à ceux des √ lois de mouvement données puisque l’intersection calculée est à t = 23 < 1 alors que, sur le graphique erroné, l’intersection se produit à t > 1. - 320/709 - 9.6. Situation III Retour sur les notations (t1 , t2 ) et (t, ∆t) {4-40’08}. E1 intervient à propos des notations (t, t + ∆t) et (t1 , t2 ). Elle semble contente d’avoir pu se débrouiller avec la notation ∆t et pense que l’autre notation, qu’elle souhaitait pourtant conserver, l’aurait embrouillée davantage car elle aurait été coupée du reste du groupe. JY pense plutôt qu’elle ne connaît pas la factorisation t32 − t31 et il demande au groupe ce que cela donne. {4-40’48}. JY interrompt E1 pour montrer que ∆t n’est autre que t2 − t1 et que, par conséquent, il est normal qu’il soit factorisable. Une méthode « aussi rapide mais moins clean » {4-41’29}. La rapidité dont parlait N1 précédemment, concernait la méthode d’égalisation des vitesses moyennes et non le choix des notations. N1 trouve cette méthode finalement « aussi rapide [. . . ] que les autres » mais qu’elle « est moins clean ». Une particularité du MRUA {4-41’38}. N1 demande à JY ce qui rend les autres méthodes désormais caduques. JY leur propose de le trouver eux-mêmes en reprenant la question selon une des autres méthodes. C1 constate que, puisque « ce n’est plus t2 , c’est t3 , la courbe, elle ne donne plus la même chose ». JY leur dit qu’un autre groupe, pour résoudre la première partie de la situation II, avait raisonné sur les propriétés des MRUA (alors même que rien n’indiquait qu’il s’agissait d’une parabole, puisque les élèves ne disposait pas encore de l’expression analytique des lois de mouvement). Résoudre une équation du troisième degré. . . {4-43’16}. JY explique que, graphiquement, les autres méthodes sont toujours efficaces, mais plus analytiquement. Les élèves du groupe 1 comprennent facilement que la stratégie des droites parallèles conduit à la résolution d’une équation du troisième degré. {4-43’43}. Les élèves proposent eux-mêmes de résoudre l’équation du troisième degré par la méthode de Newton — qu’ils ont étudié auparavant, au chapitre « Juste frôler une courbe » du manuel du Groupe AHA (1999) et qui traite des tangentes sans parler encore de dérivée —. Néanmoins, les élèves se rendent comptent qu’une telle méthode permet plutôt de trouver une approximation qu’une valeur exacte d’une solution de cette équation. {4-44’18}. JY quitte les élèves du groupe 1. - 321/709 - 9.6.2. Résumé des enregistrements filmés dans le groupe 1 L’expression de la vitesse instantanée {4-44’40}. Les élèves attaquent alors la dernière question : trouver la vitesse instantanée de P1 à t = 1, 5. N1 puis E1 cherchent une solution sans effort, en remplaçant t par 1, 5 dans la loi de mouvement. Mais C1 réagit immédiatement : il pense que cela donnera la vitesse moyenne sur l’intervalle [0; 1, 5] (à la division par 1, 5 près, il a raison) et non la vitesse instantanée. {4-45’25}. M1 a l’idée d’utiliser l’égalité des vitesses moyennes et d’y remplacer t par 1, 5. C1 ne voit pas l’intérêt d’utiliser l’égalité puisque la vitesse cherchée ne concerne que la particule P1 . N1 puis E1 comprennent l’intérêt de l’idée de M1 : utiliser l’expression obtenue pour v1 et d’y remplacer t par 1, 5. {4-45’58}. N1 se rend compte qu’ils ont utilisé la formule qui donne la vitesse moyenne, et non la vitesse instantanée. Mais M1 lui répond immédiatement que « ∆t rapprochant de 0 », ils obtiennent bien la vitesse instantanée. Vérification de la cohérence du résultat à l’aide du graphique {4-46’08}. M1 obtient une valeur numérique. Il l’exprime en « je ne sais pas quoi par je ne sais pas quoi », puis en p par t, ce qui montre qu’il n’a pas oublié de penser aux unités, lesquelles ne sont pas précisées dans l’énoncé. C1 estime le résultat plausible en le comparant à la vitesse de P2 . Association vitesse instantanée et ∆t = 0, vitesse moyenne et ∆t 6= 0 {4-46’18}. E1 invite le groupe à justifier ce calcul. C1 résume brièvement la démarche. Écrire que « ∆t vaut 0 » devient naturel à C1 « vu que c’est une vitesse instantanée ». {4-46’49}. N1 est finalement satisfait de la méthode d’égalisation des vitesses moyennes par rapport aux autres méthodes car il lui semble que les autres groupes sont loin d’avoir trouvé la réponse. Le groupe poursuit la rédaction de la réponse obtenue. {4-47’22}. E1 manifeste ses doutes quant à la validité du calcul effectué, puisque l’expression de v1 utilisée est celle d’une vitesse moyenne et non instantanée. N1 termine de rédiger sa réponse et ne participe pas au débat. Les points de vue de C1 et M1 ne sont pas identiques : M1 considère que « ∆t petit, c’est ça la vitesse instantanée ». Pour C1, « ∆t devient 0 ». Finalement, M1 considère « que ∆t se rapproche de 0 ». C1, sans en être certain, pense que les deux raisonnements sont équivalents. C1 valide le résultat grâce au graphique. {4-47’46}. Les élèves du groupe 1 ont terminé l’étude de la situation III et se détendent un peu en jouant avec la caméra. {4-48’31}. La sonnerie retentit. Comme il y a deux heures d’affilée, le cours continue. {4-50’14}. Un élève du groupe 3 (Na3), s’adresse aux élèves du groupe 1 pour savoir quelle méthode ils ont employé. Il appelle leur méthode commune celle de Fermat (à l’instat de JY qui l’avait évoquée lors de la mise en commun de la situation II.2 (p. 314 ou {4-16’35}). {4-50’23}. Les élèves continuent à se détendre, en attendant la mise en commun. Ils parlent d’un film de cinéma et jouent encore avec la caméra. - 322/709 - 9.6. Situation III Intervention de BM, étonnée que les élèves du groupe 1 aient tout terminé {4-50’36}. BM, voyant les élèves jouer avec la caméra, intervient. Les élèves lui disent avoir terminé, ce qui étonne BM. {4-50’57}. Na3 continue à jouer avec la caméra. Il distrait E1 et N1. M1 répond aux questions de BM. BM s’attendait à trouver des unités pour la vitesse. C1 a le regard absent mais écoute le dialogue entre BM et M1. {4-51’24}. BM quitte le groupe 1 dont les élèves continuent à jouer à leur aise avec la caméra (jusqu’au bout de la cassette, à {4-55’59}). Outre quelques petites scènes dignes d’un bêtisier, à {4-52’57}, on entend C1 narguer un autre groupe qui n’a pas encore terminé. Mise en commun {5-0’38}. JY expose ce qui s’est passé dans les différents groupes pour résoudre la situation III. {5-1’11}. JY montre comment la stratégie de l’écart maximum conduit à chercher le maximum d’une fonction du troisième degré. {5-1’59}. JY dessine l’allure de la fonction d’écart de position entre les deux particules. Ensuite, il montre graphiquement aux élèves que, lorsqu’une fonction du troisième degré a un extremum local, il n’y a pas d’axe de symétrie qui y passe (contrairement à l’extremum local d’une fonction du second degré). {5-3’09}. Un élève lève la main. Il a trouvé l’instant cherché en utilisant ses connaissances de la tangente développées au chapitre précédent du cours de BM. JY accepte sa méthode et rebondit en disant qu’il s’agit de savoir si les autres méthodes envisagées conduisent au même résultat. {5-4’12}. Après la stratégie de l’écart maximum, JY aborde celle des droites parallèles. On obtient, dans ce cas, une équation du troisième degré, dont la résolution exacte n’est pas à la portée des élèves. {5-5’15}. Il reste alors à traiter de la méthode d’égalisation des vitesses moyennes. {5-6’51}. Comme pour la situation II, JY va utiliser la méthode d’adégalisation de Fermat. Mais il ne masque pas aux élèves le problème que, dans la situation III, il ne sera plus possible de vérifier que le résultat est correct à l’aide des deux autres méthodes. {5-9’32}. JY indique aux élèves l’erreur quant au graphique de la loi de mouvement de P2 , qui rend la vérification graphique du résultat impossible. {5-10’19}. JY aborde ensuite la question complémentaire qui consiste à trouver la vitesse de la particule P1 à un instant donné. {5-11’09}. JY commence l’institutionnalisation du calcul de la vitesse instantanée. - 323/709 - {5-12’50}. Ayant proposé une formule, JY demande « comment valider ce calcul ». Ni3 lève la main. Il ajoute quelques mots inaudibles. JY pense en tout cas que Ni3 fait référence aux connaissances acquises dans la classe au chapitre précédent, sur l’étude des tangentes à des courbes polynomiales. {5-13’20}. Ni3 lève à nouveau la main et JY lui donne la parole. L’idée de Ni3 n’aboutit pas. {5-13’41}. C1 propose l’idée de mesurer la vitesse moyenne à des instants proches de l’instant cherché. JY donne la réponse : il faut « regarder la vitesse instantanée à un instant connu [. . . ] où on sait ce que vaut la vitesse ». Un élève propose 0 et JY vérifie que la formule fonctionne. {5-14’13}. JY voudrait que les élèves proposent un instant non nul. Une élève propose t = 21 . {5-15’15}. JY termine l’institutionnalisation du calcul donnant la vitesse instantanée d’un mobile comme limite de la vitesse moyenne, la limite étant entendue (comme dit vers {5-11’09}) comme la technique consistant à supprimer les termes en ∆t une fois faites toutes les simplifications algébriques possibles. {5-16’26}. JY demande aux élèves s’ils ont des questions et laisse un temps de silence pour qu’ils puissent réagir. Ensuite, il propose de revenir à la situation II et de déterminer la formule donnant la vitesse instantanée pour les mobiles de cette situation. {5-17’30}. Me4 lève la main. JY lui donne la parole. Me4 se demande comment JY a trouvé si facilement la formule et JY lui répond. {5-17’50}. T2 associe la vitesse instantanée à la pente de la tangente. JY coupe la parole à T2 à cause du mot tangente. JY, faisant le geste à l’aide de sa main, préfère ici parler de pente de la courbe. 9.7 9.7.1 Situation IV Énoncé proposé aux élèves IV. Un mouvement plus complet Nous allons nous intéresser au mouvement (plus compliqué qu’à la première section) d’une particule sur un axe comme à la figure 1. On pourra considérer par exemple que les unités sont le mètre pour la position et la minute pour le temps. Décrire par des phrases en français et le plus complètement possible le mouvement du mobile spécifié par le graphique de la figure 5. En particulier, donner des indications quant à la position, la vitesse et l’accélération du mobile. - 324/709 - 9.7. Situation IV Figure 5 9.7.2 Résumé des enregistrements filmés dans le groupe 1 L’expérimentation de cette situation s’est déroulée le vendredi 11 janvier 2008 (pendant une période de cours). Résistance à s’exprimer en français {5-18’25}. Les élèves sont peu enthousiastes à l’idée de quitter les calculs pour revenir à une description en français de la situation. JY estime qu’il faudra peu de temps aux élèves pour traiter la situation IV. {5-18’50}. JY et BM distribuent la feuille relative à la situation IV. {5-19’40}. JY rejoint le groupe 1 et approche la caméra. S’ensuit un petit dialogue qui montre le climat de confiance qui règne entre JY et les élèves du groupe 1. Lien évident avec la situation I {5-20’11}. Les élèves du groupe 1 comprennent immédiatement le lien entre la situation I et la IV. JY parle de la nouveauté de la situation IV : il y a « des vitesses négatives ». Le mobile recule {5-21’00}. M1 fait observer à E1 que « vitesse négative » signifie « juste » que le mobile « recule ». - 325/709 - 9.7.2. Résumé des enregistrements filmés dans le groupe 1 Une vision géométrique de la courbe {5-20’49}. Pendant ce temps, C1 expose à N1 sa vision a priori symétrique de la courbe. Découpage du mouvement {5-21’18}. M1 interpelle N1 et C1 pour être en phase avec eux. La question porte sur le découpage du mouvement en phases distinctes. Les élèves distinguent deux phases de part et d’autre du point d’inflexion de la partie descendante de la courbe. {5-21’41}. Quand JY leur demande la raison de leur choix, les élèves finissent par expliciter que c’est à cause du changement de concavité de la courbe. Similitudes avec la situation I {5-22’11}. Une fois le découpage effectué, les élèves commencent à rédiger leur réponse. Au début, la description est très semblable à celle faite pour la situation I. {5-22’48}. M1 est le seul du groupe à ne rien écrire sur sa feuille ; il semble ne pas suivre la conversation des autres, lesquels poursuivent la rédaction de leur réponse à voix haute, en complétant mutuellement les explications des uns et des autres. Naturel des élèves {5-22’58}. Quelques instants de silence tandis que chacun rédige sa réponse sur sa feuille. Suit un intermède à propos d’un élève d’un autre groupe dont la voix forte les a distrait. Les dialogues ne présentent pas d’intérêt direct avec notre sujet mais montrent, une nouvelle fois, que les élèves restent très naturels avec JY et ce, malgré la présence de la caméra. Ne pas exister ou valoir zéro ? {5-23’48}. N1 reste concentré et revient dans le vif du sujet le premier, au sujet de l’accélération. Une discussion naît sur la distinction entre ne pas exister et valoir zéro : que choisir entre « il n’y a pas d’accélération » et « l’accélération est nulle » ? Reprendre la situation I à zéro ? {5-25’32}. E1 manifeste des réticences à devoir expliquer une nouvelle fois la situation en français. JY rappelle les acquis de la situation I qui permettent de répondre désormais plus rapidement. {5-25’51}. Pendant que E1 parle avec JY, M1 et C1 commencent à débattre de l’accélération dans la zone B (partie croissante de la courbe et concavité positive). M1 envisage le découpage de la zone en petits intervalles, comme fait lors de l’étude de la situation I, découpage qu’il souhaiterait néanmoins éviter car jugé très lourd. - 326/709 - 9.7. Situation IV Courbe non rectiligne, donc accélération {5-25’59}. À partir d’ici, JY écoute le débat entre C1 et M1 à propos de la justification de l’accélération dans la zone B du graphique : « comme c’est une courbe, ça accélère ». Accélération constante ? {5-26’08}. N1 rejoint le débat entre M1 et C1. Le débat évolue vers une nouvelle question : l’accélération est-elle constante ? {5-26’37}. JY a laissé le débat prendre sans intervenir. Il intervient ensuite pour montrer aux élèves du groupe 1 que le graphique seul ne suffit pas pour pouvoir affirmer la constance de l’accélération : s’il s’agit d’une parabole, l’accélération sera constante ; sinon, elle ne le sera pas. Accélération, croissance de la courbe et concavité {5-27’36}. C1 a écrit sur sa feuille que, puisque telle partie du graphique est une courbe (par opposition à un segment de droite), la vitesse augmente. JY, en montrant une autre partie du graphique, également courbe, mais décroissante, puis une partie croissante mais à concavité tournée vers le bas, invite les élèves à affiner leur raisonnement. C1 conclut qu’il y a accélération car« c’est une courbe croissante à concavité vers le haut ». {5-28’26}. JY ne se satisfait pas de cette réponse : il veut savoir pourquoi, lorsque la courbe est croissante à concavité tournée vers le haut, la vitesse augmente. Certains élèves pensent qu’ils doivent retourner à la considération des marches d’escaliers, ce qu’ils veulent éviter. E1 parle de pentes « de plus en plus. . . ». JY termine la phrase (« . . . de plus en plus fortes ») et rappelle le lien supposé entre la pente de la courbe et la vitesse instantanée. {5-29’26}. Chacun rédige sa réponse. Les élèves se lisent leurs réponses et tâchent de les compléter. Vitesse et position : augmenter moins vite ou diminuer ? {5-29’53}. Dans la zone C (celle où la courbe est croissante à concavité négative) M1 se demande si la vitesse augmente moins vite ou si elle diminue. Les élèves parlent de décélération plutôt que d’accélération négative. {5-30’10}. La diminution de la vitesse est associée à celle de la pente de la courbe. {5-30’55}. Bien que M1 ait bien répondu en termes de pentes, il semble croire que cela n’est pas assez convainquant et veut compléter sa réponse en faisant référence à la concavité de la courbe. - 327/709 - 9.7.2. Résumé des enregistrements filmés dans le groupe 1 Accélération comprise entre 0 et 1 ? {5-31’44}. Commence ici un long débat sur le lien entre le signe de l’accélération et ses conséquences sur la vitesse et la position dans la zone C du graphique (courbe croissante à concavité tournée vers le bas). Bien que M1 ait affirmé plus haut que l’accélération est négative puisque les pentes diminuent, il considère désormais que l’accélération est comprise entre 0 et 1. C1 suit M1 tandis que E1 et N1 considèrent plutôt que l’accélération est négative. {5-32’15}. M1 réussit à faire douter E1. JY reste étranger au débat. {5-32’28}. N1, à son tour, admet que l’accélération est positive dans la zone C. Accélération négative ? {5-32’35}. Finalement, c’est C1 qui revient sur son point de vue. Il commence par douter que l’accélération soit comprise entre 0 et 1. Cela relance le débat et N1 revient à son opinion première. Hauteur en fonction de la portée contre position en fonction du temps {5-33’10}. M1 donne le cas du tir oblique d’un obus soumis à la gravitation terrestre, cette dernière étant considérée comme une accélération négative : « ça tombe », c’est-à-dire que la position diminue. N1, implicitement, veut montrer à M1 que, dans le cas du tir d’obus, la représentation graphique habituelle est une parabole, certes, mais qui représente la trajectoire de l’obus et non la distance parcourue en fonction du temps. Quoi qu’il en soit, N1 affirme que, même lorsque l’obus est en train de tomber, il continue à voir sa distance parcourue augmenter. E1 préfère lier décélérer à l’action de freiner plutôt qu’au signe négatif de l’accélération : « Il veut dire qu’une accélération négative c’est une décélération. Or, moi, dans ma tête, c’est plus facile quand je me dis : il décélère, ça veut dire qu’il freine ». {5-33’48}. C1 en vient à considérer deux sortes d’accélérations négatives. N1 voit que le débat n’avance pas ; il demande à JY d’intervenir. Le signe de l’accélération est lié à celui de la vitesse et de la position. . . {5-34’04}. M1 lie le signe de l’accélération à la fois au signe de la vitesse et à celui de la position. JY commence par leur demander un effort de précision dans l’emploi des mots : par exemple, les élèves parlent de distance parcourue quand il s’agit de positions. {5-34’35}. M1 explique pourquoi il considère que l’accélération est comprise entre 0 et 1 : pour lui, explicitement, l’accélération est un coefficient multiplicateur. On voit plus loin (vers {5-36’18}) que M1 a en tête les lois de mouvement d’un objet en chute libre (qui suit un MRUA) avec une vitesse et une position initiales nulles : une accélération constante a, une vitesse v = at et une position donnée par p = 21 at2 . Cela explique que, la vitesse étant positive (et, implicitement, le temps aussi), l’accélération ne puisse pas être négative ; et, en prenant des valeurs variables de a (ce qui est contradictoire avec l’hypothèse implicite que le mouvement est un MRUA) qui diminueraient de 1 et 0, cela justifierait que la vitesse diminue jusqu’à 0. Contrairement à JY, les autres élèves, familiarisés également avec la cinématique, comprennent les explications de M1 et semblent prêts à le suivre. Effectivement, dans la zone B (t ∈ [2; 4], voir Figure 5, p. 325), les conditions initiales sont nulles si bien que le raisonnement de M1 est correct. En revanche, la vitesse initiale dans la zone C (t ∈ [4; 6]) est non nulle, si bien que, pour autant que le mouvement représenté soit celui d’un MRUA, la loi de vitesse s’écrit v = a(t − 4) + v4 et le raisonnement de M1 devient caduque. - 328/709 - 9.7. Situation IV Accélération positive = la vitesse augmente {5-34’59}. JY revient à la signification d’une accélération positive pour aider les élèves à comprendre, par contraste, ce que signifie avoir une accélération négative. N1 identifie accélération positive à vitesse qui augmente. {5-35’36}. M1 confirme qu’il voit un lien entre le signe de l’accélération et celui de la vitesse. JY se fait piéger quelques secondes avant de lui donner l’exemple d’une voiture qui roule et commence à freiner pour montrer que la vitesse reste positive jusqu’à l’arrêt de la voiture. Une formule analytique supposée qui supplante l’analyse graphique {5-36’18}. On croit assister à un dialogue de sourds entre JY qui parle de vitesse positive et M1 qui trouve bizarre d’avoir une vitesse négative. Cela va conduire M1 à expliciter ce qu’il pense être la loi de mouvement de la particule. {5-36’42}. Admettant implicitement que le mouvement décrit ici est un MRUA, JY précise que dans la zone C, la vitesse initiale est non nulle, ce qui convainc M1 que la vitesse puisse rester positive, bien que l’accélération soit négative. {5-37’42}. Les explications relatives à la zone D (la courbe est alors un segment de droite horizontal) ne posent pas de problème aux élèves. Courbe décroissante : vitesse négative {5-37’54}. Voyant le temps passer, JY invite les élèves à aborder les zones où la courbe est décroissante. N1 utilise sa mémoire pour affirmer que le mobile recule. La question de savoir si le mobile recule ou a fait demi-tour viendra plus tard. La vitesse est décrite comme négative mais sans justification. Les élèves ne parlent pas du signe de l’accélération dans un premier temps. Que signifie « augmenter » pour une vitesse négative ? {5-38’23}. M1 considère que l’accélération est positive « parce que la vitesse est négative mais elle augmente ». Il se contredit formellement presque aussitôt : « la vitesse diminue ». {5-38’37}. N1 interprète la diminution de position : « ça revient sur ses pas. Ça recule ». 4 4. On voit plus loin ; à {5-41’48}, que les élèves ne distinguent pas encore reculer — ou faire marche arrière — et faire demi-tour. - 329/709 - 9.7.2. Résumé des enregistrements filmés dans le groupe 1 Accélération positive puis négative ? {5-38’57}. M1, N1 et E1 s’accordent pour dire que l’accélération est positive dans la zone E (courbe décroissante et concavité tournée vers le bas) puis, qu’elle est négative dans la zone F (courbe décroissante et concavité tournée vers le haut). Accélération négative puis positive ? {5-39’24}. Les élèves du groupe 1 rédigent leurs réponses. {5-40’09}. JY demande à M1 de ré-expliquer son raisonnement. C1 considère plutôt que l’accélération est d’abord négative car la vitesse « au début ça va être −2 puis, après, 100 m plus loin, ça va être −3 m/s ». {5-40’56}. N1, en utilisant sans raison la règle des signes lors d’une multiplication, parvient à convaincre C1 que l’accélération est positive. JY met en lumière l’usage inopportun de cet argument. Accélération positive = appuyer sur l’accélérateur ; accélération négative = appuyer sur le frein {5-41’30}. M1 reprend son argumentation lié au langage automobile : accélération négative signifie que l’on freine et accélération positive signifie que l’on accélère. Faire demi-tour = faire marche arrière ? Une question de repère {5-41’48}. E1 considère que c’est comme si une voiture faisait demi-tour. JY lance le débat de savoir si ce point de vue équivaut à faire marche arrière. M1 associe le signe (négatif) de la vitesse au fait que le mobile fait marche arrière, la marche arrière étant justifiée par la présence d’un « repère ». Le débat est interrompu par la sonnerie de fin du cours ({5-42’16}). {6-3’37}. Le débat reprend sur le signe de l’accélération. C1 comme M1 sont de plus en plus sûrs de leurs affirmations opposées. {6-4’50}. JY confie la caméra à E1 car il compte quitter momentanément le groupe 1. M1 serait prêt à abandonner son point de vue pour en finir avec ce débat. Les autres élèves refusent tant qu’ils ne sont pas réellement convaincus. - 330/709 - 9.7. Situation IV Nouvelle argumentation algébrique du signe de l’accélération {6-5’28}. JY quitte le groupe 1. M1 précise pourquoi il est prêt à se rallier au point de vue de C1 : « la vitesse augmente en négatif ». Les élèves argumentent en partant des lois algébriques d’un MRUA. Mais N1 se trompe dans la formule utilisée : il dit x = at2 . Outre qu’il oublie le coefficient 12 devant l’accélération, il oublie surtout ici la position initiale. Ainsi, puisque la position est positive, il en conclut que l’accélération est également positive. En revanche, en écrivant que v = at et en donnant à l’accélération une valeur négative, C1 montre que la vitesse sera non seulement négative, mais de plus en plus négative. {6-6’11}. Le vocabulaire employé par les élèves est parfois approximatif. Ainsi, N1 parlera d’une distance qui doit être positive (alors qu’il s’agit d’une position ; une distance est positive par nature) et C1 dit que « x est négatif, vu qu’on descend » ; en s’aidant du graphique, C1 explique qu’il faut considérer la variation de position par rapport à une position initiale, cette variation étant bien négative. E1 rappelle que ce n’est pas x la variable mais p. N1 se range à l’avis de C1, ainsi que M1, malgré ses réticences non éliminées : M1 n’a plus « envie de réfléchir ». Lien entre les signes de l’accélération et de la vitesse {6-6’36}. Pour la zone F (courbe décroissante et convexe), C1 hésite un instant puis conclut sans se justifier que l’accélération est positive. {6-7’01}. Chacun rédige sa réponse. M1 décèle dans la juxtaposition faite par E1 (« vitesse négative, accélération négative »), un lien « logique » entre les signes de l’accélération et de la vitesse. C1 justifie le signe positif de l’accélération dans la zone F : « sa vitesse négative va diminuer, donc l’accélération va être positive ». {6-7’42}. C1, sans doute par fatigue, se laisse influencer par M1 et établit un lien entre le signe de l’accélération et celui de la vitesse 5 . {6-7’59}. C1 ayant entendu un autre groupe est rassuré de constater que, dans d’autres groupes aussi, la détermination du signe de l’accélération ne fait pas l’unanimité. {6-8’24}.M1 se détend en jouant avec un feutre fluo, puis demande la caméra à E1 qui refuse de la lui donner. C1 n’est pas étonné que M1 n’arrive plus à se concentrer : « c’est la 7e heure du vendredi », dit-il. Cela explique aussi un lapsus que l’on trouve dans la réponse écrite de C1 : après avoir écrit que « l’accélération est positive et la vitesse diminue en valeur absolue et elle est négative », il écrit, aussitôt après : « Elle est positive [il ne peut s’agir que de l’accélération, puisqu’il vient de dire que la vitesse est négative] et donc de signe contraire à l’accélération [en réalité, il ne peut s’agir que de la vitesse pour rendre le raisonnement cohérent] ce qui est logique car la vitesse diminue en valeur absolue ». {6-8’46}. C1 rédige la dernière partie de sa réponse, celle relative à la zone F (courbe décroissante et convexe). 5. On ne trouve pas trace de ce lien dans la réponse écrite de C1 mais bien dans celle de M1 : « Vitesse augmente lorsque accélération de même signe que la vitesse. Vitesse diminue lorsque accélération de signe opposé à la vitesse ». On comprend mieux à {6-15’44} ce que veut dire M1 : il dira alors que « si tu as une vitesse positive, pour que ça freine, il faut une accélération négative » (les signes sont bien opposés). Il ne termine pas ses phrases à propos des autres cas mais, en substance, son intuition est de dire que, lorsque la vitesse est négative, pour freiner, il faudra une accélération positive. Au contraire, lorsque la vitesse est positive, pour accélérer (au sens automobile du terme), l’accélération est positive tandis que, lorsque la vitesse est négative, pour accélérer, l’accélération est également négative. - 331/709 - 9.7.2. Résumé des enregistrements filmés dans le groupe 1 Que signifie « diminuer » pour une vitesse négative ? {6-9’19}. Les élèves continuent de débattre sur la signification d’une diminution dans le cas d’une grandeur négative. Sans en être conscients, ils discutent dans des registres différents. Les uns considèrent une variation en valeur absolue quand les autres la considèrent en valeur relative, quand ils ne passent pas eux-mêmes d’un registre à l’autre. Distinction valeur signée et valeur absolue {6-9’55}. M1 prend conscience de la difficulté de devoir décrire et argumenter en français. Les élèves commencent à distinguer la valeur absolue de la valeur signée de la vitesse. À l’opposé de M1, E1 n’est pas satisfaite de la justification proposée du signe de l’accélération. {6-10’18}. M1 revient à son idée de lier les signes de la vitesse et de l’accélération. Cette fois, C1 le suit sans réserve et tente de convaincre E1 qu’une telle justification est suffisante. {6-10’37}. E1 n’est toujours pas satisfaite des arguments de C1 et M1. M1 va redonner une explication qui se termine par une contradiction formelle : « Enfin, tu vois ce que je veux dire ? Elle est négative, mais elle augmente, mais elle diminue ». E1 aurait peut-être mieux compris une phrase telle que celle-ci : « La vitesse est négative, mais elle augmente en valeur absolue, mais elle diminue en valeur signée ». {6-10’57}. E1 dit à voix haute ce qu’elle pense avoir compris. Elle parle de la variation de l’accélération au lieu de la variation de la vitesse, et M1 l’approuve. M1 précise sa pensée à propos de la rédaction en français : « ça embrouille » tandis que, dit-il, « Tu as un + ou un − : tu sais direct, quoi ! ». Le signe de l’accélération dépend du repère {6-11’25}. M1 considère le tir oblique d’un obus pour expliquer la nécessité ou non de considérer l’accélération de la pesanteur en négatif ou pas. Cela donne l’idée à C1 de faire un changement de repère pour rendre ce qui était négatif, positif (et réciproquement). {6-12’29}. N1 et E1 essaient de terminer la rédaction de leur réponse tandis que M1 se détend à nouveau en taquinant les autres. Les dialogues entendus ne présentent pas d’intérêt pour notre propos. La réponse d’un autre groupe {6-13’37}. Les élèves du groupe 1 demandent à A6 de lire sa réponse. A6 raisonne en termes de croissance/décroissance de la vitesse (prise en valeur absolue) et, en compensation, inverse sa réponse quand la position décroît : « on va dans le sens contraire des coordonnéespositions et on accélère, donc c’est une accélération négative ». - 332/709 - 9.7. Situation IV La tension monte {6-15’01}. E1 n’est pas convaincue par les différentes argumentations données jusque là. Elle tourne vers elle la feuille de M1 dans l’espoir d’y puiser une quelconque inspiration. M1 s’y oppose. {6-15’44}. Devant la réaction de M1, E1 finit par abandonner. Elle dit avoir compris mais l’intonation de sa voix indique davantage de résignation que de conviction à accepter ce que les autres semblent trouver évident. Bien qu’elle affirme avoir compris, elle ne parvient pas à rédiger une réponse qui la satisfasse. {6-16’20}. Les élèves jouent avec la caméra, en attendant l’intervention de JY à propos de cette situation. {6-19’01}. E1 et M1 se disputent à nouveau à propos de la rédaction de la réponse. {6-19’44}. Après une pause, la dispute reprend. Un dialogue de sourd en est la cause : E1 voudrait que M1 la laisse travailler en paix tandis que M1 pense que E1 veut le faire travailler davantage. Pendant ce temps, N1 continue à rédiger sa réponse. {6-20’43}. Un nouvel épisode de la dispute entre M1 et E1. M1, se sentant soutenu par les autres élèves témoins de la scène, continue à titiller E1 (les dialogues sont peu audibles) qui réplique en distinguant les élèves qui veulent travailler et les autres. {6-22’50}. C1 demande à A6 de reposer la caméra. M1 approuve et observe que la caméra, une fois posée, « on ne la voit pas ». A6 continue à garder la caméra en main. {6-23’18}. C1 propose une formule qui permet de déterminer le signe de l’accélération à partir de celui de la vitesse. La caméra ne filme pas la formule proposée, mais C1 a encadré sur sa feuille la formule v = a · t ; cependant, C1 n’explicite pas son raisonnement. E1 et M1 se disputent encore une fois. Mise en commun {6-24’40}. JY, voyant que tous les groupes ont terminé la situation IV, fait la synthèse de celle-ci. Il dessine au tableau l’allure du graphique et rappelle la description des zones que les élèves ont nommées A, B, C et D (parties croissante et stationnaires de la courbe) comme étant similaires à la courbe proposée dans la situation 1. {6-26’00}. JY aborde alors la partie spécifique de cette situation : là où la courbe est décroissante 6 . {6-26’38}. JY rappelle le lien entre le signe de la vitesse et le sens de déplacement du mobile : la vitesse est positive/négative si et seulement si la position du mobile augmente/diminue. Il aborde alors la question manifestement épineuse du signe de l’accélération 6. JY est plongé dans ce monde pseudo-cinématique, voire automobile : il parle d’une position qui recule. Outre qu’il aurait dû parler ici de mobile et non de position, il oublie de dire qu’en mathématique, reculer n’a pas de signification : il convient plutôt de parler d’aller dans un sens ou dans l’autre de l’axe des positions. - 333/709 - quand la vitesse est négative. Il montre qu’il y a un choix à faire entre deux options considérées comme légitimes par différents physiciens : soit considérer le signe de l’accélération en fonction de la variation de la valeur absolue de la vitesse (son intensité), soit en fonction de la variation de la vitesse prise avec son signe. JY indique alors que c’est cette seconde option que les mathématiciens ont choisie car elle lie le signe de l’accélération à la croissance de la vitesse de la même manière que le signe de la vitesse est lié à la croissance de la position : ainsi, l’accélération est positive/négative si et seulement si la vitesse du mobile augmente/diminue. Le signe de l’accélération est dès lors indépendamment du signe de la vitesse, donc du sens du parcours. En revanche, JY ne parle pas du lien entre la concavité et le signe de la dérivée seconde puisque, à ce stade de l’expérimentation, la dérivée première n’est pas encore définie ni, a fortiori, la dérivée seconde. Pendant le discours de JY, on entend A6 à voix basse qui se reconnaît successivement dans chacune des deux positions défendues par les physiciens, sans remarquer qu’elles sont incompatibles. {6-30’01}. Conscient des difficultés des élèves à quitter le champ de l’expérience sensible, JY les invite à imaginer être à bord d’une voiture qui roule en marche avant et de se souvenir de ce qu’ils ressentent selon que le conducteur appuie sur l’accélérateur ou sur le frein. Il leur demande ensuite ce qu’ils ressentent lorsque le conducteur appuie sur ces mêmes pédales tandis qu’il roule en marche arrière. Par cette expérience de pensée, JY veut donner aux élèves l’occasion de dissocier le signe de l’accélération de sa réduction au langage commun d’accélérer et de freiner (ou décélérer). {6-32’30}. L’étude de la situation IV se termine. Groupe par groupe, JY va prendre les feuilles des réponses des élèves relatives aux situations I à IV. Il annonce qu’il les rendra au cours d’après, le lundi. {8-0’12}. À la fin de l’étude de la situation V (ce qui explique que la référence soit celle de la cassette vidéo n˚8 et non plus n˚6), JY revient sur la situation IV car le caractère négatif de la vitesse (cas où la courbe est décroissante) n’a pas été justifié analytiquement. Un élève dit que « La pente est négative » et une élève ajoute « Je ne suis pas sûre ». JY exprime la vitesse moyenne et montre qu’elle est toujours négative. Il en déduit, par passage à la limite, que la vitesse instantanée est négative ou nulle (il exclut ce dernier cas puisque la pente est non nulle dans la configuration donnée). On trouvera ces dialogues dans la section correspondant à la situation V (Annexe A.6, p. 566) pour respecter le déroulement chronologique de l’expérimentation. 9.8 9.8.1 Situation V Énoncé proposé aux élèves - 334/709 - 9.8. Situation V V. Deux problèmes et une solution V.1 Un mobile en mouvement Considérons un mobile sur une trajectoire rectiligne et dont la loi de mouvement est donnée par la fonction p (t) = 4 t3 − 25t2 + 150t Entre t = 0 et t = 10, à quel(s) instant(s) la distance du mobile à l’origine est maximale ? Que vaut alors sa vitesse ? V.2 Un volume à optimiser On considère à présent une plaque en tôle dont on a retiré les coins selon la figure 6. Figure 6 En pliant les bords de cette plaque, on obtient une boîte rectangulaire et ouverte dont la profondeur est x. Déterminer la valeur de x telle que le volume de la boîte soit maximum. 9.8.2 Résumé des enregistrements filmés dans le groupe 1 L’expérimentation de cette situation s’est déroulée le lundi 14 janvier 2008 (pendant un peu plus d’une période et demi de cours). - 335/709 - 9.8.2. Résumé des enregistrements filmés dans le groupe 1 Du bon usage des tangentes {7-4’50}. La première réaction des élèves en lisant l’énoncé proposé est de trouver la première question difficile. M1 parle de « faire une fonction » (le mot fonction est présent dans l’énoncé de la situation V) puis rectifie en parlant de représenter le graphique de la fonction. C1 propose d’utiliser les tangentes car, se souvient-il, au chapitre précédemment abordé avec BM, il était question de maxima/minima (pourtant, BM utilise le manuel du groupe AHA et il n’est pas question d’extrema dans ce chapitre 7 ). JY leur demande d’essayer de ne pas utiliser les tangentes. {7-5’15}. C1 se résigne à ne pas utiliser cette méthode et a le sentiment que les autres groupes ont pourtant utilisé cette méthode auparavant 8 . {7-5’19}. M1 parle à nouveau de faire un graphique. Il regarde d’abord JY dans l’espoir de déceler sur son visage un signe approbateur ou non, mais JY ne réagit pas. Il s’adresse alors aux autres élèves de son groupe. E1 répond que « pour faire le graphique, il faut les tangentes » 9 . En particulier, sans les tangentes, C1 se demande comment faire ; il n’envisage pas de représenter la courbe point par point. {7-5’42}. C1 déclare que « C’est embêtant d’avoir vu les tangentes avant de voir ça ». L’intonation de sa voix ne permet pas de savoir s’il est affirmatif ou interrogatif. Quoi qu’il en soit, JY reconnaît le désagrément. Réduction abusive au second degré {7-5’46}. M1 considère que représenter le graphique suffirait à répondre à la question, le maximum de la fonction étant ainsi rendu visible. E1 et les autres lui rétorquent à nouveau que, sans les tangentes, ils ne peut construire un tel graphique. M1 propose alors de mettre 4t en évidence, de sorte de se ramener à l’étude d’une fonction du second degré, laquelle est bien connue et ne nécessite pas d’utiliser les tangentes. M1 semble convaincre les autres élèves que le 4t peut-être écarté sans conséquence notable, son argument étant opportuniste : « avec un t2 , tu peux reconnaître le maximum et tout ça ». {7-7’25}. JY les laisse essayer leur idée : trouver le maximum d’une fonction du second degré pour — croient-ils — trouver le maximum d’une fonction du troisième degré. 7. Voir BM pour connaître le contenu de son cours sur les tangentes. 8. En réalité, ce que d’autres groupes ont utilisé est la stratégie des droites parallèles, la méthode, d’abord graphique, qui consiste à réduire un intervalle de temps à un instant unique en déplaçant une droite parallèlement à une autre jusqu’à n’obtenir qu’un point de contact avec la courbe, cette droite ultime étant effectivement une tangente. 9. Cette réponse peut s’expliquer par le fait que, dans le manuel du groupe AHA (1999), on montre précisément que les (champs de) tangentes aident à tracer l’allure d’une courbe. - 336/709 - 9.8. Situation V Concavité tournée vers le haut ou vers le bas ? {7-8’12}. Une légère hésitation de JY fait renaître le doute chez N1. C1 cherche de son côté : il ne factorise pas le terme 4t ; il a l’intuition que la courbe obtenue sera à concavité tournée vers le bas en raison du terme −25t2 . Au contraire, M1, à la lecture de la fonction du second degré qu’il obtient en ayant factorisé 4t, déduit du coefficient positif de t2 que la parabole ainsi mise en évidence aura sa concavité tournée vers le haut, si bien que le maximum sur l’intervalle [0; 10] sera à t = 10. {7-8’50}. M1 prétend que la loi proposée est celle de la vitesse, ce que les autres récusent. À C1 qui lui montre une courbe à concavité tournée vers le bas, M1 répond que la trajectoire est rectiligne. JY demande à C1 ce que rectiligne signifie ici. C’est N1 qui répond : « Ça veut dire que c’est sur une route droite ». Cependant, M1 dit que « Au début il recule et puis il avance, vu que c’est t3 − 25t2 ». Le second degré, on connaît {7-10’04}. Les élèves en reviennent à la nécessité de trouver un maximum et, comme ils ne savent pas le faire pour une fonction du troisième degré, ils pensent essayer de le faire pour la fonction du second degré qu’ils ont mise en évidence. N1 « ne pense pas que ce soit bon » et voudrait trouver une autre méthode. Rejet de la fonction du second degré {7-10’29}. C1 propose de construire un tableau de valeurs. E1 trouve que ça va prendre trop de temps. M1 s’intéresse implicitement à l’axe de symétrie de la parabole pour trouver son sommet. C1, constatant que la parabole a sa concavité tournée vers le haut, rejette l’idée de chercher le sommet : « il n’y a pas de maximum [local] ». {7-11’29}. N1 et C1 puis E1 sont à présent convaincus que l’étude de la parabole ne les aidera pas à résoudre le problème. Du coup, N1 met entre parenthèses ce qu’il a écrit jusque là sur sa feuille. Signe d’une différence de fonctions {7-12’10}. N1 raisonne à la manière de M1 (cf. {7-8’50}) en considérant que la loi de mouvement est d’abord décroissante car −25t2 l’emporte d’abord sur t3 , puis croissante car, « à partir d’un certain nombre, le t3 va prendre le dessus sur le t2 ». Ici aussi, le terme du premier degré n’est pas pris en considération. Cette fois, M1 compare bien −25t2 à t3 + 150t. Néanmoins, il confond lui aussi la croissance de la position (il parle de « monter ») avec le signe de la position. {7-13’05}. C1 observe que le facteur 4 n’a pas d’influence sur la recherche du maximum. - 337/709 - 9.8.2. Résumé des enregistrements filmés dans le groupe 1 Un timide effet de contrat {7-13’28}. N1 émet des doutes quant à la méthode suivie jusque là. Il propose d’utiliser t1 et t2 ou t et ∆t mais sans parvenir à expliciter ce qu’il veut en faire. M1 lui rétorque que ce type de méthode sert à « calculer la vitesse », et non à trouver un maximum. Calcul numérique par dépit {7-13’49}. C1 a un souvenir lointain d’une méthode employée dans le cas des fonctions homographiques. N1 et C1 constatent que cette méthode n’est pas exploitable ici. M1 revient sur son idée que 25t2 « a le dessus tout le temps » et que, par conséquent, la position est toujours négative ou nulle. C1 veut lui montrer le contraire et choisit comme contre-exemple t = 10 mais obtient p(10) = 0. {7-14’58}. M1 et C1 font des conjectures sur les signes de p(2), p(9), etc. mais sans faire réellement de calcul. M1 affirme à un moment que « À 2, c’est en dessous de 0 » puis, quelques secondes plus tard, que « À 2, c’est positif ». {7-15’21}. JY demande aux élèves de faire les calculs pour vérifier si leurs intuitions sont correctes. E1 a du mal à suivre ce que font les autres élèves. Il faut dire qu’elle est fort enrhumée, ce qui ne l’aide pas à rester concentrée. JY explique à E1 que le facteur 4 n’a pas d’influence sur le signe de la position p(t). {7-16’02}. JY conseille à C1 de préciser sur sa copie ce qu’il est en train de calculer. C1 ne comprend pas bien la notation fonctionnelle et, lorsque JY lui demande d’écrire « p de 2 », il écrit p2 et ne comprend pas pourquoi JY lui répète « p de 2 ». E1 se rend compte qu’ils en sont à essayer de calculer les positions avec « tous les chiffres » ; les autres lui répondent qu’ils ne voient pas comment faire autrement. {7-16’29}. JY quitte le groupe 1. Après avoir calculé p(2), les élèves calculent p(3) qui est également positif, contrairement aux prédictions de M1. C1 remarque que p(3) > p(2). Il propose donc de calculer p(4). M1 n’est pas d’accord pour faire tant de calculs. De plus, N1 et E1 font remarquer que la valeur à trouver ne sera sans doute pas un nombre entier mais plutôt « 3, 3743 . . . ou un truc dans ce genre-là ». Avec une telle méthode, ils concluent que « ce n’est pas du tout précis ce qu’on fait ». Retour vers le futur {7-17’31}. La situation évoque à M1 une des trois méthodes déjà rencontrées dans les situations II et III : « Il y avait les escaliers, distance maximale, et l’autre c’était. . . la tangente ou je sais pas quoi ». La méthode dont parle M1 est celle de la distance maximale mais il ne parvient pas à l’identifier comme telle. En revanche, aidé par N1, il se souvient que, dans cette méthode, il était question d’une différence : « un truc au carré moins un bazar » (situation II) puis « un truc au cube moins un truc au carré » (en fait, à la situation III, on soustrayait « un truc » du premier degré), différence qui représentait un écart de positions entre deux mobiles. M1 trouve, de ce fait, que la situation V ressemble aux situations II et III. - 338/709 - 9.8. Situation V {7-18’10}. N1 voit comme différence majeure entre la nouvelle situation et les anciennes le fait qu’ils ne disposent que d’une loi de mouvement et non plus de deux (les élèves les appellent des « équations »). Il propose alors de considérer comme différence la loi de mouvement donnée moins zéro (il parle de « l’axe Ox »). {7-18’36}. M1 préfèrerait « tracer le graphe, par exemple de t2 ou bien faire un tableau de signes ». E1 approuve l’idée de faire un tableau de signes avec une ligne pour 4t et une autre pour t2 − 25t + 150. M1 fait remarquer que le terme 4t étant toujours positif pour t ∈ [0; 10], cette ligne est inutile. E1 décide de le garder, par précaution. C1 propose d’éliminer le facteur 4 qui ne modifie rien dans tous les cas. Tout le monde est nulle part {7-19’12}. Les élèves du groupe 1 commencent le calcul des racines de t2 − 25t + 150. Ayant demandé une calculette à un élève d’un groupe voisin, c’est l’occasion pour N1 et C1 de se rassurer qu’ils ne sont pas les seuls à avoir du mal à résoudre la situation V. Même M2, réputé être le meilleur élève de la classe, ne trouve pas : « Tout le monde est nulle part ». {7-20’00}. C1 finit de discuter avec les élèves du groupe 2 et conclut que « Avec les tangentes, il y a moyen, mais c’est le seul moyen ». Laborieusement, les élèves cherchent les racines de t2 − 25t + 150. Pour C1, faire un tableau de signes, « il n’y a rien de plus chiant ». Il avertit le reste de son groupe qu’à la fin, seule la partie où t ∈ [0; 10] les intéresse. {7-20’52}. E1, s’adressant à un élève d’un autre groupe, résume ce que son groupe est occupé à faire : « On fait plein de trucs qu’on essaie de faire avec ce qu’on a mais ça nous mène à rien pour l’instant ». Finalement, les élèves terminent leur tableau de signes. Ils en concluent que, si l’énoncé précise que t ∈ [0; 10], c’est uniquement parce que, dans cet intervalle, la position est positive. Conjecture graphique {7-21’57}. Sur base du tableau de signes obtenu et des deux racines 0 et 10, C1 conjecture l’allure du graphique et l’instant du maximum sur [0; 10]. Ils trouvent qu’il s’agit « vraiment [d’]une fonction marrante » mais ne reconnaissent pas explicitement qu’il s’agit d’une fonction du troisième degré. M1 constate avec dépit que sa conjecture initiale (cf. {7-13’49}) est tout à fait fausse. À deux reprises, N1 trace en l’air, avec son doigt, l’allure de la courbe entre t = 0 et t = 10. {7-23’07}. N1 demande à E1 de proposer une bonne idée ; E1 répond par une boutade. C1 continue à chercher « Quand exactement » la fonction atteint son maximum. À son tour, C1 trace avec son doigt une courbe croissante puis décroissante à concavité tournée vers le bas. M1 propose « de calculer le sommet » mais sans proposer le moyen de le calculer. N1 se souvient que « le seul moyen de trouver le sommet », c’est d’utiliser la méthode de Fermat (N1 dit « Kerma » ; on voit à {7-27’04} qu’il s’agit bien de Fermat). En parlant de Fermat, N1 fait référence à {4-16’35} (mise en commun de la situation II.2) ou à {5-6’51} (mise en commun de la situation III). Dans les deux cas, il n’était pas question de trouver un sommet ; on peut penser que N1, observant que la loi de mouvement est du troisième degré, se souvient que seule la stratégie des marches d’escalier fonctionne et il a associé Fermat à cette stratégie. - 339/709 - 9.8.2. Résumé des enregistrements filmés dans le groupe 1 Le produit d’une fonction par une autre ou par une constante ? {7-23’36}. M1 pense que le sommet de p(t) = 4t(t2 − 25t + 150) est le même que celui de t2 − 25t + 150. E1 lui rétorque qu’une fonction du troisième degré (en réalité, E1 a parlé de t3 ) « peut faire plusieurs sommets », tandis qu’une fonction du second degré « a juste un minimum ou juste un maximum ». M1 argumente que p(t) est le produit d’une fonction du second degré par une fonction du premier degré ; il trace avec son doigt, sur sa feuille, une parabole puis une droite. Implicitement, selon M1, une telle multiplication provoque un étirement vertical de la fonction, ce qui ne modifie pas l’abscisse du maximum. M1, reprenant le terme inexact employé par E1 précédemment, ajoute qu’ils n’ont pas affaire à « une fonction t3 normale ». Chercher un lien avec les situations précédentes {7-24’08}. N1 rappelle qu’ils n’ont pas étudié le produit d’une fonction par une autre mais seulement le produit d’une fonction par une constante. E1 a l’impression que le raisonnement de M1 est correct mais qu’il est difficilement réalisable en pratique. M1 persiste à chercher le sommet par sa méthode. C1 cherche à relier la situation V aux situations déjà rencontrées : « Ça doit être un truc un peu comme on l’a fait l’autre fois, mais c’est pas évident ». {7-24’28}. N1 reprend la lecture attentive de l’énoncé. Il se demande ce que signifie le mot « origine » (l’énoncé demande « à quel(s) instant(s) la distance du mobile à l’origine est maximale »). E1 entend qu’un groupe pense avoir trouvé la solution en utilisant une calculatrice graphique ; BM dit à ce groupe qu’ils savent « tracer le graphique sans calculette ! » Pendant ce temps, M1 pense avoir trouvé le minimum de la fonction à t = 12, 5. N1, distrait, est déçu par le résultat de M1 alors que, non seulement 12, 5 > 10 est en dehors du domaine d’étude demandé mais encore, une telle affirmation est tout à fait compatible avec le tableau de signe qu’il vient de construire : simplement, il a perdu de vue que c’est le maximum qui est cherché et que l’on se restreint à t ∈ [0; 10]. {7-25’17}. E1 propose de tracer le graphique. M1 ne voit pas comment faire ce tracé sans utiliser les tangentes. L’utilisation des tangentes est d’autant plus fraîche dans l’esprit des élèves qu’ils ont eu, ce jour-là, une interrogation qui portait sur ce sujet, dit M1. E1 précise qu’il s’agissait de la fonction t3 + t2 , une fonction qui ressemble à celle présentement étudiée. Mais les élèves savent qu’ils doivent pouvoir s’en sortir autrement. {7-25’42}. JY rejoint le groupe 1 pour rendre aux élèves leurs feuilles relatives aux situations précédentes. Ainsi, jusqu’à présent, les élèves n’ont pu utiliser que leurs souvenirs des situations précédentes ; ils n’ont pas pu se référer à leurs notes écrites. N1 propose de relire les situations précédentes pour éclairer la situation présente. C1 raconte qu’ils ont « fait un tableau de signes ». M1 revendique de pouvoir utiliser les tangentes pour tracer la courbe. JY rappelle qu’il s’agit d’une fonction du troisième degré, donc connue dans son allure générale. En particulier, puisque entre les racines 0 et 10 la fonction est positive, c’est qu’elle passe par un maximum 10 . C1 montre à JY l’allure de la courbe entre les racines. 10. La continuité de la fonction est sous-entendue et ne pose pas de problème, s’agissant d’une fonction polynomiale - 340/709 - 9.8. Situation V Propriétés d’une fonction du troisième degré {7-26’41}. JY signale que, s’agissant d’une fonction du troisième degré, il n’y a plus d’axe de symétrie et que, par conséquent, le maximum n’est pas à t = 5. E1 envisage le cas d’une fonction du troisième degré n’ayant qu’une racine mais deux extrema locaux [elle n’en donne pas l’expression analytique mais −t(t2 − 4t + 5) en serait un exemple] ; si tel était le cas, on pourrait envisager que le maximum sur [0; 10] soit en 10. Mais JY lui montre qu’une telle situation est incompatible avec le tableau de signes obtenu précédemment. {7-27’04}. N1 fait référence à la méthode des tangentes, mais il s’agit de la méthode vue à la situation II (stratégie des droites parallèles) et non celle du chapitre vu précédemment par les élèves. Cette méthode consistait à déplacer une droite parallèlement à elle même jusqu’à réduire son intersection avec une courbe à un point unique. C1 propose de « la rabattre sur l’axe des x, et puis, après, trouver la racine ». En regardant sa feuille, on voit un graphique du type de celui cherché : partant du point (0; 0), croissant puis décroissant jusqu’au point (10; 0), à concavité tournée vers le bas ; en dessous, on retrouve le même graphique déplacé verticalement de sorte que son sommet soit sur l’axe des x. C’est ce qu’il appelle « rabattre »la courbe. N1 fait également référence à la méthode de Fermat mais sans l’expliciter davantage. Revenir au contexte cinématique {7-27’33}. JY recadre les élèves du groupe 1 sur le contexte cinématique du problème. M1 cherche le contrat didactique : « Enfin, vous nous donnez ça pour, quand même, qu’on utilise une formule. . . ». JY précise que le but est plutôt « de comprendre ce qui se passe ». Les élèves observent que le mobile avance puis recule. JY précise que « à l’instant qui [les] intéresse, il avançait : il se met à reculer ». M1 en déduit qu’il s’agit de « calculer à partir de quand il commence à reculer ». N1 observe aussitôt « Que la pente est positive et puis négative », ce que M1 interprète en termes de vitesses. La position maximale correspond à une vitesse nulle {7-28’56}. M1 propose alors de chercher « l’équation de la vitesse » pour en étudier le signe. Pour le moment, les élèves ne cherchent pas quand la vitesse s’annule. E1 observe que l’énoncé comporte une seconde question, laquelle est considérée par E1 comme succédant à la première et non simultanée : « À la fin on nous demandera que vaut la vitesse ». JY donne aux élèves des feuilles blanches supplémentaires et quitte le groupe 1. {7-29’20}. C1 revient sur l’idée de translation verticale vers le bas de sa courbe. Il se souvient que, lors de la situation II, il y avait eu « un truc comme ça ». N1 lui répond : « Oui, mais tu ne sais pas de combien. Donc tu ne sais pas quelle translation tu auras ». C1 abandonne son idée. M1 se demande « Comment on avait trouvé les vitesses ». N1 a un souvenir procédural et non conceptuel : « On avait déjà deux équations et on mettait t + ∆t, là ». M1 précise que c’était lorsqu’ils pouvaient égaler deux vitesses. Il observe dans un premier temps que ce n’est pas le cas ici, puisqu’ils ne disposent que d’une loi de mouvement, puis se ravise ({7-30’14}) : « Ou bien, non : vitesse égale à zéro. . . Mais oui : elle augmente. . . Le - 341/709 - 9.8.2. Résumé des enregistrements filmés dans le groupe 1 moment où elle [la vitesse] sera égale à zéro, c’est le moment où elle [la distance] sera plus grande, parce qu’elle [la distance] augmente puis elle descend ». Les autres élèves sont aussitôt convaincus que c’est la bonne idée ; E1 ajoute qu’elle y avait « déjà pensé tout à l’heure » mais qui n’avait rien dit. {7-30’36}. Pour E1, « Ça, on √ sait tout à fait faire, poser l’équation de la vitesse ». M1 précise : « Au lieu de dire "égal 3", des trucs comme ça, on fait "égal 0" ». E1 se souvient qu’ils avaient utilisé t1 et t2 , mais elle ne sait pas expliquer à N1 et C1 pourquoi ; ces derniers acceptent de procéder de la sorte. La question du choix entre les notations t1 et t2 ou t et t + ∆t est vite résolue par E1 : « C’est égal [. . . ] Moi je préfère t1 , t2 , mais, bon, après. . . » {7-31’18}. C1 se souvient qu’à la fin, « on supprime les ∆t. . . Enfin, ∆t égal à zéro » ; mais il ne dit pas pourquoi. E1 pense que « l’intervalle de temps on l’a, en soi ». Éliminer 4 ou 4t ? {7-31’27}. M1 revient avec son idée que le facteur 4t est à « virer ». Les autres élèves du groupe lui expliquent que seul le facteur 4 peut être éliminé : C1 lui dit : « Tu ne peux pas virer le t, vu que le t va varier ». E1 a un autre argument : « Tu ne peux pas virer le t. Ça change tout parce que, sinon, tu as aussi une parabole ». Mais M1 n’est pas convaincu et décide de suivre sa voie et de comparer son résultat final à celui des autres. Des souvenirs jusqu’à la compréhension {7-31’55}. C1 ne se souvient pas en détail de « comment on faisait ». Les élèves décalquent ce qu’ils avaient fait dans les situations II et III : ils écrivent une expression avec t + ∆t à la place de t puis ils soustraient l’expression avec t, mais ils ne s’expriment pas en termes d’espace parcouru et de temps écoulé (il faut attendre {7-34’05} pour que M1 éclaire N1 à ce sujet). Cela entraine des erreurs telles que la mise au dénominateur de t + ∆t (C1) au lieu de ∆t seul. N1 a l’impression d’obtenir une équation très lourde et du troisième degré de surcroît. Cela motive M1 à proposer à nouveau au groupe de ne pas tenir compte du facteur 4t : « 4t c’est, enfin, c’est constant, c’est une droite. Je suis sûr que ça ne change rien ». Les autres continuent à rejeter très clairement l’argumentation de M1. {7-33’25}. C1 commence à expliquer à N1 comment simplifier les termes en t3 mais N1 a du mal à se convaincre que la simplification est possible. {7-33’42}. JY revient dans le groupe 1 mais les élèves continuent à raisonner imperturbablement. {7-34’00}. La valeur nulle de la vitesse inquiète E1 : « On ne sait pas résoudre ces trucs, vu que c’est égal à zéro. Il n’y a pas moyen ». C1 demande à JY son avis sur la méthode employée par le groupe pour trouver la vitesse. {7-34’05}. Commencent alors trois conversations en parallèle : dans la première, E1 résume à JY la démarche entreprise par le groupe 1. - 342/709 - 9.8. Situation V La seconde est un soliloque de C1. Il affirme qu’il est sûr de sa procédure de simplification. Enfin, dans la troisième conversation, M1 prend le relais de C1 pour aider N1 à simplifier l’expression qu’il a obtenue. Pour M1, il est clair que le numérateur est obtenu en faisant « Position finale moins position au départ ». La réaction de N1 confirme que, jusque là, celuici ne comprenait pas le calcul qu’il tentait d’effectuer : « Bien vu. », dit-il. {7-34’42}. N1 trouve le calcul long : « Ça, ça, ça, ça. . . C’est astronomique, hein ce truc ! Ça va être super long ! » JY encourage les élèves à persévérer dans leurs calculs. {7-34’50}. Nouvelles conversations simultanées entre JY et M1, d’une part, et C1 et N1 d’autre part. Dans la première conversation, M1 soumet à JY son idée de ne pas tenir compte du facteur 4t dans la résolution du problème. Dans un premier temps, JY donne la même explication à M1 que C1 : t est variable. M1 étant d’autant moins convaincu de l’argument que t varie seulement entre 0 et 10, JY lui propose de faire les deux méthodes : en tenant compte du facteur t et en n’en tenant pas compte. M1 déclare laisser les autres faire avec t3 pour tâcher de trouver le sommet avec la fonction en t2 . M1 a l’intuition que la multiplication d’une fonction donnée par « une droite [de pente forcément] constante » ne modifie pas l’abscisse du sommet de courbe de cette fonction. JY réfléchit à un contre exemple et propose à M1 le cas de la fonction y = t multipliée par la « droite » y = t. La fonction n’a pas de maximum ou de minimum local tandis que le produit t2 a un minimum local et absolu en t = 0. M1 semble renoncer à son idée qu’il espérait correcte pour éviter de devoir affronter le calcul commencé par le reste du groupe et qu’il juge être « un truc hyper long ». Dans l’autre conversation, N1 et C1 progressent dans la simplification du quotient différentiel. E1 leur demande de ralentir mais, trop concentrés, ils ne lui répondent pas. En cours de route, C1 doute de pouvoir conclure avec une telle méthode : « Je suis sûr que ça, on n’arrivera à rien, mais bon. . . On peut toujours essayer ». C1 est inquiet de voir tous les termes indépendants de ∆t disparaître. {7-36’47}. JY, ayant terminé son explication à M1, filme C1 et N1 qui poursuivent imperturbablement leur réflexion. C1 se rassure quand il prend conscience qu’il doit encore tout diviser par ∆t. {7-37’02}. E1 écoute C1 et N1 en essayant de comprendre leur démarche. M1 demande à E1 où ils en sont. L’équation v(t) = 0 {7-37’02} 11 . Pendant ce temps, C1 et N1 approchent d’une expression algébriquement simplifiée du quotient différentiel et rappellent qu’ensuite, ils devront poser ∆t = 0 avant de conclure. 11. C’est bien le même temps que ci-dessus. - 343/709 - 9.8.2. Résumé des enregistrements filmés dans le groupe 1 {7-37’51}. N1, ayant terminé la simplification algébrique de son quotient différentiel, demande au reste du groupe s’il « ne fallait pas tenir compte du 4 en fait ». Tous répondent que le 4 ne sert à rien ici et M1 distingue explicitement le statut du facteur 4 du facteur t : « Avec t ça change quelque chose mais 4, non ». {7-38’18}. N1 et C1 égalisent « ces ∆t à zéro ». Après la rectification d’un oubli de distribution du signe moins dans une parenthèse, ils parviennent à « l’équation de la vitesse » : C1 écrit sur sa feuille Ev = 3t2 − 50t + 150 et encadre cette réponse ; plus bas, cependant, il écrit 3t2 − 50t + 150 = 0. Sur la feuille de N1, il n’y a pas réellement d’équation : il obtient une fonction du second degré au terme d’une suite de lignes de calcul sans aucun signe d’égalité. M1, sur sa feuille écrira d’abord v = 3t2 − 50t + 150 avant d’écrire 3t2 − 50t + 150 = 0 avec l’explication « mobile avance puis recule, et atteint sa position maximale lorsque sa vitesse p(t) est nulle ». Enfin, E1 écrit que, « sur l’intervalle ∆t : v = = 0 (on ne sait pas s’il s’agit t d’une erreur ou d’une représentation sténographique ou idéogrammatique) ; ensuite elle écrit que v est égale au quotient différentiel puis remplace v par 0 pour la suite de la simplification algébrique du quotient différentiel ; puis elle écrit « ∆t négligeable » pour justifier l’élimination des termes en ∆t restant ; finalement, elle obtient l’équation 0 = 3t2 − 50t + 150. {7-38’58}. JY revient sur la justification de la non prise en compte du facteur 4 dans le contexte de la question posée. Bien que C1 n’ai pas donné beaucoup d’explications dans sa copie, il a bien compris que « ce qu’on cherche, c’est la vitesse quand elle vaut zéro. Donc 4 fois zéro, ça fait zéro ». JY leur demande ce qui se produirait s’ils cherchaient la vitesse à un instant quelconque et E1 répond qu’on « aurait dû prendre en compte le 4 ». Résolution de l’équation 3t2 − 50t + 150 = 0 {7-39’17}. E1 essaie de rattraper N1 et C1 en lisant ce qu’ils ont écrit. M1 calcule et simplifie lui aussi son quotient différentiel. Pendant ce temps, C1 et N1 cherchent les racines de l’équation 3t2 − 50t + 150 = 0. Après quelques hésitations sur la formule à employer, C1 est sur le point de trouver les deux racines. {7-41’28}. N1, se souvenant qu’ils cherchent le maximum de la distance et se rappelant −b les coordonnées du sommet d’une parabole (« il y a [abscisse du sommet d’une parabole] 2a −ρ ou [son ordonnée] »), estime inutile le calcul des racines. C1 lui rappelle que la fonction 4a qu’ils ont « c’est l’équation de la vitesse », ce qui suffit à N1 pour réaliser son erreur. M1 et E1 ne parviennent pas à suivre le raisonnement de N1 et C1. {7-41’54}. M1 s’accroche pour obtenir des informations de N1 qui, dès lors, aide M1 et E1 à trouver l’expression de la vitesse. C1 pressent qu’il va trouver deux racines, dont une ne sera pas dans l’intervalle [0; 10]. Il cherche les racines à l’aide d’une calculette, sans se soucier de l’avancement du reste du groupe : « Voilà. Moi je brûle, moi ». - 344/709 - 9.8. Situation V L’instant cherché est trouvé {7-42’18}. C1 trouve l’instant cherché : t = 3, 925. Il veut aussitôt l’annoncer à M2, dans l’espoir d’avoir trouvé avant lui. M1 lui demande une nouvelle fois d’attendre le reste du groupe. C1 est confiant : « Normalement, c’est bon. Je ne vois pas pourquoi ça serait faux ». {7-42’32}. JY calcule de tête une valeur approchée de la réponse et les autres élèves tâchent de trouver eux aussi une réponse. C1 continue à demander à d’autres s’ils ont trouvé une réponse, si bien que M1 affirme que C1 « veut absolument se la péter ». E1, plus discrètement, est « fière » d’avoir aidé le groupe à parvenir à la solution. {7-43’12}. À M2, qui lui demande sans doute en quelle unité il obtient la valeur 3, 925, C1 répond : « Temps. En temps, le temps quoi ! ». Il est vrai que l’énoncé ne précise pas quelle est l’unité de temps choisie. M2 a obtenu une autre réponse et N1 commence à douter du résultat. C1 observe que la réponse de M2 est fausse puisqu’elle « doit être entre 0 et 10 ». E1 est rassurée d’apprendre que la valeur trouvée par C1 a été obtenue à l’aide d’une calculette. {7-43’34}. M1 est d’accord avec C1. N1, sans remettre en cause le procédé, est perturbé √ par la présence du signe moins devant ρ dans le calcul d’une des racines. Il demande si, « quand tu as un moins, c’est négatif ». C1 et JY lui répondent que ce n’est pas le cas : t = 3, 925 est obtenu en faisant « avec le moins », tandis qu’avec le « plus », on obtient t = 12, 7, valeur écartée car supérieure à 10. N1 observe que cette seconde valeur correspond à un minimum de la fonction. {7-44’00}. N1 poursuit son calcul en décomposant le discriminant en facteurs premiers. C1 observe que son résultat « est cohérent avec le graphique. Donc ça devrait. . . Ça doit être bon ». Sans plus attendre, C1 lit la question suivante, le calcul de la vitesse. M1 lui fait aussitôt remarquer que la question est déjà résolue, et pour cause : « C1, sa vitesse, c’est égal à zéro. On vient de. . . C’est notre raisonnement ! » {7-44’44}. JY quitte le groupe 1. M1 demande à C1 d’attendre le reste du groupe et d’expliquer ce qu’il a fait. C1 se lève avec sa feuille et explique sa démarche à M1. E1 est « trop contente » d’avoir eu l’intuition nécessaire pour trouver la solution du problème. {7-45’10}. M1 poursuit méthodiquement la rédaction de sa réponse : il ne veut rien écrire dont il ne soit pas certain mais demande toutes les réponses à C1 et N1. N1 et C1 sont épatés d’avoir si bien « géré » la résolution du problème. « On est les kings, là », estime C1, avant de conclure : « Là, je suis assez fier de notre groupe ». {7-45’31}. N1 rappelle qu’il reste encore l’autre partie de la situation V, située au verso de la feuille. C1, harcelé par M1 qui veut poursuivre la rédaction de sa réponse, n’entend pas N1. Celui-ci insiste. Il faut attendre {7-46’07} pour que C1 entende N1. Avant même de lire son contenu, C1 est déçu car il espérait avoir terminé. - 345/709 - 9.8.2. Résumé des enregistrements filmés dans le groupe 1 Découverte du second problème {7-46’22}. Les élèves du groupe 1 continuent à rédiger leur réponse, sauf C1 qui se distrait en discutant avec M6. {7-46’48}. N1, E1 et C1 lisent le nouveau problème tandis que M1 achève la résolution du problème précédent. N1 observe qu’il s’agit une nouvelle fois d’une « histoire de maximum ». C1 « en [a] marre ». N1 explique à E1 à quoi ressemble la boîte rectangulaire : « tu replies ça. Tac, tu replies ». Les élèves d’un autre groupe rigolent bruyamment, jusqu’à s’essouffler ; E1 déclare amusée : « Ils n’en peuvent plus, quoi ! » et C1, dépité, lui répond : « Ben moi, je n’en peux plus non plus ». Le volume de la boîte est promptement exprimé {7-48’17}. E1 et N1 expriment le volume de la boîte en termes de longueur fois largeur fois hauteur ou profondeur avant de l’exprimer algébriquement. {7-48’45}. N1 dit que « la longueur c’est 30 − 2x ». E1 dit la longueur est de 30 et ne semble pas entendre N1 réagir en disant à nouveau que c’est 30 − 2x. Sans doute s’agit-il d’une erreur d’inattention de E1 car elle exprime correctement la largeur : 20 − 2x. E1 et N1 s’accordent pour dire que la hauteur est x. Ils obtiennent l’expression du volume de la boîte. Faire à l’identique ou adapter ? {7-49’12}. N1 observe qu’il obtient une fonction du troisième degré. E1 pense qu’ils devront suivre la même méthode que pour trouver l’écart maximal « vu qu’il disait "Deux problèmes et une solution" ». {7-49’29}. M1 est étonné de lire la valeur 30 sur la copie de E1. Celle-ci se rend compte de son erreur. {7-49’30}. Pendant ce temps, C1 s’informe auprès de N1 de l’expression du volume qu’il a obtenue. {7-49’47}. Tous les élèves du groupe 1 parviennent à la même expression du volume de la boîte : V = (30 − 2x) · (20 − 2x) · x. M1, à son tour, observe que « ça fait un truc du troisième degré ». C1 voit un obstacle à utiliser la solution de l’écart maximum dans ce nouveau contexte : « Je ne comprends pas comment on peut faire la même chose que l’autre fois vu qu’on n’a pas la vitesse ». N1 argumente en disant qu’ils obtiennent à nouveau « une équation du troisième degré ». Cela ne convainc pas C1 qui demande à un élève du groupe 6 voisin ce qu’ils ont obtenu comme « équation ». {7-50’09}. N1 et les autres élèves du groupe 1 entreprennent de développer l’expression du volume de la boîte. {7-50’32}. JY revient dans le groupe 1 et annonce que M2 a terminé l’ensemble de la situation V. M1 est sceptique car il aurait entendu que la réponse du groupe 2 était différente de la leur. M1 pense également que les élèves du groupe 2 « ont utilisé la tangente », ce qui est perçu comme contraire au contrat didactique. JY confirme que le groupe 2 a utilisé ses connaissances de la tangente avant d’avoir « l’idée de la vitesse [. . . ] et ils ont vérifié que la vitesse égale à zéro donnait le même résultat que la tangente ». - 346/709 - 9.8. Situation V Contextes différents mais même réponse a priori {7-51’11}. C1 a terminé de développer l’expression du volume et déclare, sceptique : « Je rêve ou c’est la même équation ? », avant d’affirmer de plus en plus nettement : « L’équation est la même ! Oui. Regarde : c’est la même qu’en 1 » 12 . C1 a obtenu une expression très semblable pour le volume de la boîte que pour la position du mobile au début de la situation V. Ce qui diffère, outre le contexte, ce sont les variables, une longueur à la place d’un temps. C1 n’est pas dérangé par ces différences. En revanche, l’absence de contraintes explicites le gêne : « Ben c’est la même chose ! Ah ben non, ben non. . . Ce n’est pas entre zéro et dix, cette fois-ci. . . » {7-51’29}. M1 et E1 continuent à développer leur expression du volume. N1 ne s’inquiète pas de l’absence de contraintes car, « de toute façon, ce sera le même résultat vu que l’autre, on a vu que c’était le minimum » : autrement dit, étant donné que l’expression est la même et qu’ils cherchent un maximum, ils obtiendront la même valeur. {7-51’39}. C1 demande à voir le tableau de signes fait par N1 au début de la résolution de la situation V.1. Il estime alors que la solution sera pour x compris entre 10 et 15. N1, s’appuyant sur ce même tableau, n’est pas d’accord « Parce que, regarde. Ça fait. . . C’est négatif ». Puis il se rétracte : « Ah non, c’est positif ». C1 rappelle qu’ils cherchent quand le volume est maximum. Or, en l’absence de contrainte, pour x > 15, la fonction du troisième degré donnant le volume peut être aussi grande que l’on veut. La caméra est hors champ mais cela explique que C1 affirme alors que la solution « est +∞ ». Néanmoins, N1 ne croit pas à une telle solution, sans expliquer pourquoi : « Ton x ne peut pas être infini ! » Que faire sans la vitesse ? {7-51’44}. Pendant ce temps, M1 et E1 terminent le développement de leur expression du volume. Ils se rendent compte à leur tour qu’il s’agit de la même expression que celle de la position du mobile au début de la situation V. C1 se distrait un instant du dialogue qu’il a avec N1 pour confirmer à M1, comme une évidence, que « C’est la même équation. Ben, oui, c’est fait exprès » ! M1 se rend aussitôt compte d’une difficulté méthodologique pour pouvoir affirmer que la solution du présent problème est celle du problème précédent : l’absence de vitesse. Il pense qu’il « faut trouver une excuse pour avoir la vitesse ». E1 déclare : « on ne sait plus mettre v est égal à zéro ». {7-52’25}. JY intervient pour vérifier que les élèves du groupe 1, E1 en particulier, ne confondent pas le volume V de la vitesse v. Il demande : « C’est quoi le V ? » C’est justement E1 qui répond que « c’est le volume » mais la confusion reste possible puisqu’elle ajoute aussitôt : « Mais on ne sait plus mettre l’équation sur égale à zéro de cette manière-là ». Elle est néanmoins consciente de l’information manquante : « là, on avait l’information que la vitesse était nulle. C’est grâce à ça qu’on savait faire quelque chose ». M1 a l’intuition d’utiliser x + ∆x mais il ne précise pas davantage sa pensée et les autres ne l’entendent pas. 12. En réalité, il n’y a pas de numérotation .1 et .2 sur la feuille distribuée aux élèves. C1 fait référence au recto de la situation V. - 347/709 - 9.8.2. Résumé des enregistrements filmés dans le groupe 1 {7-52’47}. M1 précise à JY son idée : « On peut utiliser qu’on avait t + ∆t avant, pour trouver un moment et un moment juste après. Mais, là, on peut utiliser la même chose pour dire un volume précis et un volume après ». En effet, « On avait trouvé une vitesse parce que ça [la position du mobile] monte et puis ça redescend. Et là, on ne peut pas trouver que le volume monte et descend. . . ? » JY tâche de rester neutre dans ses réponses à M1 : « Oui, oui. . . », « Pourquoi pas ? » et un « Oui. . . » évasif. {7-52’43}. Pendant ce temps, N1 identifie la contrainte cachée : en raison de la largeur de la plaque, le x correspondant à la dimension des coins découpés « ne peut être égal que maximum à 10 ». C’est donc « la même chose ! C’est exactement la même chose ». C1 le rejoint : « C’est la même chose ! Ben oui ». {7-53’13}. E1 interrompt JY et M1 pour écouter C1 et N1 raconter ce qu’ils ont trouvé. Ceux-ci poursuivent leur explication là où ils en étaient et C1 conclut que « c’est bien de nouveau 3 virgule neuf machin là [3, 925] ». M1 est content que N1 et C1 aient trouvé mais E1 n’est pas satisfaite des explications. {7-53’37}. JY constate la facilité qu’ont N1 et C1 de mettre en parallèle les deux problèmes ; en même temps, il soutient comme « compréhensible » le fait que, pour E1, « ce n’est pas aussi clair ». Mais, soit E1 ne veut pas se singulariser, soit JY a mal interprété ses réticences ; toujours est-il qu’elle se rétracte : « là, maintenant, je suis d’accord, hein ? Moi, ça me semble logique », ce qui provoque les sourires de JY, N1 et E1 elle-même. {7-53’54}. Commencent alors des conversations parallèles entre E1 et JY, d’une part, et C1, N1 et M1, d’autre part. E1 montre à JY qu’elle a compris pourquoi le problème d’optimisation cinématique précédait celui d’optimisation du volume : « si on avait commencé par ça, ça aurait été plus compliqué [. . . ] Parce que, si on commençait par ça, on ne pouvait pas égaliser cette équation, dire qu’elle était nulle. Donc on n’arrivait pas à trouver cette réponse-là ». Comme un clin d’œil, JY demande à E1 de lire le titre de la situation V, pensant qu’elle ne l’avait pas encore fait ; E1 ne réagit pas, bien qu’en fait, nous avons vu plus haut qu’elle avait déjà lu et analysé ce titre. Pendant ce temps, C1 et N1 expliquent plus en détail leur raisonnement pour trouver la contrainte du problème. {7-54’30}. JY annonce qu’il va quitter le groupe 1 pour laisser ses élèves terminer de rédiger leur réponse. {7-54’40}. JY pose la caméra sur le pied ; la caméra n’étant plus toute proche des élèves du groupe 1, on entend trop le bruit de fond pour retranscrire les derniers dialogues qui ne semblent cependant pas significatifs. Les élèves terminent de rédiger leur réponse. - 348/709 - 9.9. Situation VI Mise en commun {8-0’00}. Avant de commencer la mise en commun de ce qui a été fait dans les groupes, JY précise aux autres élèves de la classe qu’il n’a donné aucune réponse aux élèves du groupe 1. {8-0’12}. Comme signalé lors du résumé des enregistrements filmés de la situation IV (cf. p. 334), JY revient sur cette dernière. {8-3’07}. JY aborde la mise en commun de la situation V proprement dite. Il raconte d’une part la démarche première des élèves, qui était analytique mais les laissait bloqués. Il raconte d’autre part comment les élèves se sont débloqués lorsqu’ils sont revenus à une approche cinématique du problème, leur donnant alors l’idée d’écrire que l’instant cherché est celui auquel la vitesse instantanée est nulle. {8-8’24}. JY aborde le second problème de la situation V, relative au volume d’une boîte parallélépipédique. Il fait observer que les élèves ont d’emblée reconnu que l’expression du volume était le même que celle de la loi de mouvement du premier problème, aux noms des variables près (x au lieu de t). {8-10’17}. JY raconte comment certains élèves ont d’abord douté de l’équivalence des deux problèmes en raison de l’absence de contraintes explicites sur x alors que 0 6 t 6 10. Ils ont ensuite été rassurés en découvrant que cette contrainte est implicitement la même vis-à-vis de x en raison des dimensions de la plaque constitutive de la boîte. Il en résulte, dit-il, que « la réponse sera la même ». Un élève relève que ce ne sera « Pas le même axe » mais JY ne l’entend pas et ne précise pas que ce sont les valeurs numériques qui sont les mêmes, tandis que les unités changent. JY montre que le problème du volume peut être interprété comme un problème cinématique. {8-12’41}. JY propose d’interpréter de même tout graphique fonctionnel y = f (x) comme une loi de mouvement. Finalement, il indique que la dernière étape dans l’abstraction consistera à ne plus revenir à l’interprétation cinématique. {8-15’18}. Par analogie avec ce qui précède, JY écrit le quotient différentiel et sa limite, la fonction dérivée, dans le cas d’une fonction f quelconque de la variable x. {8-18’21}. JY transfère les interprétations faites dans le contexte cinématique au contexte fonctionnel abstrait : il lie d’abord la croissance/décroissance de la fonction au signe de sa dérivée. Ensuite, JY introduit l’accélération instantanée comme étant le taux instantané de variation de la vitesse, c’est-à-dire « la vitesse de la vitesse » ; par analogie, il introduit alors la dérivée seconde d’une fonction comme étant la dérivée de la dérivée. Cela lui permet de lier la concavité d’une courbe au signe de la dérivée seconde. {8-20’53}. JY annonce aux élèves qu’à la suite du travail qu’ils auront fourni à propos des différentes situations proposées, ils verront avec leur professeur (BM) diverses propriétés qui permettent de calculer rapidement toutes sortes de dérivées. 9.9 9.9.1 Situation VI Énoncé proposé aux élèves - 349/709 - 9.9.1. Énoncé proposé aux élèves VI. Prendre la tangente ? VI.1 Touch and Go Considérons un mobile sur une trajectoire rectiligne. Il démarre à l’instant t = 0 de la position p = 2. Il accélère jusqu’à l’instant t = 3. À cet instant, il occupe la position p = 6 et sa vitesse instantanée vaut 2. Il décélère ensuite jusqu’à l’arrêt qui se produit à l’instant t = 6 et à la position p = 10. Il fait alors demi-tour et atteint la position p = 8, 25 à l’instant t = 7, 5. Sa vitesse vaut alors −2, 5. Il continue à décélérer jusqu’à l’instant t = 9 et la position p = 2. Sa vitesse devient alors constante et vaut −6. Dessiner le plus précisément possible la loi de mouvement de ce mobile sur la figure 7. Figure 7 - 350/709 - 9.9. Situation VI VI.2 Approximation par une droite √ On suppose ici que la loi de mouvement d’un certain mobile est p = t. Ainsi, à l’instant t = 9 = 32 , la position du mobile sera 3. Sans calculatrice, il n’est pas évident de connaître la valeur numérique de la position du mobile aux instants qui ne sont pas des carrés parfaits. Ainsi, à t = 8, 46, on peut seulement dire que, grossièrement, la position est de l’ordre de 3. On voudrait trouver une approximation plus fine de cette position. Quel(s) moyen(s) proposez-vous (en excluant le recours à une calculette) pour donner une telle approximation ? Soit un mobile qui suit la loi de position est p = t17 + 3t − 1. Donner une approximation plus fine que p (1) = 3 de la position du mobile à l’instant t = 1, 127. 9.9.2 Résumé des enregistrements filmés dans le groupe 1 L’expérimentation de la situation VI.1 s’est déroulée le lundi 14 janvier 2008 (pendant un peu moins d’une demie période) et le vendredi 18 janvier 2008 (pendant un peu plus d’une demie période de cours). L’expérimentation de la situation VI.2 s’est déroulée le vendredi 18 janvier 2008 (pendant un peu moins d’une période et demi de cours). Comme annoncé plus haut (à propos de l’analyse a priori, pp. 242 et 281), nous avons dû faire le choix de ne pas étendre notre analyse a posteriori à la dernière situation de notre ingénierie. C’est pourquoi nous n’avons pas résumé ce qui s’était passé en classe ni transcrit avec précision les dialogues enregistrés (nous disposons néanmoins d’une première transcription qui pourra être retravaillée lors d’une future recherche). De même, nous n’avons pas synthétisé ce que les élèves avaient noté sur leurs copies. - 351/709 - 9.9.2. Résumé des enregistrements filmés dans le groupe 1 - 352/709 - Chapitre 10 Analyse a posteriori Dans ce chapitre, nous allons confronter les hypothèses formulées dans l’analyse a priori (cf. chapitres 7 et 8, p. 231) à la réalité observée lors des expérimentations (analyse a posteriori) : « [La phase d’expérimentation] est suivie d’une phase d’analyse dite a posteriori qui s’appuie sur l’ensemble des données recueillies lors de l’expérimentation : observations réalisées des séances d’enseignement mais aussi productions des élèves en classe ou hors classe. » (Artigue 1988, p. 297) Cette analyse a posteriori permet alors, par comparaison avec l’analyse a priori, de valider ou non les hypothèses engagées dans la recherche : « C’est sur la confrontation des deux analyses : analyse a priori et analyse a posteriori que se fonde essentiellement la validation des hypothèses engagées dans la recherche. » (Artigue 1988, p. 297) Or, quand on voit la richesse des dialogues enregistrés en classe et celle des écrits des élèves qui les complètent, on peut être tenté de commenter et d’analyser tous les faits et gestes des différents intervenants (professeur, expérimentateur et élèves) ; même en se cantonnant au domaine strictement mathématique, il est facile de s’écarter du sujet qui est le nôtre. En même temps, nous trouverions dommage de faire abstraction de tout l’effort qui a été fourni en classe et par nous. Aussi, avons-nous choisi, d’une part, d’aller à l’essentiel dans ce chapitre et, d’autre part, de conserver en annexe le matériau qui nous a permis de faire une telle synthèse (cf. Annexe C, p. 609). 10.1 Des représentations graphiques qui se prêtent à une approche qualitative de la vitesse instantanée Nous illustrons et interprétons ici en quoi les graphiques de lois de mouvement se prêtent à une étude qualitative de la vitesse au sens décrit à la section 6.4, p. 225. D’abord, les élèves parviennent à y lire les intervalles où la vitesse est variable. Ensuite, ils l’exploitent correctement pour lier accélération ou décélération du mobile au sens de la concavité. 10.1.1. Des graphiques correctement interprétés, un accent mis sur la variation de la vitesse 10.1.1 Des graphiques correctement interprétés, un accent mis sur la variation de la vitesse Rappelons que la première tâche proposée aux élèves porte sur la description d’un mouvement rectiligne à partir du graphique de sa loi (celui de la figure 2, p. 290). Trois aspects peuvent être a priori relevés : la position du mobile par rapport à l’origine choisie sur la trajectoire en relation avec la situation du graphique par rapport à l’axe des abscisses, le sens de parcours du mobile traduit par la croissance ou décroissance de la courbe et la variation de la vitesse en liaison avec la concavité. Mis à part un débat sur le signe négatif de la position initiale du mobile, l’ensemble des élèves observés se sont focalisés sur la vitesse et plus précisément sur sa variation. D’abord en repérant les intervalles où le mobile est à l’arrêt : E1 : Donc, simplement on dit par exemple : ici il ne bouge pas, vu que sa position reste la même alors que le temps augmente. . . ({1-5’52}) puis, très vite, en rapprochant accélération ou décélération du mobile et sens de la concavité de la courbe que certains expriment indûment en termes de « parabole dans un sens ou dans l’autre ». C1 [s’adressant à N1] : Et puis là, à un moment, on dirait que ça fait une courbe comme ça et puis après, ça fait une parabole inversée comme ça. C’est pas la même parabole. Ça c’est une parabole et puis là ça fait un truc : c’est une parabole dans l’autre sens. JY : Alors ? Tu dis quoi ? N1 : Ça veut dire que là il accélère. . . C1 : On dirait que ici, là, c’est une parabole dans un sens et puis là, la parabole est dans l’autre sens, donc c’est pas : il accélère et puis là il décélère ? N1 : Ça veut dire que là il augmente plus vite ses mètres en fonction des secondes, et là il augmente moins vite. E1 : Oui. C’est l’accélération quoi. ({1-6’45}) Comme le montre cet échange, l’élément technologique porte sur l’augmentation de la distance par rapport au temps. Mais certains élèves peinent, dans un premier temps, à exprimer cette augmentation comme une différence de positions : E1 : En fait quand on regarde dans des intervalles de temps plus petits, on voit qu’à chaque fois la position. . . si on réduit à chaque fois l’intervalle de temps, on voit que la position change à chaque fois plus par rapport au temps [E1 le montre sur sa feuille où elle prend la position initiale de la particule comme référence et trace des segments verticaux de l’axe des abscisses à la courbe]. C1 : Chaque seconde. . . À chaque seconde, la distance est plus grande. M1 : C’est pas la même différence de position. E1 : Il faut que je voie si la position est de plus en plus grande ou bien si c’est la même. JY : Ok. Donc, quand tu dis : la position est de plus en plus grande, de toutes façons elle est de plus en plus grande. E1 : La différence. ({1-8’58}) - 354/709 - 10.1. Des représentations graphiques qui se prêtent à une approche qualitative de la vitesse instantanée Par contre, on peut remarquer ici l’idée d’un découpage du temps de plus en plus fin, ce qui permet d’enclencher un débat sur ce qui distingue vitesse moyenne et vitesse instantanée, débat que l’expérimentateur provoque en demandant à quel type de vitesse on a affaire ici : E1 : Il y a vitesse instantanée et vitesse moyenne. JY : Oui. Et ce serait laquelle ? Ou ce serait une autre ou je ne sais pas. . . M1 : Instantanée ? JY : Qu’est-ce que ça pourrait être la vitesse instantanée ? E1 : C’est à chaque moment la vitesse qu’on a. M1 : Sur un petit intervalle, quoi. E1 : Et si on fait la moyenne de toutes les vitesses instantanées qu’on a, là, on aura la vitesse moyenne. Et si on prend à chaque fois le même intervalle de temps. . . C1 : Non, pas vraiment. . . N1 : Il y en a une infinité ! ({1-12’03}) Un peu plus tard, M1 demande aux autres élèves de son groupe pourquoi ils ne parlent pas ici en termes de vitesses instantanées, d’autant que deux d’entre eux avaient parlé de « vitesse moyenne qui augmente à chaque instant ». N’ayant pas été entendu une première fois, il insiste : M1 : Mais pourquoi c’est pas bon vitesse instantanée ? E1 : Mais, à mon avis, la vitesse instantanée, c’est pour, à chaque fois, un temps de plus en plus. . . petit, quoi, mais [. . . ] N1 : Je ne vois pas très bien. E1 : Si, genre, si ce n’est même pas une seconde, si c’est une vitesse moyenne, euh. . . Tu pourras demander au prof. Oui. À mon avis, il faut vraiment un intervalle de temps hyper hyper précis pour avoir la vitesse instantanée. ({118’57}) Ces quelques réactions se doivent d’abord d’être rapportées à la scolarité antérieure des élèves interrogés. Ainsi, n’avons-nous pas rencontré un seul d’entre eux qui confonde la trajectoire et le graphique de la loi de mouvement. Cela s’explique sans doute par le fait qu’ils sont, à ce niveau d’étude, quelque peu familiers de la cinématique, notamment des mouvements rectilignes uniformes et des mouvements rectilignes uniformément accélérés qu’ils ont étudiés au cours de physique lors de l’année précédente. On peut même supposer qu’ils y ont entendu parler de l’expression vitesse instantanée, même si l’approche reste généralement très sommaire à ce stade faute de connaissances en analyse. C’est aussi par référence à l’expérience scolaire des élèves qu’on peut expliquer leur difficulté à parler de concavité et la façon incongrue dont certains le font. Ils ont en effet étudié les fonctions du second degré lors de l’année scolaire précédente et c’est dans ce seul contexte qu’ils ont rencontré le sens de la concavité pour la première fois ; en plus, il n’est pas sûr que leur professeur ait utilisé alors cette dernière expression, se contentant peut-être de parler de parabole tournée vers le haut ou tournée vers le bas. - 355/709 - 10.1.2. D’une lecture de la concavité en termes d’accélération ou de décélération au découpage de plus en plus fin du temps Mais la forme même de la courbe proposée aux élèves et, en particulier, les contrastes qu’elle met en lumière, peuvent expliquer aussi ce qu’ils relèvent préférentiellement comme caractéristiques. En ce qui concerne la situation du graphique par rapport à l’axe des abscisses, il est significatif que les élèves remarquent qu’une partie de ce celui-ci est située en dessous et s’en étonnent quoique assez brièvement. Par contre, le graphique n’est que croissant, ce qui signifie que le mobile parcourt constamment la trajectoire dans le sens positif. Ce fait ne soulève pas de commentaires de la part des élèves. Sans doute une courbe croissante sur certains intervalles et décroissante sur d’autres aurait-elle suscité plus de propos relatifs à cet aspect du mouvement. Nous avons expliqué (section 8.1.2.2, p. 249) pour quelles raisons une telle courbe n’a pas été proposée dans les premières situations de notre ingénierie. Du point de vue de la variation de la vitesse, la courbe est suffisamment contrastée, traduisant à la fois des moments d’arrêt, des moments d’accélération et d’autres correspondant à une décélération du mobile. Et c’est peut-être ce qui fait que les élèves se sont surtout attachés à cette caractéristique : on voit les choses surtout quand elles changent. Les particularités de la courbe soumise à l’interprétation des élèves sont donc des variables didactiques. Et, comme nous le verrons, c’est le focus mis sur la variation de la vitesse qui fera milieu dans la suite des épisodes didactiques. 10.1.2 D’une lecture de la concavité en termes d’accélération ou de décélération au découpage de plus en plus fin du temps Comme dit plus haut, la vitesse est une grandeur intensive et ne peut donc être mesurée par un nombre. Par contre, on peut en distinguer plusieurs degrés d’intensité. Et c’est bien ce que font les élèves qui parlent d’accélération et de décélération même s’ils n’expriment pas clairement qu’une accélération (resp. une décélération) correspond à une vitesse de plus en plus grande (resp. de plus en plus petite). L’un d’eux parle cependant d’un mobile qui « augmente plus vite ses mètres en fonction des secondes » ({1-6’45}) et un autre dit « que la position change à chaque fois plus par rapport au temps » ({1-8’58}). Les expressions plus vite et à chaque fois plus indiquent bien l’idée d’un degré d’intensité croissant même si elles sont relatives aux distances : cela revient au même pourvu que le changement soit rapporté au temps, ce qui est effectivement le cas dans ces propos. Le graphique d’une loi de mouvement se prête à une telle lecture. C’est en effet un ostensif qui s’inscrit dans un espace à deux dimensions qu’il met en correspondance : une dimension temporelle et une dimension spatiale. Il convient ici de le contraster avec la représentation (déjà citée plus haut, section 7.3.1, p. 234) lors de leçons données par des élèves-professeurs où, sur une seule droite à la fois trajectoire et ligne du temps, on désigne en un même point une position et l’instant auquel cette position est atteinte par le mobile. La séparation entre le spatial et le temporel que réalise la représentation graphique d’une loi de mouvement dans un système d’axes et le caractère continu de ce graphique permettent en effet, si on décode ce dernier correctement, d’évaluer la distance parcourue par un mobile sur n’importe quel intervalle de temps et aussi le temps qu’il met pour aller d’une position quelconque à une autre. C’est ce qui permet surtout de voir une vitesse augmenter (resp. diminuer) selon le sens de la concavité de la courbe : soit en considérant qu’à de mêmes intervalles de temps correspondent des intervalles d’espace de plus en plus grands (resp. petits) ou qu’à de mêmes intervalles d’espace correspondent des intervalles de temps de plus en plus petits (resp. grands). Et ce, si petits soient les intervalles considérés. Ces découpages possibles du temps et de l’espace et leur mise en correspondance - 356/709 - 10.1. Des représentations graphiques qui se prêtent à une approche qualitative de la vitesse instantanée participent ainsi à la prise de conscience de la variabilité de la vitesse. Mais, si cette situation permet aux élèves de travailler cette variation en liaison avec la forme de la courbe — avec ou non des sollicitations du professeur les engageant par exemple au travail numérique — rien ne permet de conclure qu’ils pensent cette variation comme associée à celle de la pente d’une tangente à cette courbe, fût-ce à un niveau naïf, ou à celle de pente changeante de la courbe. Dans les expérimentations concernées ici, nous avons cependant rencontré quelques élèves qui ont exprimé ce point de vue, surtout mais pas uniquement, dans la classe où le concept de tangente avait été préalablement introduit dans un cadre algébrique en des termes décrits plus haut. Et, en des circonstances semblables, nous avons pu observer des élèves qui, tout en disant que le mobile accélère, longeaient la courbe en maintenant leur main tangentiellement à la celle-ci, exprimant, par ce geste, qu’ils associent une droite, ou à tout le moins une pente, en chaque point de la courbe. Ce n’est pas seulement la variabilité de la vitesse que montrent à voir les découpages associés du temps et de l’espace mais aussi le fait que, sauf là où le mobile est à l’arrêt, sa vitesse change tout le temps, ce qui est lié au fait que sa loi de mouvement est alors représentée par une courbe et non une droite. Cela peut expliquer que les élèves éprouvent d’emblée la nécessité de considérer des intervalles de plus en plus petits : « quand on regarde dans des intervalles de temps plus petits [. . . ] si on réduit à chaque fois l’intervalle de temps » ({18’58}). Se profile donc, dès cette première situation, la notion de vitesse instantanée, même si c’est dans une sorte de confusion : pour l’un c’est « à chaque moment la vitesse qu’on a » ({1-11’46}), propos qui traduit un principe de continuité déjà observé à propos du problème du vase conique ; pour l’autre, c’est la vitesse « sur un petit intervalle, quoi » bien qu’il faille « vraiment un intervalle de temps hyper hyper précis pour avoir la vitesse instantanée » ({118’57}). Quant à la vitesse moyenne, elle devient, pour un élève, « la moyenne de toutes les vitesses instantanées qu’on a, là » ({1-12’03}), ce qui ne semble pas convaincre ses interlocuteurs qui objectent que « Non, pas vraiment » ou « Il y en a une infinité ». Nous reviendrons plus loin sur les difficultés d’accès au concept de vitesse instantanée à partir de celui de vitesse moyenne ainsi qu’aux ambiguïtés liées au concept d’infinitésimal. Cette première situation se termine par une mise en commun de ce qui a été observé par l’expérimentateur dans les différents groupes et par une institutionnalisation de l’expression algébrique de la vitesse moyenne avec les notations ∆t et ∆p. À ce moment, il arrive que le professeur utilise les expressions vitesse instantanée et même pente d’une courbe en écho aux propos éventuels d’élèves sur les pentes de tangentes sans toutefois développer de lien entre les deux mais en institutionnalisant la relation entre la concavité et la croissance ou décroissance des écarts d’ordonnées pour de mêmes écarts d’abscisses. Nous verrons plus loin s’il peut s’agir là, pour les élèves, d’objets pour penser dont ils peuvent s’emparer pour répondre aux questions ultérieures. En définitive, cette première tâche engage les élèves à l’étude globale d’un mouvement sur une durée appréciable, leur regard restant essentiellement qualitatif : il s’agit surtout de savoir si une vitesse augmente ou diminue. Nous allons voir dans la section suivante comment et pourquoi cette première approche peut faire progresser les élèves dans l’identification d’une technique porteuse du concept même de dérivée lorsque leur est dévolue une question à caractère local et portant sur le temps. - 357/709 - 10.2 D’une approche globale des mouvements à la gestion d’une question locale relative au temps Comme décrit plus haut, on demande ensuite aux élèves de trouver l’instant où deux mobiles ont la même vitesse. Il s’agit toujours de mouvements rectilignes, l’un uniforme et l’autre non. Dans un premier temps, les lois de mouvement sont précisées par un graphique (voir figure 3, p. 299). Ensuite, on en donne les expressions analytiques, le mouvement non uniforme étant d’abord modélisé par une fonction du second degré et ensuite par une fonction du troisième degré. L’impact de chacune de ces trois phases sera commenté au fur et à mesure de l’analyse. 10.2.1 Un contexte qui favorise la mise en œuvre de stratégies variées Forts de leur initiation préalable à certains mouvements au cours de physique mais aussi sans doute grâce au premier travail d’interprétation du graphique d’un mouvement, les élèves décodent facilement les nouveaux graphiques fournis, l’un en termes de mouvement rectiligne uniforme, l’autre en termes de mouvement rectiligne accéléré : C1 : Celle-là [la particule P1 ], elle va toujours accélérer, tandis qu’elle [la vitesse de P2 ] va être constante. . . Probablement en référence à leur expérience scolaire, certains disent spontanément que ce dernier correspond à un mouvement uniformément accéléré alors que rien de tel ne peut être affirmé à ce stade, aucune expression analytique n’ayant encore été précisée. Le fait que la question porte sur le temps n’échappe pas aux élèves qui utilisent souvent des mots tels que « avant », « après », « quand ». Aucun d’eux n’exprime de doute quant à l’existence et l’unicité d’une réponse, même si ce n’est pas incompatible avec une certaine perplexité quant à la possibilité de faire mieux que d’approximer celle-ci, ce qui peut s’expliquer, à ce stade, par l’impossibilité d’un travail algébrique : C1 : Donc il faut trouver quand c’est le plus près possible ? ({2-3’22}) ... C1 : En fait, il n’y a qu’un seul moment où les deux particules ont la même vitesse. C’est plus ou moins à cet endroit qu’on avait dit, là. ({2-7’55}) Trois stratégies possibles ont été évoquées dans l’analyse a priori : stratégie des droites parallèles, stratégie des marches d’escalier et stratégie de l’écart maximal. Les deux premières ont été utilisées spontanément dans toutes les classes que nous avons observées et plus souvent la première que la deuxième. La troisième n’a été évoquée que dans une seule classe. Au total, dans toutes les classes concernées, la plupart des groupes d’élèves sont arrivés à produire quelque chose de pertinent par rapport à cette question. Mais ce n’est pas tant l’occurrence d’apparition de ces stratégies que nous regardons ici mais plutôt ce qui, dans chacune d’elles, conduit les élèves à localiser la réponse attendue. - 358/709 - 10.2. D’une approche globale des mouvements à la gestion d’une question locale relative au temps 10.2.2 Un contraste entre deux mouvements qui permet de localiser graphiquement l’instant cherché Dans cette section, nous nous intéresserons plus particulièrement à la phase de l’expérimentation où les élèves ne peuvent travailler que dans un registre graphique, les expressions analytiques n’étant pas encore précisées et, qui plus est, les systèmes d’axes n’étant pas complètement gradués. C’est là en effet que nous avons pu observer l’émergence et la justification des idées mises sur le tapis par les élèves, avant que leur explicitation ne passe à l’arrière-plan dans le labeur des calculs ou la gestion de difficultés bien réelles liées à la symbolisation algébrique. Pour mettre en évidence certains aspects de l’analyse, nous épinglerons, d’une stratégie à l’autre, certains propos d’élèves qui permettent de faire une hypothèse sur le fonctionnement de tous ceux qui produisent des actes pertinents sans forcément s’exprimer beaucoup. Rappelons que les deux mouvements étudiés sont contrastés, l’un étant uniforme et l’autre étant accéléré ce qui se traduit par le caractère tantôt rectiligne tantôt curviligne des graphiques qui représentent leurs lois respectives. Ce contraste est une variable didactique majeure de la situation. À cela s’ajoute l’existence de deux repères phares, soit les points d’intersection des deux graphiques : les mobiles partent de la même position au même moment et se retrouvent à un autre instant à un même endroit de la trajectoire. Cette caractéristique du problème est sans doute moins essentielle en ce sens qu’elle n’est pas nécessaire à l’expression de plusieurs des raisonnements avancés par les élèves. Elle peut cependant renforcer la première variable didactique en incitant les élèves à comparer les deux mobiles l’un par rapport à l’autre entre ces deux moments-clés que ce soit en termes de positions ou de vitesses relatives et trouver par là une information précieuse par rapport à la question posée. En particulier, on peut s’attendre à que le deuxième point d’intersection des deux graphiques donnés aux élèves soit un point attractif et que certains d’entre eux proposent l’abscisse de ce point en guise de réponse. Nous avons pu enregistrer un tel événement dans un des groupes filmés et il est intéressant d’observer ce qu’il a pu susciter : E1 : Ben moi je dirais : quand ils se croisent. JY : Quand ils se croisent. E1 : C’est à. . . Quand c’est une vitesse instantanée. Enfin, pour ce temps t ici, on voit qu’ils ont la même position. JY : Oui. N1 : Et qu’ils sont partis du même point de départ. E1 : Oui. N1 : Donc, c’est que leur vitesse. . . C1 : C’est que la vitesse moyenne de tout, depuis le départ, est la même. C’est la même vitesse moyenne sur l’intervalle. ({2-2’24}) ... C1 : Enfin, en quelque sorte, ils auront la même vitesse moyenne sur un plus petit intervalle de temps quand ça est le même. [. . . ] Si on va là, c’est la vitesse moyenne de tout, donc c’est pas très intéressant. En regardant sur un plus petit intervalle de temps, quand ça [il montre, sur le graphique de la figure 8 ci-après, une contremarche sous le graphique de P1 ], la différence de position sur l’intervalle de temps, est la même entre les deux [il pointe alors le graphique - 359/709 - 10.2.2. Un contraste entre deux mouvements qui permet de localiser graphiquement l’instant cherché de P2 mais pas explicitement la contremarche correspondant], ça veut dire que la vitesse moyenne pour le petit intervalle de temps est la même. Donc il faut trouver quand c’est le plus près possible. ({2-3’22}) ... C1 : En fait, il n’y a qu’un seul moment où les deux particules ont la même vitesse. C’est plus ou moins à cet endroit qu’on avait dit, là. ({2-7’55}) ... C1 : Celle-là [la particule P1 ], elle va toujours accélérer, tandis qu’elle [la vitesse de P2 ] va être constante. Donc, là ce sera égal. ({2-8’10}) ... N1 : Ce sera plus ou moins ici. E1 : C’est très vague, c’est pas très précis. ({2-9’03}) ... N1 : Ce sera aux environs de 1, quoi. E1 : Oui. Et pour ça, il faudrait prendre des intervalles de temps encore plus petits. JY : Voilà. Et plus je vais prendre un intervalle de temps plus petit. . . N1 : . . . au plus on se rapprochera de. . . ({2-11’24}) Figure 8 Comme on le voit sur cet extrait, une première réponse prend appui sur le fait que les deux graphiques se coupent en deux points : entre ces instants, les deux mobiles ont parcouru le même espace et c’est ce qui conduit à produire une fausse réponse en référence sans doute à une première approche de la vitesse vue au cours de physique comme rapport entre espace parcouru et temps mis pour le parcourir. Mais cette réponse ne résiste pas à l’analyse collective et on voit les élèves distinguer très vite la vitesse instantanée de la « vitesse moyenne de tout, depuis le départ » laquelle est jugée inadaptée à la question : « donc c’est pas très intéressant ». Un lien est alors fait avec le dessin réalisé par N1 (Figure 8 ci-avant) qui a découpé le temps et l’espace en intervalles plus petits et dessiné des marches et contremarches. Cela fait apparaître l’intérêt de considérer des intervalles de temps plus - 360/709 - 10.2. D’une approche globale des mouvements à la gestion d’une question locale relative au temps petits et même « encore plus petits ». On peut imaginer ici que c’est la comparaison des graphiques respectivement rectiligne et curviligne entre leurs deux points d’intersection qui mène à un tel cheminement. Comme le dit C1, « Celle-là [la particule P1 ], elle va toujours accélérer, tandis qu’elle [la vitesse de P2 ] va être constante ». Dès lors, si ces deux mobiles ont bien une même vitesse moyenne sur l’intervalle de temps correspondant, la différence de leurs comportements n’autorise aucune réponse à la question posée avant d’avoir étudié ce qui se passe sur de plus petits laps de temps. Dans cet échange, l’élève C1 joue le rôle de leader, se montre plus explicite que les autres et semble les convaincre. Leur cheminement collectif, ici reconstitué par nous, est cependant crédible dans la mesure où, a priori en tout cas, le travail fait à propos de la première situation a enrichi le milieu en ce sens. L’échange précédent illustre ce que nous avons appelé, dans l’analyse a priori, la stratégie des marches d’escalier. Les élèves y comparent des taux de variation de deux fonctions ou plutôt, ce qui revient au même, des écarts d’ordonnées correspondants à de mêmes écarts d’abscisses. Il est toutefois plus facile de comparer deux tels taux entre deux points d’intersection des graphiques, comme au tout début de cet échange. Cela pourrait expliquer que d’autres élèves optent pour la stratégie des droites parallèles ou du moins une de ses variantes consistant à tracer plusieurs droites parallèles au graphique de P2 et coupant le graphique de P1 en deux points. L’idée est de remplacer le mobile à mouvement uniforme par un autre de même vitesse constante mais qui va rencontrer le mobile à mouvement accéléré entre deux instants plus proches. C’est ce qu’explique un élève en s’aidant d’un dessin assez sommaire : « La droite P2 a une vitesse constante car pour un certain temps, un certain espace est parcouru et, plus loin, pour un même temps, un même espace est parcouru. Si on trace une parallèle à cette droite, cette parallèle a la même vitesse (même pente) ; c’est juste que la particule est partie plus tôt ou plus tard. Toutes les particules qui coupent la courbe en 2 points, entre ces deux points on a même vitesse moyenne [en réalité, l’élève ne met aucune ponctuation]. Si elle coupe la courbe en un point, c’est la même vitesse à cet instant. CQFD » (copie de G1, lors de l’expérimentation de 2007 à l’Institut Saint-Joseph à Etterbeek). En somme, il s’agit de reproduire une figure semblable à la figure 9 ci-après en continuant à déplacer parallèlement la droite de sorte que la réponse soit encadrée plus finement. Figure 9 On peut voir là, en acte mais aussi en mots, une ébauche cinématique du théorème des accroissements finis. L’élève assimile une droite coupant la courbe en deux points à un - 361/709 - 10.2.2. Un contraste entre deux mouvements qui permet de localiser graphiquement l’instant cherché mouvement à vitesse constante et cherche le point de la courbe où existe une « parallèle de même vitesse (même pente) » qui la rencontre en seul point. Bien sûr le propos ne déclare pas explicitement l’existence d’un tel point et c’est le tracé de la tangente qui fait foi ; en outre, le concept de dérivée n’est pas encore défini, ni celui de tangente. Mais l’expression « droite de même vitesse » ({4-3’48}) qui sera reprise par un autre élève lors de la synthèse à propos d’une droite parallèle à celle modélisant le mouvement de P2 autorise une traduction de l’égalité entre une vitesse moyenne et une vitesse instantanée en une égalité entre pente de sécante et pente de tangente. Un autre regard consiste, comme nous l’avons décrit dans notre analyse a priori, à imaginer le parcours d’une droite, tangentiellement à la courbe. On arrive alors à la même solution graphique, laquelle peut être étayée, à ce stade, en coordonnant deux arguments qui peuvent faire écho aux intuitions des élèves et qui ne requièrent qu’une comparaison qualitative de vitesses, outillée graphiquement comme à l’occasion de la première situation, mais portant ici non pas sur l’évolution d’un seul mobile mais bien sur la comparaison de deux mouvements. Le premier argument est le pendant du théorème des valeurs intermédiaires pour la grandeur vitesse : un mobile qui accélère passe par tous les degrés de vitesse. Le second est que le mobile dont le mouvement accéléré est représenté par la courbe de la figure 9 possède, en M , une vitesse inférieure à celle du mobile qui évolue à vitesse constante et, en N , une vitesse supérieure. Au total, il a donc même vitesse que l’autre en un instant situé entre M et N . La première de ces deux intuitions expliquerait qu’aucun élève ne doute de l’existence d’une réponse à la question posée, ainsi que nous l’avons dit plus haut. Quant à la seconde, elle peut s’appuyer sur une certaine relation entre vitesse (instantanée) et pente de la courbe ou pente de la tangente à la courbe. Un élève l’exprime en ces derniers termes tout en dessinant un faisceau de tangentes à la courbe de P1 : « Les particules ont la même vitesse en "A" car, avant ce point, les pentes tracées par les tangentes de cette courbe sont moins grandes que P2 . Au moment "A", la tangente trace une pente parallèle à P2 , donc une pente qui parcourt pour un même laps de temps une même vitesse. Et, après ce moment, les pentes tracées par les tangentes de la courbe sont plus grandes que P2 » (copie de L2, lors de l’expérimentation de 2007 à l’Institut Saint-Joseph à Etterbeek). On remarque bien dans ce propos la comparaison qualitative des vitesses se traduire en termes de comparaison qualitative de pentes, ainsi que la référence à un « avant ce point », un « après ce moment » que sépare, dans le discours, un « au moment ». Il s’agit d’un élève qui recommence son année et qui avait donc déjà reçu un enseignement des dérivées et des tangentes au cours duquel, sans doute, le professeur a parcouru tangentiellement la courbe pour illustrer la croissance d’une fonction. D’autres qui ne sont pas dans ce cas repèrent l’instant correspondant au point de la courbe où la tangente, tracée à vue, est parallèle à la droite modélisant le mouvement de P2 . Ils établissent alors un lien plus abruptement entre égalité de vitesses et égalité de pentes en n’hésitant pas à parler de « graphes parallèles » et de « pente des courbes » : « Quand les deux graphes sont parallèles, les deux particules ont aussi la même vitesse, car la pente des courbes est la même » (copie de T2 pour la situation II.1). - 362/709 - 10.2. D’une approche globale des mouvements à la gestion d’une question locale relative au temps ou encore de « taux d’accroissement de la courbe » à propos de l’instant où le mobile à mouvement accéléré a même vitesse (instantanée) que l’autre : « Puisque la vitesse (moyenne) correspond au rapport entre la différence de position et la différence de temps, c’est-à-dire à la pente de la droite, les vitesses sont identiques lorsque ces rapports sont égaux, c’est-à-dire lorsque le taux d’accroissement de la courbe vaut la pente de la droite. Graphiquement, grâce à la propriété énoncée ci-dessous, c’est lorsque ces deux lignes sont parallèles. Propriété : Lorsque deux droites ont la même pente, elles sont parallèles. Les deux graphes sont parallèles approximativement après 10/12 de temps. » (copie de C4 pour la situation II.1) On voit donc apparaître ici, dans les propos des élèves, les trois variantes de la stratégie des droites parallèles décrites dans l’analyse a priori. Quant à la stratégie de l’écart maximal, nous l’avons très peu rencontrée dans les classes où se sont déroulées nos expérimentations. Contentons-nous de regarder en quels termes un élève l’exprime : « En fait, moi, j’ai écrit que, avant le temps t0 où la vitesse est égale, on voit que la distance grandit entre P2 et P1 ; donc, quand on calcule [mais l’élève ne calcule rien], qu’on fait la différence des distances, c’est de plus en plus grand, P2 est de plus en plus loin ; et, après le temps t0 , ça re-diminue jusqu’au point d’intersection, et puis ça ré-augmente, mais alors c’est P1 qui le dépasse. Donc ça veut dire que, au départ, P2 franchit une plus grande distance que P1 dans le même temps et, après ça, c’est le contraire, donc ça veut dire qu’au temps t0 , c’est égal » (un élève lors d’une pré-expérimentation au collège Saint-Michel en 2005). L’élève parle ici de « la différence des distances, c’est de plus en plus grand [. . . ] ça re-diminue [. . . ] ça ré-augmente » qu’il traduit en termes de mobile de « plus en plus loin de l’autre » puis en termes de dépassement. L’un des deux mobiles évoluant à vitesse constante, il sait par là comment varie la vitesse de l’autre par rapport à celle-là. On observe donc là une étude qualitative non pas des vitesses comme précédemment mais des positions respectives des mobiles, cette étude étant, elle aussi, qualitative et prenant en compte un avant et un après l’instant cherché. Résumons, pour conclure cette section, ce qu’apportent les deux variables didactiques majeures du problème étudié ici : d’une part, la question posée porte sur le temps et non sur la vitesse ; d’autre part, il ne s’agit pas du temps auquel un mobile possède une vitesse donnée mais bien le temps auquel un mouvement uniforme et un mouvement accéléré se déroulent à même vitesse. Les lois de mouvement sont précisées par des graphiques dont le caractère rectiligne ou curviligne indique le type de mouvement auquel on a affaire. Voici, d’une stratégie à l’autre, l’impact potentiel de telles caractéristiques. Tout d’abord, le concept de vitesse moyenne y est, une fois engagé par les élèves, perçu comme inopérant pour traiter un mouvement à vitesse variable. Cette variabilité découle, elle, d’une interprétation du caractère curviligne de la loi de mouvement. Elle peut induire un découpage du temps en intervalles plus petits sur lesquels les vitesses moyennes changent et/ou peut être associée à la variabilité - 363/709 - de la pente de la courbe (ou de celles de ses tangentes). Cette variabilité est contrastée avec ce qui se passe pour le mouvement uniforme modélisé par une droite. Dans un des cas, le décodage graphique pousse à affiner davantage le découpage du temps et, de l’autre, il permet de distinguer deux périodes : celle où l’un des deux mobiles possède une vitesse plus petite que l’autre et celle où c’est le contraire ; l’instant qui les sépare est alors identifié comme celui où les mobiles ont même vitesse. Se jouent donc ici des intuitions liées à des aspects qualitatifs et à la continuité implicite des grandeurs physiques en jeu : temps, vitesse auxquelles il faut prêter la propriété des valeurs intermédiaires pour se convaincre de l’existence de la solution. Ce premier type de continuité se traduit par une continuité graphique des lois de mouvements sur laquelle reposent certaines des stratégies graphiques engagées ici. Cette partie de l’expérimentation illustre donc la possibilité d’épurer l’objet mental de vitesse chez les élèves en les faisant travailler sur des graphiques, ainsi que l’avait déjà montré le travail de Janvier, 1978, à un autre niveau et à partir de dispositifs différents. Elle montre aussi, à l’instar de Bloch (2000), l’importance du milieu graphique dans l’apprentissage des fonctions (cf. section 7.3.1, p. 233). 10.3 D’une question locale à une réponse mobilisant la formulevitesse Comme précisé plus haut, le travail graphique se poursuit par un travail analytique et, dans un premier temps, le mouvement accéléré est traduit par la loi p1 (t) = t2 : il est donc alors uniformément accéléré. Dans notre analyse a priori, nous avons décrit une résolution algébrique possible correspondant à la stratégie des droites parallèles : annuler le discriminant de l’équation du second degré obtenue en résolvant le système formé de l’équation de p1 (t) et de celle d’une droite parallèle à p2 (t). Par ailleurs, la stratégie de l’écart maximal revient tout simplement à chercher le maximum d’une fonction du second degré. Dans les deux cas, les difficultés éprouvées par les élèves pour trouver la solution algébriquement sont très diverses d’une classe à l’autre ; dans certaines même, le professeur doit rappeler la forme de l’équation d’une droite. Mais là n’est pas l’objet principal de notre étude car nous voulons étudier dans quelle mesure une résolution analytique de type infinitésimal pourrait être disponible et ce qu’elle pourrait soulever comme difficultés. Une résolution de ce type est le plus souvent liée à la stratégie des marches d’escalier mais on pourrait imaginer qu’elle traduise une variante de celle des droites parallèles qui consiste à réduire l’intervalle contenant l’instant cherché en considérant des droites parallèles à p2 (t) dont les points d’intersection à p1 (t) sont de plus en plus proches. Nous verrons comment ce travail conduit les élèves à formuler et à mobiliser une fonction-vitesse même si le statut fonctionnel de la formule construite ne sera explicite qu’ultérieurement. 10.3.1 Des limites du travail numérique à l’identification d’un calcul algébrique nouveau et sujet à caution Revenons au groupe 1 dont nous avons rapporté essentiellement les échanges en raison — nous l’avons déjà signalé — de la richesse des échanges enregistrés. Après avoir découpé - 364/709 - 10.3. D’une question locale à une réponse mobilisant la formule-vitesse les deux mouvements en escaliers et tenté de voir sur quel intervalle de temps les vitesses moyennes ou les contremarches respectives étaient plus ou moins les mêmes, ces élèves en arrivent à la conclusion : « C’est très vague, c’est pas très précis » ({2-9’03}). Et cette conclusion est bien légitime vu que les données rendent difficile l’accès à la solution par ce biais, du moins sur un mode graphique. Disposant ensuite des expressions analytiques, ils poursuivent par des calculs numériques traduisant leur objectif affiché de « prendre des intervalles de temps de temps encore plus petits » ({2-11’24}). Ils calculent ainsi les vitesses moyennes sur des intervalles de temps proches de t = 1 : de t = 3/4 à t = 1 et de t = 1 à t = 5/4 dans l’espoir de trouver un intervalle de temps sur lequel les vitesses moyennes sont égales. E1 : Donc là on a toutes les positions ; on cherche les vitesses ; et on compare, en gros. ({3-8’27}) Et, comme ils ne trouvent pas, il poursuivent avec un découpage plus fin encore pour finir par mettre en doute la possibilité d’y arriver : N1 : C’est un peu long, quoi. JY : C’est un peu long. . . C1 : Ce ne sera jamais tout à fait précis. E1 : On n’arrivera jamais. ({3-18’03}) Le passage au registre algébrique est alors envisagé suite à une relance de l’expérimentateur somme toute assez banale : JY : Essayez de vous souvenir. . . Qu’est-ce qu’on cherche ? M1 : Une égalité. . . JY : Une égalité. M1 : On pourrait faire une équation. . . E1 : Oui. On saurait les mettre dans la même équation. ... E1 : Il faudrait faire avec les équations des vitesses. ({3-18’38}) Mais ce passage au registre algébrique suppose, dans le groupe, un certain cheminement E1 : On doit prendre un t bien précis ou bien on met dans l’équation avec un t. . . ? N1 : Non, on doit faire en fonction. . . En général quoi. ({3-19’53}) ... JY : Alors est-ce qu’il faut le faire à un temps t précis, ou il faut prendre à un temps t quelconque. . . ce calcul de ∆p/∆t ... N1 : Il faut, il faut prendre un temps, mais euh, enfin pas numérique. JY : Alors, pourquoi ? Quel est l’intérêt de prendre un temps pas numérique, comme tu dis, c’est-à-dire la lettre t pour garder un temps quelconque ? [. . . ] - 365/709 - 10.3.1. Des limites du travail numérique à l’identification d’un calcul algébrique nouveau et sujet à caution E1 : Parce qu’on ne sait pas quand c’est. JY : Parce qu’on ne sait pas quand c’est. Et donc, quand on ne sait pas quand c’est. . . Qu’est-ce que vous avez voulu résoudre tout à l’heure ? M1 : Une égalité. JY : Une égalité. Une équation, même, tu as dit tout à l’heure, M1. Donc, quand tu as une équation, qu’est-ce que ça sous-entend quand tu as une équation ? N1 et M1 : Des inconnues. JY : Au moins une inconnue. Et quelle est cette inconnue ici ? M1 et N1 : t. ({3-23’12}) Quant à l’écriture algébrique de la vitesse moyenne, elle n’est pas immédiate, les élèves hésitant entre les formules p/t et ∆p/∆t. Le professeur ré-explique ce qui les différencie mais le groupe opte, en définitive, pour une autre écriture où les extrémités de l’intervalle contenant la solution sont notées t1 et t2 : M1 : Tu n’as qu’à dire que t c’est juste entre t1 et t2 . On n’est pas obligé de donner des chiffres. ({3-27’37}) et où la vitesse moyenne s’écrit t22 − t21 ou, sous forme simplifiée, t2 + t1 . t2 − t1 S’ensuivent l’écriture d’une équation à deux inconnues t2 + t1 = malaise qu’elle suscite et l’égalisation de t2 et t1 . √ 3, l’expression du √ M1 : Donc t2 = 3 − t1 . √ E1 : Donc. . . Oui, et t1 = 3 − t2 . M1 : Oui. Et ça nous fait quoi ? E1 : Et ça, et ça. . . Oui, c’est ça, c’est ça le problème : une fois qu’on a ça, on n’a toujours pas l’instant t. ({3-32’56}) ... N1 : Mais il faudrait trouver une autre façon. . . Enfin. . . encore un autre truc où tu as t2 + t1 et alors on saurait obtenir un système. Tu vois ce que je veux dire ? S’il y a deux inconnues, il faudrait trouver une autre manière. . . E1 : Oui, mais qu’est-ce que tu aurais d’autre comme équation à part ça ? ({334’36}) ... N1 : Et si. . . À quel moment. . . On ne devrait pas juste prendre un seul t et dire : c’est une vitesse instantanée ? On pourrait prendre juste un t vu que c’est un seul moment. M1 : Oui, mais, limite, ils sont tellement proches, qu’on peut dire que t1 = t2 . N1 : Oui, c’est ça, en fait. M1 : Oui. ({3-36’27}) - 366/709 - 10.3. D’une question locale à une réponse mobilisant la formule-vitesse La solution est alors très vite trouvée : N1 en déduit que « t est égal à » et M1 complète l’affirmation en disant : « sur 2 ». Ces élèves justifient ensuite leur démarche à l’adresse des autres élèves du groupe et à celle du professeur qui vient s’enquérir de leur progression. M1 : Parce qu’en fait, ils sont tellement proches. . . Tu mets √ t2 égale plus ou moins √ 3 t1 . Et donc, tu n’as qu’à dire : 2t1 = 3. Donc t1 = . 2 ... E1 : Ça paraît bizarre d’égaliser t2 et t1 . ({3-37’08}) ... C1 : C’est un peu fac[ile]. . . Ça ne met pas vraiment en commun les deux équations. ({3-38’49}) ... BM : En fait, vous avez fait. . . Vous avez rendu votre différence de temps. . . E1 [qui coupe BM et continue la phrase de BM] : . . . tellement petite que t2 est égal à t1 . . . N1 : Infiniment petite. E1 : Enfin, presque égal. [M1 parle en même temps que E1 mais dit la même chose]. E1 : Enfin, égal, en fait. BM : Vous l’avez fait explicitement [BM insiste sur ce dernier mot] égal. E1 : Oui, oui. BM : Donc le ∆t. . . E1 : Mais ce n’est pas imprécis, à ce moment-là ? N1 : Ben non : c’est logique. Si tu réduis à fond l’intervalle de temps, ça deviendra égal. ({3-41’45}) Les élèves cherchent l’aval du professeur. BM : Oui, oui. E1 : Donc c’est juste. . . BM : Ah mais, oui, oui, c’est bien. E1 : Ah, c’est cool. ({3-41’11}) D’autres groupes font appel à la stratégie des marches d’escalier en utilisant les notations t et ∆t. Ainsi peut on observer des élèves égaler ce qu’ils appellent la « pente des escaliers » (copies de H2 et M2 pour la situation II.2), pour chacune des particules, pentes respectives qu’ils notent P1 (t) et P2 (t), tout en précisant qu’il s’agit de vitesses moyennes. Mais, bien vite, ils passent aux vitesses instantanées en écrivant √ que les particules « ont la même vitesse instantanée lorsque P1 (t) = P2 (t) ⇔ 2t + ∆t = 3 » (Ibid.), ce qui les engage à mobiliser, sans√aucune justification, le concept de limite : « lim∆t→0 (2t + ∆t) = 2t » et à conclure que 3 t= . 2 - 367/709 - 10.3.1. Des limites du travail numérique à l’identification d’un calcul algébrique nouveau et sujet à caution Ces observations appellent plusieurs commentaires. Tout d’abord, rappelons que l’inconnue est un instant, celui auquel les deux mobiles ont même vitesse. Et que cet instant peut-être encadré de manières diverses que nous avons décrites dans l’analyse a priori. Les élèves filmés ici le font en cherchant à déterminer l’intervalle de temps sur lequel les deux mobiles ont même vitesse moyenne. Ils ne justifient pas explicitement le bien-fondé de leur démarche mais on peut imaginer que l’étude qualitative réalisée précédemment à partir des seuls graphiques de positions en donne la clé telle que formulée, en substance, par d’autres élèves que nous avons pu observer aux prises √ avec des questions analogues. Supposons que le mobile P1 ait une vitesse moyenne égale à 3 entre t1 et t2 . Il ne peut posséder une telle vitesse déjà en t1 sinon, vu √ qu’il accélère constamment, il aurait, sur ce laps de temps, une vitesse sans cesse supérieure à 3 et donc une vitesse moyenne elle-même supérieure. Pour des raisons analogues, on ne peut supposer qu’il atteigne une telle vitesse seulement en t2 . Il l’atteint donc entre t1 et t2 . Cela étant, une investigation numérique ne permet pas de trouver un tel intervalle, si fin soit le découpage, d’autant que la valeur irrationnelle de la vitesse constante du mobile P1 ne facilite pas les choses. Quant à la stratégie même des marches d’escaliers, elle n’offre guère de précision et rend de ce fait l’investigation graphique particulièrement malaisée. L’algébrisation devient alors nécessaire, qu’elle soit de l’initiative des élèves ou obtenue à l’invite d’un professeur souvent demandeur, au nom du contrat classique, d’une forme ou l’autre de généralisation. Ici, l’évolution des élèves est spontanée et ils passent de l’idée « d’égalité » à celle « d’équation ». Mais le mot équation semble polyvalent : E1 parle d’abord de les mettre dans une même équation — et le contexte laisse supposer que les renvoie aux vitesses qui sont égales — et utilise ensuite l’expression « équations de vitesses », ce qui fait plutôt penser à des formules (fonctions-vitesses) qu’elle a normalement déjà rencontrées au cours de physique lors de l’étude de mouvements rectilignes. Un peu plus loin, la même élève hésitera à « prendre un t bien précis » ou à « [mettre] dans l’équation avec un t » ce qui indique qu’elle se situe sans doute difficilement entre l’univers des fonctions et de leurs images, d’une part, et celui des équations comportant des inconnues d’autre part. Le choix de l’inconnue, quant à lui, est problématique. Comme le montre l’échange supra, les élèves sont conscients que équation va de pair avec inconnue et que l’inconnue renvoie ici au temps. Mais leur démarche s’accommode mal d’une seule inconnue. Ils veulent situer l’instant cherché dans un intervalle où les deux mobiles ont même vitesse moyenne tout en voulant réduire cet intervalle au maximum parce qu’ils savent qu’un des deux mobiles change constamment de vitesse. Or, travailler avec la seule lettre t pour représenter le temps et fixer numériquement la durée de cet intervalle n’autorise qu’une approximation. Reste donc à algébriser non seulement le temps mais aussi son incrément, sous forme de ∆t par exemple, ou encore, comme le font les élèves de ce groupe, à représenter les extrémités de l’intervalle par des symboles différents, ici t1 et t2 . Ce choix leur permet de simplifier leur équation sous √ la forme t1 + t2 = 3 mais les accule dans une impasse : comment déterminer deux inconnues à partir d’une seule équation, impasse que l’un d’eux exprime par la nécessité de trouver un système sans savoir quelle nouvelle équation ajouter. C’est de là que naît sans doute l’idée d’assimiler t1 et t2 , soit en évoquant que « On ne devrait pas juste prendre un seul t et dire : c’est une vitesse instantanée [. . . ] », soit en pensant qu’on cherche l’intervalle le plus petit possible : « Oui, mais, limite, ils sont tellement proches qu’on peut dire que t1 = t2 ». On notera, dans ce dernier propos, la présence du mot limite sans qu’on puisse dire s’il est signe d’une quelconque réminiscence chez l’élève du calcul de limites de fonctions ou s’il s’agit d’un - 368/709 - 10.3. D’une question locale à une réponse mobilisant la formule-vitesse des très nombreux usages communs de ce mot qui renvoient à l’idée de borne, à celle d’extrême, ou d’infranchissable, voire d’inconvenant. . . Quoiqu’il en soit, les élèves identifient là un calcul algébrique, nouveau pour eux, lequel consiste à égaler, dans une équation, deux inconnues a priori distinctes. Comme illustré plus haut, d’autres groupes d’élèves ont opté, peut-être en référence aux cours précédents, pour un autre système de notations en désignant l’intervalle de temps sous la forme [t, t + ∆t] 1 . Le calcul nouveau consiste alors à supprimer√∆t dans l’expression de la vitesse moyenne : 2t + ∆t pour finir par résoudre l’équation 2t = 3, calcul que nous avons vu proposer par l’un ou l’autre élève. Dans les deux cas, nous avons affaire à un passage à la limite qui, loin d’une définition formalisée du concept homonyme, prend l’allure d’une procédure de calcul littéral : égaler t1 à t2 ou égaler ∆t à 0 ; procédure que susciteraient, d’une part, l’impossibilité de résoudre une seule équation par rapport à deux inconnues et, d’autre part, la nécessité éprouvée tant physiquement que graphiquement, de travailler sur des intervalles de temps « les plus petits possible ». On retrouve là un déroulement analogue à celui observé à propos du problème du vase conique et, à l’instar de Schneider (1988), on peut souligner le rôle joué ici par le registre algébrique dans l’identification d’un calcul de limite, les seuls tableaux numériques ne permettant rien de tel, même pas de conjecturer une quelconque limite si ce n’est en la devinant par effet de contrat dans des cas choisis délibérément simples par le professeur. Bien sûr, nous avons là une forme embryonnaire du savoir en jeu, la limite étant le résultat de la mise en œuvre d’une technique et non pas un concept donnant prise à la validation de théorèmes plus généraux tels ceux relatifs à l’algèbre des limites. Ce qui est signe qu’on est bien ici dans une praxéologie-modélisation, lequel sera le prélude de la praxéologie-déduction que constitue l’analyse mathématique. Soulignons que c’est encore le point de vue de Lagrange (1797) qui définit la dérivée comme « limite » du f (x + i) − f (x) taux d’accroissement P = , cette limite étant pensée comme le résultat d’un i acte qui consiste à annuler i, la référence à l’action étant particulièrement bien rendue par l’utilisation du verbe faire : « Or, P étant une nouvelle fonction de x et i, on pourra de même en séparer ce qui est indépendant de i et qui, par conséquent, ne s’évanouit pas lorsque i devient nul. Soit donc p ce que devient P lorsqu’on fait i = 0 ». (Op. cité, p. 24) Mais cet acte de passage à la limite est lui-même considéré, par les élèves, comme ayant un caractère suspect : « Ça paraît bizarre d’égaliser t1 et t2 » dit E1. Et d’évoquer alors la nécessité ou du moins l’intérêt de considérer une différence de temps « tellement petite que t1 est égal à t2 . . . » ou « infiniment petite » ou encore d’hésiter entre le « Enfin, presque égal » ou le « Enfin, égal, en fait ». Cette valse-hésitation n’est pas sans rappeler les débats, dans l’histoire des mathématiques, sur le double statut de ce qu’on appelait jadis l’infinitésimal. Rappelons de quoi il s’agit à travers la procédure par laquelle Fermat montre que, de tous les rectangles isopérimétriques, c’est le carré qui a l’aire la plus grande. Nous avons décrit cet exemple à la section 3.5.2. Pour mémoire, il représente le demi-périmètre par un segment de longueur b qu’il partage en deux segments de longueurs respectives a et b − a. Après avoir ajouté à a une quantité e et diminué d’autant b − a, il « adégale » les produits a(b − a) et (a + e)(b − a − e), adégalité qu’il traite ensuite comme une égalité algébrique pour finir par « supprimer » e. En substance : 1. Nous n’analyserons guère ici les raisons qui peuvent pousser les élèves à choisir un système de notations plutôt qu’un autre, si ce n’est, qu’avec les notations t1 et t2 , aucune extrémité de l’intervalle de temps n’est privilégiée par rapport à l’autre et que les deux ont des rôles parfaitement symétriques. - 369/709 - 10.3.1. Des limites du travail numérique à l’identification d’un calcul algébrique nouveau et sujet à caution a(b − a) ∼ (a + e)(b − a − e) be ∼ 2ae + e2 (diviser par e) b ∼ 2a + e (supprimer e) b = 2a. C’est là une première ébauche du calcul de dérivées (cf. la classification faite par Grabiner à la section 3.2, p. 51) bien que, contrairement à ce que fait Lagrange, on n’y voit pas apparaître l’écriture à proprement parler du taux de variation. Cependant, la quantité e bénéficie d’un double statut : non nul puisqu’on divise par e à un moment donné du calcul, puis rendu nul au terme du développement. Dans l’expérimentation liée au vase conique, Schneider (1988, 1992) avait observé des élèves s’étonner explicitement de cette incohérence algébrique. D’une part, lorsqu’on calcule le débit moyen, on divise par ∆t, ce qui laisse supposer que ∆t n’est pas nul puisque « l’on ne peut pas diviser par 0 » et, d’autre part, on supprime ∆t en fin de parcours, sans jeu de compensation algébrique, ce qui rend l’égalité caduque sauf si ∆t égale 0. Les élèves interrogés dans le cadre de l’expérimentation analysée ici n’ont pas vraiment été explicites sur ce point, du moins pas avant que l’expérimentateur n’en ait parlé de lui-même. Mais ils ont cependant soulevé le caractère « bizarre » du calcul fait, à de nombreuses reprises, que ce soit dans l’échange repris plus haut ou après, lorsque p2 (t) sera modélisé par la fonction t3 : « Oui. Mais ça fait bizarre parce qu’il y a deux endroits où il y a des ∆t, et les deux endroits, on les baque, quoi ; donc ça fait un truc bizarre » ({4-32’44}). Et plusieurs ont lié cette audace à une quelconque imprécision de la réponse trouvée : « Mais ce n’est pas imprécis à ce moment-là ? » ({3-41’45}) À propos du vase conique, Schneider (1988, 1992) avait également rendu compte de propos d’élèves liant le caractère approximatif d’une procédure basée sur l’annulation de ∆t à l’impossibilité physique de mesurer avec exactitude un quelconque volume versé en un temps nul et les avait interprétés, comme dit plus haut, par l’obstacle positiviste des mathématiques et donc par un attachement excessif à l’expérience sensible. Rien de si explicite dans les enregistrements effectués lors de notre expérimentation, même si l’on ne peut exclure que de telles raisons soient en toile de fond de certaines des hésitations des élèves. D’autant que, lors de la résolution graphique, certains avaient éprouvé des difficultés à concevoir la vitesse instantanée comme la vitesse que l’on a à chaque moment en ajoutant « sur un petit intervalle quoi ». Il faut aussi préciser que l’expérimentateur avait anticipé les débats possibles, coupant ainsi l’herbe sous les pieds des élèves. Ainsi, lors de l’institutionnalisation faisant suite à la première situation, il avait évoqué de lui-même les radars permettant de détecter les excès de vitesse des voitures en précisant bien qu’un radar ne fait que « mesurer une vitesse moyenne sur un intervalle de temps très petit » et « qu’aucun appareil n’est capable de donner la vitesse instantanée ». À cela s’ajoutent deux différences avec le problème du vase conique. D’une part, les mouvements étudiés ici le sont à travers des fonctions, donc des représentations mathématiques plus construites, sans référence aucune à un dispositif expérimental, plus brut fût-il, de l’ordre de l’expérience mentale, comme dans le cas du vase conique. D’autre part, l’annulation de ∆t correspond à l’intuition graphique, exprimée à plusieurs reprises ici, que la solution peut être située dans un intervalle de temps aussi petit que possible. En revanche, on trouve trace dans nos expérimentations de difficultés dont on peut supposer, d’après l’analyse de Schneider (Ibid.), qu’elles sont à l’origine de celles évoquées cidessus. En particulier, plusieurs marqueurs langagiers montrent le souci des élèves de trouver - 370/709 - 10.3. D’une question locale à une réponse mobilisant la formule-vitesse un sens au traitement fait à ∆t ainsi que le malaise à ne pas en trouver un et font apparaître qu’une certaine notion d’infinitésimal prime, dans leur chef, sur le concept de limite de fonction. Dans l’analyse standard, ce dernier exprime, dans un langage formalisé ou plus proche du langage courant, ce que veut dire : « la limite de la fonction f égale b lorsque la variable x tend vers a » mais ne permet en aucun cas de donner sens, de manière dissociée, ni à l’expression « f (x) tend vers b », ni à l’expression « x tend vers a ». La définition de la limite est en effet contravariante et subordonne ainsi le comportement de ∆t ou celui de ∆p à la progression de leur rapport. Ici, au contraire, les élèves se polarisent, dès la résolution graphique, sur ce fameux ∆t dont il parlent avec hésitation et circonspection comme d’une « différence de temps tellement petite que t1 = t2 (ou ∆t = 0) » ou « infiniment petite » ou un intervalle de temps « qu’on réduit à fond ». Mais vouloir donner un sens à « ∆t tend vers 0 » de manière autonome, dans une perspective covariante de la limite, conduit à une impasse : le temps étant une grandeur continue par excellence, ∆t ne peut « tendre vers 0 » sans le devenir. De même en est-il de ∆p. En rendant nulles ces deux grandeurs avant même de lier leur comportement à celui de leur rapport, comme on le ferait en considérant la limite de la fonction taux d’accroissement, on est acculé à devoir considérer le quotient 0/0 qu’on éprouve beaucoup de peine à interpréter physiquement puisque rien ne se passe en un temps nul. C’est là l’impasse du 0/0, identifiée par les historiens comme un nœud dans le développement du calcul infinitésimal (cf. e.a. Boyer 1949). Cette section a permis de mettre à jour quelques avatars d’une genèse scolaire de la dérivée qu’enclenchent les variables didactiques d’une situation donnée. En l’occurrence, la recherche du moment où deux mobiles ont la même vitesse sur un intervalle où l’un évolue à vitesse constante tandis que l’autre accélère conduit à situer l’inconnue dans des intervalles de plus en plus petits. La difficulté éprouvée à le faire graphiquement ou numériquement pousse à algébriser non seulement le temps mais aussi la durée de l’intervalle. Des considérations physiques (il existe un seul instant où les deux vitesses sont égales) et algébriques (une seule équation ne suffit pas pour déterminer deux inconnues) donnent alors l’idée de rendre nul l’incrément de temps. Il en découle une forme algébrisée de la dérivée (ici 2t à partir de t2 ) qui permet de trouver le temps cherché comme racine d’une équation du premier degré même si cette forme n’a pas encore le statut de fonction comme nous l’analyserons plus loin. Évidemment, cette démarche est collective et suppose, à plusieurs reprises, une aide du professeur ou de l’expérimentateur, en particulier pour exprimer correctement l’image de la somme par une fonction quadratique. Ce calcul est évidemment très lourd en regard de ceux auxquels conduisent respectivement la stratégie des droites parallèles ou celle de l’écart maximum. Qui plus est, il possède un caractère douteux en transgressant les règles habituelles du calcul algébrique selon lesquelles toute simplification appelle un jeu de compensation. Il convient donc non seulement de le valider mais aussi de faire apparaître que son champ d’opérationnalité dépasse le seul problème rencontré ici. C’est l’objet de la section suivante. 10.3.2 Validation pragmatique de ce nouveau calcul et extension de son champ d’application Malgré les réserves avancées par les élèves sur la légitimité du nouveau calcul identifié, aucun n’exprime de doute quant à l’exactitude de la réponse qu’il permet de donner à la - 371/709 - 10.3.2. Validation pragmatique de ce nouveau calcul et extension de son champ d’application question posée. Et pourtant, la suppression d’un terme dans une somme, sans jeu de compensations, induit fortement la conviction de commettre une erreur, fût-elle négligeable, et donc celle d’approcher seulement ce qui est cherché : on peut observer en tout cas, dans l’histoire des mathématiques ainsi que dans des réactions d’élèves (Schneider 1988), que de tels arguments sont avancés — aussi bien que des considérations empiristes — pour dénier à un tel calcul le pouvoir de déterminer exactement une vitesse ou un débit instantanés. Cependant, ne l’oublions pas, il s’agit ici de déterminer un instant, celui où deux mobiles ont même vitesse et, qui plus est, après avoir acquis la conviction que cet instant est unique et l’avoir situé dans un intervalle codé algébriquement sous la forme [t, t + ∆t] (ou [t1 , t2 ]) : il peut dès lors sembler normal de cerner l’instant cherché en « réduisant à fond » cet intervalle par annulation de ∆t ou assimilation de t1 à t2 . Quoiqu’il en soit, la plausibilité du résultat trouvé peut être testée sur le dessin, trois solutions graphiques ayant été institutionnalisées à l’issue du travail précédent. Et c’est bien sur cette base que les élèves mettent à l’épreuve le résultat de leur investigation : M1 : Ça doit faire un virgule. . . Normalement, ça doit être plus petit que 1, parce que. . . C’est censé être plus petit que 1. Oui, ben. . . ({3-37’08}) ... E1 : En même temps, c’est vrai que sur le, sur le graphique, ça paraît logique comme chiffre, ou pas ? M1 : Moi, je dis : c’est bon. C1 : Oui, ça doit être bon. E1 : Ça parait logique, quoi. N1 : Oui. Moi aussi, ça me parait bon. M1 : Voilà. ({3-37’46}) D’autre part, la réponse obtenue par ce calcul est la même que celle fournie par les deux autres stratégies qui non seulement s’appuient sur des intuitions physiques traduites graphiquement mais mobilisent aussi des techniques jouissant d’une certaine crédibilité à ce niveau de la scolarité : exprimer l’unicité de la solution d’un système ou maximiser une fonction du second degré. C’est là une manière pragmatique de valider une nouvelle méthode : on la teste sur sa capacité à produire le même résultat que des méthodes déjà éprouvées. C’est ainsi que Fermat procède pour sa méthode d’adégalité. Comme nous l’avons montré à la section 3.5.2, p. 79, avant d’exploiter sa méthode pour trouver de nouveaux résultats, il la met à l’épreuve pour résoudre deux problèmes qui l’avaient été dès l’Antiquité sans usage aucun d’une quelconque notion d’infinitésimal : l’optimisation de l’aire des rectangles isopérimétriques (rappelée plus haut) — déjà réglée par Euclide sur base d’une preuve exclusivement géométrique — et la détermination de la tangente en un point d’une parabole réalisée par Apollonius de Perge sans aucune considération infinitésimale. Le choix d’une fonction du second degré pour modéliser le mouvement non uniforme est, de ce point de vue, une variable didactique importante, puisque l’existence d’au moins une autre méthode va permettre un contrôle de la réponse fournie par le nouveau calcul, celui qui est, a priori, sujet à caution en raison de l’annulation de ∆t. Ce mode de validation pragmatique est le propre des praxéologies-modélisation : il permet de donner aux techniques elles-mêmes le statut de modèle mathématique — ici, la vitesse instantanée qui sera définie à terme comme le résultat - 372/709 - 10.3. D’une question locale à une réponse mobilisant la formule-vitesse de ce calcul nouveau. Mais il s’agit là d’une démarche étrangère à la culture scolaire, en raison du contrat didactique classique. En effet, toute technique enseignée à l’école est a priori reçue par les élèves comme légitime. Et il est rare qu’un professeur en souligne les aspects éventuellement provocateurs pour en valider le bien-fondé par comparaison avec d’autres méthodes déjà éprouvées. Pour toutes ces raisons, nous nous attendions à ce que cette démarche de validation pragmatique passe relativement inaperçue dans les expérimentations menées par nous. Nous avons toutefois rencontré quelques élèves qui, d’eux- mêmes, y recouraient. Ainsi, ceux qui avaient mobilisé spontanément un calcul de limite : lim∆t→0 (2t + ∆t) = 2t, pour trouver la réponse une deuxième fois après l’avoir déjà obtenue par la stratégie de l’écart maximum commentent ainsi leur résultat : « Les deux réponses sont les mêmes, donc on suppose que le deuxième procédé est correct même s’il est louche » (copie de D2 dans la situation II.2). De même, avons nous observé le soulagement d’autres élèves lorsqu’ils ont vu que leur solution, basée sur une procédure infinitésimale, correspondait à celle trouvée par le biais d’une autre stratégie : « Oh, on gère ! » (E1 à {3-41’01}). Dans d’autres classes, c’est l’expérimentateur qui, sur base de ce qu’il avait entendu dans les groupes, a souligné le caractère scandaleux du nouveau calcul identifié — en le rapprochant de la méthode d’adégalité de Fermat — et a mis en évidence le rôle joué par l’existence d’autres méthodes de résolution. Comme nous l’avons déjà dit, la recherche d’un moment où deux mobiles ont même vitesse n’a pas de caractère fondamental vis-à-vis du savoir visé lorsque le mouvement non uniforme est modélisé par une fonction du second degré, en raison de l’existence d’autres méthodes de résolution qui permettent d’éviter la méthode infinitésimale. Et c’est ce qui nous a amenés à remplacer, dans un second temps, ce mouvement par un autre dont la loi est une fonction du troisième degré. Ce choix permet d’invalider les deux autres stratégies qui demandent alors d’exprimer qu’une équation du troisième degré a une solution unique ou de maximiser un polynôme du troisième degré, ce que les élèves ne savent pas faire à ce stade. Reste le calcul infinitésimal et certains élèves s’y engagent sur demande expresse de l’expérimentateur plus que par conviction, ayant été échaudés par la complication des calculs lors de la recherche précédente : M1 : On aurait dû faire la tangente. Avec la tangente, on aurait été tranquilles. Oui, il [JY] nous a donné une saloperie avec ces escaliers, là. Qui a eu l’idée de ces escaliers là ? E1 : C’est moi [ce qui provoque les sourires de E1 et N1]. ({3-35’12}) Ces élèves optent ici pour les notations t et ∆t, sans doute par référence à l’institutionnalisation faite par l’expérimentateur à la suite du problème précédent. Mais les calculs deviennent encore plus compliqués, celui de la vitesse moyenne supposant cette fois de mobiliser la formule du cube d’une somme et faisant apparaître, après les simplifications algébriques, un terme contenant ∆t et un autre comprenant (∆t)2 . Le contraste n’en n’est que plus impressionnant entre l’expression de la vitesse moyenne et celle de la vitesse instantanée, réduite à 3t2 après annulation de ∆t. C’est ce qu’illustre l’échange suivant : C1 : C’est hyper facile. ... C1 : C’est la même chose que l’autre fois. ({4-29’14}) ... - 373/709 - 10.3.2. Validation pragmatique de ce nouveau calcul et extension de son champ d’application C1 : Oui, ça va : c’est pas si long. ({4-29’47}) ... C1 : Oui, on fait de nouveau "Eh, ∆t = 0 !" E1 : ∆t ne peut pas être égal à zéro. M1 : Tu mets ∆t en évidence. Ça fait 3t2 fois ∆t, plus 3t(∆t)2 . . . E1 : Ah, oui, oui, je vois. ({4-30’33}) ... C1 : Ça me parait un peu facile. ({4-32’44}) ... N1 : Cette méthode, quand on la connaît, elle est aussi rapide, oui, que les autres, je trouve. ({4-41’29}) Les élèves adoptent alors cette méthode au point de ne pas la remettre en cause lorsqu’une vérification, faite sur un graphique faux, contredira le résultat obtenu. Même si, aux yeux de l’un ou l’autre, elle garde un caractère plus que particulier : N1 : Cette méthode [. . . ] est aussi rapide, oui, que les autres. [. . . ] Mais elle est moins clean. ({4-41’29}) On peut supposer là que la validation pragmatique de cette méthode joue un rôle et ce, d’autant plus que la fonction p(t) = t3 se comporte comme la fonction p(t) = t2 du point de vue de la croissance et de la concavité, cette dernière caractéristique étant prégnante, comme nous l’avons vu, dans l’identification d’une accélération du mouvement et de la mise en œuvre de l’une ou l’autre stratégie qui en résulte. Une mise en commun permet enfin au professeur de désigner cette méthode comme la démarche optimale pour répondre à la question posée et les élèves filmés, qui râlaient de devoir suivre la stratégie des marches d’escaliers une nouvelle fois, se réjouissent finalement quand ils voient que leur stratégie est la seule à rester opérationnelle lorsque la loi du mouvement non uniforme est une fonction du troisième degré. Comme analysé dans cette section, le problème des deux mobiles joue à peu de choses près le même rôle que le problème du vase conique dans l’émergence du concept de vitesse instantanée et ce, en raison de variables didactiques analogues. Un mouvement à vitesse variable y est contrasté avec un mouvement uniforme. Une question relative à l’instant auquel les deux mobiles ont même vitesse pousse les élèves à engager et à mettre à l’épreuve le concept de vitesse moyenne pour localiser l’inconnue dans des intervalles de temps de plus en plus petits. L’algébrisation d’une des stratégies graphiques, portant sur le temps t et son incrément ∆t, permet d’identifier un calcul nouveau dans lequel on annule ∆t en fin de parcours. Cette méthode, a priori sujette à caution, est confortée par sa capacité à fournir une réponse dont la plausibilité est validée graphiquement et qui, dans un cas au moins, est celle à laquelle conduisent deux autres méthodes déjà institutionnalisées. Cependant, contrairement au problème du vase conique, celui des deux mobiles repose sur une symbolisation graphique de mouvements rectilignes par le biais des lois de position qui leur correspondent. Il y a donc un milieu à créer en amont dont fait partie un rapport idoine des élèves à de tels objets. - 374/709 - 10.4. La portée des problèmes analysés dans un apprentissage plus global de l’Analyse 10.4 La portée des problèmes analysés dans un apprentissage plus global de l’Analyse Suite aux deux situations qui ont été analysées jusqu’ici, il reste un travail à faire pour justifier la définition du concept de vitesse instantanée en termes de calcul infinitésimal. Ensuite, nous tenterons d’évaluer le saut à réaliser pour passer du concept de vitesse instantanée à celui de taux de variation instantané. 10.4.1 Vers la définition du concept de vitesse instantanée Il s’agit à présent de demander aux élèves, non plus le moment auquel deux mobiles ont même vitesse mais plutôt ce que vaut la vitesse de l’un d’eux à un instant donné. Le mobile en question est celui dont la loi de position est p(t) = t3 et dont la vitesse est 3t2 ; l’instant choisi est t = 1,5. On attend des élèves qu’ils considèrent cette formule comme fonction du temps et qu’ils y remplacent tout simplement t par 1,5 pour obtenir la réponse cherchée. Voici le cheminement de quelques-uns d’entre eux, assez significatif de ce que nous avons pu observer dans l’ensemble des groupes. C1 : Ben, il y a une deuxième question : quelle est la vitesse de P1 à t = 1,5 ? E1 : Ah oui. N1 : Ben on fait (1,5)3 quoi. C1 : Non. 3 3 ... N1 [croyant rectifier correctement] : Euh, 2 C1 : Non, non. . . Parce qu’en fait, on demande la vitesse instantanée à t de P1 . Tu vois ? N1 [découragé] : Ah, non ! C1 : Enfin, là, tu fais 1,5 : tu auras la vitesse moyenne jusque t = 1,5, tu vois ? M1 : Tu fais 1,5. . . Attends. C1 [à M1] : Non ! Parce que, là, ce sera la vitesse moyenne jusqu’à 1,5. Tu dois donner la vitesse instantanée. M1 : Mais comment on calcule ça ? E1 : Attends. Tu ne peux pas juste remplacer 1,5 dans l’équation, avoir la position. . . ? C1 : Non. E1 : . . . et comme ça, tu as le temps, la position et la vitesse ? C1 : Non, parce qu’alors, ce serait la vitesse moyenne jusque t = 1,5. N1 : Ben, attends. On va juste essayer, pour voir. C1 : Ce ne sera pas une vitesse instantanée. ({4-44’40}) M1 a l’idée d’utiliser l’égalité des vitesses moyennes et d’y remplacer t par 1,5. C1 ne voit pas l’intérêt d’utiliser l’égalité puisque la vitesse cherchée ne concerne que la particule P1 . N1 puis E1 comprennent l’intérêt de l’idée de M1 : utiliser l’expression obtenue pour v1 et d’y remplacer t par 1,5. - 375/709 - 10.4.1. Vers la définition du concept de vitesse instantanée M1 : Mais ce n’est pas 1,5 + ∆t machin chouette. . . C’est ça ? E1 : Mais, de toute façon, on obtiendra un chiffre [. . . ] M1 : Mais oui, mais, ici, tu remplaces le 3t2 . . . tu remplaces par. . . Oui, par 1,5. . . 3 Tu vois, par 1,5 au carré − = 0. 4 C1 : Non !. . . M1 : Tu obtiens la vitesse. Euh, oui. . . 3 C1 [continuant sa phrase] : . . . parce que . . . 4 N1 : Ah ! Si, si, si, si. C1 [terminant sa phrase] : . . . on s’en fout, on n’en a plus besoin. M1 [à N1, plus réceptif que C1] : Tu comprends ? E1 : Non ! Parce que, là, tu as égalisé. . . Ah oui ? 3 C1 : En , on n’en a plus besoin. On te demande juste P1 . On ne te demande plus 4 P2 . P2 , on n’en a rien à f. . . E1 : Ah mais, le v1 . . . On a l’équation de v1 : il suffit de remplacer t. N1 : Oui. M1 : Et tu me fais 3 × 1,5 [on n’entend pas au carré]. C1 : Oui mais, quand. . . N1 [coupant C1. N1 voit sur sa feuille la formule qu’il avait encadrée 3t2 + 3t∆t + ∆t2 ] : Mais c’est ça, c’est ça, alors ! E1 : Oui c’est ça. C’est v1 . ({4-45’25}) N1 se rend compte qu’ils ont utilisé la formule qui donne la vitesse moyenne, et non la vitesse instantanée. Mais M1 lui répond immédiatement que « ∆t rapprochant de 0 », ils obtiennent bien la vitesse instantanée. M1 : Et tu remplaces les t ? N1 : Ah non, mais c’est la vitesse. . . M1 [qui rectifie] : ∆t ? N1 [qui termine sa phrase après réflexion] : . . . moyenne. M1 : Mais oui, mais ∆t, ∆t rapprochant de 0, donc c’est 3 fois 1,5 au carré. N1 : Oui, oui, oui, tu as raison. C1 : Oui, ça doit être ça. ({4-45’58}). Comme le montre cet échange, l’adoption d’un point de vue fonctionnel ne va pas de soi pour tous les élèves. Pour le comprendre, il convient de se ramener au problème des √ deux mobiles dont la solution était obtenue par résolution d’une équation : 2t = 3 dans le 3 cas où le mouvement non uniforme était t2 et 3t2 = dans le cas où c’était t3 . Dans ces 4 √ 3 deux équations, 3 ou est la vitesse constante d’un des deux mobiles tandis que l’autre 4 membre est la vitesse variable de l’autre mobile. Mais il est possible de résoudre le problème sans identifier 2t ou 3t2 comme la loi de vitesse du mobile P1 . On peut même arriver à ces équations en égalant non pas des vitesses mais des écarts de position, ce qui n’était pas le cas des élèves filmés ici. En outre, à supposer que les élèves identifient bien 2t ou 3t2 comme la - 376/709 - 10.4. La portée des problèmes analysés dans un apprentissage plus global de l’Analyse vitesse instantanée du mobile concerné, il faut qu’ils changent de point de vue pour regarder cette formule non pas comme un des membres d’une équation mais comme une fonction de t, ce qui ne va pas de soi ainsi que montré par plusieurs chercheurs (e.a. Sierpinska 1992). Toutefois, c’est un retour en arrière qui permet aux élèves d’adopter le bon regard. En effet, c’est en considérant l’égalité des vitesses moyennes des deux mobiles du problème précédent que les élèves réalisent d’abord qu’un seul des deux mobiles est ici concerné et, ensuite, qu’il convient d’y remplacer ∆t par 0. Le problème des deux mobiles reste également une référence pour justifier que, à une loi de position de la forme t3 , correspond une loi de vitesse de la forme 3t2 . Par exemple, on peut affirmer que la vitesse du mobile concerné, en t = 1/2, vaut 3/4 car, en cherchant l’instant où ce mobile a même vitesse qu’un mobile à vitesse uniforme de 3/4 comme dans le problème précédent, on tombe sur 1/2. Et cet argument qui s’appuie sur l’intuition formalisée lors de la situation précédente vaut pour toute valeur de t. Évidemment, cela suppose une référence implicite à la bijectivité de la fonction-vitesse en jeu. Qui plus est, on travaille sur un exemple particulier. Mais, n’est-il pas suffisamment probant pour pouvoir conclure que l’expression de la vitesse instantanée d’un mobile, en un instant t, est obtenue en annulant ∆t de l’expression de sa vitesse moyenne sur [t, t + ∆t], une fois faites les simplifications algébriques ? On est là en mesure de définir, au moyen d’un tel calcul, le concept de vitesse instantanée. Et c’est un tournant au cours duquel on passe du préconstruit vitesse à un concept proprement mathématique et qui est typique, comme nous l’avons dit plus haut, de la transition entre une praxéologie-modélisation et une praxéologie-déduction. Évidemment, le concept en question est encore défini à ce stade par l’acte de suppression de termes, comme chez Lagrange, et du chemin reste à parcourir avant de le subordonner au concept de limite formalisé en termes de quantificateurs et d’inégalités. Mais cette forme embryonnaire de définition peut vivre pendant un certain temps et son application à plusieurs exemples suffira à faire émerger, dans les classes, l’idée de certaines régularités dans les résultats et celle de l’existence d’un calcul plus rapide qui s’apparente à notre calcul des dérivées. 10.4.2 Avantages du nouveau point de vue sur la vitesse Cette première approche du concept de vitesse instantanée lui donne une existence autonome et lui confère certaines propriétés qui heurtent le sens commun. Ainsi, les élèves s’étonneront-ils de devoir accepter qu’une vitesse puisse être négative, si l’on se conforme à la manière de la définir. C’est le moment opportun pour leur faire interpréter une loi de mouvement non monotone et la considération d’un tel graphique permettra de montrer les avantages du nouveau point de vue sur la vitesse : l’unicité d’une définition et du type de calcul la déterminant, que la fonction soit croissante ou décroissante, et une information donnée par le signe de la vitesse sur le sens de parcours du mobile. La même situation donnera également l’occasion de définir l’accélération instantanée comme résultat d’un même type de calcul appliqué à la vitesse et de montrer que le respect de cette définition se solde par des conséquences qui peuvent paraître cocasses, en particulier l’obligation de parler d’accélération positive sur un intervalle où le graphique de la loi de position est décroissant avec une concavité tournée vers le haut alors que l’on a envie, dans ce cas, de parler de décélération, la courbe étant de moins en moins pentue. . . C’est le prix de la mathématisation des grandeurs. - 377/709 - 10.4.3. De la vitesse instantanée au taux de variation instantané 10.4.3 De la vitesse instantanée au taux de variation instantané Une dernière situation retient ici notre attention. Il s’agit de faire évoluer la notion de vitesse instantanée en celle plus large de dérivée. Sans prétendre créer pour cela une situation à caractère adidactique, nous avons proposé aux élèves deux problèmes d’optimisation mobilisant une même fonction mais situés, le premier dans un contexte graphico-cinématique et le second dans un contexte géométrique. Rappelons l’énoncé du premier problème : Considérons un mobile sur une trajectoire rectiligne et dont la loi de mouvement est donnée par la fonction p (t) = 4 t3 − 25t2 + 150t Entre t = 0 et t = 10, à quel(s) instant(s) la distance du mobile à l’origine est maximale ? Que vaut alors sa vitesse ? et celui du second (voir figure 6, p. 335) : On considère à présent une plaque en tôle dont on a retiré les coins selon la figure [6]. En pliant les bords de cette plaque, on obtient une boîte rectangulaire et sans couvercle. Déterminer la valeur de x telle que le volume de la boîte soit maximum. Ce dispositif est dicté par une observation antérieure (Schneider 1988) : aux prises avec ce dernier problème d’optimisation, peu d’élèves ayant reçu un enseignement standard des dérivées lient le maximum du volume au point où la dérivée est nulle et, lorsqu’ils parlent de tangente, c’est pour évoquer une translation de l’axe Ox jusqu’à la hauteur où il frôle le maximum. Nous estimions que le contexte cinématique du premier problème peut aider les élèves à associer l’idée de maximum à l’annulation d’un taux de variation instantané, ici une vitesse. Quant au deuxième problème, il mobilise la même fonction que le premier. Cela peut conduire les élèves à transférer de l’un à l’autre soit la réponse, soit la technique. L’enjeu est d’arriver à faire émerger l’idée que ces deux problèmes font partie de la même classe ; ce qui nous intéresse ici c’est l’intelligibilité que les élèves expriment des résolutions de chacun des problèmes et de ce qu’elles ont en commun. Pour la plupart des élèves, il ne va pas de soi de rapprocher la recherche d’un maximum et l’annulation de la vitesse. Ceux qui en restent aux aspects graphiques ne parviennent qu’à une approximation numérique. L’expérimentateur engage alors les élèves à interpréter le graphique en termes de mouvement : JY : À l’instant qui vous intéresse, il avançait : il se met à reculer [. . . ] Creusez ce que ça veut dire. ({7-27’33}) Cette sollicitation guide l’un ou l’autre d’entre eux vers la solution : - 378/709 - 10.4. La portée des problèmes analysés dans un apprentissage plus global de l’Analyse M1 : Calculer à partir de quand il commence à reculer. N1 : Alors attends : qu’est-ce que ça veut dire. . . Ben qu’il a une vitesse positive. . . M1 : Positive au début. . . N1 : Que la pente est positive et puis négative. . . M1 : Ben il faudrait trouver un moyen de calculer à partir de quand, justement, il recule ; de voir par rapport à la vitesse qui est positive puis négative. ({727’33}) ... M1 : Il faut voir comment on a calculé les vitesses à partir des équations : il y a peut-être moyen de trouver l’équation de la vitesse. Enfin, tu vois, on avait à chaque fois trouvé une équation d’une vitesse. On avait. . . Tu vois, 3t2 . . . 3t2 pour celle-là. ({7-28’56}) ... M1 : Donc, tout simplement plus grand que zéro, il n’y a pas moyen ? On dit tout simplement : quand [. . . ]. Tu vois ? Ou bien, non : vitesse égale à zéro. . . Mais oui : elle augmente. . . Le moment où elle [la vitesse] sera égale à zéro, c’est le moment où elle [la distance] sera plus grande, parce qu’elle [la distance] augmente puis elle descend. N1 : Oui, c’est ça. E1 : Oui, elle sera égale à zéro. C1 : Quand v est égale à 0, oui. N1 : Oui, c’est ça, où la pente est nulle. ({7-30’14}) Lorsque l’expérimentateur revient dans leur groupe, les élèves lui expliquent pourquoi ils ont écrit que la vitesse est nulle lorsque la distance est maximale : E1 : Ici, on sait que la vitesse sera égale à zéro. [. . . ] Parce que c’est. . . Il avance, il s’arrête, et puis il recule. ({7-34’05}) Lorsqu’ils abordent le deuxième problème, les élèves prennent assez vite conscience d’une similitude formelle — voire d’une similitude graphique — entre les deux problèmes mais n’expriment pas forcément d’intelligibilité quant à la parenté de ceux-ci. Voici ce qu’en disent deux d’entre eux : C1 : Je ne comprends pas comment on peut faire la même chose que l’autre fois vu qu’on n’a pas la vitesse, on n’a pas de vitesse. ({7-49’47}) ... M1 : Il faut trouver une excuse pour avoir la vitesse. ({7-51’44}) En revanche, quelques secondes plus tard, le même élève construit une procédure similaire à celle employée pour résoudre le premier problème en envisageant de faire jouer à x et ∆x le même rôle qu’à t et ∆t précédemment : - 379/709 - 10.4.3. De la vitesse instantanée au taux de variation instantané M1 : Mais, au lieu de dire. . . On ferait mieux de dire x+∆x. [. . . ] Mais oui mais la vitesse [. . . ] On peut utiliser qu’on avait t + ∆t avant, pour trouver un moment et un moment juste après. Mais là, on peut utiliser la même chose pour dire un volume précis et un volume après. Donc, x + ∆x, enfin, je ne sais pas. . . . ({7-52’47}) Enfin, un élève observe l’intérêt d’avoir proposé les deux problèmes dans cet ordre : E1 : Si on avait commencé par ça [le problème du volume], ça aurait été plus compliqué, disons. Parce que, si on commençait par ça, on ne pouvait pas égaliser cette équation [avec la vitesse instantanée], dire qu’elle était nulle. Donc on n’arrivait pas à trouver cette réponse-là. ({7-53’54}) Rappelons l’enjeu majeur de ces deux problèmes : instituer la classe des problèmes d’optimisation à partir de deux d’entre eux, le premier se situant dans un contexte graphicocinématique, le second faisant partie du cadre géométrique. Comme observé, il ne va pas de soi qu’un problème de distance maximale peut se penser en termes de vitesse nulle. Les élèves s’en tiennent d’abord à des aspects graphiques jusqu’au moment où l’expérimentateur commente le mouvement rectiligne représenté par ce graphique en parlant d’un mobile qui « avance » ou « recule ». C’est là un langage qui situe l’expérience dans un univers encore peu épuré : on aurait pu, en faisant référence à un mobile ponctuel qui n’a ni avant ni arrière, parler d’un mouvement dans le sens positif ou négatif sur la trajectoire orientée. Mais c’est un discours qui fait mouche puisque les élèves s’en emparent pour l’interpréter en termes de vitesse positive ou négative, ou encore de pente positive ou négative, conformément à ce qui a été enseigné auparavant. Et c’est ce qui permet à l’un d’eux de convoquer un type de calcul déjà pratiqué dans des situations antérieures et qu’il appelle « l’équation de la vitesse ». Toutefois, il faut remarquer que penser à annuler cette vitesse ne lui vient pas directement à l’esprit car il semble envisager tout d’abord de résoudre une inéquation : « tout simplement plus grand que 0 ». Par contre, une fois exprimée (par un autre élève) cette idée d’annulation, tous les élèves s’en emparent ; l’un d’eux l’interprète en termes d’annulation de la pente et un autre la justifie en revenant au mobile qui « s’arrête » entre le moment où il « avance » et celui où il « recule ». On voit ici s’entremêler plusieurs jeux de langage, le discours portant dialectiquement sur le mouvement d’un mobile dans un langage proche du quotidien, sur des savoirs physiques déjà construits comme le signe de la vitesse ou son annulation, sur des connaissances graphiques ou symboliques qui les traduisent : la pente, une inéquation ou une équation. On peut donc conclure que l’univers graphico-cinématique dans lequel les élèves ont été plongés antérieurement a pu constituer, pour ce groupe d’élèves au moins, un univers cognitif permettant une certaine dialectique avec un système d’écritures symboliques. Comme on l’a dit plus haut, le deuxième problème est, d’un point de vue formel, équivalent en tout point au premier : même fonction mobilisée, même résolution via un calcul de dérivée et son annulation. Ce pourrait être suffisant pour que les élèves copient la réponse de l’un à l’autre. Ils n’en font rien, même si l’un d’eux est conscient que c’est à dessein que le professeur leur propose les problèmes dans cet ordre. Au delà de l’unité fonctionnelle, il faut ici comprendre qu’une même technique permet de les résoudre tous deux. La difficulté est qu’il faut penser alors à une sorte de pendant de la vitesse dans le deuxième problème, sans pouvoir encore parler de dérivée. Il convient de souligner que le mot même de dérivée est - 380/709 - 10.5. Conclusion de l’analyse a posteriori : de situations fondamentales au discours technologique propre aux praxéologies-modélisation significatif d’un autre niveau d’appréhension de ces divers problèmes et atteste que l’on est conscient de les résoudre en cherchant une nouvelle fonction, dérivée d’une autre au moyen des règles de dérivation. Mais les élèves concernés n’ont pas encore appris de calcul de dérivées et cherchent, comme l’un d’eux l’exprime, « une excuse pour avoir la vitesse ». A défaut de pouvoir s’appeler dérivée, l’équivalent de la vitesse dans le problème de la boîte aurait pu être ce que certains nomment le taux instantané de variation. En effet, le taux est un rapport tout comme la vitesse ; comme celle-ci, il mobilise une variation : ici variation d’un volume au lieu d’une variation de position ; le qualificatif instantané, par contre, peut paraître incongru dans le problème du volume étant donné que, contrairement au problème de la vitesse, la variable indépendante n’est plus le temps. Et pourtant, comme Schneider (1988) l’a observé, les élèves qui parviennent à injecter une idée de variation là où elle ne va pas de soi a priori le font souvent en référence au temps de déroulement de la pensée. Il est symptomatique, de ce point de vue, de voir comment l’élève M1 subodore l’intérêt de remplacer t + ∆t par x + ∆x en faisant le parallèle entre, d’une part, « un moment et un moment juste après » et, d’autre part, « un volume précis et un volume après » : c’est bien x + ∆x qu’il note mais c’est « après » qu’il dit. On peut donc penser, au niveau du type de calculs considérés à ce stade (qui consistent, rappelons-le, à supprimer des termes contenant ∆x dans un taux moyen ∆y/∆x), que la locution taux de variation instantané facilite la prise de conscience des liens entre les deux problèmes étudiés ici. Même si elle peut favoriser une confusion chez les élèves, entre variation temporelle et variation en fonction d’une variable indépendante quelconque, confusion qui nécessitera de la part du professeur un discours d’explicitation sur la signification du remplacement de t en x. On trouve, dans cet épisode didactique encore, tout l’intérêt d’un jeu de langage approprié pour faire vivre un système de notations donnant prise à une technique nouvelle. 10.5 Conclusion de l’analyse a posteriori : de situations fondamentales au discours technologique propre aux praxéologies-modélisation 10.5.1 Des situations à caractère fondamental À travers cette recherche, nous avons voulu montrer en quoi des lois de mouvements rectilignes pouvaient faire milieu pour un apprentissage des dérivées, certains aspects de ce milieu étant alliés et d’autres antagonistes. Dans un premier temps, des lois de mouvement, données graphiquement, autorisent une analyse qualitative et globale des mouvements en termes d’accélération ou de constance de la vitesse ; elles favorisent aussi une forme en acte du théorème des accroissements finis dans un contexte particulier : si, sur un intervalle de temps donné, un mobile qui accélère a même vitesse moyenne qu’un mobile animé d’un mouvement uniforme, ils auront tous deux même vitesse (instantanée) en un instant précis de cet intervalle. Dans un second temps, la recherche de cet instant à partir des expressions analytiques des lois de mouvement provoque la mise à l’épreuve du concept de vitesse moyenne et l’identification d’un nouveau calcul où l’on annule ∆t dans l’expression de cette dernière, après l’avoir simplifiée. Ce calcul conduit à la formule de la vitesse instantanée du mouvement non uniforme, d’abord impliquée dans une équation dont l’inconnue est le temps, puis mobilisée comme fonction qui donne, à tout instant, la vitesse du mobile. C’est donc la fonction - 381/709 - 10.5.2. Un discours technologique incontournable qui s’écarte des standards dérivée qui est en jeu, le nombre dérivé n’en étant qu’un sous-produit, soit une de ses images en une valeur particulière de t. Sa légitimité comme modèle mathématique de la vitesse — légitimité qui ne va pas de soi a priori, l’annulation de ∆t étant sujet à débat — vient, dans ce parcours, non seulement de son instrumentalité dans la résolution de questions qui relèvent de l’instantané mais aussi d’une validation pragmatique, le résultat de la nouvelle technique étant mise à l’épreuve d’autres méthodes. Enfin, le concept de taux instantané de variation permet d’élargir celui de vitesse instantanée, dans un contexte de problèmes d’optimisation, mais cette extension suppose un discours approprié où la référence au temps, utile de prime abord, se doit d’être présentée comme un artifice mental momentané. Le parallèle fait avec le problème déjà ancien du vase conique (Schneider 1988) a permis non seulement de comprendre la spécificité des situations où les mouvements sont symbolisés par des graphiques et des formules mais encore il a mis en évidence des variables didactiques majeures communes aux deux approches et crédibilisé l’analyse relative à leur rôle : en particulier l’existence d’un mouvement dans un contexte où il apparaît non uniforme d’entrée de jeu et où il est contrasté avec un mouvement uniforme ; le choix du temps comme inconnue pour provoquer l’émergence d’une procédure infinitésimale ; la possibilité d’une validation pragmatique de celle-ci. Bien sûr, il s’agit d’une toute première approche des dérivées et, qui plus est, ce n’en est qu’une parmi d’autres, les raisons d’être des fonctions dérivées étant multiples. Cependant, comme nous l’avons analysé dans (Gantois & Schneider 2009), il est des applications plus porteuses que d’autres pour servir d’amorce à ce savoir mathématique. Ainsi, si l’on peut penser que la vitesse est un objet mental préfigurant le concept de dérivée — comme cela a été le cas chez Newton dans l’histoire des mathématiques —, chez les élèves interrogés dans le cadre de nos expérimentations, il y a tout lieu de penser que, a contrario, l’émergence du concept de coût marginal en économie succédera à un travail préalable sur les taux de variation et leur interprétation graphique plutôt qu’elle ne le précédera. Quant à l’approche classique des dérivées que l’on introduit comme pentes de tangentes, elle souffre d’inconvénients multiples : une circularité entre tangente et pente dont on sait plus trop qui est l’objet premier ou l’objet second ; une perception fallacieuse de la limite liée à l’obstacle empiriste qui présente la tangente comme limite de sécantes en un sens non défini ; et, souvent, une entrée en matière par les nombres dérivés, peu propre à faire sentir d’entrée de jeu l’instrumentalité du nouveau savoir mathématique. Quoiqu’il en soit, le propre du calcul des dérivées est de fédérer, autour d’une seule et même technique, des types de tâches diversifiés qui en constituent autant de raisons d’être : vitesses, optimisation, tangentes, approximations numériques et autres applications. Aussi pensons-nous, à l’instar du groupe AHA (1999a), qu’il faut faire travailler tous les types de tâches concernés pour leur portée spécifique eu égard au savoir à construire. Il s’agit globalement de considérer la variété épistémologique sous-jacente au calcul de dérivées pour en faire mieux apparaître progressivement son caractère unificateur. Mais la portée de notre recherche est plus générale et nous y venons. 10.5.2 Un discours technologique incontournable qui s’écarte des standards On voit dans l’expérimentation s’entremêler plusieurs jeux de langage, le discours portant dialectiquement sur le mouvement d’un mobile dans un langage proche du quotidien, - 382/709 - 10.5. Conclusion de l’analyse a posteriori : de situations fondamentales au discours technologique propre aux praxéologies-modélisation sur des savoirs physiques construits ou préconstruits comme la vitesse moyenne ou la vitesse instantanée, sur certaines connaissances graphiques ou symboliques qui leur sont associées : la pente, une inéquation ou une équation. En outre, l’univers graphico-cinématique dans lequel les élèves ont été plongés a pu constituer, pour eux, un univers cognitif permettant une certaine dialectique avec un système d’écritures symboliques. Au delà de l’identification des moments adidactiques possibles, l’analyse faite ici montre donc que les lois de mouvements peuvent constituer les objets d’un milieu pour l’apprentissage de la dérivée dans la mesure où des jeux de langage appropriés permettent aux élèves de s’emparer de ces objets, que ces jeux soient partagés par les élèves seuls ou engagés par l’enseignant pour les aider à désigner les objets du milieu. Peu nous importe de classifier ces jeux langagiers comme on le fait dans certaines recherches à orientation plus cognitiviste. L’important pour nous est de souligner leur caractère peu standardisé, typique des praxéologies-modélisation. Ainsi, les élèves utilisent des expressions telles que « droite de même vitesse », « pente d’une courbe », « graphes parallèles » pour désigner une droite et une courbe qui ont même pente en une même abscisse. . . Ils parlent aussi de « réduire à fond » l’intervalle de temps ou encore utilisent le mot « après » alors que le temps est hors contexte. Il n’empêche que ces jeux de langage s’accompagnent d’actions sur des notations qui en rendent compte, telles que l’annulation de ∆t dans l’expression d’un taux de variation ou le remplacement de ∆t par ∆x dans un tel calcul. S’instaure ainsi une dialectique entre notions et notations, au sens où l’entend Mercier (2008) qui débouche sur l’identification d’une nouvelle technique et sur la formulation d’un discours qui la justifie et la rend intelligible eu égard aux questions posées, en bref un discours technologique au sens de Chevallard (1999). En l’occurrence, ce discours technologique n’est pas, ni en tout ni en partie, un discours théorique au sens entendu dans l’institution des mathématiciens. Il repose en effet sur des arguments hybrides mêlant connotations cinématiques et graphiques, la vitesse et son expression graphique y portant des jeux de langage plus primitifs que ceux qu’autorise le concept de dérivée. Ainsi, l’accélération est interprétée en termes de concavité d’une courbe, la vitesse augmentant avec la pente, et la détermination d’un instant auquel deux mobiles ont même vitesse s’appuie sur l’égalité des pentes de deux courbes en un point. . . Qui plus est, une validation pragmatique a cours ici. Ainsi, la nouvelle procédure infinitésimale acquiert une légitimité dans la mesure où elle fournit le même résultat que d’autres méthodes ; de plus, si la vitesse d’un mobile qui accélère vaut v1 au temps t1 , c’est parce que t1 est précisément l’instant auquel ce mobile a même vitesse qu’un mobile de vitesse uniforme égale à v1 . Un tel discours n’a pas droit de cité au sein de l’analyse mathématique. Et pour cause ! Dans l’analyse standard qui est une praxéologie-déduction, la vitesse instantanée est définie par le biais du concept de limite. Il n’y a donc plus lieu de se demander si une telle vitesse peut-être déterminée exactement par un calcul de limite. Quant au concept de limite lui-même, il est un proof generated concept au sens de Lakatos (1984), construit pour donner prise à un système de preuves que l’on voulait précisément épurées de toute intuition géométrique ou cinématique. Il permet ainsi de constituer l’analyse comme discipline autonome par rapport à la géométrie et à la physique et de structurer un discours déductif dans lequel les problèmes géométriques et physiques à l’origine du calcul infinitésimal sont relégués dans une ultime section en tant qu’applications de la théorie. C’est là un exemple de ce que Chevallard (1999) nomme « une déconnexion franche du cœur théorico-technologique de l’œuvre d’avec ses applications ». Mais aussi un exemple de ce que Freudenthal (1973) appelle une « inversion didactique », soit un exposé à contre-courant de l’histoire. En fait, le parcours didactique décrit ici restaure une - 383/709 - 10.5.2. Un discours technologique incontournable qui s’écarte des standards forme d’historicité des notions enseignées en prenant une des applications de l’analyse comme raison d’être du savoir enseigné et en proposant une validation des stratégies engagées qui ne s’appuie pas sur la théorie mathématique achevée 2 . Le travail réalisé rentre donc bien dans le cadre des praxéologies-modélisation ; en même temps, il fait la part belle au discours heuristique tel que précisé par Schneider (2011) et justifie par là le besoin de parler de discours technologique sans devoir l’assimiler à un discours théorique, fût-il local. C’est que, en fonction du basculement décrit plus haut entre la phase de modélisation et celle de mise en ordre déductif, l’organisation mathématique analysée ici ne constitue pas une réplique d’extraits de celle construite à des fins de théorisation déductive. En cela et comme le montrent les travaux de Rouy (2007), elle rompt radicalement avec la transposition didactique en usage dans l’enseignement secondaire, où prédominent des praxéologies à trous qui imitent le discours théorique dont elles empruntent des éléments emblématiques tout en gommant les aspects jugés inaccessibles pour les élèves concernés. On peut en conclure la fragilité écologique du dispositif didactique analysé ici mais on peut aussi questionner la difficulté éprouvée tant par les chercheurs que par les enseignants à identifier de potentielles praxéologies-modélisation en raison, sans doute, d’un sentiment de naturalité vis-à-vis des approches inspirées du bourbakisme. Sans doute cette difficulté participe-t-elle du monumentalisme dénoncé par Chevallard (2012) dans l’enseignement des mathématiques : « Hier, je dénonçais le monumentalisme triomphant, dans lequel l’enseignement devient une suite de visites de monuments dont souvent on ignore les raisons d’être, alors que l’école devrait les enseigner ! » (Op. cité, p. 2) 2. La référence importante faite ici au travail de Fermat ne doit pas escamoter l’intérêt de poursuivre ce parcours à la manière des analystes du XVIIIe siècle avant d’en arriver au concept de limite de Cauchy. - 384/709 - Cinquième partie Conclusion et perspectives 385 La conclusion d'une version électronique d'une thèse étant ce qui est le plus souvent lu, celle-ci reprend, au prix de redites, le préprint d'un article publié dans Recherches en Didactique des Mathématiques (2012) qui donne une vue synthétique et conclusive de cette recherche. En revanche, les annexes ne sont pas disponibles dans la version électronique de cette thèse. Bibliographie ACADÉMIE DE BORDEAUX : Meilleure approximation affine. Non daté mais lu en 2012 hURL: http://mathematiques.ac-bordeaux.fr/profplus/docmaths/ anabases/4_der/best_approx_aff.pdfi. ADAM, Arthur et LOUSBERG Francis : Espace Math 56. De Boeck, Bruxelles, 1999. AHA, Groupe (BOLLY Pierre, CHEVALER Anne, CITTA Micheline, KRYSINSKA Mariza, ROUCHE Nicolas et SCHNEIDER Maggy) : Vers l’infini pas à pas. Approche heuristique de l’analyse. Manuel pour l’élève. De Boeck, Bruxelles, 1999. AHA, Groupe (BOLLY Pierre, CHEVALER Anne, CITTA Micheline, KRYSINSKA Mariza, ROUCHE Nicolas et SCHNEIDER Maggy) : Vers l’infini pas à pas. Approche heuristique de l’analyse. Guide méthodologique. De Boeck, Bruxelles, 1999a. APOLLONIUS DE PERGE : Les coniques d’Apollonius de Perge. Desclée, De Brower, Bruges, 1923, trad. P. Ver Eecke. ARTIGUE, Michèle : "Ingénierie didactique". Recherches en Didactique des Mathématiques, La Pensée Sauvage, Grenoble, vol. 9(3), 1988, 281–308. ARTIGUE, Michèle : "Epistémologie et didactique". Recherches en Didactique des Mathématiques, La Pensée Sauvage, Grenoble, vol. 10(2-3), 1991, 241–286. ARTIGUE, Michèle : "Un regard didactique sur l’utilisation des outils de calcul formel dans l’enseignement des mathématiques". Repères IREM, Éditions Topiques, Metz, no 19, 1995, 77–108. ASSUDE, Teresa, MERCIER Alain et SENSEVY Gérard : "L’action didactique du professeur dans la dynamique des milieux." Recherches en Didactique des Mathématiques, La Pensée Sauvage, Grenoble, vol. 27(2), 2007, 221–252. BACHELARD, Gaston : La formation de l’esprit scientifique. J. Vrin, Paris, 1980. BARROW, Isaac : Lectiones geometricae : in quibus (praesertim) generalia curvarum linearum symptomata declarantur. Typis Gulielmi Godbid, & prostant venales apud Johannem Dunmore, Londres, 1670. BELL, Eric Temple : Les grands mathématiciens. Payot, Paris, 1939. BERKELEY, George : "The Analyst". dans The works of G. Berkeley. Volume 4, Nelson, Londres (1951), 1734. BERTHELOT, R. et SALIN M.-H. : L’enseignement de l’espace et de la géométrie dans la scolarité obligatoire. Thèse de doctorat, Université de Bordeaux I, 1992. 395 Bibliographie BLOCH, Isabelle : L’enseignement de l’analyse à la charnière lycée/université. Savoirs, connaissances et conditions relatives à la validation. Thèse de doctorat, Université de Bordeaux I, 2000. BOLZANO, Bernhard : Rein analytischer Beweis des Lehrsatzes dass zwischen je zwey Werthen, die ein entgegengesetztes Resultat gewaehren, wenigstens eine reele Wurzel der Gleichung liege. Gottlieb Haase, Prague, 1817. BOSCH, Marianna et CHEVALLARD Yves : "Ostensifs et sensibilité aux ostensifs dans l’activité mathématique". Recherches en Didactique des Mathématiques, La Pensée Sauvage, Grenoble, vol. 19(1), 1999, 77–124. BOYER, Carl B. : The History of the Calculus and its Conceptual Development. Dover Publications, New York, 1949. BROUSSEAU, Guy : "Les obstacles épistémologiques et les problèmes en mathématiques". dans Vanhamme Willy et Vanhamme Jacqueline (éd.): La problématique et l’enseignement des mathématiques. Comptes rendus de la XXVIIIe rencontre organisée par la Commission Internationale pour l’Étude et l’Amélioration de l’Enseignement des Mathématiques. 1976, 101–117. BROUSSEAU, Guy : "Les obstacles épistémologiques et les problèmes en mathématique". Recherches en Didactique des Mathématiques, La Pensée Sauvage, Grenoble, vol. 4(2), 1983, 165–198. BROUSSEAU, Guy : "La relation didactique : le milieu". dans Actes de la IVe École d’Été de didactique des mathématiques. IREM Paris 7, 1986, 54–68. BROUSSEAU, Guy : "Les obstacles épistémologiques et la didactique des mathématiques". dans Colloque International : Construction des savoirs - Obstacles et conflits. Montréal, 1988. BROUSSEAU, Guy : "Le contrat didactique : le milieu". Recherches en Didactique des Mathématiques, La Pensée Sauvage, Grenoble, vol. 9(3), 1988a, 309–336. BROUSSEAU, Guy : La théorie des situations didactiques. La Pensée Sauvage, Grenoble, 1998. BROUSSEAU, Guy : Glossaire de quelques concepts de la théorie des situations didactiques en mathématiques. 1998a, Version 5 du 28/09/2010 hURL: http://guy-brousseau. com/biographie/glossaires/i. BUEKENHOUT, Francis : Chap. La spirale des dérivées. dans"L’enseignement de la dérivée aux débutants". Academia - Erasme, Louvain-la-Neuve, 1992. CALINGER, Ronald : A Contextual History of Mathematics. Prentice Hall, Upper Saddle River, 1999. CARDINET, Jean et SCHMUTZ Madeleine : L’évaluation des recherches en pédagogie. I.R.D.P., Neuchâtel, 1975. CASTELA, Corinne : "Apprendre avec et contre ses connaissances antérieures". Recherches en Didactique des Mathématiques, La Pensée Sauvage, Grenoble, vol. 15(1), 1995, 7–48. CAUCHY, Augustin-Louis : Cours d’analyse de l’École Royale Polytechnique. Paris, 1821. CAVALIERI, Bonaventura : Géométrie par les Indivisibles. 1635. CHARLOT, Bernard : "Les contenus non mathématiques dans l’enseignement des mathématiques". Cahiers Galilée, Louvain-la-Neuve, no 42, 1978, 5–9. - 396/709 - Bibliographie CHAUVAT, Gérard : Étude didactique pour la réalisation et l’utilisation d’un logiciel de représentations graphiques cartésiennes des relations binaires entre réels dans l’enseignement des mathématiques des DUT industriels. Thèse de doctorat, Université d’Orléans, 1997. CHEVALLARD, Yves : "Sur l’ingénierie didactique". dans IIe École d’Été de Didactique des mathématiques. Olivet. 5-17 juillet 1982. 1982. CHEVALLARD, Yves : La transposition didactique. 2e édition. La Pensée Sauvage, Grenoble, 1991. CHEVALLARD, Yves : "Concepts fondamentaux de la didactique : perspectives apportées par une approche anthropologique". Recherches en didactique des mathématiques, La Pensée sauvage, Grenoble, vol. 12(1), 1992, 73–112. CHEVALLARD, Yves : "L’analyse des pratiques enseignantes en théorie anthropologique du didactique." Recherches en Didactique des Mathématiques, La Pensée Sauvage, Grenoble, vol. 19(2), 1999, 221–266. CHEVALLARD, Yves : "Sur le rapport aux mathématiques". Journal du séminaire TAD/IDD 2012. CHILOV, G. : "Analyse mathématique dans la classe des fonctions rationnelles". dans Initiation aux mathématiques, Editions MIR, Moscou, 1974. COLLINGWOOD, James : Rigor in Analysis : From Newton to Cauchy. Williamsburg, 2005 hURL: http://www.homsigmaa.org/oldwinners.htmli. CORNU, Bernard : Apprentissage de la notion de limite : conceptions et obstacles. Thèse de doctorat, Université de Grenoble, 1983. DELFELD, Hélène, PASQUASY Fabienne, t’KINDT-DEMULDER Ingrid, TIMMERMANS Marie-Monique : Actimath 5. Mathématiques générales. Analyse. Van In, Wavre–Wommelgem, 2003. DHOMBRES, Jean : Nombre, mesure et continu. Nathan, Paris, 1978. DHOMBRES, Jean : "La rigueur mathématique. Euler et le XVIIIe siècle". dans Actes de l’université d’été sur l’histoire des mathématiques. Toulouse. 6-12 juillet 1986. IREM de Toulouse, 1986, 166–243. DHOMBRES, Jean, DAHAN-DALMEDICO Amy, BKOUCHE Rudolf, HOUZEL Christian et GUILLENOT Michel : Mathématiques au fil des âges. Gautier-Villars, Bordas, Paris, 1987. DORIER, Jean-Luc : Recherche en Histoire et en Didactique des Mathématiques sur l’Algèbre linéaire – Perspectives théorique sur leurs interactions. Grenoble: Les cahiers du laboratoire Leibniz no 12, 2000. EULER, Leonhard : Introduction à l’analyse des infinis. Lausanne, 1748. FERMAT, Pierre de : Methodus ad Disquirendam Maximam et Minimam. manuscrit reçu par Mersenne, 1638. FREGONA, Dilma : Les figures planes comme "milieu" dans l’enseignement de la géométrie : interactions, contrats et transpositions didactiques. Thèse de doctorat, Université de Bordeaux I, diffusion LADIST, 1995. FREUDENTHAL, Hans : Mathematics as an educational task. D. Reidel, Dordrecht, 1973. - 397/709 - Bibliographie GALILÉE, Galileo : Discours et démonstrations mathématiques concernant deux sciences nouvelles. Traduction par M. Clavelin, Armand Colin, Paris, 1970. GANTOIS, Jean-Yves et SCHNEIDER Maggy : "Introduire les dérivées par les vitesses. Pour qui ? Pourquoi ? Comment ?" Petit X, IREM de Grenoble, Grenoble, no 79, 2009, 5–21. GRABINER, Judith V. : "Is Mathematical Truth Time-Dependent ?" The American Mathematical Monthly, Washington, D.C. vol. 81/4, 1974, 354–365. GRABINER, Judith V. : The origins of Cauchy’s rigorous calculus. MIT Press, Cambridge, Mass., 1981. GRABINER, Judith V. : "The changing concept of change : the derivation from Fermat to Weierstrass". Mathematics Magazine, Washington, D.C. vol. 56, 1983, 195–206. GRABINER, Judith V. : "Who Gave You The Epsilon ? Cauchy and the Origins of Rigorous Calculus." The American Mathematical Monthly, Washington, D.C. vol. 91, 1983a, 185– 194. GUILLAUD, Jean-Claude : Enseigner le concept de force en classe de troisième. APISP, Académie de Grenoble, 2000 hURL: www.ac-grenoble.fr/apisp/actu/didac.htmli. HAUTE ÉCOLE PÉDAGOGIQUE DU VALAIS : Lexique des termes clefs. 2010 hURL: http: //www.kleio.ch/HEP_VS/hepvsvideo/6_LEXIQUE_DIDACTIQUE_10.pdfi. HOUART, Mireille et SCHMETZ Roland : Rapport final du projet interfacultaire « Explicitation des prérequis et mesure de leur maîtrise en première année du grade de Bachelier ». FUNDP, Namur, Belgique, Octobre 2006. HOUZEL, Christian, OVAERT Jean-Louis, RAYMOND Pierre et SANSUC JeanJacques : Philosophie et calcul de l’infini. Maspero, Paris, 1976. IREM DE BASSE-NORMANDIE : Aux origines du calcul infinitésimal. Ellipses, Paris, 1999. IREM DE LYON, HEMILY (Groupe d’Histoire et de l’Epistémologie des Mathématiques de l’IREM de Lyon) : Textes fondateurs du calcul infinitésimal. Ellipses, Paris, 2006. JOHSUA, Samuel et DUPIN Jean-Jacques : Introduction à la didactique des sciences et des mathématiques. Presses Universitaires de France, Paris, 1993. KITCHER, Philip : "Mathematical Rigor - Who needs it ?" Noûs, Detroit, Michigan, vol. 15/4, 1981, 469–493. KLEINER, Israel : "Rigor and Proof in Mathematics : A Historical Perspective". Mathematics Magazine, vol. 64 (5), 1991, 291–314. KRYSINSKA, Mariza et SCHNEIDER Maggy : "Exploitation du concept de milieu pour analyser un enseignement relatif aux fonctions exponentielles et logarithmes". dans Actes de la XIe École d’Été de Didactique des mathématiques à Corps (Isère), La Pensée Sauvage, Grenoble. 2001. LABORDE, C. et CAPPONI B. : "Cabri-géomètre constituant d’un milieu pour l’apprentissage de la notion de figure géométrique". Recherches en Didactique des Mathématiques, La Pensée Sauvage, Grenoble, vol. 14(1/2), 1994, 165–209. LACASTA, Eduardo : Les graphiques cartésiens de fonctions dans l’enseignement secondaire des mathématiques : illusions et contrôles. Thèse de doctorat, Université Bordeaux I, 1995. - 398/709 - Bibliographie LACROIX, Silvestre François : Traité du Calcul différentiel et du Calcul intégral, T. I. Duprat, Paris, 1797. LAGRANGE, Joseph-Louis : Théorie des fonctions analytiques. Imprimerie de la République, Paris, 1797. LAGRANGE, Joseph-Louis : Leçons sur le calcul des fonctions. Courcier, Paris, 1806. LAKATOS, Imré : Preuves et réfutations. Hermann, Paris, 1985. LALANDE, A. : Vocabulaire technique et critique de la philosophie. Librairie F. Alcan, Paris, 1932. LERCHER, Alain : Les mots de la philosophie. Belin, Paris, 1985. MARGOLINAS, Claire : "Éléments pour l’analyse du rôle du maître : les phases de conclusion". Recherches en Didactique des Mathématiques, La Pensée Sauvage, Grenoble, vol. 12(1), 1992, 113–158. MARGOLINAS, Claire : "Le milieu et le contrat, concepts pour la construction et l’analyse de situations d’enseignement". dans Analyse des pratiques enseignantes et didactique des mathématiques. Actes de l’Université d’Été à La Rochelle, IREM de Clermont-Ferrand. 1998, 3–16. MATHÉCRIT, Équipe : Atelier 103 : calcul différentiel et intégral I. Modulo éditeur, Montréal et Paris, 1978. MATHERON, Yves : Une étude didactique de la mémoire dans l’enseignement des mathématiques au collège et au lycée. Quelques exemples. Thèse de doctorat, Université Aix-Marseille I, 2000. MERCIER, Alain : L’élève et les contraintes temporelles de l’enseignement, un cas en calcul algébrique. Thèse du troisième cycle, Université de Bordeaux I, 1992. MERCIER, Alain : "La participation des élèves à l’enseignement". Recherches en Didactique des Mathématiques, La Pensée Sauvage, Grenoble, vol. 18(3), 1998, 279–310. MERCIER, Alain : "Questions d’épistémologie des situations". dans Conférence introductive au Colloque international de l’AFIRSE à Bordeaux. 2008. NEWTON, Isaac : De Analysi per Æquationes Numero Terminorum Infinitas. 1669. NEWTON, Isaac : Principes mathématiques de philosophie naturelle. Traduction Mme du Châtelet, Paris, 1759, 1687. OVAERT, Jean-Louis : Chap. La thèse de Lagrange et la transformation de l’Analyse. dans"Philosophie et calcul de l’infini". François Maspero, Paris, 1976. OVAERT, Jean-Louis et SANSUC Jean-Jacques : Chap. Introduction aux travaux d’Euler et de Lagrange en Analyse. dans"Philosophie et calcul de l’infini". François Maspero, Paris, 1976. PERRIN-GLORIAN, M.-J. : "Problèmes d’articulation de cadres théoriques : l’exemple du concept de milieu". Recherches en Didactique des Mathématiques, La Pensée Sauvage, Grenoble, vol. 19(3), 1999, 279–321. PIAGET, Jean : Les notions de mouvement et de vitesse chez l’enfant. Presses Universitaires de France, Paris, 1972. PIAGET, Jean : La prise de conscience. Presses Universitaires de France, Collection psychologie d’aujourd’hui, Paris, 1974. - 399/709 - Bibliographie ROBERT, Aline, LATTUATI Marie et PENNINCKX Jacqueline : L’Enseignement des mathématiques au lycée : un point de vue didactique. Ellipses Marketing, Paris, 1999. ROGALSKI, Janine : "Représentations graphiques dans l’enseignement : concepts et méthodes d’analyse appliqués au graphe de fonctions. Signes et discours dans l’éducation et la vulgarisation scientifique". dans Giordan et Martinand (éd.): Sixièmes journées Internationales sur l’éducation scientifique, Chamonix. 1984. ROUCHE, Nicolas : "De l’élève aux mathématiques, le chemin s’allonge". dans Bouillard Philippe et Lemaire Jacques Ch. (éd.): L’apprentissage des sciences en question(s). Espaces de Libertés, Bruxelles, 2005. ROUY, Emmanuelle : Formation initiale des professeurs de l’enseignement secondaire supérieur et changements de rationalité mathématique entre l’institution secondaire et l’institution universitaire - Le cas éclairant du thème des dérivées. Thèse de doctorat, Université de Liège, 2007. SAELENS, Isabelle : Proposition de repères historiques et épistémologiques pour une approche heuristique de l’Analyse dans l’enseignement secondaire. DEA, Facultés universitaires Notre-Dame de Paix, Namur, 1995. SALIN, M.-H. : "Pratiques ostensives des enseignants". dans Lemoyne G. et Conne F. (éd.): Le cognitif en didactique des mathématiques. Les presses de l’Université de Montréal, Montréal, 1999, 327–352. SCHNEIDER, Maggy : "Un obstacle épistémologique soulevé par des "découpages infinis" des surfaces et des solides". Recherches en Didactique des Mathématiques, La Pensée Sauvage, Grenoble, vol. 11(2-3), 1991, 241–294. SCHNEIDER, Maggy : "Quelques difficultés d’apprentissage du concept de tangente". Repères IREM, Topiques éditions, Metz, no 5, 1991a, 65–81. SCHNEIDER, Maggy : "A propos de l’apprentissage du taux de variation instantané". Educational Studies in Mathematics, no 23, 1992, 317–350. SCHNEIDER, Maggy : Entre recherche et développement : quel choix de valeurs pour l’ingénierie curriculaire ? Intervention aux journées mathématiques organisées par l’INRP, 12 juin 2007 hURL: http://www.inrp.fr/i. SCHNEIDER, Maggy : Traité de didactique des mathématiques - La didactique par des exemples et contre-exemples. Université de Liège, 2008. SCHNEIDER, Maggy : "Ingénieries didactiques et situations fondamentales. Quel niveau praxéologique ?" dans XVIe École d’Été de Didactique des mathématiques organisée par l’association pour la recherche en didactique des mathématiques à Carcassone. 2011, 175–205. SIERPINSKA, Anna : "Obstacles épistémologiques relatifs à la notion de limite". Recherches en Didactique des Mathématiques, La Pensée Sauvage, Grenoble, vol. 6(1), 1985, 5–68. SIERPINSKA, Anna : "On understanding the notion of function". dans Dubinsky E. et Harel G. (éd.): The concept of function : Elements of Pedagogy and Epistemology. Volume vol. 25, Notes and Reports Series of the Mathematical Association of America, 1992, 25–58. STRUIK, Dirk Jan : A Source Book in Mathematics. Harvard University Press, Cambridge, M.A., 1969. - 400/709 -