Hélène Bouchet, Camille Coye, Alban Lemasson

Hélène BOUCHET, Université de Lyon, Université Jean Monnet Saint-Etienne, UMR 9197 Neuro-PSI / ENES – CNRS, Saint-Etienne helene.bouchet chez yahoo.fr

Camille COYE, Université de Rennes 1, UMR 6552 EthoS – CNRS, Station Biologique de Paimpont, Rennes camille.coye chez univ-rennes1.fr

Alban LEMASSON, Université de Rennes 1, UMR 6552 EthoS – CNRS, Station Biologique de Paimpont, Rennes alban.lemasson chez univ-rennes1.fr

Le langage est-il le propre de l’homme ? Apports des études sur les primates non humains

Résumé / Abstract

Le langage, vu comme une entité complexe, est considéré comme le propre de l’homme. En revanche, si l’on choisit de décomposer le langage en une somme de propriétés (complémentaires mais) distinctes, il devient possible d’établir des parallèles avec l’animal. Les primates non humains présentent un intérêt comparatif tout particulier de par leur proximité phylogénétique avec l’homme. En nous appuyant sur des études éthologiques récentes, nous tenterons d’évaluer dans quelle mesure certaines propriétés du langage (e.g. contrôle vocal moteur, combinaisons syntaxiques, plasticité vocale, règles conversationnelles) ne sont finalement pas le propre de l’homme. Nous examinerons quels sont les parallèles pouvant être établis entre homme et singes, et quelles sont les limites à ces comparaisons.

Language, seen as a complex entity, is considered as belonging to man. However, if we choose to break language down to a sum of (complementary but) distinct properties, it becomes possible to draw parallels between man and animal. Non-human primates are particularly interesting when it comes to comparative approach given their phylogenetic closeness to man. By reviewing recent ethological studies, we will attempt to assess to which extent some properties of language (e.g. vocal motor control, syntactic combinations, vocal plasticity, conversational rules) are after all not specific to man. We will examine which parallels can be drawn between man, monkeys and apes, and which are the limits to these comparisons.

Mots-clés
 |   |   |   |   |   | 


Introduction

La question de l’appartenance du langage à l’homme est, depuis l’antiquité, régulièrement sujet à controverses. Aristote considérait déjà, dans sa Politique (env. -340 av. J-C.), l’homme comme un « animal politique parlant » chez qui la voix est signifiante. La philosophie s’est longtemps emparée de cette question, avec, par exemple, Descartes qui dans son Discours de la méthode (1637) défend l’idée que les animaux peuvent « proférer des paroles » sans pour autant « parler… c’est-à-dire en témoignant qu’ils pensent ce qu’ils disent. ». Pour éviter les « querelles stériles et les thèses farfelues », la société de linguistique de Paris indique en 1865 dans son règlement ne plus souhaiter recevoir aucune communication concernant l’origine du langage. En parallèle, la biologie continue à s’intéresser à cette question de l’évolution du langage, avec en premier lieu, Darwin qui, dans son livre sur les origines de l’homme (The descent of man, and selection in relation to sex, 1871) affirme que « l’homme n’est pas le seul animal qui puisse user d’un langage pour exprimer ce qui se passe dans son esprit, et comprendre plus ou moins ce qui est dit par un autre ». Il cite notamment l’exemple des singes du Paraguay qui « murmurent un ensemble de six mots distincts quand ils sont dans un état d’excitation, tout en provoquant chez leurs congénères des émotions similaires ». Aujourd’hui le débat est transdisciplinaire, opposant des courants de pensée prônant, pour les discontinuistes, une différence d’ordre qualitative [1–3] et, pour les continuistes, une différence d’ordre quantitative [4–8] entre le langage humain et la communication vocale animale ; certains auteurs ont récemment suggéré un positionnement intermédiaire, mêlant ces deux courants à première vue antagonistes [9].

Le langage est un comportement social [10, 11], et ce dès l’enfance [12] : l’acte de communication consiste en une interaction sociale entre un individu émetteur/locuteur et un ou plusieurs individus receveurs/récepteurs par le biais d’un échange de signaux [13, 14]. Pour Dunbar [15], le langage est pour l’homme un instrument de cohésion sociale, au même titre que le toilettage chez les singes qui est bien moins lié à des questions d’hygiène que de cimentage de lien social. Ainsi, au cours de l’évolution des primates, lorsqu’il y a eu élargissement de la taille du groupe social, l’instrument « toilettage manuel » se serait révélé peu efficace, laissant place à l’échange de signaux vocaux et progressivement au langage. Chez les macaques japonais, l’idée que l’échange vocal puisse être vu comme un « toilettage vocal, à distance » vient justement d’être démontrée, ces deux comportements se distribuant de manière identique au sein du réseau social : les femelles qui s’épouillent le plus lorsqu’elles sont à proximité sont également celles qui échangent vocalement le plus lorsqu’elles sont distantes [16]. Ainsi l’éthologie, qui s’intéresse à l’étude des comportements animaux et humains et notamment à la communication spontanée et aux interactions entre les membres d’un groupe chez différentes espèces animales plus ou moins sociales, peut apporter une contribution significative au débat.

Le langage consiste en un système organisé de signaux arbitraires et de structures dont l’agencement est régi par des règles, utilisé à des fins de communication [17]. Si l’on considère le langage comme une entité complexe caractérisée par des propriétés telles que la générativité (capacité de générer un nombre infini de messages à partir d’un nombre fini d’éléments), la récursivité (construction syntaxique pouvant se répéter un nombre indéfini de fois à partir du résultat qu’elle produit), la fonction symbolique (évocation de situations ou d’objets en se servant de signes ou symboles) et les capacités de déplacement (capacité de référer à des évènements ou choses éloignés dans le temps et l’espace), il semble être le propre de l’homme [18, 19] ; un tel niveau de complexité n’ayant pas, à ce jour, été observé dans les productions vocales spontanées chez l’animal. En revanche, si l’on décompose le langage en une somme de propriétés (complémentaires mais) distinctes (comme la sémantique, la syntaxe, l’apprentissage social, la plasticité acoustique, les règles conversationnelles), observées dans toutes les langues du monde, il devient alors possible de tenter d’établir des parallèles avec l’animal [5, 6, 8, 9, 20]. Tandis que certains traits demeureront propres à l’homme, d’autres caractéristiques essentielles du langage pourront se révéler être partagées avec l’animal et, selon les propriétés, par des espèces plus ou moins éloignées phylogénétiquement de l’homme. Cette approche s’interroge sur l’existence d’un réel fossé qualitatif entre langage humain et communication animale, et recherche les possibilités de le combler en identifiant des similarités, identités ou différences partielles selon les cas, entre l’homme et l’animal. C’est cette approche que nous utiliserons dans cet article.

Nous passerons alors en revue un certain nombre de propriétés du langage et tenterons d’évaluer dans quelle mesure ces caractéristiques sont finalement, ou non, le propre de l’homme. Nous nous intéresserons ainsi aux capacités de contrôle moteur de la production vocale, aux composantes émotionnelle/référentielle/identitaire des messages, aux propriétés combinatoires des productions vocales, au développement vocal chez le jeune, aux capacités de plasticité vocale sous influences sociales chez l’adulte, ainsi qu’à l’ajustement à l’audience et aux règles temporelles et sociales des interactions vocales. Nous nous appuierons sur la littérature récente concernant la communication vocale chez les primates non humains qui présentent un intérêt comparatif tout particulier de par leur proximité phylogénétique avec l’homme.

1 Contrôle moteur de la production vocale

Chez l’homme, le langage oral repose en premier lieu sur sa capacité à contrôler sa voix de manière volontaire, que ce soit en termes d’émission (choisir de parler ou de rester silencieux) ou en termes de modulation de la structure acoustique (articulation, prosodie, capacité d’imitation). Cette faculté s’appuie sur des prédispositions anatomiques (e.g. descente du larynx), cérébrales (e.g. aire de Broca) et neuronales favorables [21, 22]. L’homme présente notamment un circuit neuronal direct entre le cortex moteur et le larynx lui permettant un contrôle affiné de son appareil phonatoire [23].

Au sein de l’ordre des primates, les capacités de contrôle vocal observées chez l’homme sont inégalées, les singes n’auraient qu’un contrôle très limité sur leurs productions vocales [24, 25]. On a longtemps pensé que ces inégalités reposaient sur des différences fondamentales du point de vue de l’anatomie du tractus vocal [26]. Or de récents travaux de modélisation ont montré que les singes possèdent les prédispositions anatomiques de base requises pour le contrôle articulatoire et laryngé [27, 28]. Cela suggère que les différences interspécifiques en termes de flexibilité vocale ont plus à voir avec le degré de contrôle neuronal dont dispose chaque espèce qu’avec des divergences anatomiques.

Les émissions vocales des singes ont longtemps été considérées comme essentiellement automatiques car liées quasi-exclusivement au niveau d’excitation de l’émetteur, avec une production associée à des structures cérébrales subcorticales et notamment au système limbique [29–31]. Cependant, il est important de souligner que nombre de ces anciennes études ont, pour des raisons techniques, été menées chez des sujets anesthésiés ou restreints dans leurs mouvements, un contexte critiquable d’un point de vue biologique et social [32]. En outre, il est intéressant de noter que, si certaines études ont permis de provoquer la production de cris via la stimulation de régions cérébrales profondes chez les singes, les vocalisations obtenues étaient exclusivement des cris d’alarme ou de détresse ([33, 34] mais voir [35] pour la seule exception). Aucune étude n’a permis l’expression de la totalité du répertoire d’une espèce.

De récentes études de conditionnement opérant ont relancé le débat sur la capacité de contrôle vocal des primates non humains, vraisemblablement sous-estimée jusqu’alors. En effet, des singes se sont révélés capables d’interrompre brutalement leur vocalisation à la diffusion d’un bruit blanc [36, 37], d’apprendre à vocaliser sur commande en réponse à un signe de la main de l’expérimentateur humain [38], ou d’être conditionnés à vocaliser sur présentation d’un item alimentaire [39] ou d’un stimulus visuel [40]. Des expériences de manipulation du bruit de fond ont révélé que les singes sont également capables de moduler la structure acoustique de leur cri (amplitude, durée) de façon à optimiser les chances de diffusion de leur signal dans un milieu bruyant [41, 42] (remarque : pour des exemples de modulation dans le domaine fréquentiel, sous l’influence de facteurs sociaux, voir les phénomènes de convergence vocale décrits §6 et §7). De plus, les bases neurobiologiques de cette aptitude au contrôle vocal chez les primates non humains ont pu être identifiées [39, 40, 43]. Ces études ont mis en lumière le rôle joué par le cortex prémoteur et le cortex préfrontal, des aires cérébrales également impliquées dans la production du langage chez l’homme (i.e. homologues de l’aire de Broca). En outre, d’après ces mêmes études, l’activation des aires cérébrales n’est pas identique selon le contexte de production vocale. Certaines émissions vocales, notamment celles émises spontanément sans raison apparente, sont plutôt automatiques, alors que d’autres, notamment celles impliquées dans un échange vocal social, sont plutôt volontaires [43]. D’un point de vue neuronal, le contexte d’interaction sociale semble donc plus propice à la plasticité vocale. Nous verrons, au cours de cette revue, que les exemples de variabilité sous influences sociales sont effectivement nombreux.

En résumé, le contrôle vocal chez les primates non humains a longtemps été considéré comme quasi inexistant, pour des raisons anatomiques d’une part, et parce que les émissions vocales des singes étaient vues comme de simples manifestations réflexes de l’état émotionnel de l’émetteur (associées à des structures cérébrales subcorticales) d’autre part. Or de récentes études ont révélé que les différences homme-singes reposeraient finalement plus sur des capacités inégales de contrôle neuronal que sur des divergences anatomiques, même si des différences qualitatives subsistent à ce niveau (e.g. mobilité de la langue [44]). Des études expérimentales ont permis d’observer un certain degré de contrôle vocal chez les singes, que ce soit en termes d’émission (choisir de crier ou non selon le contexte) ou en termes de modulation de la structure acoustique. Des bases neurobiologiques communes (implication du cortex prémoteur et du cortex préfrontal) au sein de l’ordre des primates ont même pu être identifiées, notamment s’agissant des vocalisations émises en contexte social. On ne peut donc plus parler de réelle discontinuité à ce niveau, même si des différences importantes subsistent. Par exemple, en dépit de l’existence de relevés anecdotiques d’imitation de signaux humains voisés (e.g. le chimpanzé Viki, après un entraînement intensif, aurait été capable de prononcer 4 mots [45]) ou non-voisés (e.g. plusieurs orangs-outans captifs produisent des sifflements par imitation de leurs soigneurs humains [46]) par des grand-singes, les grandes capacités d’imitation de l’homme demeurent inégalées.

2 Composantes émotionnelle/référentielle/identitaire des messages

Chez l’homme, la voix et la façon de parler sont porteuses d’informations relatives à l’état émotionnel du locuteur, encodées par la prosodie (i.e. vitesse d’élocution et variations de tonalité) [47–49], qui sont d’une grande importance pour les relations sociales, en lien notamment avec l’empathie. Elles sont également porteuses d’informations sur son identité. Il est intéressant de noter que la quantité d’indices identitaires présents dans le discours varie selon la situation, notamment en fonction du nombre d’auditeurs-cibles (communication de masse versus conversation en tête-à-tête) et de la composition de l’audience (étrangers versus individus familiers) : le discours sera plus riche en informations identitaires dans un contexte intime, mais plus neutre dans un contexte public [50]. Mais le cœur du langage humain est sa sémantique, soit l’association de signaux arbitraires pour référer à des éléments pourvus de sens, qui permet à l’homme de communiquer sur tous les sujets, qu’ils soient concrets ou abstraits (capacité d’abstraction), et qu’ils soient proches ou éloignés dans le temps et l’espace (capacité de déplacement) [19].

Classiquement, les vocalisations animales ont été considérées avant tout comme des reflets acoustiques de changements de l’état interne (émotionnel) de l’émetteur [30, 51]. En effet, chez les singes comme chez l’homme, des variations de tonalité, de durée ou de rythme encodent des variations de l’état émotionnel [52]. Ainsi, chez les saïmiris, le degré d’aversion est encodé dans la structure acoustique des cris (amplitude, fréquence, ratio signal sur bruit) [35]. Chez les mones de Campbell, lorsque le niveau de danger augmente (i.e. prédateur entendu à distance versus prédateur détecté visuellement à proximité, ce qui constitue un danger imminent), les mâles émettent leurs cris d’alarme plus rapidement [53], tandis que lorsque le groupe a subi une séparation prolongée, les cris de contact des femelles au moment des retrouvailles sont plus longs et plus aigus que la normale [54].

D’autres auteurs ont défendu l’idée d’un codage acoustique d’informations référentielles relatives à un stimulus extérieur tel qu’une source de nourriture (quantité, qualité ; e.g. macaques [55], tamarins [56], chimpanzés [57]) ou un risque de prédation (type de prédateur notamment terrestre versus aérien, degré d’imminence du danger ; e.g. vervets [58], cercopithèques Diane [59], mones de Campbell [60, 61], capucins [62]), ou encore d’informations relatives au succès (éjaculation) ou non d’un acte de copulation (e.g. macaques [63]). Pour mettre en évidence ce codage d’informations référentielles, il est possible de conduire des expériences dites « de repasse » qui consistent en l’utilisation de cris pré-enregistrés, déclenchés par des évènements extérieurs distincts identifiés (e.g. la présence d’un prédateur), pour une diffusion ultérieure (i.e. « repasse ») en l’absence du stimulus initial (i.e. le prédateur). De telles expériences permettent de confirmer que les cris seuls suffisent pour provoquer des réactions comportementales très spécifiques et identiques à celles observées dans le contexte d’origine (i.e. risque de prédation). Par exemple, la repasse de cris d’alarme signalant un prédateur induit les mêmes réactions que la présence du prédateur : lever la tête ou fuir vers le haut pour un prédateur terrestre, et l’opposé pour un prédateur aérien [64–67]. Cette composante référentielle des vocalisations animales s’apparente au caractère sémantique des mots dans le langage humain, et il a également été suggéré que les vocalisations puissent être associées à des représentations mentales chez les receveurs [65, 68] même si l’hypothèse d’un simple apprentissage associatif ne peut être exclue à l’heure actuelle. Il est important de remarquer que la composante référentielle des signaux n’a pu être mise en évidence que pour un nombre restreint de types de cris parmi l’ensemble formant le répertoire vocal des primates non humains, en l’occurrence les cris alimentaires, les cris d’alarme, ou encore les cris de copulation, mais pas les cris émis en contexte d’interaction affiliative par exemple.

Finalement, un modèle dual réconciliant ces deux courants de pensée a été proposé, considérant que les cris des primates non humains pouvaient présenter à la fois une composante émotionnelle et une composante référentielle [69], comme c’est le cas chez l’homme. Mais les études de ces 20 dernières années ont révélé qu’une troisième composante, la composante identitaire, pouvait s’avérer particulièrement développée, notamment dans les cris dont les composantes émotionnelle et référentielle sont de moindre importance. Cet encodage d’informations identitaires cruciales leur confère alors une fonction de « badge social ». L’appartenance de l’émetteur à une espèce [70], une population [71], un groupe social [72, 73], une lignée génétique [74, 75], un réseau social [76], mais aussi son sexe, son âge, sa taille corporelle [77], son statut hiérarchique [78], sans oublier son identité individuelle [79,80] sont autant d’informations pouvant être encodées dans les cris des singes. Au sein d’un groupe, ces informations vont par exemple pouvoir être utilisées par les receveurs pour choisir d’intervenir, ou non, dans un conflit opposant deux congénères dont les cris auront indiqué la lignée, le sexe, le rang hiérarchique, l’identité individuelle, etc... Ainsi, un mâle babouin ne va s’approcher d’un conflit que s’il entretient des liens d’amitié forts avec la femelle allaitante agressée, qu’il n’a pu apprendre à reconnaître vocalement qu’après sa migration au sein du groupe à l’âge adulte [81]. Par ailleurs, les babouins sont plus attentifs à un conflit suggérant un renversement de hiérarchie entre deux lignées, qu’à un conflit intra-lignée [7]. L’encodage d’informations identitaires dans les cris est important dans nombre de contextes, mais c’est le cas plus particulièrement pour ceux émis dans le cadre des interactions sociales (et qui ne sont donc pas des cris dits référentiels) où l’identité des acteurs est un paramètre essentiel. Cette idée a donné naissance à une hypothèse selon laquelle le degré d’encodage de l’identité dans les cris varierait au sein du répertoire vocal, en lien avec la fonction sociale de chaque type de cri [82–85]. Les cris impliqués dans la médiation des relations intra-groupe et dirigés vers un partenaire social particulier (par exemple les cris affiliatifs) seraient sujets à des pressions (sociales) de sélection en faveur d’un degré important de variabilité. Cela permettrait notamment l’encodage d’informations relatives à l’identité de l’émetteur (variabilité inter-individuelle), à son état émotionnel ou encore à ses « intentions » en termes de stratégies sociales (variabilité intra-individuelle). Au contraire, les cris émis dans un contexte moins social et dirigés vers l’ensemble du groupe (par exemple les cris d’alarmes) seraient sujets à des pressions de sélection en faveur d’une plus grande stéréotypie permettant d’éviter tout risque de confusion du signal. Cette hypothèse a été validée récemment grâce à des études évaluant le degré de variabilité acoustique dans tout ou partie du répertoire vocal chez plusieurs espèces. En effet, les cris affiliatifs sont ceux qui présentent le degré de variabilité des paramètres acoustiques le plus élevé et qui encodent l’identité de la manière la plus fiable [82, 84, 86–88]. En revanche, chez ces mêmes espèces, les cris agonistiques, les cris d’alarme, ou les cris liés à l’alimentation ont une structure comparativement plus stéréotypée avec peu de variabilité intra- ou inter-individuelle [82, 84, 86]. Un parallèle intéressant peut être fait avec ce que l’on observe chez l’homme dont le degré de personnalisation du discours varie en fonction de l’audience visée [50].

Pour illustrer l’existence simultanée de ces trois composantes (référentielle, émotionnelle, identitaire) dans les messages vocaux d’une même espèce de primate, on peut citer l’exemple des mones de Campbell. Chez cette espèce, les mâles produisent six types de cris forts qu’ils émettent en séquences dont la composition varie en fonction du type de danger [60, 89] : chute d’un arbre, détection d’un groupe voisin, détection d’un prédateur avec précision possible du type (léopard, aigle...). En outre, la rythmicité de ces séquences [53], ainsi que la structure acoustique même des cris (paramètres temporels et fréquentiels) [20], varient en fonction du degré d’imminence du danger (prédateur détecté acoustiquement versus visuellement), reflétant donc l’état émotionnel de l’émetteur. Enfin, des informations identitaires sont encodées dans la structure acoustique de certains cris (paramètres fréquentiels) [20] ainsi que dans l’organisation temporelle de certaines séquences [53].

En conclusion, tandis que des parallèles homme-singes peuvent aisément être établis lorsque l’on s’intéresse aux caractères émotionnel (avec notamment le lien prosodie-émotions) et identitaire des messages (avec notamment le degré de personnalisation du discours en fonction du public visé), c’est concernant la composante référentielle que les différences les plus importantes subsistent. Les signaux des animaux réfèrent à des éléments présents dans leur environnement à l’instant t. Leurs messages présentent donc un caractère sémantique, mais de par leur manque de détachement par rapport au contexte immédiat, ils ne remplissent pas de fonction symbolique et n’apportent pas la preuve d’une faculté de déplacement, par opposition au langage humain [19]. Enfin, même s’il est difficile d’affirmer aujourd’hui que les singes possèdent une représentation mentale du contenu référentiel des cris qu’ils entendent, il semblerait qu’ils ne réagissent pas sur la base d’un simple processus d’apprentissage associatif. C’est donc du point de vue des processus cognitifs sous-tendant la sémanticité que des investigations supplémentaires demeurent nécessaires avant de pouvoir établir la limite de l’analogie homme-singes.

3 Propriétés combinatoires des productions vocales

Une des caractéristiques essentielle du langage est le principe de double-articulation (ou dualité d’assemblage) qui implique une structure combinatoire à deux niveaux, régie par de nombreuses règles grammaticales : le premier niveau concerne l’assemblage d’unités sans valeur sémantique (les phonèmes) en éléments porteurs de sens (les morphèmes et mots), et le second la combinaison de ces unités sémantiques au sein de structures plus importantes (les phrases) dont le sens dépend de règles syntaxiques [19, 90]. Cette caractéristique clé du langage humain est à la base de notre capacité à générer une infinité de message à partir d’un nombre fini d’éléments.

Traditionnellement, les études chez les primates non humains se sont focalisées sur l’identification des différents types de cris émis par une espèce. Or, dans l’optique d’une approche comparative avec l’homme sur la question de la double-articulation, plusieurs auteurs ont récemment souligné l’intérêt de privilégier une analyse multi-niveaux de la structure organisationnelle du répertoire vocal des primates non humains [91–93]. Aussi, des études récentes se sont intéressées à l’existence de systèmes combinatoires chez les singes, et ont révélé l’existence de correspondances avec la structure impliquant plusieurs niveaux (phonèmes – morphèmes – mots – phrases) communément admise chez l’homme. Plusieurs espèces de primates non humains possèdent en effet des systèmes communicatifs impliquant à minima trois niveaux : différents cris (i.e. signaux ayant une structure distincte et une fonction propre, associés à un ou des contextes d’émission particuliers) peuvent être émis tels quels (« cris simples »), ou bien concaténés (avec des unités vocales n’étant jamais émises isolément, ou avec d’autres cris) pour former des « cris complexes » dont la fonction dépend des parties qui les composent ; enfin, les cris (« simples » ou « complexes ») peuvent être combinés en « séquences vocales » (i.e. série de cris émise par un même individu) dont la signification varie en fonction des cris qui les composent, l’ordre dans lequel ils sont émis et/ou leur rythme d’émission [93]. Le répertoire vocal des singes apparaît alors comme un système plus flexible, avec des combinaisons fonctionnelles optionnelles, mais prédictibles, de structures acoustiques.

Pour faciliter la comparaison homme-singes concernant les propriétés combinatoires de leurs productions vocales, nous avons décidé d’emprunter la terminologie linguistique utilisée classiquement dans l’étude de la morphologie [94] pour décrire des phénomènes qui nous semblent comparables ; toutes précautions gardées sur les limites de cette analogie. Nous utiliserons ainsi le terme « d’affixation » lorsqu’un « cri complexe » est formé par ajout d’un affixe à un radical ; un « affixe » référant à une unité acoustique n’apparaissant que comme sous-partie d’une vocalisation, et n’ayant pas de fonction propre prise indépendamment (par opposition au « radical » qui possède une fonction propre lorsqu’il est émis seul). Nous qualifierons de « préfixe » tout affixe se rattachant à l’avant d’un radical, et de « suffixe » tout affixe se rattachant à l’arrière de celui-ci. Enfin, nous parlerons de « syntaxe » lorsqu’il s’agira de décrire les règles de combinaison d’éléments fonctionnels en séquences plus complexes.

De récentes études se sont ainsi intéressées à un premier niveau d’organisation des émissions vocales des primates non humains : la façon dont des unités vocales sont combinées afin de former des cris complexes. Cela a permis de mettre en évidence qu’à partir de quelques unités discrètes, les singes sont capables d’émettre une grande variété de signaux. On trouve un exemple de suffixation chez les mangabés à collier dont quatre types de cris simples (émis en contexte alimentaire ou social) peuvent être combinés à une unité ‘Uh’ (jamais émise seule par ailleurs). L’utilisation de ce suffixe est fonction du contexte social : les cris comprenant un ‘Uh’ sont émis plus souvent lors d’échanges vocaux impliquant de multiples partenaires que lors d’émissions vocales isolées [95]. Un autre exemple, remarquable, est celui de la mone de Campbell. Les mâles produisent des cris d’alarme spécifiques au type de danger détecté : les cris ‘Krak’ signalent un danger au sol (i.e. un léopard, ou un autre danger urgent au sol dans les régions où ce prédateur n’est plus présent ; voir [96] pour une analyse linguistique dialectale du phénomène se basant sur les implicatures scalaires), alors que les cris ‘Hok’ signalent la détection d’un aigle [60]. Ils peuvent également combiner ces cris simples à un suffixe unique ‘oo’ (cette unité ‘oo’ n’est jamais émise seule) pour former les cris complexes ‘Krak-oo’ et ‘Hok-oo’. Ces derniers sont émis dans un contexte plus large de perturbation, moins urgente, respectivement au sol et dans la canopée. Ainsi, l’affixation d’une unité ‘oo’ permet d’élargir le sens du message porté par les cris simples ‘Krak’ et ‘Hok’, et d’en atténuer l’urgence [60]. La valeur sémantique des ‘Krak’ et des ‘Hok’ ainsi que des cris ‘Krak’ suffixés (‘Krak-oo’) a été confirmée expérimentalement. Lorsqu’ils entendent des repasses de cris ‘Krak’ ou ‘Hok’, les cercopithèques Diane qui vivent en sympatrie (i.e. co-existent dans un même habitat et interagissent fréquemment) avec les mones de Campbell se comportent comme si le prédateur (terrestre ou aérien) avait été détecté [65], et ils répondent plus fortement aux cris non-suffixés ‘Krak’ (léopard) qu’aux cris suffixés ‘Krak-oo’ (danger non-spécifié) [97]. Il a en outre été prouvé que la moindre urgence associée aux cris suffixés n’est pas la conséquence d’un simple ralentissement de la séquence lié à la contrainte d’émission de ces unités additionnelles [98]. De plus, des analyses structurales [98], ainsi que des expériences de repasses de cris artificiellement recombinés [97], ont démontré que les cris complexes consistent bien en la combinaison linéaire d’une racine et d’un suffixe. La linéarité des contextes associés aux cris simples et suffixés (i.e. ‘Krak-’ = sol ; ‘Hok-’ = canopée) et l’utilisation d’un unique suffixe pour les deux combinaisons suggèrent une possible règle communicative : « ‘-oo’ atténue l’urgence ». Toutefois, les capacités cognitives impliquées dans ce phénomène restent méconnues et d’autres études évaluant la capacité des animaux à généraliser cette règle sont nécessaires avant de pousser plus avant la comparaison homme-singes, et de conclure sur l’existence d’une « proto-grammaire ».

Plusieurs auteurs ont également décrit des productions vocales impliquant non plus la combinaison d’une racine avec un affixe, mais la combinaison de deux cris simples ensemble pour former un cri complexe dont la signification dépend de ses composants (e.g. chimpanzés [99]). C’est par exemple le cas des cercopithèques Diane, une espèce proche de la mone de Campbell, chez qui les femelles peuvent émettre quatre cris simples : ‘H’, ‘L’, ‘R’ et ‘A’. Les trois premiers (‘H’, ‘L’, ‘R’) sont émis en fonction de la valence émotionnelle du contexte social, respectivement dans un contexte positif, neutre et négatif. Le quatrième (‘A’) est émis dans des contextes variés et comporte deux sous-types dont la structure encode l’identité de l’émetteur plus (sous-type ‘Af’) ou moins (sous-type ‘Ab’) fortement. Ces cris peuvent être combinés, non-aléatoirement, en six cris complexes comportant une partie contextuelle (‘H’, ‘L’ ou ‘R’) et une partie identitaire (‘A’) [100]. Les différents cris complexes (i.e. ‘HAf’, ‘HAb’, ‘LAf’, ‘LAb’, ‘RAf’ et ‘RAb’) sont utilisés dans des contextes correspondant aux sous-unités qui les composent, suggérant l’existence d’une addition des messages vocaux. Récemment, une expérience de repasse de stimuli artificiels (i.e. recombinaison pertinente de cris recréée à partir de cris émis indépendamment) a démontré que les receveurs perçoivent les différences acoustiques et adaptent leur réaction en fonction du type de cri complexe diffusé [101], confirmant ainsi la pertinence biologique des combinaisons de cris chez les primates non humains. Un système analogue de combinaisons de cris a été mis en évidence chez les femelles mones de Campbell qui produisent des cris complexes dont la première partie encode l’état émotionnel de l’émetteur (un paradigme expérimental de séparation-réunion a mis en évidence une augmentation de la tonalité et de la durée consécutive à un stress social plus important [54]) et la seconde partie, caractérisée par une modulation de fréquence en forme d’arche, encode son identité (une expérience de repasse a confirmé la capacité de reconnaissance individuelle par les récepteurs sur la base du pattern de cette arche [102]).

Enfin, un niveau d’organisation supérieur s’est révélé riche en informations contextuelles, celui des séquences de cris. Ainsi, les bonobos émettent leurs cris alimentaires en séquences dont la composition, en termes de types de cris, varie en fonction du type de nourriture [103], et cette information est décodée avec succès par les receveurs [104]. Un autre exemple remarquable, mentionné précédemment, est celui des séquences de cris d’alarmes (2 à 40 cris émis à la suite) des mâles mones de Campbell. Leur analyse a révélé un système de combinaisons complexe, reposant sur des associations et des transitions (i.e. ordre de succession des cris) non-aléatoires entre les six différents types de cris (‘Boom’, ‘Krak’, ‘Krak-oo’, ‘Hok’, ‘Hok-oo’ et ‘Wak-oo’). Ce système encode des informations aussi diverses que la nature et l’imminence du danger, le type de prédateur et l’activité du mâle [89]. Par exemple, une série de cris ’Boom’ est une incitation au rassemblement et au déplacement du groupe, tandis qu’une série composée de cris ‘Krak-oo’ est émise lorsqu’un prédateur est détecté. Mais la combinaison des deux (soit une séquence composée de cris ‘Boom’ suivis de cris ‘Krak-oo’) est émise dans un contexte radicalement différent, suite à la chute d’un arbre. Et lorsqu’un groupe voisin est détecté, des cris ‘Hok-oo’ sont ajoutés à l’intérieur de la séquence « chute d’arbre » qui porte alors encore un nouveau message, cette fois-ci territorial. Par ailleurs, l’ajout de cris ‘Krak’ à une séquence « alerte générale au prédateur » (série de ‘Krak-oo’) sert à spécifier le type de prédateur détecté (léopard). En outre, il est apparu que l’organisation de ces séquences vocales est prévisible puisque les informations cruciales sont données dès le début de la série de cris [89]. Par exemple, les cris ‘Boom’ produits dans un contexte de non-prédation sont émis en premier. Les cris simples (‘Krak’ et ‘Hok’) informant sur le type de prédateur détecté sont également émis avant les cris suffixés (« alerte générale ») au sein d’une séquence. D’ailleurs, des repasses de séquences vocales enregistrées dans un contexte de détection d’un prédateur, auxquelles des cris ‘Boom’ avaient été artificiellement ajoutés, n’ont pas provoqué de réaction anti-prédatrice chez les individus récepteurs [66]. Enfin, le rythme d’émission des cris au sein de la séquence s’est également avéré être porteur d’informations. Le débit d’émission des cris ‘Krak’ et ‘Krak-oo’ augmente en fonction de l’imminence du danger (léopard détecté visuellement versus acoustiquement), tandis que le rythme d’émission des ‘Hok’ augmente lorsque le mâle s’apprête à contre-attaquer l’aigle détecté [53]. Les exemples indiquant que l’émission de cris en séquences permet d’affiner le message ou bien de créer de nouveaux messages se sont multipliés ces dernières années [62, 105–109].

L’analyse de la structure des productions vocales des primates non humains a permis de mettre en évidence plusieurs niveaux d’organisation révélant un système complexe de combinaisons, perçues et interprétées par les receveurs de manière appropriée. Des parallèles avec les aspects sémantiques morphologiques et syntactiques du langage peuvent être envisagés [91, 110]. On observe notamment des analogies entre cris simples référentiels et mots simples (i.e. composés d’un seul morphème), entre affixes associés à une modification systématique du message (e.g. ‘-oo’ des mâles mones de Campbell) et affixes lexicaux, entre combinaisons de cris/affixes et mots complexes (ou composés selon les items combinés), et enfin entre séquences et phrases. Toutefois, ces analogies restent préliminaires et d’autres études seront nécessaires afin de confirmer ou infirmer ces propositions. En outre, le niveau phonétique chez l’animal n’a pas été étudié, ce qui limite les comparaisons avec le principe de dualité d’assemblage caractéristique du langage humain [91]. Quoiqu’il en soit, les primates non humains ne présentent de toute évidence pas les propriétés de générativité et de récursivité observées dans les productions vocales chez l’homme : tous les types de cris ne sont pas impliqués dans des combinaisons, les processus combinatoires engagés sont simples comparés aux règles grammaticales du langage, et la taille restreinte et le caractère fermé du répertoire vocal des singes limite les possibilités de combinaisons qui sont infinies chez l’homme. Si nous possédons déjà certaines clés quant aux mécanismes et capacités cognitives impliqués dans la production et la perception des vocalisations (contrôle volontaire de la production et intentionnalité, représentation mentale et inférences sur l’environnement), de nombreuses questions restent en suspens afin de clarifier les limites des parallèles pouvant être tracées entre langage humain et communication animale. La question des mécanismes cognitifs sous-tendant les combinaisons chez les singes (i.e. règles de combinaisons réelles, ou apprentissage de motifs complexes seulement associés à différents contextes) reste notamment ouverte.

4 Développement vocal chez le jeune : déterminisme génétique versus apprentissage social

Chez l’homme, une phase de babillage précède l’apparition des premiers mots chez l’enfant [6, 111]. Le développement des différents aspects du langage se fait sous l’influence de tuteurs sociaux (notamment les parents) qui vont guider l’apprentissage par l’enfant des aspects prosodiques [6, 112], du contenu sémantique [113], du contexte d’émission des vocalisations (aspects pragmatiques) [114–116], ou encore des règles conversationnelles [6, 117]. Les quelques cas célèbres « d’enfants sauvages » ont confirmé que, chez l’homme, le manque d’expérience auditive et sociale crée un retard de développement de la production vocale : l’apprentissage du langage au-delà de la période sensible est limité, voire impossible [118–120]. En outre, l’homme fait preuve de plasticité vocale tout au long de sa vie (i.e. apprentissage vocal ouvert) : il peut perpétuellement apprendre de nouveaux mots, une nouvelle langue et ses nouveaux phonèmes, ou encore imiter de nouvelles voix.

Le développement de la communication vocale chez les singes est, depuis les études pionnières des années 1970-1980, considéré comme étant sous l’emprise d’un fort déterminisme génétique [24, 121, 122], par opposition au langage humain dont l’acquisition nécessite un apprentissage social complexe. Des expériences d’isolement social ou d’assourdissement à la naissance [123–125] ont montré que, même en l’absence de tous stimuli sociaux ou auditifs, les vocalisations des primates non humains apparaissaient dès la naissance comme structurellement comparables à celles des adultes et variaient peu par la suite. Ces expériences méritent cependant d’être relativisées car le juvénile ne peut jamais être totalement privé d’expérience sociale (notamment au stade prénatal). Par ailleurs, des expériences d’hybridation et d’adoption croisée [126–128] ont montré que les individus hybrides produisaient des vocalisations dont la structure était intermédiaire entre les deux espèces parentes, laissant supposer un fort déterminisme génétique. Cependant, le fait que ces expériences aient été réalisées avec des espèces phylogénétiquement proches empêche de le conclure avec certitude [127, 128]. En effet, de larges comparaisons interspécifiques ont mis en évidence qu’une forte proximité phylogénétique se traduisait par une plus grande ressemblance vocale au sein de plusieurs taxons (e.g. cercopithèques forestiers : Cercopithecus sp. [70], gibbons : Hylobates sp. [129]). Enfin, il est à noter que des expériences similaires apportent parfois des résultats contradictoires [130], possiblement imputables aux progrès des techniques de mesure acoustique depuis la fin des années 1980 [85, 122]. Des réplications récentes [131, 132] des expériences d’élevage en isolement social des années 1970 [124] ont révélé un certain degré de variabilité acoustique structurale au cours du développement qui serait seulement en partie expliqué par des changements morpho-anatomiques maturationnels. En outre, il s’est avéré que tous les types de cris n’apparaissaient pas sous leur forme adulte dès la naissance : certains présentent un degré de changement plus important au cours du développement [133, 134]. Un cas exceptionnel de flexibilité vocale a été rapporté chez deux espèces de ouistitis [135–137] dont les juvéniles présentent un phénomène de « babillage », comparable à ce que l’on peut observer chez les enfants humains [10]. A la naissance, les jeunes ouistitis produisent de longues séquences de cris de structures variées. Au cours du développement, les séquences émises sont de plus en plus courtes, et la structure des cris des juvéniles évolue vers des formes adultes, notamment grâce aux feedback de leurs aînés [137]. Enfin, une étude récente sur les duos mère-fille chez les gibbons a mis en évidence un degré de flexibilité acoustique dans le chant du jeune qui va au-delà de simples changements maturationnels [138]. Au cours du développement, les femelles immatures produisent des chants qui sont de plus en plus ressemblants acoustiquement et de plus en plus synchrones avec ceux de leur mère ; cette dernière jouant un rôle de tuteur facilitant l’apprentissage en produisant des chants stéréotypés.

Maintenant, si l’on s’intéresse à un autre aspect de la communication qui est, non pas la production abordée précédemment (i.e. émission de cris caractérisés par un ensemble de paramètres acoustiques), mais l’utilisation des vocalisations (i.e. fréquence et spécificité du contexte d’émission), il existe chez les primates non humains un certain nombre de preuves d’apprentissage social du contexte d’émission approprié [122, 139, 140]. Ainsi, au cours du développement, on observe un affinement progressif du contexte d’utilisation des différents types de cris [141–144]. Par exemple, les jeunes vervets apprennent progressivement à émettre le cri d’alarme spécifique à la détection d’un aigle martial à bon escient : d’abord émis envers tout objet volant (y compris une feuille d’arbre) par les plus jeunes, puis envers toutes les espèces d’oiseaux par les juvéniles, il est enfin préférentiellement émis envers les espèces de rapaces et surtout l’aigle martial par les adultes [58, 145]. L’expérience et l’observation du comportement des adultes joueraient un rôle primordial dans cet apprentissage. En outre, les adultes participent parfois activement à l’apprentissage de l’utilisation des cris par les juvéniles [146]. Chez les tamarins, l’émission de cris alimentaires par les adultes associée à des transferts de nourriture (de l’adulte vers le jeune) permettrait au juvénile d’apprendre non seulement quels aliments sont convenables, mais aussi quelles vocalisations sont appropriées en contexte d’alimentation [147]. Par ailleurs, les preuves d’un apprentissage social des règles d’interaction régissant les échanges vocaux se multiplient : les jeunes singes apprennent au fil du temps à répondre de manière appropriée, avec le bon délai et au bon moment, aux vocalisations de leurs congénères (e.g. mones de Campbell [148], macaques [6, 149], ouistitis [150]). En ne répondant qu’aux vocalisations émises dans le respect des règles d’échange, les parents joueraient là encore un rôle de tuteur dans l’apprentissage des jeunes [150].

Enfin, à l’âge adulte, quelques études mettant en évidence des capacités d’innovation vocale sont également venues remettre en cause l’idée que le système d’apprentissage chez les singes était strictement fermé (i.e. absence de plasticité vocale tout au long de la vie). Tout d’abord deux exemples anecdotiques chez des chimpanzés [151] et des orangs-outangs [152] qui se sont mis à produire de nouveaux signaux en captivité, respectivement destinés à attirer l’attention des humains (‘extended grunt’ et ‘raspberry’) ou produits par imitation de ces derniers (sifflement). Chez les mones de Campbell aussi des différences entre populations captives et sauvages ont été rapportées. Tandis que les femelles sauvages produisent trois types de cris liés à des types distincts de danger (dangers divers autres que prédation, détection d’un aigle, détection d’un léopard) [61], les femelles captives ne produisent aucun des deux cris d’alarme liés aux prédateurs mais elles émettent le cri associé aux dangers divers ainsi qu’un second cri, innovant, à l’approche d’humains « inquiétants » (e.g. vétérinaire, personne non familière) [153]. La captivité constituerait ainsi une nouvelle niche écologique propice au développement de capacités vocales innovantes [154].

Ces études récentes sont donc venues remettre en question la présupposée totale fixité du répertoire vocal des primates non humains. Le fait que le développement du répertoire vocal des singes soit soumis à un fort déterminisme génétique reste indiscutable, mais au niveau individuel, il existe un certain degré de flexibilité dans la production vocale chez le juvénile qui perdure à l’âge adulte. Les preuves de l’importance de l’expérience et des influences sociales sur le développement de l’utilisation vocale (i.e. émission d’un cri dans un contexte approprié) sont quant à elles nombreuses chez les singes, et présentent de nombreux points communs avec le développement du langage chez l’enfant.

5 Plasticité vocale et « identité sociale » chez l’adulte

Chez l’homme, la voix et la façon de parler encodent de nombreuses informations relatives à l’identité sociale et personnelle du locuteur. Ainsi, l’origine géographique transparaît dans le langage humain sous la forme d’accents ou de dialectes régionaux (i.e. variations liées à la distance spatiale), tandis que l’appartenance à une entité sociale est reflétée par l’existence de dialectes sociaux (i.e. variations liées à la distance sociale) et par un phénomène de convergence vocale (i.e. les amis ou les apparentés font correspondre leur façon de parler) [10, 155–157]. En outre, l’identité personnelle du locuteur, soit des paramètres tels que son sexe, son statut ou sa classe sociale, donne lieu à des variations en termes de phonation, de vocabulaire ou encore de style [156, 158, 159]. Les influences sociales sur la plasticité vocale observée chez l’homme sont donc diverses et variées, et elles affectent le langage à tous les niveaux, de la phonation à la syntaxe en passant par le champ lexical.

Au cours des recherches menées ces 15 dernières années, les facteurs sociaux se sont révélés source, chez les primates non humains, d’un degré de variabilité vocale chez l’adulte jusqu’alors sous-estimé. Ainsi, l’appartenance de l’émetteur à une population donnée se reflète dans la structure acoustique de certains types de cris (i.e. « dialecte phonologique ») [71–73, 160–162], voire dans la composition de son répertoire vocal (présence/absence de types de cris ou de messages encodés, i.e. « dialecte sémantique ») [96, 163]. Les études ont prouvé que les dialectes ne sont pas liés à une divergence génétique entre les populations [71, 161], et que les caractéristiques de l’habitat occupé ne suffisent pas non plus à expliquer les différences inter-groupes observées [72, 73, 160, 161, 164, 165]. Pour expliquer la présence, à un moment donné, de structures acoustiques similaires dans le répertoire de congénères appartenant à une même entité, l’hypothèse d’un phénomène d’apprentissage social semble souvent la plus plausible. Une étude longitudinale chez les macaques a d’ailleurs révélé que les différences inter-populations n’apparaissaient chez les juvéniles qu’après l’âge de 6 ou 7 mois [71]. De plus, une étude portant sur des chimpanzés captifs a mis en évidence une modification de la structure des cris alimentaires lors d’un changement de groupe, cette convergence vocale n’apparaissant qu’après la mise en place de liens sociaux affiliatifs forts entre les individus [166]. Ces résultats soutiennent l’idée que l’expérience sociale joue un rôle prépondérant dans l’acquisition des dialectes.

Au sein même d’un groupe social, des différences interindividuelles liées à l’appartenance de l’émetteur à un réseau affinitaire peut également transparaître dans ses vocalisations. Ce phénomène de partage vocal a notamment été mis en évidence chez les mones de Campbell : les femelles ayant des liens sociaux privilégiés émettent les mêmes variantes de cris de contact (caractérisées par la forme de la modulation de fréquence) alors que les femelles isolées socialement ont des cris divergeant des autres individus [167, 168], et ce sans lien avec leur degré d’apparentement génétique [168]. De plus, le répertoire d’une femelle (i.e. la structure acoustique et le nombre de ses variantes) et l’identité de ses partenaires de partage vocal évoluent au cours du temps, en parallèle de la dynamique de ses affinités au sein du groupe social [76], et ce degré de variabilité acoustique est perçu par les congénères puisqu’ils répondent différemment à une variante présente, une variante passée et une variante inconnue [102]. D’autres cas de convergence de certains paramètres acoustiques entre membres d’un même groupe social ont été observés suite à une perturbation sociale. Ainsi, lors de la formation de nouveaux groupes sociaux, on a pu constater un ajustement des paramètres acoustiques des cris d’un individu en fonction de ceux de son nouveau partenaire [169–171], en parallèle d’une augmentation de l’activité vocale [172], et plus particulièrement une augmentation de la fréquence des échanges vocaux [173–175], qui pourrait faciliter l’ajustement vocal au nouveau partenaire ainsi que la mise en place des relations sociales.

Enfin, l’individu émetteur va également pouvoir donner des informations relatives à son rôle social au sein du groupe par l’intermédiaire de son activité vocale. Le statut social d’un individu est notamment fonction de son sexe, et des différences entre singes mâles et femelles d’un point de vue vocal ont pu être mises en évidence. Qu’elles soient de l’ordre d’une phonation particulière ou de types de cris propres à un sexe, ces différences ont généralement été expliquées par des différences morphologiques et physiologiques [27, 77, 176]. Or dans le cadre d’une approche expérimentale, des mâles se sont révélés capables de produire des cris dits spécifiques aux femelles suite à une stimulation électrique cérébrale [177, 178]. En outre, dans un contexte de perturbation sociale [179, 180] ou de danger imminent [61, 181], des observations anecdotiques ont été faites de femelles produisant des cris dits spécifiques au mâle, lorsque celui-ci était absent ou bien demeurait anormalement silencieux. Le dimorphisme vocal observé refléterait donc l’utilisation préférentielle de certains types de cris par les individus, en fonction de leur rôle social (i.e. protection du groupe pour les mâles adultes versus maintien de la cohésion sociale intra-groupe pour les femelles adultes) [95, 178, 181, 182], plutôt que l’incapacité des individus d’un sexe à produire certains types de cris. Le rang hiérarchique est une autre information relative au statut social de l’individu qui peut transparaître dans la structure acoustique de ses cris [78], ou dans leur utilisation que ce soit en termes de fréquence d’émission [183] ou d’émission de types de cris particuliers [70, 184]. Il est intéressant de noter qu’en cas de changement de statut hiérarchique, on observe un ajustement des paramètres acoustiques [78] ou une apparition/disparation des types de cris spécifiques [70] de telle manière que le message contenu dans les signaux vocaux de l’individu émetteur demeure fiable. Il a d’ailleurs été démontré expérimentalement que cette flexibilité acoustique est perçue et utilisée par les congénères mâles pour évaluer le statut de leur adversaire et ajuster leur réponse [185].

En conclusion, chez les primates non humains comme chez l’homme, l’identité sociale et personnelle transparaissent dans le comportement vocal sous différentes formes, que ce soit en termes de phonation ou d’utilisation d’un vocabulaire particulier. Néanmoins, chez les singes, seuls certains types de cris sont affectés, et du fait de la taille restreinte de leur répertoire vocal, les phénomènes sont de moindre ampleur que ceux observés chez l’homme dont le discours dans son ensemble fait preuve de plasticité.

6 Effet d’audience et règles d’interaction vocale

Chez l’homme, la communication est intentionnelle et directionnelle, visant une audience ou un interlocuteur particulier avec la volonté de lui communiquer un message. Le discours est par exemple modulé en fonction du public visé [50]. On constate l’existence d’interlocuteurs préférentiels, plus familiers [186] ou plus âgés [187–189]. Les conversations sont caractérisées par le respect de règles temporelles telle que le respect d’un délai de réponse (i.e. couper la parole est considéré comme impoli [189]) et l’organisation en tours de parole (i.e. on parle en alternance) [6, 190, 191]. On observe également des phénomènes de persistance (i.e. répétition du message jusqu’à obtention d’une réponse) et d’élaboration (i.e. modification de la structure acoustique) du signal destinés augmenter les chances de succès à poursuivre la conversation [192–194]. Enfin, l’homme est capable d’ajuster sa distance sociale à l’interlocuteur au cours de la conversation grâce à un phénomène de convergence/divergence langagière, phénomène qualifié d’accommodation vocale [195].

Outre son propre statut social, de récentes études chez les primates non humains ont mis en évidence qu’un individu était capable d’ajuster son comportement vocal en fonction de son auditoire, qu’il soit composé de receveurs passifs ou d’interlocuteurs vocalement actifs. Un premier ensemble de travaux a trait à ce qui a été qualifié d’effet audience, c’est-à-dire que l’émission de cris va dépendre de la présence de congénères à proximité. Ainsi, l’identité de ces receveurs potentiels va influer sur le comportement vocal de l’émetteur qui va choisir de ne vocaliser que lorsque certains partenaires sont présents. Dans le cas des cris d’alarme, l’émission d’un signal vocal augmentant le risque de se faire détecter par le prédateur, un individu a tout intérêt à en limiter la production. Aussi, les mâles vervets émettent plus fréquemment des cris d’alarmes si une femelle est à proximité, tandis que les femelles en émettent préférentiellement si des juvéniles sont à proximité [64]. Chez les chimpanzés et les bonobos, l’émission de cris de fonctions diverses par les mâles (cris alimentaires, cris de cohésion lors des déplacements) et les femelles (cris de copulation, cris de salutation envers les mâles dominants) est favorisée ou inhibée par le nombre et le statut des congénères présents (e.g. dominants versus subordonnés, partenaires sociaux préférentiels), mais aussi par l’absence de certains (e.g. dominants) [183, 196–199]. Outre l’identité des partenaires présents, l’individu émetteur va également ajuster son comportement vocal en fonction de la distance le séparant de son audience : choisir de vocaliser ou non [56, 200, 201], ou bien sélectionner le type de cri acoustiquement approprié à une communication courte- versus longue-distance [202]. Enfin, plusieurs études ont révélé que les primates non humains étaient capables d’ajuster leur comportement vocal de manière encore plus complexe d’un point de vue cognitif. Les chimpanzés émettent différents sous-types de cris de détresse en fonction de l’intensité de l’agression ou du statut hiérarchique de l’opposant, mais ils utilisent également ces sous-types de cris stratégiquement : les victimes d’attaques sévères exagèrent la gravité de l’agression qu’elles subissent (en produisant des cris de détresse plus longs et plus aigus, caractéristiques d’agressions extrêmement sévères) si au moins un congénère dans l’audience est de rang égal ou supérieur à l’agresseur [203]. Les cercopithèques à diadème mâles émettent plus de cris d’alarme lorsque les membres de leur groupe sont proches d’un prédateur que lorsqu’ils en sont éloignés, et ce indépendamment de leur propre proximité vis-à-vis du danger [204]. Chez les chimpanzés, la probabilité qu’un cri d’alarme soit émis est plus élevée si l’individu se trouve en présence de congénères qui ignorent le danger (i.e. qui n’ont pas repéré par eux-mêmes la source du danger, ou qui n’ont pas encore eu l’opportunité d’entendre un cri d’alarme) versus des congénères qui sont déjà en possession de cette information [205, 206]. En outre, lors de la manifestation de ce comportement, l’individu adapte sa position spatiale de manière à signaler physiquement la position du danger (e.g. un serpent) et surveille visuellement ses congénères en alternant le regard entre le danger et ses congénères [207].

Un second ensemble de travaux a trait aux caractéristiques des échanges vocaux chez les primates non humains, apparentés à des formes simples de conversations selon plusieurs auteurs puisqu’ils sont caractérisés par le respect d’un certain nombre de règles d’interaction [208–210]. Une première règle temporelle correspond à l’évitement de la superposition des cris (i.e. éviter de se « couper la parole ») en respectant un délai de réponse. Le délai minimum limitant les risques de coupure est généralement de l’ordre de la durée moyenne d’un cri [211], tandis que le délai maximum de réponse assurant la continuité de l’échange vocal est chez la plupart des espèces de primates non humains de l’ordre de la seconde [212]. Il est intéressant de noter que ce délai de réponse peut être modulé en fonction de déterminants sociaux. Par exemple, un individu va répondre plus rapidement à un partenaire auquel il est plus affilié socialement [213]. Une seconde règle temporelle consiste à respecter des tours de paroles, c’est-à-dire à faire en sorte que les deux interlocuteurs émettent leurs cris en alternance (et évitent de crier deux fois de suite) [148, 149, 211, 214]. Une autre règle, qualitative, a trait au fait que certains interlocuteurs vont être préférés. Ainsi, les aînés [149, 150, 211, 215] et les « amis » [16, 209, 213, 216] vont constituer des interlocuteurs préférentiels, recevant plus de réponses que les autres congénères. Enfin, il existe des règles ayant trait à la structure même des cris dont la modulation va permettre d’initier ou de prolonger un échange vocal. Les mâles chimpanzés sont ainsi capables de modifier la structure de leurs cris forts ‘pant-hoots’ (i.e. durée et nombre de certains éléments) afin de faciliter le développement d’un chorus avec un congénère (i.e. émission synchronisée, « en chœur », de cris) [217]. Un macaque est quant à lui capable de moduler son comportement vocal afin d’attirer l’attention d’un partenaire silencieux et d’augmenter la probabilité de recevoir une réponse en émettant de manière répétée des cris « exagérés » (i.e. augmentation de la modulation de fréquence, cris plus longs et plus aigus) [218]. Ces exemples attestent des capacités de persistance (répétition du message jusqu’à obtention d’une réponse) et d’élaboration (modification de la structure acoustique) chez les primates non humains [192–194]. Enfin, l’ajustement de la structure acoustique des cris peut aller jusqu’à copier l’interlocuteur vocalement. En effet, des études ont mis en évidence que dans le cadre d’un d’échange vocal, un individu est capable de sélectionner dans son répertoire le cri le plus proche structurellement de celui utilisé par son partenaire ; phénomène qui a été qualifié de « call matching » [219–221]. Chez les cercopithèques Diane, un phénomène de convergence/divergence acoustique inter-individuelle a même été décrit : les femelles émettent des cris très stéréotypés et individualisables lorsqu’elles se déplacent dans un habitat visuellement dense (besoin de cohésion spatiale) alors qu’elles convergent acoustiquement au cours d’un échange vocal (besoin de cohésion sociale) [219]. Ce phénomène est analogue au processus d’accommodation vocale chez l’homme [195].

La mise en évidence, chez les primates non humains, d’une certaine flexibilité dans l’utilisation des signaux vocaux en fonction du contexte social (modulation en fonction de l’audience ou de l’interlocuteur) a apporté la preuve du caractère intentionnel et directionnel de la communication vocale chez les primates non humains [206], des propriétés jusqu’il y a peu considérées comme étant l’apanage du langage humain. En outre, ces phénomènes apportent également des preuves supplémentaires, en contexte naturel, des capacités de contrôle moteur des vocalisations chez les singes. On retrouve chez les primates non humains des équivalents de nombreuses propriétés caractérisant la prise en compte de l’auditoire lors d’un discours et les conversations chez l’homme. Les différences homme-singes seraient donc, concernant cet aspect du langage, clairement plus quantitatives que qualitatives. Tous ces parallèles sont particulièrement intéressants du fait du rôle clé qu’occupent les conversations dans le maintien et le renforcement des relations sociales chez l’homme [15], comme chez les singes [16].

7 Conclusion et réflexions évolutives

L’objectif de ce travail était de recenser un certain nombre de caractéristiques du langage humain dans une démarche comparative visant à déterminer les parallèles pouvant être tracés entre langage humain et communication vocale des primates non humains, ainsi que les limites devant être posées à ces comparaisons. Les capacités de contrôle de la production vocale chez l’homme sont nettement supérieures à celles des autres primates. Toutefois, l’analyse des structures anatomiques et neuronales sous-tendant cette aptitude a révélé des homologies structurales entre homme et singes, suggérant l’existence de différences quantitatives plus que qualitatives. Les singes sont capables de contrôler l’expression et de moduler leur signal vocal dans des paradigmes expérimentaux mais aussi en situation naturelle sociale (e.g. effet audience, règles conversationnelles), ce qui atteste d’un certain degré de contrôle moteur vocal, en plus d’apporter la preuve du caractère intentionnel et directionnel d’au moins certaines de leurs vocalisations.
D’autre part, si les parallèles homme-singes sur le plan de l’encodage d’informations émotionnelles et identitaires dans les vocalisations sont parmi les plus aisés à tracer, la limite à l’analogie reste difficile à fixer lorsque l’on aborde la question de la sémanticité. En effet, si les primates non humains possèdent des signaux référentiels avec un caractère sémantique avéré, on ne retrouve pas chez les singes la faculté de déplacement caractéristique du langage humain. En lien avec ceci, les capacités combinatoires complexes (e.g. variations systématiques du message par affixation ou combinaison d’éléments) récemment mises en évidence chez les primates non humains suggèrent des analogies plus poussées entre homme et animal que celles considérées auparavant, mais le degré de complexité des mécanismes cognitifs sous-tendant ces combinaisons chez les singes reste inconnu. La limite de l’analogie concernant la référentialité et les propriétés combinatoires semble donc ne pas se situer sur le plan de la production, mais plutôt sur le plan de la représentation et de l’intégration de ces signaux au niveau cognitif. Des études supplémentaires sont nécessaires avant de pouvoir déterminer avec certitude où se situe la limite à l’analogie.
Enfin, l’étude de la communication vocale chez les singes à travers le prisme de la vie sociale, qu’il s’agisse du développement vocal chez les jeunes ou de la flexibilité vocale chez l’adulte (encodage de l’identité sociale, ajustement à l’audience, règles conversationnelles), suggère de nombreuses similitudes entre homme et animal. L’influence des partenaires sociaux est essentielle au développement et joue fortement sur l’utilisation des vocalisations tout au long de la vie des individus, chez l’homme comme chez les singes. Ici encore, les différences entre homme et animal semblent prendre une dimension essentiellement quantitative, sur le plan de la production d’une part (capacité phonatoires) et en termes de capacités cognitives (notamment d’apprentissage) d’autre part.
De manière globale, les divers travaux considérés dans cette revue corroborent l’idée d’une similarité entre langage et communication vocale des primates non humains, impliquant à la fois des analogies importantes (notamment sur le plan qualitatif) mais aussi des différences. Les différences décrites sont surtout d’ordre quantitatif (e.g. en termes de flexibilité de production et d’utilisation), mais aussi d’ordre qualitatif notamment sur le plan de la cognition (e.g. capacités d’abstraction, de représentation mentale, de générativité et de récursivité). Toutefois, des études de plus en plus nombreuses proposant des paradigmes expérimentaux de plus en plus pertinents pour les animaux révèlent des capacités cognitives jusqu’alors insoupçonnées. Par exemple, des expériences ont démontré que l’homme et les singes possèdent un système similaire de dénombrement d’unités perçues dans différentes modalités sensorielles [222], d’ordination [223] et d’addition de valeurs numériques [224].

S’il est difficile d’atteindre un consensus quant aux identités (sous-entendant une homologie d’un point de vue évolutif, soit une continuité évolutive : propriété présente chez deux taxons apparentés qui l’ont héritée d’un ancêtre commun) et aux différences partielles (analogies résultant d’une évolution convergente : apparition indépendante d’une même propriété dans deux taxons éloignés) ou majeures (résultant d’une évolution divergente : deux taxons éloignés présentent des propriétés distinctes) entre homme et animal, un consensus existe quant à l’existence d’une continuité dans la lignée évolutive ayant conduit jusqu’à l’homme actuel qui partage, de fait, un ancêtre commun avec les primates non humains. Le langage est un phénomène complexe qui ne peut être apparu de novo mais qui a au contraire, sans aucun doute, une longue histoire évolutive. Son évolution est probablement le fruit de pressions sélectives qui se sont exercées, et s’exercent aujourd’hui encore, sur la communication d’autres espèces. Les primates constituent un ordre extrêmement diversifié sur les plans morphologique, écologique, social, et communicatif notamment. Des études comparatives entre plusieurs espèces de primates non humains ont permis d’identifier plusieurs pressions de sélection majeures et les adaptations qu’elles ont engendrées. Les adaptations, sur le plan communicatif, peuvent avoir pour objet le système de communication (e.g. type et nombre de cris du répertoire, modalité(s) sensorielle(s) impliquée(s)) ou bien la structure même des signaux (e.g. tonalité, durée, intensité, degré de variabilité des signaux).
L’habitat d’une espèce constitue une première force de sélection majeure qui favorise l’utilisation de certaines modalités sensorielles et conditionne la structure même des signaux (discrets versus gradués). Ainsi, les singes vivant en forêt tropicale, où les feuillages denses limitent la visibilité, utilisent plus la modalité acoustique que des espèces vivant en savane chez lesquelles on trouve des éléments de communication gestuelle par exemple [225–227]. De manière similaire, les espèces vivant dans des milieux dans lesquels la communication est malaisée (e.g. fort bruit de fond, dégradation du son, manque de visibilité) possèdent des signaux très distincts les uns des autres (i.e. répertoire discret) évitant la confusion de signaux proches structurellement [228].
La prédation constitue une seconde pression de sélection majeure sur l’évolution de la communication et de la cognition chez les primates non humains [229, 230]. Les animaux subissant des attaques de divers prédateurs, exigeant des réactions comportementales adaptées différentes, ont développé des cris référentiels pour signaler la nature du danger sous forme de cris simples, complexes ou de séquences [59, 60, 89, 231, 232]. De plus, la structure fine des signaux varie également en fonction des stratégies anti-prédatrices : les espèces cryptiques (i.e. discrètes) présentent des cris moins détectables (e.g. de faible intensité, de basse tonalité) et vocalisent moins souvent [233, 234].
Enfin, la vie sociale constitue un moteur clé de l’évolution de la communication chez l’animal. C’est particulièrement vrai chez les primates pour lesquels la communication joue un rôle essentiel dans la constitution et le maintien de liens sociaux forts entre les membres d’un groupe [15, 235]. La théorie d’une coévolution entre vie sociale et communication fait le postulat que le degré de complexité du système social d’une espèce est en lien avec la complexification de ses capacités communicatives [86, 236]. Plusieurs études sont venues corroborer cette théorie en démontrant que la taille du groupe social, sa composition, et la force du lien social entre les congénères influencent le degré de complexité du répertoire vocal (e.g. nombre de types de cris, existence de combinaisons, variabilité structurale des signaux) [86, 235–237], ainsi que le degré de sensibilité auditive des animaux [238]. En outre, plusieurs études portant sur d’autres modalités ont révélé une influence de la complexité sociale sur la complexité de la communication gestuelle (e.g. taille du répertoire de geste, complexité de la dynamique de communication) [239], faciale (e.g. taille du répertoire de mouvements faciaux) [240] et olfactive (e.g. complexité chimique des sécrétions glandulaires) [241], suggérant un lien fort et plus général entre socialité et communication.

Le fait que des pressions de sélection comparables s’appliquent à diverses modalités communicatives nous incite à étendre la comparaison homme-animal à la recherche de parallèles supplémentaires avec le langage humain. De nombreuses investigations se sont notamment portées sur la communication gestuelle des primates non humains, et ont démontré l’existence de caractéristiques similaires à celles du langage (voir [5] pour une revue) telles que la référentialité [242, 243], la sensibilité à l’audience et à son état attentionnel [5, 244, 245], l’intentionnalité [246, 247], une utilisation flexible [248, 249] pouvant être liée à un apprentissage [250], ainsi que des analogies neuronales et anatomiques entre homme et primates non humains quant à la production de gestes communicatifs [251, 252]. Ainsi, de plus en plus de spécialistes proposent d’adopter une approche multimodale de la communication afin d’évaluer de manière plus exhaustive les différents facteurs et mécanismes impliqués dans son évolution [253–256].

Bibliographie

1. BICKERTON D., 1995, Language and human behavior, Seattle, University of Washington Press.
2. CHOMSKY N., 1981, ‘Knowledge of Language : its elements and origins’, Philosophical Transactions of the Royal Society of London, Series B, Biological Sciences, 295, pp. 223–234.
3. PINKER S., 1994, The language instinct. How the mind creates language, New-York, Harper Perennial Modern Classics.
4. FITCH W.T., 2010, The Evolution of Language, Cambridge, UK, Cambridge University Press.
5. MEGUERDITCHIAN A., COCHET H., VAUCLAIR J., 2011, ‘From gesture to language’, in VILAIN A., SCHWARTZ J.-L., ABRY C., VAUCLAIR J., eds., Primate communication and human language : Vocalisation, gestures, imitation and deixis in humans and non-humans, Amsterdam, John Benjamins, pp. 91–118.
6. MASATAKA N., 2003, The onset of language, Cambridge, UK, Cambridge University Press.
7. SEYFARTH R.M., CHENEY D.L., BERGMAN T.J., 2005, ‘Primate social cognition and the origins of language’, Trends in Cognitive Sciences, 9, pp. 264–266.
8. SNOWDON C.T., HAUSBERGER M., 1997, Social influences on vocal development, Cambridge, UK, Cambridge University Press.
9. HAUSER M.D., CHOMSKY N., FITCH W.T., 2002, ‘The faculty of language : What is it, who has it, and how did it evolve ?’, Science, 298, pp. 1569–1579.
10. LOCKE J.L., SNOW C., 1997, ‘Social influences on vocal learning in human and nonhuman primates’, in SNOWDON C.T., HAUSBERGER M., eds., Social influences on vocal development, Cambridge, UK, Cambridge University Press, pp. 274–292.
11. MARLER P., TENAZA R., 1977, ‘Signaling behavior of apes with special reference to vocalization’, in SEBEOK T.A., ed., How animals communicate, Bloomington, Indiana University Press, pp. 965–1033.
12. PAPOUSEK M., 2007, ‘Communication in early infancy : An arena of intersubjective learning’, Infant Behavior and Development, 30, pp. 258–266.
13. EGNOR R., MILLER C., HAUSER M.D., 2005, ‘Nonhuman primate communication’, in BROWN K., ed., Encyclopedia of Language & Linguistics – Second edition, Elsevier.
14. SMITH W.J., 1965, ‘Message, meaning, and context in ethology’, American Naturalist, 99, pp. 405–409.
15. DUNBAR R.I.M., 1996, Grooming, gossip, and the evolution of language, Cambridge, MA, Harvard University Press.
16. ARLET M., JUBIN R., MASATAKA N., LEMASSON A., 2015, ‘Grooming-at-a-distance by exchanging calls in nonhuman primates’, Biology Letters, 11, pp. 20150711.
17. BRANDONE A.C., SALKIND S.J., GOLINKOFF R.M., HIRSH-PASEK K., 2006, ‘Language development’, in BEAR G.G., MINKE K.M., eds., Children’s needs III : Development, prevention, and intervention, Washington DC, National Association of School Psychologists, pp. 499–514.
18. CHOMSKY N., 1965, Aspects of the theory of syntax, Cambridge, MA, MIT Press.
19. HOCKETT C.F., 1960, ‘The origin of speech’, Scientific American, 203, pp. 88–111.
20. LEMASSON A., OUATTARA K., ZUBERBÜHLER K., 2013, ‘Exploring the gaps between primate calls and human language’, in BOTHA R., EVERAERT M., eds., The evolutionary emergence of language : Evidence and inference, Utrecht, Oxford University Press, pp. 181–203.
21. FITCH W.T., 2000, ‘The evolution of speech : A comparative review’, Trends in Cognitive Sciences, 4, pp. 258–266.
22. GHAZANFAR A.A., RENDALL D., 2008, ‘Evolution of human vocal production’, Current Biology, 18, pp. R457–R460.
23. JÜRGENS U., 2002, ‘Neural pathways underlying vocal control’, Neuroscience & Biobehavioral Reviews, 26, pp. 235–258.
24. HAMMERSCHMIDT K., FISCHER J., 2008, ‘Constraints in primate vocal production’, in OLLER D.K., GRIEBEL U., eds., The evolution of communicative creativity : Complexity, creativity, and adaptability in human and animal communication, Cambridge, MA, MIT Press, pp. 93–119.
25. JÜRGENS U., 2009, ‘The neural control of vocalization in mammals : A review’, Journal of Voice, 23, pp. 1–10.
26. LIEBERMAN P., 1968, ‘Primate vocalizations and human linguistic ability’, Journal of the Acoustical Society of America, 44, pp. 1574–1584.
27. RIEDE T., 2010, ‘Elasticity and stress relaxation of rhesus monkey (Macaca mulatta) vocal folds’, Journal of Experimental Biology, 213, pp. 2924–2932.
28. RIEDE T., BRONSON E., HATZIKIROU H., ZUBERBÜHLER K., 2005, ‘Vocal production mechanisms in a non-human primate : Morphological data and a model’, Journal of Human Evolution, 48, pp. 85–96.
29. AITKEN P.G., 1981, ‘Cortical control of conditioned and spontaneous vocal behavior in rhesus monkeys’, Brain and Language, 13, pp. 171–184.
30. JÜRGENS U., 1995, ‘Neuronal control of vocal production in nonhuman and human primates’, in ZIMMERMANN E., NEWMAN J.D., JÜRGENS U., eds., Current topics in primate vocal communication, New-York, Plenum, pp. 199–206.
31. PLOOG D., 1981, ‘Neurobiology of primate audio-vocal behavior’, Brain Research Reviews, 3, pp. 35–61.
32. WANG X., 2000, ‘On cortical coding of vocal communication sounds in primates’, Proceedings of the National Academy of Sciences, 97, pp. 11843–11849.
33. MAGOUN H.W., ATLAS D., INGERSOLL E.H., RANSON S.W., 1937, ‘Associated facial, vocal and respiratory components of emotional expression : An experimental study’, Journal of Neurology and Psychopathology, 17, pp. 241–255.
34. NEWMAN J.D., 2007, ‘Neural circuits underlying crying and cry responding in mammals’, Behavioural Brain Research, 182, pp. 155–165.
35. FICHTEL C., HAMMERSCHMIDT K., JÜRGENS U., 2001, ‘On the vocal expression of emotion. A multi-parametric analysis of different states of aversion in the squirrel monkey’, Behaviour, 138, pp. 97–116.
36. MILLER C.T., FLUSBERG S., HAUSER M.D., 2003, ‘Interruptibility of long call production in tamarins : Implications for vocal control’, Journal of Experimental Biology, 206, pp. 2629–2639.
37. ROY S., MILLER C.T., GOTTSCH D., WANG X., 2011, ‘Vocal control by the common marmoset in the presence of interfering noise’, Journal of Experimental Biology, 214, pp. 3619–3629.
38. KODA H., OYAKAWA C., KATO A., MASATAKA N., 2007, ‘Experimental evidence for the volitional control of vocal production in an immature gibbon’, Behaviour, 144, pp. 681–692.
39. COUDÉ G., FERRARI P.F., RODÀ F., MARANESI M., BORELLI E., VERONI V., MONTI F., ROZZI S., FOGASSI L., 2011, ‘Neurons controlling voluntary vocalization in the macaque ventral premotor cortex’, PLoS ONE, 6, pp. e26822.
40. HAGE S.R., NIEDER A., 2013, ‘Single neurons in monkey prefrontal cortex encode volitional initiation of vocalizations’, Nature Communications, 4, pp. 2409.
41. BRUMM H., VOSS K., KÖLLMER I., Todt D., 2004, ‘Acoustic communication in noise : Regulation of call characteristics in a New World monkey’, Journal of Experimental Biology, 207, pp. 443–448.
42. EGNOR S.E.R., HAUSER M.D., 2006, ‘Noise-induced vocal modulation in cotton-top tamarins (Saguinus oedipus)’, American Journal of Primatology, 68, pp. 1183–1190.
43. SIMÕES C.S., VIANNEY P.V.R., DE MOURA M.M., FREIRE M.A.M., MELLO L.E., SAMESHIMA K., ARAÚJO J.F., NICOLELIS M.A.L., MELLO C.V., RIBEIRO S., 2010, ‘Activation of frontal neocortical areas by vocal production in marmosets’, Frontiers in Integrative Neuroscience, 4, pp. 123.
44. LIEBERMAN P., 2007, ‘The evolution of human speech. Its anatomical and neural bases.’, Current Anthropology, 48, pp. 39–66.
45. HAYES K.J., NISSEN C.H., 1971, ‘Higher mental functions of a home-raised chimpanzee’, in SCHRIER A.M., STOLLNITZ F., eds., Behavior of nonhuman primates : Modern research trends, New-York, Academic Press, pp. 59–115.
46. LAMEIRA A.R., HARDUS M.E., KOWALSKY B., DE VRIES H., SPRUIJT B.M., STERCK E.H., SHUMAKER R.W., WICH S.A., 2013, ‘Orangutan (Pongo spp.) whistling and implications for the emergence of an open-ended call repertoire : A replication and extension’, Journal of the Acoustical Society of America, 134, pp. 2326–2335.
47. BREITENSTEIN C., VAN LANCKER D., DAUM I., 2010, ‘The contribution of speech rate and pitch variation to the perception of vocal emotions in a German and an American sample’, Cognition and Emotion, 15, pp. 57–79.
48. SCHERER K.R., 2003, ‘Vocal communication of emotion : A review of research paradigms’, Speech Communication, 40, pp. 227–256.
49. SCHERER K.R., BANSE R., WALLBOTT H.G., 2001, ‘Emotion inferences from vocal expression correlate across languages and cultures’, Journal of Cross-Cultural Psychology, 32, pp. 76– 92.
50. BELL A., 1984, ‘Language style as audience design’, Language in Society, 13, pp. 145–204.
51. MORTON E.S., 1977, ‘On the occurrence and significance of motivation-structural rules in some bird and mammal sounds’, The American Naturalist, 111, pp. 855–869.
52. ALTENMÜLLER E., SCHMIDT S., ZIMMERMANN E., editors, 2013, Evolution of emotional communication. From sounds in nohuman mammals to speech and music in man, Oxford, Oxford University Press.
53. LEMASSON A., OUATTARA K., BOUCHET H., ZUBERBÜHLER K., 2010, ‘Speed of call delivery is related to context and caller identity in Campbell’s monkey males’, Naturwissenschaften, 97, pp. 1–5.
54. LEMASSON A., REMEUF K., ROSSARD A., ZIMMERMANN E., 2012, ‘Cross-taxa similarities in affect-induced changes of vocal behavior and voice in arboreal monkeys’, PLoS ONE, 7, pp. e45106.
55. DITTUS W.P.J., 1984, ‘Toque macaque food calls : Semantic communication concerning food distribution in the environment’, Animal behaviour, 32, pp. 470–477.
56. ROUSH R.S., SNOWDON C.T., 2000, ‘Quality, quantity, distribution and audience effects on food calling in cotton-top tamarins’, Ethology, 106, pp. 673–690.
57. SLOCOMBE K.E., ZUBERBÜHLER K., 2005, ‘Functionally referential communication in a chimpanzee’, Current Biology, 15, pp. 1779–1784.
58. SEYFARTH R.M., CHENEY D.L., MARLER P., 1980, ‘Vervet monkey alarm calls : Semantic communication in a free-ranging primate’, Animal Behaviour, 28, pp. 1070–1094.
59. ZUBERBÜHLER K., 2000, ‘Referential labelling in Diana monkeys’, Animal Behaviour, 59, pp. 917–927.
60. OUATTARA K., LEMASSON A., ZUBERBÜHLER K., 2009, ‘Campbell’s monkeys use affixation to alter call meaning’, PLoS ONE, 4, pp. e7808.
61. OUATTARA K., ZUBERBÜHLER K., N’GORAN E.K., GOMBERT J.-E., LEMASSON A., 2009, ‘The alarm call system of female Campbell’s monkeys’, Animal Behaviour, 78, pp. 35–44.
62. WHEELER B.C., 2010, ‘Production and perception of situationally variable alarm calls in wild tufted capuchin monkeys (Cebus apella nigritus)’, Behavioral Ecology and Sociobiology, 64, pp. 989–1000.
63. PFEFFERLE D., HEISTERMANN M., HODGES J.K., FISCHER J., 2008, ‘Male Barbary macaques eavesdrop on mating outcome : A playback study’, Animal Behaviour, 75, pp. 1885–1891.
64. CHENEY D.L., SEYFARTH R.M., 1990, How monkeys see the world, Chicago, University of Chicago Press.
65. ZUBERBÜHLER K., 2000, ‘Interspecies semantic communication in two forest primates’, Proceedings of the Royal Society of London B, 267, pp. 713–718.
66. ZUBERBÜHLER K., 2002, ‘A syntactic rule in forest monkey communication’, Animal Behaviour, 63, pp. 293–299.
67. ZUBERBÜHLER K., NOË R., SEYFARTH R.M., 1997, ‘Diana monkey long-distance calls : Messages for conspecifics and predators’, Animal Behaviour, 53, pp. 589–604.
68. ZUBERBÜHLER K., CHENEY D.L., SEYFARTH R.M., 1999, ‘Conceptual semantics in a nonhuman primate’, Journal of Comparative Psychology, 113, pp. 33–42.
69. MARLER P., EVANS C.S., HAUSER M.D., 1992, ‘Animal signals : motivational, referential, or both ?’, in PAPOUSEK H., JÜRGENS U., PAPOUSEK M., eds., Nonverbal vocal communication : Comparative and developmental approaches, Cambridge, UK, Cambridge University Press, pp. 66–86.
70. GAUTIER J.-P., 1988, ‘Interspecific affinities among guenons as deduced from vocalizations’, in A primate radiation : Evolutionary biology of the African guenons, Cambridge, UK, Cambridge University Press, pp. 194–226.
71. TANAKA T., SUGIURA H., MASATAKA N., 2006, ‘Cross-sectional and longitudinal studies of the development of group differences in acoustic features of coo calls in two groups of Japanese macaques’, Ethology, 112, pp. 7–21.
72. BRAUNE P., SCHMIDT S., ZIMMERMANN E., 2005, ‘Spacing and group coordination in a nocturnal primate, the golden brown mouse lemur (Microcebus ravelobensis) : The role of olfactory and acoustic signals’, Behavioral Ecology and Sociobiology, 58, pp. 587–596.
73. CROCKFORD C., HERBINGER I., VIGILANT L., BOESCH C., 2004, ‘Wild chimpanzees produce group-specific calls : A case for vocal learning ?’, Ethology, 110, pp. 221–243.
74. LEVRÉRO F., CARRETE-VEGA G., HERBERT A., LAWABI I., COURTIOL A., WILLAUME E., KAPPELER P.M., CHARPENTIER M.J.E., 2015, ‘Social shaping of voices does not impair phenotype matching of kinship in mandrills’, Nature Communications, 6, pp. 7609.
75. RENDALL D., RODMAN P.S., EMOND R.E., 1996, ‘Vocal recognition of individuals and kin in free-ranging rhesus monkeys’, Animal Behaviour, 51, pp. 1007–1015.
76. LEMASSON A., HAUSBERGER M., 2004, ‘Patterns of vocal sharing and social dynamics in a captive group of Campbell’s monkeys (Cercopithecus campbelli campbelli)’, Journal of Comparative Psychology, 118, pp. 347–359.
77. EY E., PFEFFERLE D., FISCHER J., 2007, ‘Do age- and sex-related variations reliably reflect body size in non-human primate vocalizations ? A review’, Primates, 48, pp. 253–267.
78. FISCHER J., KITCHEN D.M., SEYFARTH R.M., CHENEY D.L., 2004, ‘Baboon loud calls advertise male quality : Acoustic features and their relation to rank, age, and exhaustion’, Behavioral Ecology and Sociobiology, 56, pp. 140–148.
79. CEUGNIET M., IZUMI A., 2004, ‘Vocal individual discrimination in Japanese monkeys’, Primates, 45, pp. 119–128.
80. PRICE T., ARNOLD K., ZUBERBÜHLER K., Semple S., 2009, ‘Pyow but not hack calls of the male putty-nosed monkey (Cercopithecus nictitans) convey information about caller identity’, Behaviour, 146, pp. 871–888.
81. LEMASSON A., PALOMBIT R.A., JUBIN R., 2008, ‘Friendships between males and lactating females in a free-ranging group of olive baboons (Papio hamadryas anubis) : Evidence from playback experiments’, Behavioral Ecology and Sociobiology, 62, pp. 1027–1035.
82. BOUCHET H., BLOIS-HEULIN C., PELLIER A.-S., ZUBERBÜHLER K., LEMASSON A., 2012, ‘Acoustic variability and individual distinctiveness in the vocal repertoire of red-capped mangabeys (Cercocebus torquatus)’, Journal of Comparative Psychology, 126, pp. 45–56.
83. BRISEÑO-JARAMILLO M., ESTRADA A., LEMASSON A., 2015, ‘Individual voice recognition and an auditory map of neighbours in free-ranging black howler monkeys (Alouatta pigra)’, Behavioral Ecology and Sociobiology, 69, pp. 13–25.
84. LEMASSON A., HAUSBERGER M., 2011, ‘Acoustic variability and social significance of calls in female Campbell’s monkeys (Cercopithecus campbelli campbelli)’, The Journal of the Acoustical Society of America, 129, pp. 3341–3352.
85. SNOWDON C.T., ELOWSON A.M., ROUSH R.S., 1997, ‘Social influences on vocal development in New World primates’, in SNOWDON C.T., HAUSBERGER M., eds., Social influences on vocal development, Cambridge, UK, Cambridge University Press, pp. 234–248.
86. BOUCHET H., BLOIS-HEULIN C., LEMASSON A., 2013, ‘Social complexity parallels vocal complexity : A comparison of three non-human primate species’, Frontiers in Psychology, 4, pp. 390.
87. RENDALL D., OWREN M.J., RODMAN P.S., 1998, ‘The role of vocal tract filtering in identity cueing in rhesus monkey (Macaca mulatta) vocalizations’, The Journal of the Acoustical Society of America, 103, pp. 602–614.
88. RENDALL D., NOTMAN H., OWREN M.J., 2009, ‘Asymmetries in the individual distinctiveness and maternal recognition of infant contact calls and distress screams in baboons’, The Journal of the Acoustical Society of America, 125, pp. 1792–1805.
89. OUATTARA K., LEMASSON A., ZUBERBÜHLER K., 2009, ‘Campbell’s monkeys concatenate vocalizations into context-specific call sequences’, Proceedings of the National Academy of Sciences, 106, pp. 22026–22031.
90. DE BOER B., SANDLER W., KIRBY S., 2012, ‘New perspectives on duality of patterning : Introduction to the special issue’, Language and Cognition, 4, pp. 251–259.
91. COLLIER K., BICKEL B., VAN SCHAIK C.P., MANSER M.B., TOWNSEND S.W., 2014, ‘Language evolution : Syntax before phonology ?’, Proceedings of the Royal Society of London B, 281, pp. 20140263.
92. HAUSER M.D., 2000, ‘A primate dictionary ? Decoding the function and meaning of another species’ vocalizations’, Cognitive Science, 24, pp. 445–475.
93. ZUBERBÜHLER K., LEMASSON A., 2013, ‘Primate communication : Meaning from strings of calls’, in LOWENTHAL F., LEFEBVRE L., eds., Language and recursion, New-York, Springer, pp. 115–125.
94. ARONOFF M., FUDEMAN K., 2011, What is morphology ? (2nd edition), Oxford, Wiley Blackwell.
95. BOUCHET H., PELLIER A.-S., BLOIS-HEulin C., LEMASSON A., 2010, ‘Sex differences in the vocal repertoire of adult red-capped mangabeys (Cercocebus torquatus) : A multi-level acoustic analysis’, American Journal of Primatology, 72, pp. 360–375.
96. SCHLENKER P., CHEMLA E., ARNOLD K., LEMASSON A., OUATTARA K., KEENAN S., STEPHAN C., RYDER R., ZUBERBÜHLER K., 2014, ‘Monkey semantics : Two “dialects” of Campbell’s monkey alarm calls’, Linguistics and Philosophy, 37, pp. 439–501.
97. COYE C., OUATTARA K., ZUBERBÜHLER K., LEMASSON A., 2015, ‘Suffixation influences receivers’ behaviour in non-human primates’, Proceedings of the Royal Society of London B, 282, pp. 20150265.
98. KUHN J., KEENAN S., ARNOLD K., LEMASSON A., en révision, ‘On the /-oo/ “suffix” of Campbell’s monkeys (C. campbelli)’, Linguistic Inquiry.
99. CROCKFORD C., BOESCH C., 2005, ‘Call combinations in wild chimpanzees’, Behaviour, 142, pp. 397–421.
100. CANDIOTTI A., ZUBERBÜHLER K., LEMASSON A., 2012, ‘Context-related call combinations in female Diana monkeys’, Animal Cognition, 15, pp. 327–339.
101. COYE C., ZUBERBÜHLER K., LEMASSON A., sous presse, ‘Morphologically structured vocalisations in female Diana monkeys’, Animal Behaviour.
102. LEMASSON A., HAUSBERGER M., ZUBERBÜHLER K., 2005, ‘Socially meaningful vocal plasticity in adult Campbell’s monkeys’, Journal of Comparative Psychology, 119, pp. 220–229.
103. CLAY Z., ZUBERBÜHLER K., 2009, ‘Food-associated calling sequences in bonobos’, Animal Behaviour, 77, pp. 1387–1396.
104. CLAY Z., ZUBERBÜHLER K., 2011, ‘Bonobos extract meaning from call sequences’, PLoS ONE, 6, pp. e18786.
105. ARNOLD K., ZUBERBÜHLER K., 2006, ‘Language evolution : Semantic combinations in primate calls’, Nature, 441, pp. 303–303.
106. ARNOLD K., ZUBERBÜHLER K., 2008, ‘Meaningful call combinations in a non-human primate’, Current Biology, 18, pp. R202–R203.
107. CÄSAR C., ZUBERBÜHLER K., YOUNG R.J., BYRNE R.W., 2013, ‘Titi monkey call sequences vary with predator location and type’, Biology Letters, 9, pp. 20130535.
108. CLARKE E., REICHARD U.H., ZUBERBÜHLER K., 2006, ‘The syntax and meaning of wild gibbon songs’, PLoS ONE, 1, pp. e73.
109. MURPHY D., LEA S.E.G., ZUBERBÜHLER K., 2013, ‘Male blue monkey alarm calls encode predator type and distance’, Animal Behaviour, 85, pp. 119–125.
110. YIP M.J., 2006, ‘The search for phonology in other species’, Trends in Cognitive Sciences, 10, pp. 442–446.
111. VIHMAN M.M., MACKEN M.A., MILLER R., SIMMONS H., MILLER J., 1985, ‘From babbling to speech : A re-assessment of the continuity issue’, Language, 61, pp. 397–445.
112. MASATAKA N., 1992, ‘Early ontogeny of vocal behavior of Japanese infants in response to maternal speech’, Child Development, 63, pp. 1177–1185.
113. HUTTENLOCHER J., HAIGHT W., BRYK A., SELTZER M., LYONS T., 1991, ‘Early vocabulary growth : Relation to language input and gender’, Developmental Psychology, 27, pp. 236–248.
114. DORE J., 1974, ‘A pragmatic description of early language development’, Journal of Psycholinguistic Research, 3, pp. 343–350.
115. NINIO A., SNOW C.E., 1996, Pragmatic devlopment. Essays in developmental science, Boulder, Westview Press.
116. RONDAL J.-A., ESPERET E., GOMBERT J.-E., THIBAULT J.-P., COMBLAIN A., 1999, ‘Développement du langage oral’, in Rondal J.-A., Esperet E., eds., Manuel de psychologie de l’enfant, Sprimont, Belgium, Mardaga, pp. 479–564.
117. MASATAKA N., 1993, ‘Effects of contingent and noncontingent maternal stimulation on the vocal behaviour of three- to four-month-old Japanese infants’, Journal of Child Language, 20, pp. 303–312.
118. FROMKIN V., KRASHEN S., CURTISS S., RIGLER D., RIGLER M., 1974, ‘The development of language in Genie : A case of language acquisition beyond the “critical period”’, Brain and Language, 1, pp. 81–107.
119. ITARD J.-M.-G., 1932, The wild boy of Aveyron (Rapports et mémoires sur le sauvage de l’Aveyron), New-York, The Century Co.
120. SINGH J.A.L., ZINGG R.M., 1966, Wolf-children and feral man, Hamden, Archon Books.
121. NEWMAN J.D., SYMMES D., 1982, ‘Inheritance and experience in the acquisition of primate acoustic behavior’, in SNOWDON C.T., BROWN C.H., PETERSON M.R., eds., Primate communication, Cambridge, UK, Cambridge University Press, pp. 259–278.
122. SEYFARTH R.M., CHENEY D.L., 1997, ‘Some general features of vocal development in nonhuman primates.’, in SNOWDON C.T., HAUSBERGER M., eds., Social influences on vocal development, Cambridge, UK, Cambridge University Press, pp. 249–273.
123. HARLOW H.F., 1958, ‘The nature of love’, American Psychologist, 13, pp. 573–685.
124. NEWMAN J.D., SYMMES D., 1974, ‘Vocal pathology in socially deprived monkeys’, Developmental Psychobiology, 7, pp. 351–358.
125. WINTER P., HANDLEY P., PLOOG D., SCHOTT D., 1973, ‘Ontogeny of squirrel monkey calls under normal conditions and under acoustic isolation’, Behaviour, 47, pp. 230–239.
126. BROCKELMAN W.Y., SCHILLING D., 1984, ‘Inheritance of stereotyped gibbon calls’, Nature, 312, pp. 634–636.
127. GEISSMANN T., 1984, ‘Inheritance of song parameters in the gibbon song, analyzed in 2 hybrid gibbons (Hylobates pileatus x H. lar)’, Folia Primatologica, 42, pp. 216–235.
128. OWREN M.J., DIETER J.A., SEYFARTH R.M., CHENEY D.L., 1992, ‘“Food” calls produced by adult female rhesus (Macaca mulatta) and Japanese (M. fuscata) macaques, their normally-raised offspring, and offspring cross-fostered between species’, Behaviour, 120, pp. 218–231.
129. THINH V.N., HALLAM C., ROOS C., HAMMERSCHMIDT K., 2011, ‘Concordance between vocal and genetic diversity in crested gibbons’, BMC Evolutionary Biology, 11, pp. 36.
130. EGNOR R., HAUSER M.D., 2004, ‘A paradox in the evolution of primate vocal learning’, Trends in Neurosciences, 27, pp. 649–654.
131. HAMMERSCHMIDT K., NEWMAN J.D., CHAMPOUX M., SUOMI S.J., 2000, ‘Changes in rhesus macaque “coo” vocalizations during early development’, Ethology, 106, pp. 873–886.
132. HAMMERSCHMIDT K., FREUDENSTEIN T., JÜRGENS U., 2001, ‘Vocal development in squirrel monkeys’, Behaviour, 138, pp. 1179–1204.
133. ELOWSON A.M., SNOWDON C.T., SWEET C.J., 1992, ‘Ontogeny of trill and J-call vocalizations in the pygmy marmoset, Cebuella pygmaea’, Animal Behaviour, 43, pp. 703–715.
134. HAUSER M.D., 1989, ‘Ontogenetic changes in the comprehension and production of vervet monkey (Cercopithecus aethiops) vocalizations’, Journal of Comparative Psychology, 103, pp. 149–158.
135. PISTORIO A.L., VINTCH B., WANG X., 2006, ‘Acoustic analysis of vocal development in a New World primate, the common marmoset (Callithrix jacchus)’, Journal of the Acoustical Society of America, 120, pp. 1655–1670.
136. SNOWDON C.T., ELOWSON A.M., 2001, ‘“Babbling” in pygmy marmosets : Development after infancy’, Behaviour, 138, pp. 1235–1248.
137. TAKAHASHI D.Y., FENLEY A.R., TERAMOTO Y., NARAYANAN D.Z., BORJON J.I., HOLMES P., GHAZANFAR A.A., 2015, ‘The developmental dynamics of marmoset monkey vocal production’, Science, 349, pp. 734–738.
138. KODA H., LEMASSON A., OYAKAWA C., RIZALDI, JOKO P., MASATAKA N., 2013, ‘Possible role of mother-daughter vocal interactions on the development of species-specific song in gibbons’, PLoS ONE, 8, pp. e71432.
139. NAGUIB M., CLAYTON N.S., ZUBERBÜHLER K., JANIK V.M., 2009, Advances in the study of behavior, Volume 40, San Diego, Elsevier Academic Press.
140. SNOWDON C.T., 1997, ‘Affiliative processes and vocal development’, Annals of the New York Academy of Sciences, 807, pp. 340–351.
141. GOUZOULES H., GOUZOULES S., 1989, ‘Design features and developmental modification of pigtail macaque, Macaca nemestrina, agonistic screams’, Animal Behaviour, 37, pp. 383–401.
142. GOUZOULES H., GOUZOULES S., 1995, ‘Recruitment screams of pigtail monkeys (Macaca nemestrina) : Ontogenetic perspectives’, Behaviour, 132, pp. 431–450.
143. KATSU N., YAMADA K., NAKAMICHI M., 2014, ‘Development in the usage and comprehension of greeting calls in a free-ranging group of Japanese macaques (Macaca fuscata)’, Ethology, 120, pp. 1024–1034.
144. LAPORTE M.N.C., ZUBERBÜHLER K., 2011, ‘The development of a greeting signal in wild chimpanzees’, Developmental Science, 14, pp. 1220–1234.
145. SEYFARTH R.M., CHENEY D.L., 1986, ‘Vocal development in vervet monkeys’, Animal Behaviour, 34, pp. 1640–1658.
146. CARO T.M., HAUSER M.D., 1992, ‘Is there teaching in nonhuman animals ?’, Quarterly Review of Biology, 67, pp. 151–174.
147. ROUSH R.S., SNOWDON C.T., 2001, ‘Food transfer and development of feeding behavior and food-associated vocalizations in cotton-top tamarins’, Ethology, 107, pp. 415–429.
148. LEMASSON A., GLAS L., BARBU S., LACROIX A., GUILLOUX M., REMEUF K., KODA H., 2011, ‘Youngsters do not pay attention to conversational rules : Is this so for nonhuman primates ?’, Scientific Reports, 1, pp. 22.
149. LEMASSON A., GUILLOUX M., RIZALDI, BARBU S., LACROIX A., KODA H., 2013, ‘Age- and sex-dependent contact call usage in Japanese macaques’, Primates, 54, pp. 283–291.
150. CHOW C.P., MITCHELL J.F., MILLER C.T., 2015, ‘Vocal turn-taking in a non-human primate is learned during ontogeny’, Proceedings of the Royal Society of London B, 282, pp. 20150069.
151. HOPKINS W.D., TAGLIALATELA J.P., LEAVENS D.A., 2007, ‘Chimpanzees differentially produce novel vocalizations to capture the attention of a human’, Animal Behaviour, 73, pp. 281–286.
152. WICH S.A., SWARTZ K.B., HARDUS M.E., LAMEIRA A.R., STROMBERG E., SHUMAKER R.W., 2009, ‘A case of spontaneous acquisition of a human sound by an orangutan’, Primates, 50, pp. 56–64.
153. LEMASSON A., RICHARD J.-P., HAUSBERGER M., 2004, ‘A new methodological approach to context analysis of call production.’, Bioacoustics, 14, pp. 111–125.
154. SNOWDON C.T., 2009, ‘Plasticity of communication in nonhuman primates’, in NAGUIB M., CLAYTON N.S., ZUBERBÜHLER K., JANIK V.M., eds., Advances in the study of behavior, Volume 40, San Diego, Elsevier Academic Press, pp. 239–276.
155. ALLEN H.B., LINN M.D., editors, 1986, Dialect and language variation, Orlando, Academic Press.
156. BERNSTEIN B., editor, 1971, Class, codes and control. Volume 1. Theoritical studies towards a sociology of language, London, Routledge and Kegan Paul.
157. HASAN R., 1973, ‘Code, register and social dialect’, in BERNSTEIN B., ed., Class, codes and control. Volume 2. Applied studies towards sociology of language, London, Routledge and Kegan Paul, pp. 253–292.
158. PHILIPS S.U., STEELE S., TANZ C., 1987, Language, gender, and sex in comparative perspective, Cambridge, UK, Cambridge University Press.
159. RENDALL D., KOLLIAS S., NEY C., LLOYD P., 2005, ‘Pitch (F0) and formant profiles of human vowels and vowel-like baboon grunts : The role of vocalizer body size and voice-acoustic allometry’, Journal of the Acoustical Society of America, 117, pp. 944–955.
160. DE LA TORRE S., SNOWDON C.T., 2009, ‘Dialects in pygmy marmosets ? Population variation in call structure’, American Journal of Primatology, 71, pp. 333–342.
161. HAFEN T., NEVEU H., RUMPLER Y., WILDEN I., ZIMMERMANN E., 2000, ‘Acoustically dimorphic advertisement calls separate morphologically and genetically homogenous populations of the grey mouse lemur (Microcebus murinus)’, Folia Primatologica, 69, pp. 342–356.
162. MITANI J.C., HUNLEY K.L., MURDOCH M.E., 1999, ‘Geographic variation in the calls of wild chimpanzees : A reassessment’, American Journal of Primatology, 47, pp. 133–151.
163. WICH S.A., KRÜTZEN M., LAMEIRA A.R., NATER A., ARORA N., BASTIAN M.L., MEULMAN E., MORROGH-BERNARD H.C., ATMOKO S.S.U., PAMUNGKAS J., et al., 2012, ‘Call cultures in orang-utans ?’, PLoS ONE, 7, pp. e36180.
164. EY E., RAHN C., HAMMERSCHMIDT K., FISCHER J., 2009, ‘Wild female olive baboons adapt their grunt vocalizations to environmental conditions’, Ethology, 115, pp. 493–503.
165. SUGIURA H., TANAKA T., MASATAKA N., 2006, ‘Sound transmission in the habitats of Japanese macaques and its possible effect on population differences in coo calls’, Behaviour, 143, pp. 993–1012.
166. WATSON S.K., TOWNSEND S.W., SCHEL A.M., WILKE C., WALLACE E.K., CHENG L., WEST V., SLOCOMBE K.E., 2015, ‘Vocal learning in the functionally referential food grunts of chimpanzees’, Current Biology, 25, pp. 495–499.
167. LEMASSON A., GAUTIER J.-P., HAUSBERGER M., 2003, ‘Vocal similarities and social bonds in Campbell’s monkey (Cercopithecus campbelli)’, Comptes Rendus Biologies, 326, pp. 1185–1193.
168. LEMASSON A., OUATTARA K., PETIT E., ZUBERBÜHLER K., 2011, ‘Social learning of vocal structure in a nonhuman primate ?’, BMC Evolutionary Biology, 11, pp. 362.
169. GEISSMANN T., 1999, ‘Duet songs of the siamang, Hylobates syndactylus : II. Testing the pair-bonding hypothesis during a partner exchange’, Behaviour, 136, pp. 1005–1039.
170. MARSHALL A.J., WRANGHAM R.W., ARCADI A.C., 1999, ‘Does learning affect the structure of vocalizations in chimpanzees ?’, Animal Behaviour, 58, pp. 825–830.
171. SNOWDON C.T., ELOWSON A.M., 1999, ‘Pygmy marmosets modify call structure when paired’, Ethology, 105, pp. 893–908.
172. DI FIORE A., FERNANDEZ-DUQUE E., HURST D., 2007, ‘Adult male replacement in socially monogamous equatorial saki monkeys (Pithecia aequatorialis)’, Folia Primatologica, 78, pp. 88–98.
173. DOOLEY H., JUDGE D., 2007, ‘Vocal responses of captive gibbon groups to a mate change in a pair of white-cheeked gibbons (Nomascus leucogenys)’, Folia Primatologica, 78, pp. 228–239.
174. GEISSMANN T., 1986, ‘Mate change enhances duetting activity in the siamang gibbon (Hylobates syndactulus)’, Behaviour, 96, pp. 17–27.
175. LEMASSON A., GAUTIER J.-P., HAUSBERGER M., 2005, ‘A brief note on the effects of the removal of individuals on social behaviour in a captive group of Campbell’s monkeys (Cercopithecus campbelli campbelli) : A case study’, Applied Animal Behaviour Science, 91, pp. 289–296.
176. FITCH W.T., HAUSER M.D., 1995, ‘Vocal production in nonhuman primates : Acoustics, physiology, and functional constraints on “honest” advertisement’, American Journal of Primatology, 37, pp. 191–219.
177. JÜRGENS U., 1979, ‘Vocalization as an emotional indicator : A neuroethological study in the squirrel monkey’, Behaviour, 69, pp. 88–117.
178. SMITH H.J., NEWMAN J.D., SYMMES D., 1982, ‘Vocal concomitants of affiliative behavior in squirrel monkeys’, in SNOWDON C.T., BROWN C.H., PETERSON M.R., eds., Primate communication, Cambridge, UK, Cambridge University Press, pp. 30–49.
179. CHEN H.C., KAMOLNORRANATH S., KAPLAN G., 2008, ‘Female crested gibbons (genus “Nomascus”) sing male song’, Vietnamese Journal of Primatology, 1, pp. 47–53.
180. GEISSMANN T., 1983, ‘Female capped gibbon (Hylobates pileatus Gray 1891) sings male song’, Journal of Human Evolution, 12, pp. 667–671.
181. BOUCHET H., BLOIS-HEULIN C., LEMASSON A., 2012, ‘Age- and sex-specific patterns of vocal behavior in De Brazza’s monkeys (Cercopithecus neglectus)’, American Journal of Primatology, 74, pp. 12–28.
182. HOHMANN G., 1991, ‘Comparative analyses of age-and sex-specific patterns of vocal behaviour in four species of Old World monkeys.’, Folia Primatologica, 56, pp. 133–156.
183. MITANI J.C., NISHIDA T., 1993, ‘Contexts and social correlates of long-distance calling by male chimpanzees’, Animal Behaviour, 45, pp. 735–746.
184. CHENEY D.L., SEYFARTH R.M., SILK J.B., 1995, ‘The response of female baboon (Papio cynocephalus ursinus) to anomalous social interactions : Evidence for causal reasoning’, Journal of Comparative Psychology, 109, pp. 134–141.
185. KITCHEN D.M., CHENEY D.L., ENGH A.L., FISCHER J., MOSCOVICE L.R., SEYFARTH R.M., 2013, ‘Male baboon responses to experimental manipulations of loud “wahoo calls” : Testing an honest signal of fighting ability’, Behavioral Ecology and Sociobiology, 67, pp. 1825–1835.
186. CUTTING A.L., DUNN J., 2006, ‘Conversations with siblings and with friends : Links between relationship quality and social understanding’, British Journal of Developmental Psychology, 24, pp. 73–87.
187. ALBERT E.M., 1964, ‘“Rhetoric”, “logic” and “poetics” in Burundi : Culture patterning of speech behavior’, American Anthropologist, 66, pp. 35–54.
188. BASCOM W.R., 1942, ‘The principle of seniority in the social structure of the Yoruba’, American Anthropologist, 44, pp. 37–46.
189. CALAME-GRIAULE G., 1965, Ethnologie et langage : La parole chez les Dogon, Paris, Gallimard.
190. GHIGLIONE R., 1986, L’homme communiquant, Paris, A. Colin.
191. STIVERS T., ENFIELD N.J., BROWN P., ENGLERT C., HAYASHI M., HEINEMANN T., HOYMANN G., ROSSANO F., DE RUITER J.P., YOON K.E., 2009, ‘Universals and cultural variation in turn-taking in conversation’, Proceedings of the National Academy of Sciences, 106, pp. 10587–10592.
192. BATES E., CAMAIONI L., VOLTERRA V., 1975, ‘The acquisition of performatives prior to speech’, Merrill-Palmer Quarterly of Behavior and Development, 21, pp. 205–226.
193. GOLINKOFF R.M., 1986, ‘“I beg your pardon ?” : The preverbal negotiation of failed messages’, Journal of Child Language, 13, pp. 455–476.
194. GOLINKOFF R.M., 1993, ‘When is communication a “meeting of minds” ?’, 20, pp. 199–207.
195. GILES H., COUPLAND N., COUPLAND J., 1991, ‘Accommodation theory : Communication, context, and consequence’, in GILES H., COUPLAND N., COUPLAND J., eds., Contexts of accommodation : Developments in applied sociolinguistics, Cambridge, UK, Cambridge University Press, pp. 1–68.
196. CLAY Z., PIKA S., GRUBER T., ZUBERBÜHLER K., 2011, ‘Female bonobos use copulation calls as social signals’, Biology Letters, 7, pp. 513–516.
197. SLOCOMBE K.E., KALLER T., TURMAN L., TOWNSEND S.W., PAPWORTH S., SQUIBBS P., ZUBERBÜHLER K., 2010, ‘Production of food-associated calls in wild male chimpanzees is dependent on the composition of the audience’, Behavioral Ecology and Sociobiology, 64, pp. 1956–1966.
198. TOWNSEND S.W., DESCHNER T., ZUBERBÜHLER K., 2008, ‘Female chimpanzees use copulation calls flexibly to prevent social competition’, PLoS ONE, 3, pp. e2431.
199. LAPORTE M.N.C., ZUBERBÜHLER K., 2010, ‘Vocal greeting behaviour in wild chimpanzee females’, Animal Behaviour, 80, pp. 467–473.
200. CAINE N.G., ADDINGTON R.L., WINDFELDER T.L., 1995, ‘Factors affecting the rates of food calls given by red-bellied tamarins’, Animal behaviour, 50, pp. 53–60.
201. DI BITETTI M.S., 2005, ‘Food-associated calls and audience effects in tufted capuchin monkeys, Cebus apella nigritus’, Animal behaviour, 69, pp. 911–919.
202. DE LA TORRE S., SNOWDON C.T., 2002, ‘Environmental correlates of vocal communication of wild pygmy marmosets, Cebuella pygmaea’, Animal behaviour, 63, pp. 847–856.
203. SLOCOMBE K.E., ZUBERBÜHLER K., 2007, ‘Chimpanzees modify recruitment screams as a function of audience composition’, Proceedings of the National Academy of Sciences, 104, pp. 17228–17233.
204. PAPWORTH S., BÖSE A.-S., BARKER J., SCHEL A.M., ZUBERBÜHLER, K., 2008, ‘Male blue monkeys alarm in response to danger experienced by others’, Biology Letters, 4, pp. 472–475.
205. CROCKFORD C., WITTIG R.M., MUNDRY R., ZUBERBÜHLER K., 2012, ‘Wild chimpanzees inform ignorant group members of danger’, Current Biology, 22, pp. 142–146.
206. SCHEL A.M., TOWNSEND S.W., MACHANDA Z., ZUBERBÜHLER K., SLOCOMBE K.E., 2013, ‘Chimpanzee alarm call production meets key criteria for intentionality’, PLoS ONE, 8, pp. e76674.
207. CROCKFORD C., WITTIG R.M., ZUBERBÜHLER, K., 2015, ‘An intentional vocalization draws others’ attention : A playback experiment with wild chimpanzees’, Animal Cognition, 18, pp. 581–591.
208. HAUSER M.D., 1992, ‘A mechanism guiding conversational turn-taking in vervet monkeys and rhesus macaques’, in NISHIDA T., DE WAAL F.B.M., MCGREW W.C., MARLER P., PICKFORD M., eds., Topics in Primatology, Vol. 1 : Human origins, Tokyo, University of Tokyo Press, pp. 235–248.
209. SNOWDON C.T., Cleveland J., 1984, ‘“Conversations” among pygmy marmosets’, American Journal of Primatology, 7, pp. 15–20.
210. SUGIURA H., MASATAKA N., 1995, ‘Temporal and acoustic flexibility in vocal exchanges of coo calls in Japanese macaques (Macaca fuscata)’, in ZIMMERMANN E., NEWMAN J.D., JÜRGENS U., eds., Current topics in primate vocal communication, New-York, Plenum, pp. 121–140.
211. LEMASSON A., GANDON E., HAUSBERGER M., 2010, ‘Attention to elders’ voice in non-human primates’, Biology Letters, 6, pp. 325–328.
212. HENRY L., CRAIG A.J.F.K., LEMASSON A., HAUSBERGER M., 2015, ‘Social coordination in animal vocal interactions. Is there any evidence of turn-taking ? The starling as an animal model’, Frontiers in Psychology, 6, pp. 1416.
213. BIBEN M., SYMMES D., MASATAKA N., 1986, ‘Temporal and structural analysis of affiliative vocal exchanges in squirrel monkeys (Saimiri sciureus)’, Behaviour, 98, pp. 259–273.
214. TAKAHASHI D.Y., NARAYANAN D.Z., GHAZANFAR A.A., 2013, ‘Coupled oscillator dynamics of vocal turn-taking in monkeys’, Current Biology, 23, pp. 2162–2168.
215. CHEN H.C., KAPLAN G., ROGERS L.J., 2009, ‘Contact calls of common marmosets (Callithrix jacchus) : Influence of age of caller on antiphonal calling and other vocal responses’, American Journal of Primatology, 71, pp. 165–170.
216. TOUITOU S., LEMASSON A., FRÉDET J., NAIRAUD B., GUÉRY J.-P., LEVRÉRO F., en révision, ‘Social bonding drives vocal plasticity in bonobos’, Scientific Reports.
217. FEDUREK P., SCHEL A.M., SLOCOMBE K.E., 2013, ‘The acoustic structure of chimpanzee pant-hooting facilitates chorusing’, Behavioral Ecology and Sociobiology, 67, pp. 1781–1789.
218. KODA H., 2004, ‘Flexibility and context-sensitivity during the vocal exchange of coo calls in wild Japanese macaques (Macaca fuscata yakui)’, Behaviour, 141, pp. 1279–1296.
219. CANDIOTTI A., ZUBERBÜHLER K., LEMASSON A., 2012, ‘Convergence and divergence in Diana monkey vocalisations’, Biology Letters, 8, pp. 382–385.
220. MITANI J.C., BRANDT K.L., 1994, ‘Social factors influence the acoustic variability in the long-distance calls of male chimpanzees’, Ethology, 96, pp. 233–252.
221. SUGIURA H., 1998, ‘Matching of acoustic features during the vocal exchange of coo calls by Japanese macaques’, Animal Behaviour, 55, pp. 673–687.
222. JORDAN K.E., MACLEAN E.L., BRANNON E. M., 2008, ‘Monkeys match and tally quantities across senses’, Cognition, 108, pp. 617–625.
223. CANTLON J.F., BRANNON E.M., 2006, ‘Shared system for ordering small and large numbers in monkeys and humans’, Psychological Science, 17, pp. 401–406.
224. CANTLON J.F., BRANNON E.M., 2007, ‘Basic math in monkeys and college students’, PLoS Biology, 5, pp. e328.
225. BROWN C.H., GOMEZ R., WASER P.M., 1995, ‘Old World Monkey vocalizations : Adaptation to the local habitat ?’, Animal behaviour, 50, pp. 945–961.
226. MARLER P., 1965, ‘Communication in monkeys and apes’, in DEVORE I., ed., Primate behaviour : Field studies of monkeys and apes, New-York, Holt, Rinehart and Winston, pp. 236–265.
227. WASER P.M., BROWN C.H., 1986, ‘Habitat acoustics and primate communication’, American Journal of Primatology, 10, pp. 135–154.
228. MARLER P., 1975, ‘On the origin of speech from animal sounds’, in KAVANAGH J.F., CUTTING J., eds., The role of speech in language, Cambridge, MA, MIT Press, pp. 11–37.
229. MCGRAW W.S., ZUBERBÜHLER, K., 2008, ‘Socioecology, predation and cognition in a community of West African monkeys’, Evolutionary Anthropology, 17, pp. 254–266.
230. ZUBERBÜHLER K., 2007, ‘Predation and primate cognitive evolution’, in GURSKY S.L., NEKARIS K.A.I., eds., Primate anti-predator strategies, New-York, Springer, pp. 3–26.
231. CÄSAR C., BYRNE R.W., HOPPITT W., YOUNG R.J., ZUBERBÜHLER K., 2012, ‘Evidence for semantic communication in titi monkey alarm calls’, Animal Behaviour, 84, pp. 405–411.
232. STEPHAN C., ZUBERBÜHLER, K., 2008, ‘Predation increases acoustic complexity in primate alarm calls’, Biology Letters, 4, pp. 641–644.
233. CANDIOTTI A., COYE C., OUATTARA K., PETIT E.J., VALLET D., ZUBERBÜHLER K., LEMASSON A., 2015, ‘Female bonds and kinship in forest guenons’, International Journal of Primatology, 36, pp. 332–352.
234. GAUTIER-HION A., GAUTIER J.-P., 1978, ‘Le singe de Brazza : Une stratégie originale’, Zeitschrift für Tierpsychologie, 46, pp. 84–104.
235. SHULTZ S., DUNBAR R.I.M., 2007, ‘The evolution of the social brain : Anthropoids primates contrast with other vertebrates’, Proceedings of the Royal Society of London B, 274, pp. 2429–2436.
236. MCCOMB K., SEMPLE S., 2005, ‘Coevolution of vocal communication and sociality in primates’, Biology Letters, 1, pp. 381–385.
237. GUSTISON M.L., LE ROUX A., BERGMAN T.J., 2012, ‘Derived vocalizations of geladas (Theropithecus gelada) and the evolution of vocal complexity in primates’, Philosophical Transactions of the Royal Society of London, Series B, Biological Sciences, 367, pp. 1847–1859.
238. RAMSIER M.A., CUNNINGHAM A.J., FINNERAN J.J., DOMINY N.J., 2012, ‘Social drive and the evolution of primate hearing’, Philosophical Transactions of the Royal Society of London, Series B, Biological Sciences, 367, pp. 1860–1868.
239. MAESTRIPIERI D., 2007, ‘Gestural communication in three species of macaques (Macaca mulatta, M. nemestrina, M. arctoides) : Use of signals in relation to dominance and social context.’, in LIEBAL K., MULLER C., PIKA S., eds., Gestural communication in nonhuman and human primates, Amsterdam, John Benjamins, pp. 51–66.
240. DOBSON S.D., 2009, ‘Socioecological correlates of facial mobility in nonhuman anthropoids’, American Journal of Physical Anthropology, 139, pp. 413–420.
241. DELBARCO-TRILLO J., SACHA C.R., DUBAY G.R., DREA C.M., 2012, ‘Eulemur, me lemur : The evolution of scent-signal complexity in a primate clade’, Philosophical Transactions of the Royal Society of London, Series B, Biological Sciences, 367, pp. 1909–1922.
242. PIKA S., MITANI J.C., 2006, ‘Referential gestural communication in wild chimpanzees (Pan troglodytes)’, Current Biology, 16, pp. R191–R192.
243. VEÀ J., SABATER PI J., 1998, ‘Spontaneous pointing behaviour in the wild pygmy chimpanzee (Pan paniscus)’, Folia Primatologica, 69, pp. 289–290.
244. HATTORI Y., KUROSHIMA H., FUJITA K., 2007, ‘I know you are not looking at me : Capuchin monkeys’ (Cebus apella) sensitivity to human attentional states’, Animal Cognition, 10, pp. 141–148.
245. MAILLE A., ENGELHART L., BOURJADE M., BLOIS-HEULIN C., 2012, ‘To beg or not to beg ? That is the question : Mangabeys modify their production of requesting gestures in response to human’s attentional states’, PLoS ONE, 7, pp. e41197.
246. ANDERSON J.R., KUWAHATA H., FUJITA K., 2007, ‘Gaze alternation during “pointing” by squirrel monkeys (Saimiri sciureus) ?’, Animal Cognition, 10, pp. 267–271.
247. GENTY E., BREUER T., HOBAITER C., BYRNE R.W., 2009, ‘Gestural communication of the gorilla (Gorilla gorilla) : Repertoire, intentionality and possible origins’, Animal Cognition, 12, pp. 527–546.
248. ANDERSON J.R., KUROSHIMA H., HATTORI Y., FUJITA K., 2010, ‘Flexibility in the use of requesting gestures in squirrel monkeys (Saimiri sciureus)’, American Journal of Primatology, 72, pp. 707–714.
249. Pika S., LIEBAL K., CALL J., TOMASELLO M., 2005, ‘Gestural communication of apes’, Gesture, 5, pp. 41–56.
250. PIKA S., 2008, ‘Gestures of apes and pre-linguistic human children : Similar or different ?’, First Language, 28, pp. 116–140.
251. TAGLIALATELA J.P., RUSSELL J.L., SCHAEFFER J.A., HOPKINS W.D., 2011, ‘Chimpanzee vocal signaling points to a multimodal origin of human language’, PLoS ONE, 6, pp. e18852.
252. VAUCLAIR J., 2004, ‘Lateralization of communicative signals in nonhuman primates and the hypothesis of the gestural origin of language’, Interaction Studies, 5, pp. 365–386.
253. GENTY E., CLAY Z., HOBAITER C., ZUBERBÜHLER, K., 2014, ‘Multi-modal use of a socially directed call in bonobos’, PLoS ONE, 9, pp. e84738.
254. LEMASSON A., 2011, ‘What can forest guenons “tell” us about the origin of language ?’, in VILAIN A., SCHWARTZ J.-L., ABRY C., VAUCLAIR J., eds., Primate communication and human language : Vocalisation, gestures, imitation and deixis in humans and non-humans, Amsterdam, John Benjamins, pp. 39–70.
255. SLOCOMBE K.E., WALLER B.M., LIEBAL K., 2011, ‘The language void : The need for multimodality in primate communication research’, Animal Behaviour, 81, pp. 919–924.
256. WALLER B.M., LIEBAL K., BURROWS A.M., SLOCOMBE K.E., 2013, ‘How can a multimodal approach to primate communication help us understand the evolution of communication ?’, Evolutionary Psychology, 11, pp. 538–549.


Pour citer l'article

Hélène Bouchet, Camille Coye, Alban Lemasson« Le langage est-il le propre de l’homme ? Apports des études sur les primates non humains », in Tétralogiques, N°21, Existe-t-il un seuil de l’humain ?.

URL : http://tetralogiques.fr/spip.php?article30