Monika Bak Sienkiewicz: Quelle collocation causative enseigner ? L’exemple des structures V causatif + N d’EMOTION

Quelle collocation causative enseigner ? L’exemple des structures V causatif + N d’EMOTION

Monika Bak Sienkiewicz (Grenoble)

http://dx.doi.org/10.13092/lo.78.2951

1 Introduction

Si l’importance de l’enseignement aux LNN¹ des structures « courantes »² n’est plus mise en doute en didactique du FLE, les grands corpus informatisés, comme source de données linguistiques, ne sont pas encore très exploités. Les données empiriques apparaissent en effet quelque peu négligées dans les manuels, juste parfois annexées à différentes étapes de l’acquisition du vocabulaire et à l’expression orale ou écrite, par exemple. Pourtant, depuis quelques années, des linguistes comme Novakova et Tutin (2009), Diwersy et François (2011), Tutin et Grossmann (2014) et Cavalla et al. (2015), entre autres, préconisent l’utilisation des grandes bases de données telles que Frantext (www.atilf.fr/spip.php?rubrique78, [04.09.2015], textes littéraires du XVI^eau XX^e siècle), Scientext (http://scientext.msh-alpes.fr/scientext-site/spip.php?article9, [04.09.2015], textes scientifiques de la fin du XIX^e au début du XXI^e siècle) et Emolex (http://emolex.u-grenoble3.fr/emoConc/emoConc.new.php, [04.09.2015], textes journalistiques du début du XXI^e et textes littéraires de la fin du XIX^e au début du XXI^e siècle), comme corpus pour l’enseignement et l’apprentissage dans une classe de langue. Selon les auteurs, le bénéfice acquis par la constitution des concordances informatisées est double : d’une part le recours à des corpus fournissant des données empiriques variées et attestées permet de faire une description réaliste de l’environnement de la lexie, d’autre part, il trace son usage.

Il n’en demeure pas moins que dans le cas des collocations³ d’émotions, les manuels de FLE ne présentent que rarement des exemples authentiques; ils limitent souvent leur choix à quelques expressions figées ou aux collocations bien connues comme « procurer du bonheur », « faire plaisir » ou « entrer dans une colère noire », et ceci uniquement au niveau avancé en français (Cavalla/Labre 2009). Les manuels ne précisent pas non plus que les collocations d’émotions peuvent avoir des formes et des structures très variables, comme c’est le cas de la construction V causatif + N d’émotion (désormais Vcaus + N_émot).

En partant de l’étude de la fréquence⁴ des différents mécanismes causatifs que nous classons selon des critères syntaxico-sémantiques (Dixon 2000 ; Talmy 2000 et Diwersy/François 2011) et en nous fondant sur la variété des formes et des structures telles qu’elles peuvent être observées empiriquement dans le corpus (corpus Emolex), nous cherchons à établir les attirances entre ces deux classes grammaticales (les Vcaus et les N_émot). Un deuxième objectif consiste à chercher à répondre à l’interrogation suivante : quelles collocations enseigner ?

Nous présenterons d’abord les hypothèses de notre recherche, ainsi que la méthodologie de la constitution du corpus d’étude et de l’analyse linguistique (section 2). Ensuite, nous étudierons la répartition des collocatifs verbaux au sein des différents champs d’émotions de la classification d’Emolex (section 3) et présenterons une analyse lexicale de la collocation la plus fréquente de tous les champs : créer DET surprise (section 4). Nous réfléchirons ensuite aux critères de sélection des collocations, pertinentes du point de vue des finalités didactiques, pour passer enfin aux conclusions.

2 Hypothèses, corpus, méthodologie

Nous essaierons d’apporter des éléments de réponses aux questions suivantes sous-tendant cette recherche :

Y a-t-il un lexique verbal causatif « transversal » (c’est-à-dire, commun à plusieurs champs)⁵ et, respectivement, un lexique verbal causatif spécifique aux noms et/ou aux champs d’émotions différents?
Est-ce qu’il faut enseigner les associations qui, comparées aux combinaisons qui dominent en termes de fréquence, présentent des fréquences beaucoup plus faibles dans le corpus ?
Est-ce que la fréquence mesurée au moyen de méthodes quantitatives dans un corpus donné est un élément définitoire suffisant comme critère expliquant l’émergence et la systématisation des collocations Vcaus + N_émot à partir de la répétition dans l’usage ?

A partir de ces interrogations, nous formulons les hypothèses suivantes :

Il existe, dans le langage « authentique », une attirance « naturelle »⁶ entre certaines lexies (la théorie des Halbfertigprodukte⁷ de la langue de Hausmann 1984): dans le cas de notre étude, il s’agit des attirances particulières entre les N_émot et la classe des « Vcaus neutres »⁸.
Bien que la fréquence d’une collocation soit peu élevée dans un corpus donné, cette dernière peut être d’usage commun et courant (Hausmann 1984 ; Tutin 2009), par conséquent, pertinente du point de vue des finalités didactiques.
Nous supposons que les faibles résultats statistiques de certaines combinaisons peuvent être liés au type de corpus choisi (journalistique, par exemple), des préférences linguistiques de tel ou tel journaliste ou de tel ou tel support.

Deux théories seront utilisées conjointement ici: la conception des collocations statistiquement significatives de Williams (2003) qui mentionne que même si la fréquence ne sert qu’à évaluer les collocations, elle fournit des informations sur leur usage⁹ et la théorie de la disponibilité lexicale de Hausmann (1985)¹⁰. En effet, comme nous l’avons signalé supra pour Hausmann, le critère de fréquence n’est pas toujours pertinent car la collocation peut être usuelle mais pas forcément fréquente en fonction du corpus considéré. Hausmann (1985) mentionne ainsi „Viele Kollokationen sind nicht frequent, aber dennoch verfugbar“. (Il existe un nombre important de collocations qui, bien que leur fréquence soit peu élevée, restent disponibles à l’usage)¹¹ (cf. Hausmann 1985: 124). Dans la même lignée, Tutin (2005a) remarque que certaines lexies ou combinaisons peuvent être fréquentes, mais uniquement en contexte particulier, comme la fourchette qui risque de n’apparaitre que dans le contexte alimentaire ou les collocations partager DET haine, porter DET haine qui sont liées aux situations de conflit¹².

Les données sont issues du corpus Emolex (http://emolex.u-grenoble3.fr/emoBase, [20.06.2015]). Il s’agit d’une base de données contenant environ 150M de mots dont 134M de mots provenant de textes journalistiques (deux années de parution : 2007–2008) des quatre quotidiens français Le Monde, Ouest-France, Libération et Le Figaro et 16M provenant de textes littéraires sur la période XIX^e-XX^e siècle.

Le Tableau 1 recense la provenance, la nature, ainsi que la taille des corpus pour la langue française :

Nom du corpus	Période	Mots-occurrences	Genre
Le Monde (presse nationale)	2007–2008	45 527 166	journalistique
Ouest-France (presse nationale)	2007–2008	30 998 093	journalistique
Le Figaro (presse nationale)	2007–2008	40 547 032	journalistique
Libération (presse nationale)	2007–2008	20 322 010	journalistique
Littérature française contemporaine	1950–2000	15 978 230	littéraire
TOTAL		153 372 531

Tableau 1 : Descriptif du corpus français (Emolex)

La méthodologie employée s’inscrit dans la linguistique du corpus. Elle cherche à mettre en évidence les attirances entre les Vcaus et les N_émot en se basant sur des textes authentiques dont le paramètre log-likelihood (abrégé LL) (Manning/Schütze 1999) sert à cibler les collocations usuelles et fréquentes. Notre analyse recourt en outre à neuf champs d’émotion de la classification d’Emolex¹³ et à notre liste de 106 Vcaus (détaillée dans la suite de cette section).

Les méthodes lexico-statistiques (Diwersy/François 2011) nous ont permis d’élaborer les profils combinatoires des N_émot et de formuler ainsi des généralisations. Nous avons procédé par étapes : d’abord, nous avons fait une analyse quantitative qui consistait en un examen systématique des occurrences pour chacun des N_émot étudiés, ensuite, nous avons affiné notre analyse en effectuant des recherches ponctuelles sur des lexies considérées comme pertinentes (fréquence, typicité...). À partir des régularités repérées, nous avons effectué des listes des combinaisons ainsi que des tableaux synthétiques et comparatifs.

Sélectionnés dans le cadre du projet Emolex¹⁴, les 46 N_émot ont été répartis de la façon suivante :

ADMIRATION (4 noms) : admiration, émerveillement, engouement, fascination,
COLÈRE (10 noms) : agacement, colère, courroux, énervement, exaspération, fureur, indignation, ire, irritation, rage,
DECEPTION (3 noms) : amertume, déception, dépit,
JALOUSIE (3 noms) : convoitise, envie, jalousie,
JOIE (8 noms) : bonheur, enthousiasme, euphorie, joie, jubilation, liesse, plaisir, ravissement,
MEPRIS (3 noms) : condescendance, dédain, mépris,
RESPECT (3 noms) : considération, estime, respect,
SURPRISE (3 noms) : étonnement, surprise, stupeur,
TRISTESSE (9 noms) : abattement, chagrin, déprime, désespoir, malheur, mélancolie, nostalgie, regret, tristesse.

Les champs sont diversifiés sur le plan de la polarité : ADMIRATION, par exemple, a une polarité positive, COLÈRE négative, tandis que SURPRISE est neutre (Grutschus/Kern/Tutin 2013) et, également, par rapport au caractère réactif/interpersonnel des affects : les champs comme COLÈRE, DÉCEPTION, JOIE, SURPRISE, TRISTESSE sont réactifs, c’est-à-dire qu’ils impliquent un expérienceur plutôt qu’un agent, tandis que ADMIRATION, JALOUSIE, RESPECT, MÉPRIS sont interpersonnels, c’est-à-dire qu’ils se dirigent prototypiquement vers un patient (Tutin et al. 2006).

Les champs sémantiques ne sont pas équilibrés au niveau du nombre de noms recueillis : dans certains d’entre eux, il y en a moins, à cause des critères de fréquence et de sélection retenus (par exemple, le champ COLÈRE comprend dix N_émot, tandis que celui JALOUSIE n’en a que trois). Toutes nos fréquences sont donc calculées en pourcentages.

En ce qui concerne la méthodologie de notre analyse linguistique, nous avons d’abord procédé à la création d’une liste de verbes causatifs. La liste de 120 Vcaus établie dans le cadre de notre Master 2¹⁵ pour le corpus Scientext (http://scientext.msh-alpes.fr/scientext-site/spip.php?article9, [05.05.2015]) nous a servi de point de départ. Nous l’avons vérifiée dans le corpus Emolex en appliquant notre patron syntaxique Vcaus + N_émot: 106 verbes causatifs ont été répertoriés au total. A partir de cette liste pré-établie, nous avons classé le lexique verbal causatif selon la typologie de Diwersy et François (2011)¹⁶.

Le Tableau 2 illustre cette classification. Certaines classes comme la classe de « causation négative » et la classe de « décroissance » ont été reprises du classement de Diwersy et François (2011). Etant donné le nombre important de Vcaus se trouvant dans notre liste, nous nous limitons, dans le tableau 2, à quelques verbes parmi les plus représentatifs pour chaque classe :

	C. verbale	*N_émot*
C1	Vcaus neutres (au total: 29 V)	créer (stupeur), donner (plaisir), provoquer (indignation), réserver (surprise), susciter (admiration) [...]
C2	V de causation négative (au total: 14 V)	apaiser (ire), adoucir (fureur), entamer (enthousiasme), freiner (enthousiasme), réduire (fascination) [...]
C3	Vcaus phasiques inchoatifs (au total: 18 V)	déchaîner (jalousie), déclencher (stupeur), exciter (fureur), réveiller (nostalgie), soulever (enthousiasme) [...]
C4	Vcaus phasiques terminatifs (au total: 9 V)	chasser (tristesse), étouffer (colère), éteindre (émerveillement), effacer (déception), gâcher (plaisir) [...]
C5	Vcaus phasiques d’intensité forte (croissance graduelle) (au total: 22 V)	alimenter (colère), attiser (jalousie), décupler (colère), nourrir (émerveillement), prolonger (plaisir) [...]
C6	Vcaus phasiques d’intensité faible (décroissance graduelle) (au total: 14 V)	atténuer (regret), calmer (euphorie), canaliser (colère), modérer (enthousiasme), tempérer (euphorie) [...]
	Au total: 6 classes	106 Vcaus

Tableau 2 : Proposition de classement des Vcaus¹⁷

Au premier palier se trouve la classe des « Vcaus neutres » qui réunit au total 29 verbes et qui correspond aux verbes tels que causer ou exercer :

1) Le pathétique, c’est les fausses joies que leur causent certaines velléités qu’ils croient miraculeuses mais qui ne se manifestent que pour mieux les humilier.

(Frédéric Dard 1991)

2) L’horreur nous révulse en même temps qu’elle exerce sur nous une certaine fascination.

(Ouest-France 2008)

Cette classe est suivie de la classe des « V de causation négative » avec au total 14 verbes, dont, à titre d’exemple, nous pouvons citer endiguer et entamer :

3) Ces derniers n’étaient venus qu’à six joueurs, et il en fallait bien plus pour endiguer la fureur et l’enthousiasme des Finistériens.

(Ouest-France 2007)

4) Pourtant, les mauvais sondages n’ont pas semblé entamer l’enthousiasme de celui qui, jusqu’au dernier moment, a espéré « créer la surprise ».

(Le Figaro 2008)

La 3^ème classe est la classe des « Vcaus phasiques inchoatifs » (18 verbes comme déclencher, exciter) :

5) Les travaux ont débuté en février, déclenchant la colère des riverains. (Le Monde 2008)

6) C’est Zira, qui se moque sans méchanceté de mes efforts et sa présence excite toujours la colère de la fille. (Pierre Boulle 1963)

La suivante est la classe des « Vcaus phasiques terminatifs » qui ne compte que neuf verbes tels que chasser, étouffer, etc. :

7) Nous garderons ces bonnes feuilles pour les relire souvent, et chasser la tristesse si elle nous vient.

(Maurice Druon 1955)

8) Pas sûr que la riposte de Royal suffise à étouffer la colère des autres ténors socialistes.

(Libération 2007)

Les deux dernières classes sont : la classe des « Vcaus phasiques d’intensité forte » (croissance graduelle) et la classe des « Vcaus phasiques d’intensité faible » (décroissance graduelle). La première comprend des verbes comme attiser, nourrir (au total 22 verbes) :

9) En lançant pour la première fois un appel d’offres afin de choisir son équipementier sur la période 2011-2018, la FFF savait qu’elle allait attiser les convoitises.

(Le Monde 2008)

10) Des cités-dortoirs succédaient à des bâtiments colossaux, arborant des tons mornes qui paraissaient absorber le soleil pour nourrir leur seule amertume.

(Jean-Christophe Grange 2000)

La seconde (la classe des « Vcaus phasiques d’intensité faible » (décroissance graduelle)) comprend des verbes comme atténuer et canaliser (au total 14 verbes) :

11) Mais ce grand show des sprinteurs masculins ne sera certainement pas suffisant pour atténuer la déception des Jamaïquaines.

(Le Figaro 2008)

12) Les actions en nom collectif sont la meilleure façon de canaliser la colère qui provoque chaque année quelque 40 000 disputes autour des questions environnementales.

(Le Monde 2008)

Notons encore que, faute de résultat, la classe de « causation durative » correspondant aux verbes tels qu’entretenir et maintenir a été retirée de notre classement.

3 Le lexique verbal causatif : résultats et analyses

Le corpus Emolex nous a fourni 3456 cooccurrences que nous avons réparties dans les six classes verbales :

Figure 1 : Comparaison, en pourcentage, des classes de Vcaus dans notre corpus

Il en ressort que la classe des « Vcaus neutres » (28 V) est prédominante : elle comporte, au total, 2340 occ. correspondant à 55,17 % de l’ensemble. La classe des « Vcaus phasiques inchoatifs » (18 V correspondant aux 441 occ.) vient en deuxième position avec 16,75 %. La classe des « Vcaus phasiques d’intensité forte » (21 V) et la classe des « V de causation négative » (18 V) apparaissent à parts presque égales, mais, par rapport aux classes précédentes, elles sont nettement moins volumineuses (respectivement 315 occ. correspondant à 10,97 % et 273 occ. correspondant à 10,25 %). La classe des « Vcaus phasiques terminatifs » (9 V) et la classe des « Vcaus phasiques d’intensité faible » (11 V) sont statistiquement les moins significatives : elles comportent, respectivement, 6,79 % et 0,07 % de l’ensemble.

3.1 Combinaisons les plus spécifiques sur le plan de la fréquence et selon le test du log-likelihood (Manning/Schütze 1999)

Sur l’ensemble des 338 combinaisons différentes répertoriées dans le corpus Emolex, nous avons sélectionné 11 combinaisons ayant une fréquence supérieure à 100 occurrences. Le Tableau 3 répertorie l’ensemble des informations concernant ces combinaisons : la première colonne du lexicogramme intitulée « Type de combinaison » indique la combinaison, la deuxième (f) désigne sa fréquence, la troisième (f1) et la quatrième (f2) correspondent à la fréquence propre de ses composants : celle du mot-pivot (ici: N_émot) et celle de son « collocatif » (ici: Vcaus). Quant aux cinquième et sixième colonnes (« Score LL » et « champ »), elles correspondent, respectivement, au paramètre log-likelihood marquant la spécificité statistique de cette cooccurrence et au champ sémantique auquel appartient le N_émot. Les combinaisons sont classées par fréquence décroissante du test du log-likelihood :

Type de combinaison	f	f1	f2	C. verbale	Score LL	champ
faire DET plaisir	154	24946	1387387	Vcaus neutres	4773,9189	JOIE
créer DET surprise	565	21558	117498	Vcaus neutres	3665,1881	SURPRISE
faire DET bonheur	436	18048	1387387	Vcaus neutres	2409,6210	JOIE
provoquer DET colère	283	17433	76433	Vcaus neutres	2002,0050	COLERE
réserver DET surprise	244	21558	27223	Vcaus neutres	1844,5689	SURPRISE
susciter DET engouement	122	4332	31354	Vcaus neutres	1165,4956	ADMIRATION
susciter DET convoitise	130	1452	31354	Vcaus neutres	1145,6113	JALOUSIE
susciter DET enthousiasme	126	7347	31354	Vcaus neutres	1061,7810	JOIE
susciter DET colère	129	31354	76433	Vcaus neutres	824,8042	COLÈRE
susciter DET indignation	118	2831	31354	Vcaus neutres	744,7285	COLÈRE
faire DET joie	122	11624	1387387	Vcaus neutres	259,8158	JOIE

Tableau 3 : Lexicogramme des combinaisons les plus spécifiques sur le plan de la fréquence et selon le test du log-likelihood

L’intérêt de nous baser sur la valeur du log-likelihood et non uniquement sur la fréquence de la combinaison apparaît clairement dans le cas defaire DET plaisir: selon nos calculs cette combinaison a une fréquence moins forte que créer DET surprise ou faire DET bonheur (154 occ. contre 565 et 436, respectivement), mais comme la fréquence propre (f1) du nom plaisir est plus élevée (24946 vs 21558 respectivement 18048), la valeur du paramètre log-likelihood est plus forte (4773 vs 3665 respectivement 2409). Or, il faut d’autre part signaler aussi que les résultats de notre requête pour la collocationfaire DET plaisir comportaient des formes qui étaient syntaxiquement et sémantiquement peu intéressantes pour notre étude¹⁸, comme la forme figées faire (DET)₀ plaisir :

13) Aussi loin que je m’en souvienne, je me vois étudier, avant tout pour faire plaisir à mes parents.

(Ouest-France 2008)

Ainsi, nous avons testé notre hypothèse selon laquelle il existe, dans le langage « authentique », une attirance « naturelle » entre certaines lexies (la théorie des Halbfertigprodukte de la langue de Hausmann 1984). Les statistiques valident notre hypothèse : il existe, par exemple, une attirance particulière entre les N_émot et la classe des « Vcaus neutres », tandis qu’entre les N_émot et la classe des « Vcaus phasiques d’intensité faible » l’attirance est très limitée (cf. Figure 1).

Ainsi le Tableau 3 donne lieu à quelques observations essentielles, à savoir :

La classe des « Vcaus neutres » est la plus importante dans le classement.
Il y a deux combinaisons statistiquement importantes : créer DET surprise (champ SURPRISE) et faire DET bonheur (champ JOIE) ayant, respectivement, 565 et 436 occ. Cette première atteint également un score de spécificité très élevé (3665).
Dans certains champs sémantiques, l’attirance entre les N_émot et les « Vcaus neutres » est particulièrement forte ; ceci est confirmé par leurs valeurs du log-likelihood très élevées. Dans le champ JOIE, par exemple, cette attirance est représentée par quatre combinaisons telles que faire DET bonheur (436 occ. et un LL de 2409), faire DET plaisir (154 occ. et un LL de 4773), susciter DET enthousiasme (122 occ. et un LL de 1061) et faire DET joie (126 occ. et un LL de 259). Il en va de même pour le champ COLERE dont les trois combinaisons principales, à savoir provoquer DET colère (283 occ. et un LL de 2002), susciter DET colère (129 occ. et un LL de 824) et susciter DET indignation (118 occ. et un LL de 744) confirment bien l’existence des liaisons privilégiées entre ce champ et la classe des « Vcaus neutres ». Quant au champ JALOUSIE, cette attirance est illustrée par susciter DET convoitise (130 occ. et un LL de 1145).
Il y a deux types de combinaisons qui comportent les mêmes noms d’émotion, surprise et colère : créer DET surprise et réserver DET surprise (dans le champ SURPRISE) et susciter DET colère et provoquer DET colère (dans le champ COLERE). Les associations formées par surprise dominent en termes de fréquence et de spécificité.

Deux verbes forment plus d’une association : susciter (cinq combinaisons) et faire (trois combinaisons). Les autres combinaisons sont uniques, à savoir créer DET surprise, réserver DET surprise et provoquer DET colère.

3.2 Les verbes transversaux

Nous avons identifié deux verbes transversaux: susciter (qui entre en combinaison avec 25 N_émot¹⁹provenant de huit champs différents) et provoquer (qui entre en combinaison avec 21 N_émot provenant de sept champs).

Comme on peut le voir dans le Tableau 3, certaines de ces combinaisons sont très spécifiques sur le plan de la fréquence, comme c’est le cas de provoquer DET colère (qui se place en 3^ème position du classement de fréquence). Aucune association du verbe susciter n’atteint une fréquence aussi élevée que celle de provoquer qui a 283 occ. Or, sur notre liste des 11 combinaisons les plus spécifiques des champs, c’est le verbe susciter qui est le plus présent: il forme cinq combinaisons ayant une fréquence supérieure à 100 occ. : susciter DET engouement, susciter DET convoitise, susciter DET enthousiasme,susciter DET colère et susciter DET indignation.

4 Le cas de l’association dominante créer DET surprise

La combinaison créer DET surprise réunit un verbe de la classe des « Vcaus neutres » et un nom d’émotion du champ SURPRISE. Selon nos calculs, le N_surprise est le plus spécifique auprès des verbes de cette classe puisque sur l’ensemble des 3950 occ. repérées, 889 occ. reviennent à ce nom.

4.1 Le profil combinatoire du N_surprise

Le Tableau 4 ci-dessous, constitué selon le même modèle que le Tableau 3 de la section 3.1., illustre l’ensemble des collocatifs verbaux du nomsurprise repérés dans le corpus. La fréquence (f1), celle du N_surprise, est commune. Les verbes sont classés par valeur du test du log-likelihood décroissante (« Score LL ») :

Mot-pivot	Coll.verb.	f	f1	f2	Score LL	C. verbale
surprise	créer	565	21558	180292	6645,1076	Vcaus neutres
	réserver	244		41989	3450,2399	Vcaus neutres
	ménager	16		9621	187,1161	Vcaus phasiques d’intensité faible (décroissance graduelle)
	causer	22		19974	149,4207	Vcaus neutres
	provoquer	26		76433	72,2868	Vcaus neutres
	susciter	17		53308	71,0915	Vcaus neutres
	apporter	15		94694	12,8919	Vcaus neutres
Total	7 Vcaus	905 occ.

Tableau 4 : Liste des huit collocatifs verbaux du N_surprise repérés dans le corpus Emolex

On constate ainsi que surprise présente un vaste éventail de combinaisons. Or, excepté le verbe ménager appartenant à la classe des « Vcaus phasiques d’intensité faible » (décroissance graduelle), les autres verbes proviennent de la classe des « Vcaus neutres ». En tête de classement, nous retrouvons les deux verbes les plus saillants de cette classe : créer et réserver, avec les log-likelihood les plus élevés de toutes les associations: 6645 et 3450, respectivement. En troisième position se place la combinaison ménager DET surprise, mais, en fait, la fréquence de cette combinaison est moins élevée que celle du verbe provoquer : 16 occ. vs 26. Si le log-likelihood de la combinaison ménager DET surprise est supérieur à celui de provoquer DET surprise (187 vs 72), c’est dû à la fréquence du verbe provoquer, très élevée par rapport à celle de ménager : 76433 vs 9621.

Le nom surprise comprend au total 905 occ., ce qui le place en première position dans le classement général de fréquences. Ceci s’explique principalement par les fréquences très élevées de ces deux combinaisons les plus spécifiques : créer DET surprise (qui domine les statistiques en termes de fréquence et de spécificité) et réserver DET surprise (244 occ. et LL 3450). Cela signifie que ces associations ne sont pas fortuites : il existe une véritable attirance entre ces lexies. Illustrons ce constat avec deux exemples issus de notre corpus :

14) Quelques jours auparavant, Nicolas Sarkozy avait créé la surprise, [...] (Le Monde 2007)

15) Les résultats des équipes de tête du groupe D réservent bien des surprises. (Ouest-France 2008).

Ainsi, nous pouvons constater qu’il existe des attirances privilégiées entre surprise et ses deux collocatifs verbaux : créer et réserver. Il serait intéressant, à notre avis, de procéder dans la suite de notre travail à une analyse plus fine de tous les N_émot qui s’associent à ces deux verbes.

4.2 Le verbe créer – analyse des combinaisons

Le Tableau 5 présente les associations du verbe créer ayant un taux d’occurrences supérieur/égal à un. Ce tableau est construit d’après les mêmes principes que le tableau précédent (Tableau 4), mais cette fois c’est la fréquence (f2) du verbe créer qui est commune :

*Vcaus*	arguments (N_émot)	f	f1	f2	Score LL	champ
créer	surprise	565	21558	117498	6645,1076	SURPRISE
	irritation	1	1029		116,9562	COLERE
	envie	5	25163		51,9355	JALOUSIE
	engouement	15	4332		29,3864	ADMIRATION
	indignation	1	2831		27,5877	COLERE
	agacement	1	1522		17,0010	COLERE
	exaspération	1	1155		15,6505	COLERE
	stupeur	5	1735		11,7415	SURPRISE
Total	8	594 occ.				3 champs

Tableau 5 : La liste des N_émot qui entrent en combinaison avec le Vcaus créer (corpus Emolex)

A première vue, le verbe créer semble avoir un emploi riche et varié : il entre en combinaison avec huit N_émot de quatre champs différents, à savoir le champ SURPRISE, COLERE, JALOUSIE et ADMIRATION et sa combinaison dominante créer DET surprise se place en première position du classement général des fréquences (cf. Tableau 3). Or, si ce verbe peut être considéré comme « fréquent », c’est quasi uniquement grâce à la fréquence élevée de sa combinaison avec surprise : 563 occ. Par rapport à cette dernière, les autres associations de ce verbe semblent beaucoup moins significatives: sur les huit N_émot entrant en association avec ce verbe dans notre corpus il y en a quatre, à savoirindignation, irritation, agacement et exaspération, qui sont des hapax²¹.

Se plaçant en seconde position sur la liste des collocatifs verbaux de surprise, le verbe réserver correspond également à un résultat intéressant méritant une étude spécifique : 244 occ. et une valeur de LL égal à 1844 (cf. Tableau 4). Or, dans notre corpus, l’association avec surprise est unique pour ce verbe. Ainsi, nous considérons qu’il existe, peut-être, des contraintes sémantiques propres à ce verbe qui limitent sa capacité de se combiner avec d’autres N_émot. Ce constat mérite une étude supplémentaire qui n’entre pas dans le cadre de la présente étude.

4.3 Fréquence des collocations

Finalement, sur l’ensemble des 3456 occurrences repérées dans les neuf champs d’émotions, nous avons identifié 338 combinaisons ayant une fréquence entre une et 565 occurrences. La Figure 2 ci-dessous illustre leur répartition :

Figure 2 : Répartition, par rapport à la fréquence, des différents types de collocations

Il en ressort que les combinaisons ayant entre 2 et 9 occ. sont les plus fréquentes: 49,26 % de l’ensemble. Dans une grande partie il s’agit des associations des verbes de « causation négative » avec les noms du champ JOIE²² (désormais N_JOIE): entamer DET enthousiasme8, refreiner DET enthousiasme5, etc. Il y a également trois classes des verbes phasiques: la classe des verbes d’« intensité forte » (croissance graduelle) qui entre en association avec les champs COLERE, TRISTESSE et ADMIRATION ( alimenter DET colère8, aviver DET regret6, nourrir DET fascination5), la classe des verbes d’« intensité faible » (décroissance graduelle) qui s’associe avec les noms du champ COLERE (calmer DET courroux8, tempérer DET fureur4) et la classe des verbes « terminatifs » qui forme des associations avec quasiment l’ensemble des neufs champs d’Emolex: étouffer DET colère8 (champ COLERE), gâcher DET bonheur7 (champ JOIE), chasser DET tristesse4 (champ TRISTESSE), dissiper DET amertume3 (champ DECEPTION) , éteindre DET émerveillement3 (champ ADMIRATION), etc.

Moins fréquentes que les précédentes, les combinaisons ayant entre 10 et 49 occ. présentent encore un poids statistiquement important de 19,85 %. Les plus représentatives sont ici : la classe des « Vcaus neutres » et la classe des « Vcaus phasiques inchoatifs ». Pour les deux, les associations avec les N_COLERE sont les plus spécifiques : susciter DET irritation21, provoquer DET engouement18 (« Vcaus neutres ») et soulever DET indignation36, déclencher DET ire35, etc. (« Vcaus phasiques inchoatifs »).

Les collocations ayant une seule occurrence (des hapax) sont également fréquentes dans notre corpus (18,38 %). Elles impliquent quasiment l’ensemble des lexies provenant de nos deux classes grammaticales : attiser DET jalousie (verbe d’« intensité forte »+ N_JALOUSIE),empêcher DET fascination (verbe de « causation négative » + N_ADMIRATION), susciter DET liesse (« Vcaus neutres » + N_JOIE), etc.

Les plus rares sont les combinaisons ayant entre 50 et 99 occ. et celles ayant plus de 100 occurrences (les plus spécifiques donc): elles constituent à peine 8 % et 4 % de l’ensemble. A quelques exceptions, comme inspirer DET respect66, déclencher DET colère66 (verbes « inchoatifs ») et attiser DET convoitise65 (verbe d’« intensité forte »), elles ne sont formées que par les « Vcaus neutres » associés aux N_émot provenant des champs comme ADMIRATION, COLERE, JALOUSIE, JOIE et SURPRISE (cf. Tableau 3 de la section 3.1.).

Notons encore que parmi les combinaisons ayant une seule occurrence, on trouve la construction être cause de qui, selon Nazarenko (2000), représente le prototype des causatifs opérant sur une action humaine :

16) Chaque promenade, chaque trajet était cause pour lui d’une surprise et d’un émerveillement. (Maurice Druon 1955)

En fait, d’une manière générale, la fréquence des causatifs prototypiques tels que causer ou faire/laisser + Vinf n’est pas très élevée dans notre corpus. Ceci va dans le sens de l’observation de Gross et al. (2009) dont l’analyse des associations verbo-nominales de causation dans un grand corpus journalistique constitué de dix années d’éditions du journal Le Monde²³ a fait ressortir que les verbes prototypiques comme provoquer ou causer²⁴ se combinent pratiquement exclusivement avec les noms de polarité négative : dégâts, catastrophes, maladies, etc. Effectivement, dans notre corpus, le verbe provoquer apparait le plus souvent dans des combinaisons avec des N_émot de polarité négative et, plus spécifiquement, ceux provenant du champ COLERE : provoquer DET colère (283 occ.), provoquer DET indignation (61 occ.), provoquer DET ire (53 occ.), etc. Ceci est également le cas du prototypique causer ; excepté le nom surprise (22 occ.) qui est de polarité neutre, ce verbe entre en association uniquement avec des noms ayant une polarité négative : chagrin (huit occ.), malheur (sept occ.), déception (sept occ.), irritation (cinq occ.), etc. Or, il nous semble que les faibles résultats statistiques de certaines combinaisons sont liés au type de corpus choisi (des corpus journalistiques dans nos deux cas). Nous avons vérifié, d’ailleurs, dans le Web francophone²⁵, l’usualité des deux combinaisons du verbe provoquer qui ont une polarité positive: provoquer DET fascination et provoquer DET émerveillement. Ces deux collocations sont peu usuelles dans notre corpus (respectivement deux occ. et trois occ.), mais nous les considérons intuitivement comme courantes. Notre petite requête a fait ressortir l’usage fréquent de ces collocations dans la langue courante : provoquer DET émerveillement (www.google.fr/#q=provoquer+%2B+%C3%A9merveillement, [04.09.2015]) est apparu dans sept énoncés (sur dix) du contenu de la première page de google.fr, tandis que provoquer DET fascination (www.google.fr/#q=provoquer+%2B+fascination+, [04.09.2015]) était présent dans tous les énoncés de la première page Web français.

5 Conclusion

Les résultats empiriques de notre étude prenant appui sur le corpus Emolex, nous ont permis non seulement de confirmer notre hypothèse concernant l’existence des liens privilégiés entre les N_émot et certains Vcaus (la théorie des Halbfertigprodukte de la langue de Hausmann 1984), mais ont fourni également des arguments convaincants en faveur de la théorie du Lexical priming de Hoey (2005) ; il existe de véritables « attirances » entre certaines lexies (créer + surprise, faire + bonheur, réserver + surprise, etc.).

Or, malgré ces résultats très encourageants, notre étude ne nous a pas apporté de réponse définitive sur le choix des collocations à enseigner étant donné que quatre champs sur neuf ont des fréquences très faibles, à savoir MEPRIS, TRISTESSE, RESPECT et DECEPTION. Si, pour dresser des listes de collocations à enseigner, nous nous basons uniquement sur les critères de fréquence et de valeur de log-likelihood élevées (en prenant en compte, par exemple, les collocations les plus spécifiques, indiquées dans le Tableau 3), sur l’ensemble des 338 combinaisons recensées pour le patron Vcaus + N_émot, 11 combinaisons provenant des cinq champs seulement correspondront à ce critère. Le problème persiste même si nous élargissons nos critères.

Ceci nous a fait réfléchir à notre deuxième hypothèse selon laquelle la fréquence peu élevée de la collocation dans un corpus donné ne signifie pas toujours que cette dernière n’est pas usuelle (Hausmann 1984 ; Tutin 2009). C’est le cas, par exemple, des collocations provoquer DET émerveillement et provoquer DET fascination qui, comme nous l’avons signalé supra, sont peu fréquentes dans notre corpus, mais d’un usage fréquent selon les résultats de notre « requête » effectuée sur le Web francophone. Ainsi ce constat fournit des arguments en faveur de notre troisième hypothèse selon laquelle les faibles résultats statistiques de certaines combinaisons peuvent être liés au type de corpus choisi, aux préférences linguistiques de tel ou tel journaliste ou même de tel ou tel support.

En prenant en compte ce facteur, dans le cas des champs les plus faibles statistiquement (comme les quatre champs cités ci-dessous), nous jugeons pertinent de prendre en considération la théorie de la disponibilité lexicale des collocations de Hausmann (1985), repris par Tutin (2005a) et de retenir, par exemple, dans le champ MEPRIS, les combinaisons comme inspirer DET mépris (huit occ.), nourrir DET mépris (cinq occ.) ou flatter DET mépris²⁶ (deux occ.), car ces collocations sont les seules dans ce champ. Ce qui est évident aussi, c’est qu’au moment d’avoir un choix de combinaisons, nous allons recourir au concept des collocations statistiquement significatives de Williams 2003). Dans le champ JOIE, par exemple, pour introduire l’aspect terminatif de la collocation Vcaus + N_émot, nous allons retenir la collocation gâcher DET plaisir qui a 40 occ. et un LL de 290 et non gâter DET plaisir qui n’a que trois occ. et un LL de 20 (laquelle nous considérons intuitivement comme moins courante). Nous avons vérifié, d’ailleurs, dans le Web francophone, l’usualité de ces deux associations et notre requête a fait ressortir qu’effectivement gâcher DET plaisir (www.google.fr/#q=g%C3%A2cher+plaisir, [14.02.2016]) a un usage beaucoup plus fréquent dans la langue courante que gâter DET plaisir (www.google.fr/#q=g%C3%A2ter+plaisir, [14.02.2016]).

Ainsi, dans le choix des collocations à enseigner, nous allons prendre en compte aussi bien le critère de fréquence que les facteurs dits « subjectifs » (tels que, par exemple, notre propre intuition concernant l’usage, la typicité ou des critères didactiques comme les objectifs spécifiques, le niveau du public-cible, etc.). La consultation de plusieurs sources à la fois dans le cas de certaines collocations nous semblerait aussi bénéfique, même si, d’après Williams (2003), les données d’un corpus informatisé sont suffisantes pour évaluer l’usage des expressions.

Bibliographie

Bak Sienkiewicz, Monika (2010): Le lexique verbal causatif et le raisonnement causal dans les textes scientifiques issus de Scientext, Mémoire de Master 2. Grenoble, Université Stendhal Grenoble 3.

Blumenthal, Peter (2002): « Profil combinatoire des noms. Synonymie distinctive et analyse contrastive ». Zeitschrift für Französische Sprache und Literatur 112: 115–138.

Cavalla, Cristelle/Loiseau, Mathieu/Lascombe, Valérie/Socha, Joanna (2015): « Corpus, base de données, cartes mentales pour l’enseignement ». In: Blumenthal, Peter/Novakova, Iva/Siepmann, Dirk (eds.): Les émotions dans le discours. Berlin, Lang: 327–341. doi: 10.3726/978-3-653-03879-8.

Cavalla, Cristelle/Labre, Virginie (2009): « L’enseignement en FLE de la phraséologie du lexique des affects ». In: Novakova, Iva/Tutin, Agnès (eds.): Le Lexique des émotions et sa combinatoire lexicale et syntaxique. Grenoble, Éditions littéraires et linguistiques de l’université de Grenoble: 297–316.

De Mulder, Walter (2008): “Force dynamics”. In: Geeraerts, Dirk/Cuyckens, Hubert (eds.): The Oxford Handbook of Cognitive Linguistics. Oxford, Oxford University Press: 294–317.

Diwersy, Sascha et al. (2014): « Traitement des lexies d’émotion dans les corpus et les applications d’EmoBase ». Corpus 13. http://corpus.revues.org/2537 [04.09.2015].

Diwersy, Sascha/François, Jacques (2011): « La combinatoire des noms d’affect et des verbes supports de causation en français ». Travaux Neuchâtelois de Linguistique. Travaux Neuchâtelois de Linguistique 55: 139–161.

Dixon, Robert Malcolm Ward (2000): “A Typology of Causatives: Form, Syntax, and Meaning”. In: Dixon, Robert Malcolm Ward/Aikhenvald, Alexandra (eds.): Changing Valency: Case Studies in Transitivity. Cambridge, Cambridge University Press: 30–83.

Gross, Gaston/Pauna, Ramona/ Valetopoulos, Freiderikos (2009): Sémantique de la cause. Leuven/Paris: Peeters.

Grutschus, Anke/Kern, Beate/Tutin, Agnès (2013): « La polarité du lexique de l’affect : perspective combinatoire et contrastive ». In: Cislaru, Georgeta/Baider, Fabienne (eds.): Cartographie des émotions. Propositions linguistiques et sociolinguistiques. Paris, Presses Sorbonne Nouvelle: 85–98.

Hausmann, Franz Josef (1989): « Le dictionnaire de collocations ». In: Hausmann, Franz Josef/Reichmann, Oskar/Wiegand, Herbert/Zgusta, Ladislav (eds.): Dictionaries. International Encyclopedia of Lexicography. 1^st vol.. Berlin/New York, de Gruyter: 1010–1019.

Hausmann, Franz Josef (1984): „Wortschatzlernen ist Kollokationslernen. Zum Lehren und Lernen französischer Wortverbindungen“. Praxis des neusprachlichen Unterrichts 31: 395–406.

Hausmann, Franz Josef (1985): „Lexikographie“." In: Schwarze, Christoph/Wunderlich, Dieter (eds.): Handbuch der Lexikologie. Königstein, Athenäum: 367–411.

Hoey, Michael (2005): Lexical Priming: A New Theory of Words and Language. London, Routledge.

Legallois, Dominique/François, Jacques (2011): « La Linguistique fondée sur L’usage: parcours critique ». Travaux de linguistique 62: 7–33. doi: 10.3917/tl.062.0007.

Manning, Chris/Schütze, Hinrich (1999): “Collocations”. DRAFT! http://nlp.stanford.edu/fsnlp/promo/colloc.pdf [05.05.2015].

Nazarenko, Adèle (2000): La cause et son expression en français. Gap/Paris: Ophrys.

Novakova, Iva/Goossens, Vannina/Melnikova, Elena (2012): « Associations sémantiques et syntaxiques spécifiques. Sur l’exemple du lexique émotionnel des champs de surprise et de déception ». SHS Web of Conferences 1. 1017–1029. doi: 10.1051/shsconf/20120100181.

Novakova, Iva/Tutin, Agnès (eds.) (2009): Le lexique des émotions. Grenoble, Éditions littéraires et linguistiques de l’université de Grenoble.

Talmy, Leonard (2000): Toward a Cognitive Semantics. Vol. 1. Cambridge: MIT Press.

Tutin, Agnès/Grossmann Francis (eds.) (2014): L’écrit scientifique: du lexique au discours. Autour de Scientext. Rennes, Presses universitaires de Rennes.

Tutin, Agnès (2010): “Showing phraseology in context: an onomasiological access to lexico-grammatical patterns in corpora of French scientific writings”. In: Granger, Sylviane/Paquot, Magali (eds.): Lexicography in the 21^st Century: New Applications, New Challenges. Louvain, Presses universitaires de Louvain: 313–324.

Tutin, Agnès/Novakova, Iva/Grossmann, Francis/Cavalla, Cristelle (2006): « Esquisse de typologie des noms d’affect à partir de leurs propriétés combinatoires ». Langue française 150. Paris, Armand-Colin: 32–49.

Tutin, Agnès (2005a). « Les dictionnaires de collocations sont-ils nécessaires ? ». In: Revue Française de Linguistique Appliquée 2: 31–48. www.cairn.info/revue-francaise-de-linguistique-appliquee-2005-2-page-31.htm [05.05.2015].

Williams, Geoffrey (2003): « Les collocations et l’école contextualiste britannique ». In: Tutin, Agnès/Grossmann, Francis (eds.): Les collocations: analyse et traitement, Travaux de recherches en linguistique appliquée. Amsterdam, de Werelt: 33–44.

Notes

¹ Les apprenants non natifs. retour

² Comme les collocations. retour

³ L’association Vcaus + N_émot est conçue dans notre travail comme une collocation au sens large de Hausmann (1989) et de la méthodologie élaborée dans le cadre du projet Emolex (Diwersy et al. 2014), c’est-à-dire comme une association d’un nom et d’un verbe entretenant une relation sémantique et syntaxique spécifique : susciter DET colère, déclencher DET colère, calmer DET colère, etc. retour

⁴ La fréquence (ou « répétition dans l’usage ») est considérée ici comme la « source » de systématisation à travers l’effet de la répétition sur le stockage et le traitement cognitif des unités. Pour plus de détails, cf. Legallois et François (2011). retour

⁵ Ce terme est utilisé ici au sens de Novakova et al. (2012). retour

⁶ Dans le sens où les relations entre les différents éléments linguistiques sont gérées par la langue elle-même (Hausmann 1984). retour

⁷ Un « produit préfabriqué » de la langue. retour

⁸ Cette classe comprend les verbes qui, hors contexte, ne présentent pas de dimensions clairement marquées (comme provoquer, susciter, créer, etc.) (Diwersy et al. 2014). retour

⁹ Les bases des données, équilibrées et représentatives, fournissent des indications importantes sur les plans quantitatif et qualitatif de l’usage des lexies (Williams 2003). retour

¹⁰ Sous le terme de la disponibilité lexicale nous comprenons ici les lexies repérées dans le corpus Emolex selon le paramètre log-likelihood dont le seuil est d’au moins 10,83. retour

¹¹ Traduction personnelle. retour

¹² Tutin a effectué une étude à partir de la base catégorisée de Frantext sur un siècle, de 1900 à 2005. retour

¹³ Le projet franco-allemand sous la responsabilité d’I. Novakova (Université Grenoble-Alpes) et de P. Blumenthal (Université de Cologne) étudie le lexique des émotions dans cinq langues européennes. retour

¹⁴ Pour plus de détails cf. Diwersy et al. (2014). retour

¹⁵ Bak Sienkiewicz (2010). retour

¹⁶ La classification des verbes supports de causation proposée par Diwersy et François (2011) repose sur le principe de la « force dynamics » de Talmy (2000) discutée par De Mulder (2008). retour

¹⁷ Ce classement est inspiré des travaux de Dixon (2000), Nazarenko (2000), Diwersy / François (2011) et Diwersy et al. (2014). retour

¹⁸ Sur l’ensemble des 1506 occ. repérées pour cette collocation, 154 occ. seulement correspondaient à notre patron syntaxique Vcaus DET N_émot. Ceci peut expliquer la fréquence moins élevée de cette combinaison. retour

¹⁹ Sur l’ensemble des 46 N_émot sélectionnés dans le cadre du projet Emolex. retour

²⁰ Selon nos calculs et le test du log-likelihood, l’attirance entre les 106 Vcaus de notre liste et les neuf champs d’émotions est la plus forte pour ces deux verbes : provoquer DET colère a le LL de 2002, tandis que les LL des cinq associations les plus spécifiques de susciter sont supérieurs à 700. retour

²¹ Une seule occurrence. retour

²² A une seule exception : gâcher DET plaisir40. retour

²³ A partir de ce corpus, Gross a extrait environ 6000 substantifs différents sur lesquels opèrent les prédicats de cause. retour

²⁴ On trouve le même constat chez Hoey (2005: 22–23) pour le verbe to cause dont les arguments sont, dans la majorité des cas, négatifs: accident, death, disease, trouble, problems, etc. retour

²⁵ Notre objectif n’étant pas de prouver la prédominance des combinaisons véhiculant la polarité positive de ces deux verbes, mais uniquement de souligner des risques liés à l’homogénéité du corpus d’étude. Notre requête ne s’est basée alors sur aucun corpus précis sur le Web ; nous avons fait appel à un navigateur internet « services Web libres » permettant l’accès à l’ensemble des énoncées sans aucune contrainte (sauf les nôtres). retour

²⁶ Cette association est pour le moins inattendue et on peut l’attribuer à un discours journalistique, à une figura qui renforcent l’« accroche » du lecteur. Elle apparaît dans le contexte « renoncer aux expressions qui abaissent la culture et flattent le mépris des intellectuels... » (Libération 2007). retour