La logique en linguistique
← BackIntroduction
La relation entre logique et linguistique est profonde et multifacette. La logique formelle fournit des outils pour analyser la structure et la signification du langage naturel, tandis que les phénomènes du langage naturel défient et étendent les systèmes logiques formels.
De la sémantique formelle à la linguistique computationnelle, les méthodes logiques éclairent comment le langage transmet la signification, comment les phrases se combinent pour former des pensées complexes, et comment nous pouvons construire des systèmes computationnels qui comprennent le langage.
Ce guide explore l'application de la logique à l'analyse linguistique, de la sémantique vériconditionnelle au traitement du langage naturel, montrant comment le formalisme logique nous aide à comprendre la nature systématique du langage humain.
Sémantique formelle
La sémantique formelle utilise la logique et les mathématiques pour modéliser comment les expressions linguistiques obtiennent leurs significations. L'objectif est de fournir des comptes rendus précis et compositionnels de la signification qui expliquent comment la signification de la phrase découle de la signification des mots et de la structure syntaxique.
Différents cadres sémantiques font différentes hypothèses sur la nature de la signification, mais tous reposent fondamentalement sur des outils logiques pour rendre les relations de signification explicites et testables.
Sémantique vériconditionnelle
La signification d'une phrase est identifiée avec ses conditions de vérité—les conditions dans lesquelles elle serait vraie. 'La neige est blanche' signifie que la neige est blanche. La sémantique logique fournit une manière systématique de calculer les conditions de vérité.
Compositionnalité (principe de Frege)
La signification d'une expression complexe est déterminée par les significations de ses parties et la manière dont elles sont combinées. Ce principe permet à une connaissance linguistique finie de produire une infinité de phrases—une propriété centrale du langage humain.
Sémantique théorique des modèles
Les significations sont définies relativement à des modèles—structures mathématiques spécifiant ce qui existe et quelles propriétés possèdent les objets. Une phrase est vraie dans un modèle si le modèle satisfait ses conditions de vérité.
Sémantique des mondes possibles
Étend la sémantique théorique des modèles pour traiter les modaux, les conditionnels et les contextes intensionnels. La signification de 'Il pourrait pleuvoir' implique de quantifier sur des mondes possibles où il pleut.
Sémantique situationnelle
Au lieu d'évaluer les phrases relativement à des mondes entiers, utilise des situations partielles—parties de la réalité. Aborde des problèmes avec la sémantique des mondes possibles pour certains phénomènes linguistiques.
Sémantique dynamique
Traite la signification comme potentiel de changement de contexte plutôt que conditions de vérité. La signification de 'Un homme entre. Il s'assoit' implique comment 'un homme' introduit un référent de discours accessible à 'il'.
Quantification en langage naturel
Le langage naturel a une structure quantificationnelle riche qui s'étend au-delà du simple ∀ et ∃. La théorie des quantificateurs généralisés fournit des outils logiques pour analyser cette complexité.
Quantificateurs universels
Les mots comme 'tous', 'chaque', 'tout' expriment la quantification universelle mais avec des différences subtiles de signification et de distribution syntaxique. 'Chaque étudiant a réussi' ≈ ∀x(étudiant(x) → réussi(x)).
Quantificateurs existentiels
'Certains', 'un', 'plusieurs' expriment la quantification existentielle. 'Un étudiant a réussi' ≈ ∃x(étudiant(x) ∧ réussi(x)). Notez que 'certains' porte une implicature scalaire (pas tous).
Quantificateurs généralisés
'La plupart', 'peu', 'beaucoup', 'plusieurs' ne se réduisent pas à ∀ ou ∃. La théorie des quantificateurs généralisés les traite comme des relations entre ensembles : 'La plupart des étudiants ont réussi' signifie |étudiants ∩ réussis| > |étudiants ∩ ¬réussis|.
Ambiguïté de portée des quantificateurs
'Tout le monde aime quelqu'un' est ambigu : ∀x∃y(aime(x,y)) ('chacun a quelqu'un qu'il aime') vs ∃y∀x(aime(x,y)) ('il y a quelqu'un que tout le monde aime'). La portée détermine la structure logique.
Phrases à âne et anaphore
'Chaque fermier qui possède un âne le bat' pose des défis. À quoi 'le' fait-il référence ? Quelle est la portée de 'un âne' ? La sémantique dynamique et la théorie de la représentation du discours abordent ces énigmes.
Forme logique
La forme logique (FL) est la structure syntaxique abstraite qui détermine l'interprétation sémantique. Elle est souvent distincte de la structure syntaxique de surface.
Extraire la forme logique des phrases de langage naturel révèle une complexité cachée et explique les propriétés sémantiques comme l'ambiguïté, l'entraînement et l'anomalie.
Structure profonde vs structure de surface
La forme de surface 'Que mange Jean ?' et la forme profonde/logique où 'que' provient comme objet de 'mange'. Les opérations de mouvement mappent entre surface et forme logique.
Calcul lambda et liaison de variables
L'abstraction lambda (λx.P(x)) crée des fonctions à partir de formules. Essentiel pour la sémantique compositionnelle : 'marche' pourrait dénoter λx.marche(x), qui se combine avec 'Jean' pour donner marche(jean).
Théorie des types (grammaire de Montague)
Richard Montague a utilisé le calcul lambda typé pour modéliser la compositionnalité. Chaque expression a un type (e pour les entités, t pour les valeurs de vérité, etc.), et la combinaison respecte les contraintes de type.
Grammaire catégorielle
Les catégories syntaxiques sont des types logiques. Un verbe transitif a le type (NP\S)/NP—il se combine avec un NP objet à droite et un NP sujet à gauche pour former une phrase S. La syntaxe reflète la sémantique.
Présupposition et implicature
Tous les aspects de la signification ne sont pas vériconditionnels. Les présuppositions et les implicatures ajoutent des couches de signification que la sémantique formelle doit expliquer à l'aide d'outils logiques.
Présupposition sémantique
'Le roi de France est chauve' présuppose que la France a un roi. La phrase et sa négation portent cette présupposition—elle survit à la négation et au questionnement.
Présupposition pragmatique
Les présuppositions dépendent du contexte et des hypothèses du locuteur. 'Même Jean est venu' présuppose que d'autres sont venus et que Jean était peu susceptible de venir. Annulable dans certains contextes.
Projection de présupposition
Comment les présuppositions des parties se projettent en présuppositions du tout. 'Si la France a un roi, le roi de France est chauve' hérite différemment la présupposition que la phrase simple.
Implicature gricéenne
H.P. Grice a distingué ce qui est dit (signification vériconditionnelle) de ce qui est impliqué (implicature conversationnelle). 'Certains étudiants ont réussi' implique (pas tous n'ont réussi) par la maxime de quantité.
Implicature scalaire
L'utilisation d'un terme plus faible sur une échelle (<tous, la plupart, beaucoup, certains, aucun>) implique la négation des alternatives plus fortes. La pragmatique formelle utilise la logique pour modéliser ces inférences.
Modalité dans le langage
Les langages naturels expriment la nécessité, la possibilité, l'obligation et la permission à travers des verbes modaux et d'autres dispositifs. La logique modale fournit des outils pour analyser la signification modale.
Modaux épistémiques
'Doit', 'pourrait', 'peut' expriment l'état épistémique du locuteur. 'Il doit pleuvoir' signifie que le locuteur infère la pluie à partir de preuves. Analysé en utilisant la logique modale et les mondes possibles.
Modaux déontiques
'Devrait', 'doit', 'peut' expriment l'obligation et la permission. 'Tu devrais partir' impose une obligation. La logique déontique modélise ces significations normatives.
Modaux dynamiques
'Peut', 'capable de' expriment la capacité ou les propriétés dispositionnelles. 'Jean peut nager' attribue une capacité de nage—une saveur modale différente de l'épistémique ou du déontique.
Évidentialité
Certaines langues marquent grammaticalement la source d'information (observation directe, inférence, ouï-dire). La logique épistémique étendue avec des opérateurs évidentiels modélise cette catégorie sémantique.
Base modale et source d'ordonnancement
Analyse de Kratzer : les modaux quantifient sur des mondes possibles restreints par la base modale (mondes contextuellement pertinents) et ordonnés par la source d'ordonnancement (ce qui est idéal/normal). Fournit une analyse unifiée des variétés modales.
Négation
La négation en langage naturel est plus complexe que le NON logique. La portée, la polarité et les effets pragmatiques créent des motifs riches nécessitant une analyse logique sophistiquée.
Négation phrastique vs négation de constituant
'Jean n'est pas parti' (négation phrastique : ¬parti(jean)) vs 'Pas Jean est parti' (négation de constituant : focalise sur le sujet). La portée logique et la focalisation déterminent l'interprétation.
Éléments de polarité négative
Les éléments comme 'aucun', 'jamais', 'encore' nécessitent des contextes descendant-entraînants. 'Je n'ai vu personne' est correct ; *'J'ai vu personne' est incorrect. Nécessite une caractérisation logique des environnements de licence.
Double négation et concordance négative
En logique, ¬¬P = P. Certaines langues (français, espagnol) utilisent la concordance négative où plusieurs négations expriment une seule négation : 'Je ne vois personne' (Je ne vois personne = Je ne vois personne).
Négation métalinguistique
'Je n'ai pas piégé deux lapins ; j'en ai piégé trois' nie l'implicature, pas le contenu vériconditionnel. Montre que la négation peut cibler des aspects non-vériconditionnels de la signification.
Applications computationnelles
La logique formelle permet le traitement computationnel du langage naturel. De l'analyse sémantique à la réponse aux questions, les représentations logiques font le pont entre l'analyse linguistique et le raisonnement automatisé.
Le TAL moderne utilise de plus en plus des méthodes basées sur la logique aux côtés d'approches statistiques, en particulier pour les tâches nécessitant un raisonnement précis et une compréhension compositionnelle.
Traitement du langage naturel
La linguistique computationnelle utilise des formalismes logiques pour représenter la signification, permettant aux machines de comprendre et de générer du langage. L'analyse sémantique convertit les phrases en formes logiques pour le raisonnement automatisé.
Analyse sémantique
Conversion automatique de phrases en représentations sémantiques formelles (logique du premier ordre, calcul lambda, SQL). Permet la réponse aux questions, l'interrogation de bases de données et la recherche sémantique.
Systèmes de réponse aux questions
Des systèmes comme IBM Watson utilisent l'inférence logique sur des bases de connaissances. Les questions sont analysées en requêtes logiques, répondues par raisonnement sur des représentations logiques de connaissances.
Entraînement textuel
Déterminer si le texte T entraîne l'hypothèse H. 'Jean a acheté une voiture' entraîne 'Jean possède un véhicule'. Nécessite une inférence logique sur des représentations sémantiques.
Formalismes grammaticaux
- Grammaires hors-contexte : Formalisme classique avec des fondements logiques en théorie des langages formels
- Grammaire type-logique : Utilise le calcul lambda typé ; correspondance syntaxe-sémantique via l'isomorphisme de Curry-Howard
- HPSG (Grammaire syntagmatique guidée par les têtes) : Structures de traits avec contraintes logiques
- Syntaxe minimaliste : Dérive la forme logique à travers des opérations syntaxiques comme Fusion et Déplacement