Les deux révisions précédentesRévision précédenteProchaine révision | Révision précédente |
1005-h2019:generation [2019/03/09 12:42] – [Mise en perspective] CLLET43 | 1005-h2019:generation [2019/03/11 17:35] (Version actuelle) – [Exemples liés mais moins parlants] CLLET43 |
---|
===== Définition de la notion ===== | ===== Définition de la notion ===== |
| |
La génération automatique de textes (GAT) est une branche du Traitement Automatique des Langues Naturelles (TALN) et une sous discipline de la linguistique informatique. La GAT vise à exprimer sous une forme textuelle, syntaxiquement et sémantiquement correcte une représentation formelle d’un contenu. Ces systèmes informatiques de génération automatique de textes utilisent « les connaissances du langage et d’un domaine d’application pour produire automatiquement des rapports, des documents, (…) des messages d’aide et tout autre type de texte » (Reiter Ehud et Dale Robert, Building Natural Language Generation Systems). La génération automatique est aujourd’hui utilisée dans une variété de secteurs et pour diverses fins : rapports d’entreprise, données médicales, contenus de sites web, textes calibrés pour les réseaux sociaux, données météorologiques, etc. | La génération automatique de textes (GAT) est une branche du //Traitement Automatique des Langues Naturelles// (TALN) et une sous discipline de la linguistique informatique. La GAT vise à exprimer sous une forme textuelle, syntaxiquement et sémantiquement correcte une représentation formelle d’un contenu. Ces systèmes informatiques de génération automatique de textes utilisent « les connaissances du langage et d’un domaine d’application pour produire automatiquement des rapports, des documents, (…) des messages d’aide et tout autre type de texte » (Reiter Ehud et Dale Robert, Building Natural Language Generation Systems). La génération automatique est aujourd’hui utilisée dans une variété de secteurs et pour diverses fins : rapports d’entreprise, données médicales, contenus de sites web, textes calibrés pour les réseaux sociaux, données météorologiques, etc. |
| |
===== Mise en perspective ===== | ===== Mise en perspective ===== |
Bien que la génération automatique de textes soit en plein essor à l’ère de la technologie et d’Internet, il est faux de penser que le phénomène est tout récent. Le projet de la GAT a été abandonné en 1960, puis repris dans les années 1970 dans le but de créer un programme qui réponde à des questions posées. À l’époque, il fallait trois sortes de générateurs différents pour composer soit des phrases simples, un petit paragraphe ou un texte complet. Les chercheurs des années 1970 pensaient qu’une dizaine d’années suffiraient pour que leurs programmes conçoivent des textes dont la qualité était semblable à un humain. Le perfectionnement aura pris plusieurs années de plus, mais regardez où nous en sommes ! Les générateurs automatique de textes en ligne d’aujourd’hui sont faciles d’accès et nous permettent de choisir d’une à cent lignes de texte aléatoire, sans compter les générateurs de contes, de poèmes, d’histoire, etc. | Bien que la génération automatique de textes soit en plein essor à l’ère de la technologie et d’Internet, il est faux de penser que le phénomène est tout récent. Le projet de la GAT a été abandonné en 1960, puis repris dans les années 1970 dans le but de créer un programme qui réponde à des questions posées. À l’époque, il fallait trois sortes de générateurs différents pour composer soit des phrases simples, un petit paragraphe ou un texte complet. Les chercheurs des années 1970 pensaient qu’une dizaine d’années suffiraient pour que leurs programmes conçoivent des textes dont la qualité était semblable à un humain. Le perfectionnement aura pris plusieurs années de plus, mais regardez où nous en sommes ! Les générateurs automatique de textes en ligne d’aujourd’hui sont faciles d’accès et nous permettent de choisir d’une à cent lignes de texte aléatoire, sans compter les générateurs de contes, de poèmes, d’histoire, etc. |
| |
https://www.google.com/url?sa=i&source=images&cd=&cad=rja&uact=8&ved=2ahUKEwjR4tnfzfXgAhVEMt8KHdEPBiUQjRx6BAgBEAU&url=http%3A%2F%2Fwww.ohmybox.info%2Fpetite-histoire-de-la-generation-automatique-de-textes%2F&psig=AOvVaw05NPkx72k9CZPFR8zVOqKe&ust=1552239726230835 | |
| **Théorique** |
| |
| Le processus de génération automatique se déroule en trois étapes : la planification du document (document planning ou macro-planning), la micro planification (macro-planning) et la réalisation linguistique. La première se définit par la détermination du contenu et la structuration du document. La seconde est l’agrégation, la lexicalisation et la génération d’expressions de référence. Puis, la dernière étape se caractérise par la réalisation de la structure et la réalisation de la surface. Autrement dit, cet enchaînement peut s’interpréter sous forme de deux questions : « Quoi dire ? » et « Comment le dire ? ». Techniquement, les systèmes de GAT fonctionnent ainsi : ils reçoivent en entrée (//input//) des données non linguistiques pour ensuite produire en sortie (//output//) un texte cohérent. La production de textes se base sur un système de représentations informatisées qui, elles, portent sur un domaine donné (constat d’accident, bulletin météo) et dans un genre donné (récit, manuel, dialogue). |
| |
| |
| **Avantages** |
| |
| La génération automatique de textes comporte de nombreux avantages : |
| * //Réutilisabilité et maintenance// : Puisque les modifications au texte se font directement dans la base des données, cela permet une mise à jour automatique. |
| |
| * //Recherche d’informations// : La recherche d’informations textuelles est efficace étant donné que celle-ci se fait également dans la base des données. |
| |
| * //Flexibilité et interactivité// : Il est possible, avec un générateur de textes, d’obtenir différentes paraphrases à partir d’une même représentation abstraite et ce, dans le but d’améliorer le processus de communication. |
| |
| * //Multilinguisme// : Un générateur multilingue peut produire des énoncés dans différentes langues à partir d’une même base de données, tout cela en évitant le coût et les difficultés que peut amener la traduction. Il s’agit d’un avantage significatif puisque l’ajout d’une langue nécessite peu de coûts. |
| |
| * //Personnalisation et langues contrôlées// : Un système de génération paramétrable permet d’ajuster ses messages aux besoins de l’utilisateur, par exemple, ou à des circonstances particulières. |
===== Notions corrélées ===== | ===== Notions corrélées ===== |
| |
À l’ère de la technologie, les auteurs trouvent toutes sortes de façons de se diversifier. Voici un exemple de génération automatique de textes : http://enneagon.org/phrases. Ce site, accessible à tous, possède une base de références composée principalement de romans du XIXe siècle qui lui permet de générer des textes d’une longueur entre une et cent phrases. Seul hic : le générateur est totalement aléatoire, il ne faut donc pas s’attendre à un texte inspirant et pertinent : « Théorème auquel peut servir de commentaire la phrase que vous m'estimiez, que vous ignoriez ma passion, je vis bien que je verserai son sang, délivrée de ses noires prunelles. » | À l’ère de la technologie, les auteurs trouvent toutes sortes de façons de se diversifier. Voici un exemple de génération automatique de textes : http://enneagon.org/phrases. Ce site, accessible à tous, possède une base de références composée principalement de romans du XIXe siècle qui lui permet de générer des textes d’une longueur entre une et cent phrases. Seul hic : le générateur est totalement aléatoire, il ne faut donc pas s’attendre à un texte inspirant et pertinent : « Théorème auquel peut servir de commentaire la phrase que vous m'estimiez, que vous ignoriez ma passion, je vis bien que je verserai son sang, délivrée de ses noires prunelles. » |
| |
| {{:1005-h2019:nlg.jpg?400|}} |
| |
| Source de l'image : http://www.ohmybox.info/petite-histoire-de-la-generation-automatique-de-textes/ |
==== Exemples convaincants ==== | ==== Exemples convaincants ==== |
| |
* Le site Enneagon présenté précédemment est un exemple pur de ce que représente la génération automatique de texte, sans se rendre utile ou cocasse. Cependant, ce mode aléatoire de création s’est développé et est aussi utilisé à des fins humoristiques ou de divertissement. En effet, le site //Le générateur de briographies// (http://bio.gen2box.com/index.php ) peut inventer des biographies et des articles divers sur vous. Plus interactif que les autres pages web du genre, il suffit d’y entrer quelques informations et vous avez un texte personnalisé et plutôt amusant. | * Le site Enneagon présenté précédemment est un exemple pur de ce que représente la génération automatique de texte, sans se rendre utile ou cocasse. Cependant, ce mode aléatoire de création s’est développé et est aussi utilisé à des fins humoristiques ou de divertissement. En effet, le site //Le générateur de briographies// (http://bio.gen2box.com/index.php ) peut inventer des biographies et des articles divers sur vous. Plus interactif que les autres pages web du genre, il suffit d’y entrer quelques informations et vous avez un texte personnalisé et plutôt amusant. |
* La poésie, un langage plus imagé que les textes courants, serait peut-être plus adéquate à se prêter au jeu de la génération automatique. Le site La //bibliothèque d’alexandrins// (http://graner.net/nicolas/OULIPO/alex.html) permet aux utilisateurs de choisir entre 14 styles différents et de profiter de la lecture d’alexandrins aléatoires en ballades, tirades, quatrains, etc. Cette fois, le fait de générer seulement des vers de 12 syllabes ajoute un défi supplémentaire à l’algorithme et rend la lecture intéressante. | * La poésie, une forme de langage plus imagé que les textes courants, serait peut-être plus adéquate à se prêter au jeu de la génération automatique. Le site La //bibliothèque d’alexandrins// (http://graner.net/nicolas/OULIPO/alex.html) permet aux utilisateurs de choisir entre 14 styles différents et de profiter de la lecture d’alexandrins aléatoires en ballades, tirades, quatrains, etc. Cette fois, le fait de générer seulement des vers de 12 syllabes ajoute un défi supplémentaire à l’algorithme et rend la lecture intéressante. |
| |
==== Exemples liés mais moins parlants ==== | ==== Exemples liés mais moins parlants ==== |
| |
* D’autres artistes, autre que les auteurs, peuvent aussi utiliser la génération automatique. C’est le cas des musiciens ou producteurs de Jukedeck (https://www.numerama.com/tech/135515-jukedeck-compose-de-la-musique-libre-de-droits.html) qui utilisent maintenant une intelligence artificielle pour générer des pièces libres de droit à mettre en ligne. Le client peut même choisir les paramètres de sa chanson qui lui sera créée sur demande. | * D’autres artistes, autre que les auteurs, peuvent aussi utiliser la génération automatique. C’est le cas des musiciens ou producteurs de Jukedeck (https://www.numerama.com/tech/135515-jukedeck-compose-de-la-musique-libre-de-droits.html) qui utilisent maintenant une intelligence artificielle pour générer des pièces libres de droit à mettre en ligne. Le client peut même choisir les paramètres de sa chanson qui lui sera créée sur demande. |
* On retrouve de nombreux générateurs sur Internet, que ce soit des générateurs de mèmes, de textes, de poèmes, de musique, etc. Si, comme dans le point précédent, vous demandez à une intelligence artificielle de vous créer une pièce et que vous n’avez pas d’idées pour le titre, il existe même des générateurs de titres de chansons (https://fr.fantasynamegenerators.com/titres-de-chansons.php) où un seul clic peut sauver du syndrôme de la page blanche. | * On retrouve de nombreux générateurs sur Internet, que ce soit des générateurs de mèmes, de textes, de poèmes, de musique, etc. Si, comme dans le point précédent, vous demandez à une intelligence artificielle de vous créer une pièce et que vous n’avez pas d’idées pour le titre, il existe même des générateurs de titres de chansons (https://fr.fantasynamegenerators.com/titres-de-chansons.php) où un seul clic peut vous sauver du syndrôme de la page blanche. |
| |
===== Références critiques ===== | ===== Références critiques ===== |