    BioExcom: Detection and categorization of speculative sentences in biomedical literature
    (2011) ;
    Desclés, Julien
    Desclés, Jean-pierre
    Biological research papers are replete with speculative sentences. We present the BioExcom rule-based system, which detects speculations in biomedical literature. Furthermore, it enables to distinguish automatically between prior and new speculations in the analyzed paper. BioExcom is based on the Contextual Exploration processing (hierarchical research of linguistic surface markers with the EXCOM computational platform). To accomplish this task, BioExcom uses also specific linguistic resources established by concise semantic analysis performed by a biologist and a linguist. Our work shows that it is possible to detect and categorize speculative sentences without computational deep linguistic analyses. This work could be useful for biologists who are interested by finding new hypothesis in literature. © 2011 Springer-Verlag.
    Classification automatique et stratégie d'annotation appliquées à un concept philosophique: la dimension psychologique du concept de LANGAGE dans l'oeuvre de Bergson 1
    (2010) ;
    Danis, Jean
    Jean-Guy Chartier
    Chartier, Jean-François
    Desclés, Jean-pierre
    Les outils d'assistance à la lecture et à l'analyse experte des textes sont de plus en plus demandés dans le domaine des humanités. En philosophie, ces processus de lecture et d'analyse s'effectuent dans bien des cas par l'entremise d'analyses conceptuelles. Les approches lexicométriques et macrotextuelles offrent des pistes intéressantes mais demeurent limitées lorsqu'il s'agit d'analyser les multiples facettes d'un concept philosophique. Nous présentons dans cet article une méthode de fouille textuelle qui combine à l'analyse d'une concordance un algorithme de classification non supervisée (k-moyennes) et une stratégie d'annotation assistée par la plate-forme sémantique EXCOM. Le traitement est appliqué au concept de LANGAGE dans le corpus d'Henri Bergson. Abstract Assisting tools for analysis and expert reading of texts are more and more demanded by researchers in the Humanities. In philosophy, these expert reading processes are often carried out by conceptual analysis. Macro-textual approaches have given appealing results but remain limited when it's time to analyze the multifaceted properties of philosophical concepts. We present in this article a computer-assisted text mining method that allows researchers to explore the multifaceted contexts of a philosophical concept. The method aims at integrating to standard clustering methods a computer-assisted annotation strategy with the use of the platform called " EXCOM " . Our method is here applied to the concept of LANGUAGE in Henri Bergson's corpus.
    Dictionnaire multilingue de proverbes: Premier retour d’expérience
    Ce projet est réalisé au département de FLE à l’université Paris-Sorbonne Abou Dhabi. L’objectif est la création d’un dictionnaire thématique de proverbes en français et en arabe. Pour définir l’objet de notre travail, nous avons opté dans un premier temps pour le terme générique « proverbe » qui couvrirait à la fois différents concepts de la parémiologie, tels le dicton, la devinette, le précepte ou la maxime. Chaque entrée du dictionnaire contient: un proverbe français avec sa traduction approximative en arabe ; le proverbe équivalent en arabe (s’il existe) avec sa traduction approximative en français. Les apprenants (niveaux A2-B2) trouveraient dans ce travail différents intérêts pédagogiques et culturels: découverte de l’autre culture et de ses stéréotypes représentatifs à travers l’échange autour de l’imaginaire des proverbes; travailler sur la traduction des formes et des idées entre langues... Ce travail s’effectue entièrement sur une plateforme d’enseignement en ligne (forums et wikis). D’autres outils de traduction collaborative sont également utilisés. L’objectif est de diffuser en ligne un dictionnaire avec des entrées vérifiées et de le mettre à disposition du public à des fins pédagogiques (enrichissement ou introduction d’autres langues). Une évaluation de l’intérêt pédagogique de ce travail collaboratif à distance devrait également être effectuée afin de mesurer l’impact de son utilisation sur le progrès des apprenants, la modification de leur façon de travailler et l'évolution du rôle de l'enseignant.
    Direct reported speech in multilingual texts: Automatic annotation and semantic categorization
    (2010) ;
    Suh, J.
    Desclés, J.-P.
    We propose an application for the automatic identification and categorization of quotations. The categorization is based on a semantic map of enunciative modalities. The texts are treated in three languages: Arabic, Korean and French.
    E-Quotes : un outil de navigation textuelle guidée par les annotations sémantiques
    RÉSUMÉ Nous présentons E-Quotes, un outil de navigation textuelle guidée par les annotations sémantiques. Le système permet de localiser les mots clés et leurs variantes dans les citations sémantiquement catégorisés dans corpus annoté, et de naviguer entre ces citations. Nous avons expérimenté ce système sur un corpus de littérature française automatiquement annoté selon des catégories sémantiques présentes dans le contexte des citations, comme par exemple la définition, l'argumentation, l'opinion, l'ironie ou la rumeur rapportées. ABSTRACT E-Quotes : A semantic annotations-driven tool for textual navigation We present in this paper a semantic annotations-driven tool for textual navigation. The system allows to locate keywords and their variants in semantically categorized passages of an annotated corpus, and navigate between these passages. We tested this system on a French literary corpus automatically annotated according to semantic categories existing in the context of quotations, such as reported Definition, Argumentation, Opinion, Irony or Rumor. MOTS-CLÉS: Annotation sémantique, citations catégorisées, navigation textuelle, fouille de textes
    E-quotes: Enunciative modalities analysis tool for direct reported speech in Arabic
    With rapidly growing Arabic online sources aimed to encourage people’s discussions concerning personal, public or social issues (news, blogs, forums…), there is a critical need in development of computational tools for the Enunciative Modalities analysis (attitude, opinion, commitment…). We present a new system that identifies and categorizes quotations in Arabic texts and proposes a strategy to determine whether a given speaker’s quotation conveys some enunciative modalities and potentially its evaluation by the enunciator. Our system enables two query types search for keywords within the “categorized” quotations: searching for keywords in the part potentially containing the reported speech source (the reporting clause) or searching for keywords in the part concerning the topic (the reported clause). The annotation is performed with a rule-based system using the reporting markers’ meaning. We applied our system to process a corpus of Arabic newspaper articles and we obtained promising results for the evaluation. © Springer International Publishing Switzerland 2015.
    Les difficultés de l'utilisation du discours rapporté en français chez des apprenants arabophones : Interférences langagières et perspectives pédagogiques
    Dans cet article, nous étudions les difficultés rencontrées chez des apprenants arabophones en FLE dans l’utilisation du discours rapporté. A partir d’un corpus de copies d’examen (niveaux B1-B2), nous identifions les lacunes de transposition du discours direct en discours indirect et nous discutons les raisons de ces difficultés qui seraient souvent liées à des interférences langagières entre le français et l’arabe. En guise de conclusion, nous proposons quelques perspectives pédagogiques que les enseignants de FLE pourraient prendre en considération face à un public d’apprenants arabophones
    Opinion mining from arabic quotations
    (Association for Computing Machinery, Inc, 2014)
    We present a contribution to the Arabic Opinion Mining area with the development of a new system for quotations detection and categorization. Our approach differs from the existing work by proposing an operational tool that enables search for keywords in the categorized quotations. The categorization is performed with a rule-based system and is based on the reporting markers' meaning. The system end-user interface enables two query types within the categorized quotations: searching for keywords in the part containing eventually the quotation source (reporting clause) or in the part concerning the topic (reported clause). Our system was applied to process a corpus of Arabic newspaper articles. Both evaluations were carried out with the following results: 88 of recall and 93 of precision for the identification task; 85 or recall and a 93 of precision for the categorization task. The system is publicly accessible on the web site ( Copyright © 2014 ACM.
