Giter Club home page Giter Club logo

eastlingeditor's People

Contributors

m8nli9ht avatar

Stargazers

 avatar

Watchers

 avatar  avatar  avatar  avatar  avatar

eastlingeditor's Issues

Documents de type WORDLIST qui ne s'affichent pas

Titre :
Numeral-plus-classifier phrases. Tone: L1. Classifier: monetary units. Range: 1 to 30

DOI :
doi:10.24397/pangloss-0004369

Code pour l'appeler : corpus/show?mode=pro&oai_primary=cocoon-c8101691-2a1f-37c9-82fd-64739074a2ce&oai_secondary=cocoon-975ec0ec-2dd9-3e15-af4f-dfb5b7a9ad63

C'est un document de type LISTE DE MOT (WORDLIST).

image

formatage de la boîte des paramètres

Il faudrait mettre dans un même conteneur le nom du paramètre et les options qui s'y rattachent.

Ex:

Translations
...

Devrait être

Translations
...

Exposition International Image Interoperability Framework (IIIF) - Interopérabilité avec l'ontologie "Web Annotation" du W3C

En direct d'une École d'été en Humanités numériques : des collègues [Christophe Eckes (Archives Henri-Poincaré), Pierre Willaime (Archives Henri-Poincaré) et Loïc Jeanson (Université de Lausanne)] présentent un module "Annotate" pour IIIF, développé pour l'EHESS, qui permet d'utiliser le standard "Web Annotation Ontology" du W3C.

L'enjeu technique est de lier l'ontologie "Web Annotation" du W3C à la spécification IIIF.

L'outil leur permet d'annoter une partie d'une image, de même que c'est fait dans Eastling.

Lien avec Eastling : y aurait-il un export possible (conversion) du XML vers un format qui soit interopérable avec "International Image Interoperability Framework"?

En première approximation : avoir une info standard, quand on exporte depuis Eastling, pour remplir les champs demandés par l'ontologie "Web Annotation" : qu'est-ce qui motive l'annotation (=déchiffrer une écriture), à quoi sert l'annotation (=c'est une transcription de manuscrit), qu'est-ce qui est le contenu de l'annotation (là on envoie le contenu de l'annotation XML, en bon ordre, avec une syntaxe qui 'projette' la structure Pangloss : <S> <W> etc.)

À discuter, dans le contexte d'une recherche d'interopérabilité ? Cela pourrait encourager des utilisateurs plus nombreux à utiliser Eastling pour des manuscrits (texte).

Une des implications possibles pour Eastling consiste dans la façon de définir un rectangle sur l'image. Il semble que la syntaxe sur laquelle se soient accordé·e·s les collègues soit du type : <abscisse du coin supérieur gauche, ordonnée du coin supérieur gauche, largeur du rectangle, hauteur du rectangle>. Ce qui impliquerait de ré-encoder les balises AREA, qui sont actuellement en <x1, y1, x2, y2>. Par exemple : <W id="TWH_T19_W004"> <AREA image="cocoon-504731e0-1a27-334f-b752-8200439078b1" shape="rect" coords="431,30,550,113"/> deviendrait : ... coords="431,30,550 - 431 = 119,113 - 30 = 83"/>. Bref : ... coords="431,30,119,83"/>.

affichage depuis Cocoon

Un affichage (simplifié) des documents EASTling depuis Cocoon est en place. Voir cette page :
image

Y compris un [Code d'intégration dans une page web](<iframe height="320" src="https://cocoon.huma-num.fr/exist/rest/db/www/xql/cocoon_iframe.xql?id=cocoon-861c4050-8ef0-3821-bbbc-a535860ed807" width="600"></iframe>).

Comment aller de l'avant : intégrer un lecteur EASTling plus complet à Cocoon ? Proposer plusieurs lecteurs possibles ? Dans ce dernier cas : planifier des améliorations au lecteur EASTling dans Cocoon ?

remise à flot du texte "Les abeilles entrent dans la maison"

Ce texte sert de démo (prototype / preuve de concept). Mais la démo ne fonctionne plus depuis certains changements intervenus dans Cocoon (voir #3).

L'affichage EASTling ne marche pas (page blanche) :
https://pangloss.cnrs.fr/corpus/eastling_player.php?idref=cocoon-861c4050-8ef0-3821-bbbc-a535860ed807

Outre la "remise à flot", il y aura un peu de nettoyage à faire pour clarifier le lien entre le document 2276 et le document 1758.

Ce document
https://doi.org/10.24397/pangloss-0002276
est semble-t-il une version abrégée du document 1758 (lequel apparaît dans la liste comme dépourvu d'annotation : le lien avec l'annotation sera à établir, en ajustant les coordonnées temporelles).

Un document pouvant se prêter à traitement par Eastling

https://doi.org/10.24397/pangloss-0007543
On pourrait imaginer de voir une boîte se déplacer sur l'image de la partition à mesure que la musique se déroule.
C'est une application peut-être marginale ou inutile ? (Les personnes qui savent déchiffrer des partitions n'ont évidemment pas besoin d'être guidées par une boîte qui se déplace sur l'image.) Il y a des logiciels pour la musique, qui fonctionnent de façon plus élaborée.
À proposer tout de même, à titre expérimental, comme un sujet possible pour personne (stagiaire?) souhaitant essayer Eastling ? et comme un enrichissement possible d'une ressource déposée dans Pangloss, "jardin de données" où germent des innovations ?

L'info de description Place et la transcription du texte ne sont pas affichées après import depuis Pangloss

Découpage audio en phrase ou paragraphe │ Sélection et création d’une nouvelle séquence audio

Lors de la création d’une nouvelle séquence audio, et lorsque l’on souhaite poursuivre la sélection de cette nouvelle région audio, il est difficile de créer la durée souhaitée sans déplacer la région déjà sélectionnée.
Les deux outils pour le déplacement et l’étirement des deux nouveaux intervalles, de début et de fin de séquence, sont activés facilement sur la time-line audio.
Capture d’écran 2023-06-14 à 10 55 20

Serait-il possible lors de cette phase de travail, de créer par exemple, deux icônes de ces outils afin de les sélectionner selon les besoins de l’utilisateur ?
Merci !

articulation avec l'enseignement des langues rares

Enjeux importants, qui pourraient se décliner en deux grands ensembles (non fermés) :

  • langues enseignées dans le cadre de l'Institut des langues rares (ILARA - EPHE) : cours d'introduction, pas nécessairement reconduits d'année en année. Exemple :
    • maya (pétroglyphes),
    • méroïtique (stèles anciennes, en lien avec l'étude de langues contemporaines)
  • langues enseignées dans le cadre de l'INALCO : "grandes petites langues" avec enseignement régulier (d'année en année) et cursus intégral. Exemple : laotien, thai, vietnamien... (je reconnais mon biais personnel "Asie du Sud-Est" !)

L'articulation entre les deux serait également à travailler. Eastling serait un outil tout à fait pertinent pour le MOOC "écriture naxi" de l'INALCO, par exemple (pictogrammes/idéogrammes...) : un projet qui n'est pas directement lié à un diplôme INALCO (pas d'enseignement du naxi), mais qui est un projet INALCO +Université de Genève.

Conversion WAV to MP3

Il faut permettre à l'utilisateur d'uploader un fichier WAV (qui sera utilisé lors du dépôt) et de le convertir en MP3 pour optimiser le travail sur l'éditeur

import depuis site Pangloss

Premier test de l'import depuis site Pangloss !!

Et tout de suite, une amélioration à faire qui ressort :)
image

À faire : monter la limite supérieure autorisée pour les chaînes de caractères ?
Il faut autoriser les chaînes longues en prenant comme limite supérieure la traduction ou transcription intégrale d'un texte : la <FORM> ou <TRANSL> au niveau <TEXT>. Pour un bon gros récit d'une demi-heure, ça peut aller chercher dans les 50 000 caractères ou plus. (Un exemple au-dessus de 30k caractères : la traduction française du texte en fin de ce document.)

affichage des textes sans manuscrit : ajustements à réaliser pour site Pangloss

Ajustements à réaliser pour l'emploi d'Eastling comme lecteur pour tous les documents, dans le cadre de la refonte en cours du site Pangloss :

Pour l'affichage de textes sans manuscrit, par exemple ici : il reste des ajustements à faire et des fonctionnalités à ajouter, de façon à offrir les mêmes possibilités (et plus) que l'interface ancienne (version 1 = "v1").

Une comparaison avec la version 1 fait ressortir quelques besoins pour la v2 :

  • affichage du DOI du texte entier

  • affichage du DOI de chaque phrase

  • affichage du numéro de phrase (pour le type WORDLIST : numéro de mot, <W> ; dans les deux cas, c'est le 1er niveau de granularité : <S> pour les textes, <W> pour les listes de mots)

  • choix de la langue pour les différents niveaux, comme dans le site Pangloss "v1". 
    image

  • possibilité de cocher / décocher pour l'affichage des notes 

  • possibilité d'afficher toutes les gloses interlinéaires (information tout à fait cruciale), pas seulement en survolant sur un mot ou cliquant dessus, mais en mettant en forme : la forme de l'élément, sa traduction... (comme dans la v1)

Bugs :

  • actuellement l'affichage texte entier (<FORM> et traduction) ne fonctionne pas. Pour ce texte, il existe une forme au niveau du texte, et une traduction, mais le bouton est en grisé. Dans les cas où cette info n'est pas présente dans le XML, faire comme dans la v1 (=concaténer les infos du niveau <S>).

image

Améliorations "v2" :

  • pour l'affichage des notes : possibilité de choisir la langue. Par exemple, si quelqu'un ne parle pas français et ne souhaite pas afficher les notes en français.
  • ne pas afficher les notes en italiques. On voit l'idée : bien séparer du texte. Mais cela rend très peu lisible l'alphabet phonétique, pour le chinois ça a une drôle de tête (il est globalement recommandé de ne jamais mettre les caractères chinois en italiques, même si les polices "savent faire"), et globalement c'est moins lisible.
  • distinction mode "pro" et mode "normal/grand public" : à discuter : un affichage plus "léger" pour le grand public, sans numéro de DOI, par exemple ?

Ajouts proposés par Edouard : que les filtres restent dans le lecteur, et que le lecteur renvoie l'info pour mettre à jour les filtres, de sorte que l'URL intègre les choix de l'utilisateur. Cela permet de recopier une URL, l'envoyer à qqn et que la personne voie l'affichage tel qu'on l'a "ciselé" (choisi) pour tel public spécifique.

fluidité de la lecture : continuité visuelle des documents - réduire la taille du bouton "DOI" et le placer "dans la marge"

Il est important d'assurer une bonne fluidité de la lecture, par une continuité visuelle des documents, qui ne sont pas des séquences de "cartes" mais un texte qui se déroule autant que possible de façon suivie malgré le découpage qu'introduit l'appareil critique (les gloses interlinéaires).

Notamment : le bouton "DOI" doit être dans la marge, et discret.

Le bouton à utiliser est celui "officiel" des DOI, tel qu'utilisé dans la v1 du site Pangloss.

Exemple :
image

Voici l'affichage "ancien", qui est correct sur ce point : numéro de première granularité (S pour les textes, W pour les listes de mots) affiché dans la marge, avec un DOI tout proche qui lui est associé, le tout dans la marge :
image

Phase d’annotation │ Déconnexions

Lors du travail d’annotation, l'utilisateur sort de l’éditeur sans être prévenu, après une certaine durée de travail.
Cette déconnexion se produit même si le travail est en train de se poursuivre.
Serait-il possible d’afficher une alerte avant déconnexion ?
Merci !

Gestion des comptes utilisateurs

Ce lot de développement doit faire l'objet d'une étude préalable sur les sujets suivants au minimum (liste non exhaustive) :

  • création de compte avec flux de validation et d'activation
  • oubli du mot de passe
  • suppression de compte / RGPD
  • statistiques ? (langues des documents, provenance des connexions, nb de documents créés/ouverts depuis Pangloss, ...)

lecture du manuscrit en mode vidéo

Idée d'innovation : avoir la lecture du manuscrit, non pas en mode audio, mais en mode vidéo. Dans ce scénario, l'enquêteur aurait enregistré une vidéo de la personne lisant le manuscrit.

Le lecteur EASTling offrirait alors une vue sur la vidéo de la personne qui lit le manuscrit, en même temps qu'on voit l'image du manuscrit avec mise en valeur de l'unité en cours de lecture (mot, syllabe...). Cela en plus de l'appareil philologique habituel. A mesure que le texte défile, la vidéo demeure en place (elle "flotte").

bouton "Transcription du texte entier" ("Whole text transcription")

Le bouton "Transcription du texte entier" ("Whole text transcription") est inerte pour des documents qui n'ont pas dans le XML de champ <FORM> au niveau du texte entier, comme celui-ci :
corpus/show?mode=pro&oai_primary=cocoon-16586ac3-6bba-3c3f-86d9-0b9f877c605a&oai_secondary=cocoon-ec43abba-bd90-3970-a9a3-1f69ddbd75c0&optionWords=true&optionNotes=true&optionTranscriptions=%2Bphone&optionTranslations=%2Bcn%2Bfr&optionGlosses=%2Bcn%2Bfr%2Ben&optionWholeTranscriptions=false&optionWholeTranslations=%2Bcn

Ce qu'il faut faire dans ces cas-là, c'est concaténer le contenu de la balise <FORM> au niveau phrase (en proposant, s'il y a 2 attributs, par exemple 1 pour transcription orthographique et 1 pour transcription phonétique, de choisir entre l'un et l'autre), et d'afficher le produit de cette concaténation. C'est ainsi que ça marchait sur l'affichage v1.

(Sauf que ça ne marche plus au jour d'aujourd'hui, haha... mais tu vois l'idée)

On laisse un retour chariot après chaque unité PHRASE. Par exemple, pour ce texte :
ə˧bɛ˧-ʂɯ˩bɛ˩,
ə˧pʰʋ˧ nɛ˩ ə˧dzɤ˧ ɲi˩-kʋ˧˥ ndʑju˩ mi˧-ʝi˩-tsɤ˧˥.
ə˧kjɛ˧, ʝi˧ʈʂɯ˩ bɛ˧, zy˧˥ mɤ˩-ndʑju˩ mi˧-ʝi˩-tsɤ˧˥.

etc.

licence du dépôt Eastling-editor

Serait-il possible d'ajouter une licence à ce dépôt ?

L'outil Eastling-player est sous GPL-3.0. Cette licence, "GNU GPL", correspond bien aux orientations de Science ouverte souhaitées par le CNRS (présentation introductive : "The GNU General Public License is a free, copyleft license for software and other kinds of works").

Fenêtre "Annotation panel"

Lors de la lecture ou de la création d’une nouvelle annotation, la fenêtre de l’outil Annotation panel est ancrée automatiquement en haut à droite de l’affichage.

Capture d’écran 2023-06-14 à 11 12 41

Serait-il possible d’ancrer cette fenêtre sous la time-line de la ressource audio, et de choisir ensuite de la déplacer selon les besoins de l’annotateur ?

Capture d’écran 2023-06-14 à 11 31 26

Merci !

Export annotations au format XML │ nommage .XML

Bonjour,
Lors de l’export des annotations d’un document au format XML (bouton XML Annotations), le titre du XML en sortie est intitulé par exemple : eastling-ddn_Dendi_TEXT-33.xml

Capture d’écran 2023-06-14 à 10 25 19

Idem, dans l'identifiant de la balise <TEXT>, du xml récupéré.

Serait-il possible de récupérer l’intitulé de la ressource audio, par exemple "cocoon.huma-num.fr/data/tersis/nt_dendi_karimama_68_A_conte1.mp3"

ou celle du fichier XML d’annotation déjà déposé sur la base de donnée de CoCoon ?
Merci !

bouton "Transcription du texte entier" inerte

Le bouton "Transcription du texte entier" ("Whole text transcription") est inerte pour des documents qui n'ont pas dans le XML de champ <FORM> au niveau du texte entier, comme celui-ci :
corpus/show?mode=pro&oai_primary=cocoon-16586ac3-6bba-3c3f-86d9-0b9f877c605a&oai_secondary=cocoon-ec43abba-bd90-3970-a9a3-1f69ddbd75c0&optionWords=true&optionNotes=true&optionTranscriptions=%2Bphone&optionTranslations=%2Bcn%2Bfr&optionGlosses=%2Bcn%2Bfr%2Ben&optionWholeTranscriptions=false&optionWholeTranslations=%2Bcn

Ce qu'il faut faire dans ces cas-là, c'est concaténer le contenu de la balise <FORM> au niveau phrase (en proposant, s'il y a 2 attributs, par exemple 1 pour transcription orthographique et 1 pour transcription phonétique, de choisir entre l'un et l'autre), et d'afficher le produit de cette concaténation. C'est ainsi que ça marchait sur l'affichage v1.

(Sauf que ça ne marche plus au jour d'aujourd'hui, haha... mais tu vois l'idée)

On laisse un retour chariot après chaque unité PHRASE. Par exemple, pour ce texte :
ə˧bɛ˧-ʂɯ˩bɛ˩,
ə˧pʰʋ˧ nɛ˩ ə˧dzɤ˧ ɲi˩-kʋ˧˥ ndʑju˩ mi˧-ʝi˩-tsɤ˧˥.
ə˧kjɛ˧, ʝi˧ʈʂɯ˩ bɛ˧, zy˧˥ mɤ˩-ndʑju˩ mi˧-ʝi˩-tsɤ˧˥.

etc.

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.