Une IA locale pour Gramps?

,

Bonjour.

Je me demandais si il n’était pas possible de générer un modèle personnalisé d’IA (AI) pour Gramps ?

Par exemple, il existe différentes déclinaisons de modèles basés sur Mistral (pour l’assistance, pour les tâches génératives et répétitives, sur le language, la psychologie, la philosophie, les relations, …)

Geneatique faisant sa pub sur l’intégration de l’IA dans son logiciel, j’ai essayé d’en savoir un peu plus.

Quelle est l’IA utilisée par Généatique ?

Généatique utilise l’intelligence artificielle pour plusieurs fonctionnalités dans sa version 2025. L’IA est intégrée pour aider à la transcription paléographique des actes anciens, ce qui permet de pré-transcrire automatiquement les documents visuels. Cela inclut la reconnaissance et la transcription des écritures manuscrites anciennes, facilitant ainsi le travail des généalogistes12.

De plus, l’IA est utilisée pour la rédaction et la présentation des notices, fournissant des textes d’information sur les lieux, prénoms, métiers, etc., qui peuvent être rattachés à une rubrique spécifique dans l’arbre généalogique13.

Le moteur d’IA de Généatique aide également à analyser automatiquement l’arbre généalogique pour suggérer des informations supplémentaires, comme les données de l’INSEE sur les décès depuis 19703.

Ces fonctionnalités sont conçues pour alléger les tâches répétitives et fastidieuses, permettant aux utilisateurs de se concentrer sur des aspects plus approfondis de leurs recherches généalogiques32.

Est-ce Mistral ?

Il n’y a pas d’information précise indiquant que Généatique utilise spécifiquement l’IA Mistral. Les sources disponibles mentionnent l’intégration de l’IA dans Généatique pour des tâches telles que la transcription paléographique et la rédaction de notices, mais sans préciser le fournisseur de l’IA utilisé45.

Mistral AI est une startup française spécialisée dans les modèles de langage et les solutions d’IA67. Bien que Mistral AI soit mentionnée comme une préférence pour certains utilisateurs en raison de sa spécialisation dans le langage, il n’y a pas de confirmation directe que Généatique utilise les services de Mistral AI8.

Généatique n’est donc pas client chez vous ?

Il n’y a pas d’information confirmant que Généatique est un client de Mistral AI. Les résultats de recherche ne fournissent pas de détails sur une relation commerciale entre Généatique et Mistral AI9

Est-ce que Gramps utilise Mistral ou Pixtral ?

Il n’y a pas d’information indiquant que Gramps utilise Mistral ou Pixtral. Les résultats de recherche ne fournissent pas de détails sur une relation entre Gramps et ces technologies1011121314.

J’ai presque réussi à faire “surchauffer” lors de l’écriture de la dernière réponse ! Bon, visiblement d’après les références sourcées, l’IA ne savait pas très bien de quel Gramps il s’agissait…

Cordialement,
Jérôme

(Gramps 5.2.2 - OS dérivé de Ubuntu 18.04.6 LTS)

:st_martin:Je crois que je vais enfin progresser en anglais (USA) ! :fireworks:

Mistral Large (small?) 2025-02 :
:us_outlying_islands:Certainly! Here is the translation into American English!


Exactly! I can be seen as a complement to the transcription work done by Transkribus. Here’s how I can assist you in this context:

  1. Interpretation and Analysis: Once Transkribus has transcribed a handwritten text, I can help you interpret and analyze the content, provide contextual explanations, and clarify ambiguous passages.
  2. Information Research: If you need more information on a topic mentioned in a transcribed document, I can help you research additional details or historical contexts.
  3. Linguistic Assistance: I can help translate passages, explain technical or historical terms, and provide suggestions to improve the clarity of the transcribed text.
  4. Methodological Advice: If you have questions about how to use Transkribus or best practices for document transcription, I can offer advice and recommendations.

In summary, I am here to complement the work of Transkribus by providing interactive assistance and helping you make the most of the transcriptions. If you have any specific questions or needs, feel free to ask


:st_martin:Si je comprends bien, tu es un complément du travail de transcription de Transkribus ?

Exactement ! Je peux être vu comme un complément au travail de transcription effectué par Transkribus. Voici comment je peux t’aider dans ce contexte :

  1. Interprétation et Analyse : Une fois que Transkribus a transcrit un texte manuscrit, je peux t’aider à interpréter et analyser le contenu, fournir des explications contextuelles, et clarifier des passages ambigus.
  2. Recherche d’Informations : Si tu as besoin de plus d’informations sur un sujet mentionné dans un document transcrit, je peux t’aider à rechercher des détails supplémentaires ou des contextes historiques.
  3. Assistance Linguistique : Je peux aider à traduire des passages, expliquer des termes techniques ou historiques, et fournir des suggestions pour améliorer la clarté du texte transcrit.
  4. Conseils Méthodologiques : Si tu as des questions sur la manière d’utiliser Transkribus ou sur les meilleures pratiques pour la transcription de documents, je peux offrir des conseils et des recommandations.

En résumé, je suis là pour compléter le travail de Transkribus en fournissant une assistance interactive et en aidant à tirer le meilleur parti des transcriptions réalisées. Si tu as des questions ou des besoins spécifiques, n’hésite pas à demander

Un des premiers exemples est le projet Transkribus, lancé par l’Université d’Innsbruck, qui utilise l’IA pour transcrire des documents historiques, mais qui est un peu dépassé actuellement.

Je ne suis pas du tout d’accord avec l’autrice (Anne-Noëlle) de cette article promotionnel. Transkribus est actuellement, toujours bien meilleur que la plupart des IA (AI) “généralistes” dans la transcription des textes anciens et manuscrits. OpenIA et la plupart des modèles de Mistral utilisant ‘Mistral-ocr’ (Pixtral, Mistral Large), nous inventent des histoires et font trop de suppositions. On peut effectivement “régler la température” (degré de "créativité…) dans ces modèles, néanmoins les approximations (et hallucinations) sont bien présentes. Pour l’analyse a posteriori, en revanche, ces “assistant(e)s virtuel(le)s” font leur effet et apportent une aide.

For what it’s worth.
I’m a happy user of Transkribus. Have used Transkribus in my genealogy work especially for older documents written in gothic hand writing.
I’m also using Transkribus in a large project at my local archive, where we are transcribing municipal protocols (about 50.000 hand written pages).
The quality of the transcription is heavily depending on the model being used. For this project we have developed our own model, which we retrain twice per year - every new version of the model has a better score. When we started the project, we were counting the number of errors per line, now we count the number of errors per page.

Voici la traduction :united_kingdom: / :united_states::france::

Pour ce que ça vaut. Je suis un utilisateur satisfait de Transkribus. J’ai utilisé Transkribus dans mes travaux de généalogie, notamment pour les documents anciens écrits en écriture gothique. J’utilise également Transkribus dans un grand projet aux archives locales, où nous transcrivons des protocoles municipaux (environ 50 000 pages manuscrites). La qualité de la transcription dépend fortement du modèle utilisé. Pour ce projet, nous avons développé notre propre modèle, que nous réentraînons deux fois par an - chaque nouvelle version du modèle obtient un meilleur score. Lorsque nous avons commencé le projet, nous comptions le nombre d’erreurs par ligne, maintenant nous comptons le nombre d’erreurs par page.

Cela rejoint mes premières impressions suite à des tests récents avec le modèle Transkribus German handwriting M1 - Public Transkribus AI Model par rapport aux modèles de Mistral (avec support ocr).
Merci de ce temoignage.


:france::united_kingdom: / :united_states: : This aligns with my initial impressions following recent tests with the model Transkribus German handwriting M1 - Public Transkribus AI Model
againt Mistral models with ocr support.
Thank you for this testimonial.

Petite digression, pour noter que ‘Free’ et ‘Mistral’ semblent avoir le même type de stratégie (ou d’actionnaires) : Le Chat Pro est “offert” pendant 12 mois aux clients des forfaits de l’opérateur !

Sur mes essais, Mistral apprend très vite de ses erreurs…
La copie de la réponse ci-dessus, en est l’illustration. L’IA en question connaît ses limites dans le domaine, c’est déjà une bonne chose.

Pour une utilisation avec Gramps, j’ai aussi regardé la “data” en mobile (là, c’est compliqué avec le téléchargement/upload…). Les IA semblent avoir également des difficultés avec les faits, les dates et les représentations historiques. C’est quand même un souci pour de la généalogie : la mémoire c’est le temps long… Mélangez une date et un lieu avec une IA (AI), elle risque d’être perdue. Si en plus, il faut transcrire et traduire, les erreurs s’accumulent ! Bref, l’analyse est effectivement très rapide, ordonnée, sans erreurs manifestes ni fautes d’orthographe, mais bon, est-ce que ce n’est pas au généalogiste de lancer des pistes de recherche ou faire des hypothèses ?

:united_kingdom: / :united_states:

An interesting ChatGPT experiment was described on Facebook.

There was a “paper saving” technique for handwritten documents in the 18th and 19th centuries called “cross writing”. In this technique, scribes filled a page normally (in portrait orientation). Then rotated the page clockwise (to landscape orientation) and wrote a 2nd page of text.

ChatGPT had problems with it. It would be a good stress test for Transcribus.

To be fair, reading cross writing is challenging for a human. It should be an excellent test for any AI.

:france:
Une expérience intéressante de ChatGPT a été décrite sur Facebook.

Aux XVIIIe et XIXe siècles, une technique d’« économie de papier » pour les documents manuscrits, appelée « écriture croisée », existait. Cette technique consistait à remplir une page normalement (en orientation portrait), puis à la faire pivoter dans le sens des aiguilles d’une montre (en orientation paysage) et à écrire une deuxième page de texte.

ChatGPT a rencontré des problèmes avec cette technique. Ce serait un bon test de résistance pour Trancribus.

À vrai dire, la lecture de l’écriture croisée est un défi pour un humain. Ce devrait être un excellent test pour toute IA.

En fait, Transkribus part de toute façon avec un peu d’avance, puisque l’on définit un modèle adapté dès le départ. Avec un modèle specifique pour cette « écriture croisée », même dans une autre langue, cela ne sera plus un test de résistance.

1 Like