Rechercher

Bibliographie complète 422 ressources

  • ARTFL-FRANTEXT is the main ARTFL Database, comprising more than 3,600 French-language texts, 215 million words and 675,000 unique word forms. The corpus contains texts ranging from classic works of French literature to various kinds of non-fiction prose and technical writing. The eighteenth, nineteenth and twentieth centuries are about equally represented, with a smaller selection of seventeenth century texts as well as some medieval and Renaissance texts. Genres include novels, verse, theater, journalism, essays, correspondence, and treatises. Subjects include literary criticism, biology, history, economics, and philosophy. In most cases standard scholarly editions were used in converting the text into machine-readable form, and the data contain page references to these editions.

  • Il se propose ainsi de fournir une couverture bibliographique aussi complète que possible sur un grand nombre d'auteurs et de textes du Moyen Âge, principalement de langues française et latine sans pour cela exclure les autres langues d'Europe occidentale.

  • La base Jonas est un répertoire des textes littéraires français et occitans du Moyen Âge et de la première modernité, ainsi que des manuscrits et imprimés les conservant.

  • Source très appréciable, complémentaire des registres paroissiaux, Plus de 157.181 pensionnaires reçus à l’Hôtel des Invalides à Paris, de 1673 à 1796, années suivantes jusqu’au 20ème siècle (en cours) Ils avaient un métier, ils étaient cordonniers, tailleurs, meuniers, ouvriers en soie, etc. Ils ont été recrutés, au service du Roy Ils ont guerroyé sous Louis XIV, Louis XV, Louis XVI ... Transcription des registres de réception des militaires – de tous grades - ayant participé à des guerres, nés en France ou à l’étranger, reçus à l'hôtel des Invalides à Paris. (principalement Allemands, Anglais, Belges, Ecossais, Irlandais, Italiens, Suisses) 28.429 communes françaises représentées, 171.863 ACTES COMPLETS ET SUCCINTS

  • Le Corpus Académie française est un corpus lemmatisé et étiqueté des textes publiés sur le site de l'Académie française dans les rubriques « Discours », « Dire, ne pas dire » et « Questions de langue. 1635 à nos jours.

  • Cette carte s’inscrit dans le cadre du projet de recherche « Repairs. Réparations, compensations et indemnités au titre de l’esclavage (Europe-Amériques-Afrique) (XIXe-XXIe) » financé par l’ANR, Agence nationale de la recherche. Le projet Repairs est porté par trois institutions : le CIRESC, Centre international de recherche sur les esclavages et post-esclavages (CNRS) ; l’ISJPS, Institut des sciences juridique et philosophique de la Sorbonne (Université Paris 1 Panthéon Sorbonne, CNRS) ; l’URMIS, Unité de Recherche Migration et Sociétés (IRD, CNRS, Université de Paris, Université Côte d’Azur).

  • Overview This code in the R programming language downloads and processes the full set of resolutions, drafts and meeting records rendered by the United Nations Security Council (UNSC), as published by the UN Digital Library, into a rich and structured human- and machine-readable dataset. It is the basis for the Corpus of Resolutions: UN Security Council (CR-UNSC). All data sets created with this script will always be hosted permanently open access and freely available at Zenodo, the scientific repository of CERN. Each version is uniquely identified with a persistent Digitial Object Identifier (DOI), the Version DOI. The newest version of the data set will always available via the link of the Concept DOI: https://doi.org/10.5281/zenodo.7319780   Updates The CR-UNSC will be updated at least once per year. In case of serious errors an update will be provided at the earliest opportunity and a highlighted advisory issued on the Zenodo page of the current version. Minor errors will be documented in the GitHub issue tracker and fixed with the next scheduled release. The CR-UNSC is versioned according to the day of the last run of the data pipeline, in the ISO format YYYY-MM-DD. Its initial release version is 2024-05-03. Notifications regarding new and updated data sets will be published on my academic website at www.seanfobbe.com or on the Fediverse at @seanfobbe@fediscience.org   Changelog New variant: EN_TXT_BEST containing a write-out of the English resolution texts equivalent to the CSV file text variable New diagrams: bar charts of top M49 regions and sub-regions of countries mentioned in resolution texts Fixed naming mix-up of BIBTEX and GRAPHML zip archives Fixed whitespace character detection in citation extraction (adds ca. 10% more citations) Fixed improper merging of weights in citation network Fixed "cannot xtfrm data frames" warning Improve REGEX detection for certain geographic entities Improve Codebook (headings, citation network docs)   Functionality The pipeline will produce the following results and store them in the  output/ folder: Codebook as PDF Compilation Report as PDF Quality Assurance Report as PDF ZIP archive containing the main data set as a CSV file ZIP archive containing only the metadata of the main data set as a CSV file ZIP archive containing citation data and metadata as a GraphML file ZIP archive containing bibliographic data as a BIBTEX file ZIP archive containing all resolution texts as TXT files (OCR and extracted) ZIP archive containing all resolution texts as PDF files (original and English OCR) ZIP archive containing all draft texts as PDF files (original) ZIP archive containing all meeting record texts as PDF files (original) ZIP archive containing the full Source Code ZIP archive containing all intermediate pipeline results ("targets")  The integrity and veracity of each ZIP archive is documented with cryptographically secure hash signatures (SHA2-256 and SHA3-512). Hashes are stored in a separate CSV file created during the data set compilation process.   System Requirements The reference data sets were compiled on a Debian host system. Running the Docker config on an SELinux system like Fedora will require modifications of the Docker Compose config file. 40 GB space on hard drive Multi-core CPU recommended. We used 8 cores/16 threads to compile the reference data sets. Standard config will use all cores on a system. This can be fine-tuned in the config file. Given these requirements the runtime of the pipeline is approximately 40 hours. Instructions Step 1: Prepare Folder Copy the full source code to an empty folder, for example by executing: $ git clone https://github.com/seanfobbe/cr-unsc Always use a dedicated and empty (!) folder for compiling the data set. The scripts will automatically delete all PDF, TXT and many other file types in its working directory to ensure a clean run.   Step 2: Create Docker Image The Dockerfile contains automated instructions to create a full operation system with all necessary dependencies. To create the image from the Dockerfile, please execute: $ bash docker-build-image.sh   Step 3: Compile Dataset If you have previously compiled the data set, whether successfuly or not, you can delete all output and temporary files by executing: $ Rscript delete_all_data.R   You can compile the full data set by executing: $ bash docker-run-project.sh   Results The data set and all associated files are now saved in your working directory.   GNU General Public License Version 3 Copyright (C) 2024 Seán Fobbe, Lorenzo Gasbarri and Niccolò Ridi This program is free software: you can redistribute it and/or modify it under the terms of the GNU General Public License as published by the Free Software Foundation, either version 3 of the License, or (at your option) any later version. This program is distributed in the hope that it will be useful, but WITHOUT ANY WARRANTY; without even the implied warranty of MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU General Public License for more details. You should have received a copy of the GNU General Public Licensealong with this program.  If not, see https://www.gnu.org/licenses/   Author Websites Personal Website of Seán Fobbe Personal Website of Lorenzo Gasbarri Personal Website of Niccolò Ridi   Contact Did you discover any errors? Do you have suggestions on how to improve the data set? You can either post these to the Issue Tracker on GitHub or contact Seán Fobbe via https://seanfobbe.com/contact/

  • We've been working working hard to beef up our interactive guide to the UK's museum collections. Here's what's new.

  • Environ 740 000 actes de baptême, de mariage et de sépulture ont été ajoutés dans le Registre de la population du Québec ancien. Cette importante mise à jour s'étend sur la période 1849-1861, élargissant considérablement la portée de cette base de données qui couvre désormais les années 1621 à 1861.

  • More than 300 medieval manuscripts from the Bibliotheca Vossiana

  • Explore our hand-picked collection of out-of-copyright works, free for all to browse, download, and reuse. This is a living database with new images added every week.

  • Throughout our website the voices of the survivors infuse our online exhibitions, historical narratives, teaching units and ceremonies with content and with meaning. We have gathered many of those testimonies in this section where they can be easily accessed by either topic or location, according to the birthplaces of the survivors

  • In 2024,the Acquired Papers were included in the Churchill Archive,spanning items such as previously unseen personal letters,speech notes and diary en

  • Le projet GUARD – acronyme de Guarantee Unpreserved Archives Remain Documented – est porté par Nicolas Ruffini-Ronzani (Université de Namur et Archives de l’État à Namur) et Sébastien de Valeriola (Université libre de Bruxelles). Il vise à récupérer les informations éphémères qui circulent en ligne et dans les catalogues de ventes aux enchères à propos de documents d'archives médiévaux, de les compiler, de les structurer, et de les archiver de façon pérenne dans une base de données ouverte et collaborative.

  • Le Centre d’histoire orale et de récits numérisés est un centre de recherche université-communauté situé à l’Université Concordia, à Montréal (Canada). Le centre abrite des archives contenant plus de 1500 entrevues d’histoire orale​​ et 20 collections d’enregistrements issus de projets ou réalisés par des chercheur·euse·s affilié·e·s ou des organismes partenaires. La plupart des entrevues sont en français ou en anglais, et la majeure partie des documents d’archives sont des dossiers numériques. Ces enregistrements audio et vidéo abordent, du point de vue individuel des personnes interviewées, des sujets comme l’histoire urbaine et l’histoire du travail, la migration et l’immigration forcées, les relations raciales, la guerre, la violence de masse ainsi que les expériences liées au genre, à la corporéité et à la sexualité. Les archives comptent également un nombre croissant d’entrevues qui explorent l’art et la recherche-création. Nos archives sont conservées sur un serveur distinct de celui de l’Université Concordia afin de préserver l’anonymat et la vie privée des personnes interviewées. En général, les chercheur·euse·s qui utilisent notre collection sont des professeur·e·s d’université, des étudiant·e·s ou des historien·ne·s de la communauté. En vertu de notre mandat, nous encourageons aussi les personnes n’appartenant pas au milieu universitaire à utiliser notre collection. Ainsi, tout membre du public peut demander à consulter notre fonds documentaire. Toutefois, étant donné le caractère délicat de certains documents, l’accès peut être restreint selon le document demandé et le motif de la demande de consultation. D’abord, toute personne souhaitant accéder à notre collection doit s’engager par écrit à respecter les règles d’éthique du centre. La principale règle d’éthique concerne la vie privée des personnes interviewées, c’est-à-dire le niveau de confidentialité que chacune d’entre elles a attribué à ses propos ou souvenirs enregistrés au moment de la réalisation de l’entrevue (par formulaire de consentement) ou au moment du don de l’entrevue au centre (par accord de donation). Chaque entrevue archivée au centre se voit attribuer un degré de restriction conforme aux souhaits exprimés par la personne interviewée en matière de confidentialité et d’utilisation future. L’un des principaux mandats du centre est de conserver et de protéger les entrevues données en respectant ces souhaits. Par conséquent, nous nous réservons le droit de refuser l’accès à certaines entrevues si nous le jugeons nécessaire pour respecter les souhaits des personnes interviewées. L’archiviste du centre est disponible de septembre à mai pour aider les chercheur·euse·s à comprendre l’organisation de notre collection ainsi que les restrictions associées aux entrevues. Visitez la page « Éthique » pour en savoir plus sur les mesures que nous prenons pour respecter les principes d’éthique et la vie privée des personnes interviewées. Ensuite, les chercheur·euse·s doivent signer une entente d’accès en vertu de laquelle elles·ils s’engagent à respecter les conditions ci-dessus avant qu’un accès ne leur soit accordé. Une version téléchargeable de cette entente se trouve ci-dessous. Celui-ci fournit par ailleurs des renseignements plus détaillés sur la façon dont les chercheur·euse·s peuvent accéder à nos documents d’archives. La collection d’archives du Centre d’histoire orale et de récits numérisés est actuellement accessible par rendez-vous au centre, situé au campus du centre-ville de l’Université Concordia (pavillon John-W.-McConnell, 10e étage, salle LB-1042, 1400, boul. De Maisonneuve Ouest, Montréal). Les personnes souhaitant consulter notre collection sont d’abord invitées à se familiariser avec la collection du centre et à communiquer avec l’archiviste afin d’entamer leur processus de recherche. Consultez à cette fin l’onglet « Nous joindre. » Certaines entrevues ont été mises en ligne sur notre chaîne Vimeo. Veuillez consulter l’aperçu des fonds d’archives dans l’onglet Collections pour voir lesquelles ont actuellement des entrevues disponibles pour consultation en ligne. Veuillez noter que ces entretiens sont protégés par mot de passe. L’accès est accordé après avoir contacté l’archiviste.

Dernière mise à jour depuis la base de données : 25/03/2026 13:00 (EDT)