Alimentation automatique de Prospero
Posted: Thu Feb 16, 2012 2:49 am
Bonjour
Je pose une premiere question de debutant en prospero.
Je commence a utiliser prospero sur un corpus anglais assez vaste et qui m'oblige a alimenter en textes qui datent des annees 30s. Donc j'ai un gros travaille de "rattrapage" a mener.
Est-ce que vous avez mis en place une routine d'alimentation de prospero qui permette de faire l'economie du renseignement manuelle des champs externes (nom auteur, date, support, codage support)? Avec des requetes sur Lexis Nexis, je peux extraire de gros volumes de documents qui sont tres standardises - avec une structure tres simple (auteur, date...). Je me dis qu'ecrire une routine qui parse ces champs stables et qui renseigne la fiche de champs externes devrait etre assez faisable, mais je me demande comment alimenter prospero a partir de cette routine. En quelque sorte, une API a l'envers (on a les donnees et on veut les rassembler dans prospero).
Il se trouve que j'ai un etudiant en computer science qui s'interesse a ces questions et qui veut que je lui commande du "code". Donc je serais heureux de le mettre sur un exercise de ce type si cela peut beneficier a la communaute des utilisateurs. Peut etre le developpement d'un petit programme qui permettrait d'automatiser cette alimentation a partir de n'importe quelle ensemble de documents bien structures. J'imagine que c'est un probleme que pas mal des historiens qui utilisent prospero rencontrent.
Je vais aussi alimenter les dics anglais que Francis m'a communique et qui sont issus des premiers gros travaux realises depuis 2 ans. Je travaille sur la regulation financiere et sur l'invention de la fraude de marche, donc sans doute quelques etres nouveaux et quelques figures de style inedite. J'envisage dans un tres court avenir une etude comparative avec le cas francais.
Vincent
Je pose une premiere question de debutant en prospero.
Je commence a utiliser prospero sur un corpus anglais assez vaste et qui m'oblige a alimenter en textes qui datent des annees 30s. Donc j'ai un gros travaille de "rattrapage" a mener.
Est-ce que vous avez mis en place une routine d'alimentation de prospero qui permette de faire l'economie du renseignement manuelle des champs externes (nom auteur, date, support, codage support)? Avec des requetes sur Lexis Nexis, je peux extraire de gros volumes de documents qui sont tres standardises - avec une structure tres simple (auteur, date...). Je me dis qu'ecrire une routine qui parse ces champs stables et qui renseigne la fiche de champs externes devrait etre assez faisable, mais je me demande comment alimenter prospero a partir de cette routine. En quelque sorte, une API a l'envers (on a les donnees et on veut les rassembler dans prospero).
Il se trouve que j'ai un etudiant en computer science qui s'interesse a ces questions et qui veut que je lui commande du "code". Donc je serais heureux de le mettre sur un exercise de ce type si cela peut beneficier a la communaute des utilisateurs. Peut etre le developpement d'un petit programme qui permettrait d'automatiser cette alimentation a partir de n'importe quelle ensemble de documents bien structures. J'imagine que c'est un probleme que pas mal des historiens qui utilisent prospero rencontrent.
Je vais aussi alimenter les dics anglais que Francis m'a communique et qui sont issus des premiers gros travaux realises depuis 2 ans. Je travaille sur la regulation financiere et sur l'invention de la fraude de marche, donc sans doute quelques etres nouveaux et quelques figures de style inedite. J'envisage dans un tres court avenir une etude comparative avec le cas francais.
Vincent