Taller de datos enlazados (Linked Open Data) para bibliotecas, archivos y museos
Seth van Hooland
Agenda y actividades para el taller de OpenRefine organizado por CAICYT a realizarse el 5 de diciembre de 2016
1 Agenda
Sesión matutina
- Panorama: cuál es el rol de la calidad de los metadatos en el contexto actual de los metadatos sobre el patrimonio cultural y los datos enlazados
- Ronda de problemas y preguntas
- Introducción a OpenRefine
- Panorama práctico de las características de limpieza básicas avanzadas
Sesión vespertina
- Valor agregado de la validación del vocabulario y experiencia práctica con la extensión RDF
- Posibilidades y limitaciones del reconocimiento nombre-entidad y experiencia práctica con la extensión NER
- Prácticas de los participantes con sus propios metadatos
- Intercambio final
2 Cómo prepararse
2.1 Descargar e instalar OpenRefine y dos extensiones
- Descargar e instalar la versión 2.5 de OpenRefine (distribuida todavía bajo el nombre de Google Refine) desde http://openrefine.org/download.html
- Descargar e instalar la extensión RDF, desarrollada por DERI, desde http://refine.deri.ie/
- Descargar e instalar la extensión NER, desarrollada por Rubén Verborgh, desde https://github.com/RubenVerborgh/Refine-NER-Extension
2.2 Descargar los datos de los casos de estudio
- Descargar los datos de la Base de Datos de Manuscritos Schoenberg desde http://dla.library.upenn.edu/dla/schoenberg/ancillary.html?id=dla/schoenberg/data
- Descargar los datos del Museo Powerhouse desde http://book.freeyourmetadata.org/chapters/3/powerhouse-museum.tsv.
- Descargar los datos de la British Library desde http://book.freeyourmetadata.org/chapters/4/british-library.csv
Ingresar los datos en OpenRefine. Hacer click en “Crear proyecto – Esta computadora” e indicar la ruta al archivo descargado. Una forma alternativa es usar las URLs arriba indicadas; copiar y pegar esos enlaces en la opción “Crear proyecto –Dirección Web (URLs)”. Una vez que los datos estén importados, se puede usar la interfaz, y algunos filtros y facetas.
2.3 Descargar los proyectos terminados de los casos de estudio
Validar y enriquecer los metadatos lleva tiempo, así que siéntanse libres de descargar estos proyectos. Al hacerlo es posible de manera rápida mirar los resultados, y deshacer y rehhacer los cambios usando la función hacer/deshacer.
- Descargar el proyecto terminado del Museo Powerhouse desde http://book.freeyourmetadata.org/chapters/3/powerhouse-museum_reconciled.openrfine.tar.gz
- Descargar los datos de la British Library desde http://book.freeyourmetadata.org/chapters/4/british-library_reconciled_complete.openrefine.tar.gz
2.4 Material de lectura
En http://freeyourmetadata.org/publications/ se pueden encontrar enlaces a libros y pre-prints de artículos en acceso libre, que abordan tanto las posibilidades conceptuales como prácticas de los datos enlazados para el sector del patrimonio cultural.