Saltar al contenido principal

Configuración de extracción de datos

Finalidad

Permite configurar los parámetros de las extracciones de datos, definiendo los criterios de selección de los libros a incluir, el formato del archivo resultante, los métodos de envío y otros aspectos relacionados con la extracción de metadatos desde DILVE.

Listado de extracciones

Es la pantalla inicial al entrar en la sección Configurar extracción del menú Extraer datos.

Desde esta pantalla se pueden realizar todas las operaciones relacionadas con las extracciones de metadatos de DILVE:

  • crear nuevas extracciones: tanto de metadatos como de registros borrados en DILVE (desde la pestaña de Plantillas los administradores de DILVE proponen una serie de extracciones predefinidas, que se pueden utilizar como punto de partida para crear nuevas extracciones)
  • editar las extracciones ya creadas
  • ejecutar manualmente las extracciones programadas
  • eliminar las extracciones que ya no se necesiten

Extracción de metadatos

Permite configurar extracciones específicas para obtener información sobre los libros gestionados en DILVE.

La configuración de extraciones incluye los siguintes bloques de información:

Nombre de la extracción

Para crear una nueva extracción de metadatos es necesario asignarle un nombre, que se utilizará para identificarla en el listado de extracciones y en los archivos resultantes. El nombre de la extracción solo debe conterner caracteres alfanuméricos, guiones bajos o guiones medios, y no puede contener espacios ni caracteres especiales, para evitar problemas en el nombre de los archivos.

Si se está editando una extracción ya creada y se modifica su nombre al Guardar se creará una nueva extracción con el nuevo nombre, manteniendo la extracción original sin modificar.

El boton Calcular nº de registros permite obtener una estimación del número de libros que se incluirán en la extracción, en función de los criterios de selección configurados. Esta información es útil para confirmar que los criterios de selección son correctos y para tener una idea del tamaño del archivo resultante.

El nombre de la extracción se utiliza para generar el nombre de los archivos resultantes de la extracción, siguiendo el formato seleccionado en el bloque de Tipos de nombre de archivo. Al nombre de la extracción se puede añadir, como sufijo o como prefijo, la fecha y hora de la ejecución, en diferentes formatos.

** IMAGEN DEL BLOQUE "GUARDAR EXTRACCIÓN" CON LOS CAMPOS DE NOMBRE DE LA EXTRACCIÓN Y TIPOS DE NOMBRE DE ARCHIVO**

Selección de registros

Permite configurar los criterios de selección de los libros a incluir en la extracción, que se configuran en dos bloques: criterios de búsqueda y modificación de datos.

Criterios de búsqueda

Los criterios de búsqueda permiten seleccionar los libros se configuran en dos bloques mutuamente excluyentes:

  • Selecciones y búsquedas: permiten seleccionar los libros a incluir en la extracción en función de su pertenencia a determinadas selecciones o de los resultados de búsquedas guardadas.
Bloques de selecciones y búsquedas

Los bloques son los siguientes:

  • Selección actual: permite incluir en la extracción los ISBN que forman parte de la selección actual. Únicamente podrá utilizarse esta opción si la extracciónes puntual y no periódica.
  • Selección guardada: permite incluir en la extracción los ISBN que forman parte de una selección guardada previamente.
  • Búsqueda guardada: permite incluir en la extracción los libros que cumplan los criterios de una búsqueda guardada previamente, en el momento de la ejecución de la extracción.

IMAGEN DE LOS BLOQUES DE SELECCIÓN ACTUAL, SELECCIÓN GUARDADA Y BÚSQUEDA GUARDADA

  • Criterios de búsqueda relacionados con metadatos de los libros: permiten seleccionar los libros a incluir en la extracción en función de sus metadatos, como por ejemplo su fecha de publicación, su idioma, su formato, etc.
Bloques de Definición de criterios

Los criterios de búsqueda que se indique se aplicarán todos en el momento de la ejecución de la extracción, por lo que el número de libros incluidos en la extracción puede variar en función de los cambios en los metadatos de los libros entre el momento de la configuración y el momento de la ejecución.

Los bloques son los siguientes:

  • Búsquedas textuales:
    • General: permite buscar el texto en los campos de título, subtítulo, colección y en los textos descriptivos.
    • Materias: permite buscar el texto en los campos decódigo y texto de materias.

IMAGEN DE LOS BLOQUES DE BÚSQUEDAS TEXTUALES

  • Tipos de editorial
    • Editorial o Autor/editor: permite seleccionar el tipo de editorial cuyos libro se incluirán en la extracción. - En caso de seleccionar Autor/editor se consideran los libros de todos los autores/editores de DILVE. - En caso de seleccionar Editorial se pueden incluir todas las editoriales de DILVE o se pueden seleccionar un conjunto de editoriales específicas (mediante el buscador de editoriales o utilizando una lista de editoriales previamente guardada).
    • Edtoriales con datos básicos: permite excluir de la extracción los libros de editoriales no suscritas a DILVE, es decir, aquellas editoriales que no tienen metadatos ricos como cubierta, sinopsis, etc.

IMAGEN DE LOS BLOQUES DE TIPO EDITORIAL E INCLUIR EDITORIALES CON DATOS BÁSICOS

NO INCLUYO LA OPCIÓN DE MULTIMERCADO PORQUE ES MINORITARIA

  • Excluir libros sin precio: permite indicar si se quieren excluir los libros que no tengan información de precio para España.
  • Libros públicos: permite indicar si se quieren incluir los libros en estado no publicos, es decir, aquellos libros que han sido dados de alta en DILVE pero no está visibles para el resto de los usuarios de DILVE.
  • Estado en catálogo: permite indicar si se quieren incluir en la extracción solo los libros activos o también los libros descatalogados, inactivos, etc.
  • Formato: permite indicar si se quiere filtrar por formato: Soporte físico y/o Digitales (formato digital o audiolibros online).

IMAGEN DE LOS BLOQUES CORRESPONDIENTES EXCLUYENDO VENTA EN QUIOSCOS

  • Fecha de publicación: Permite indicar un intervalo de fechas de publicación para los libros a incluir en la extracción o marcar la opción de libros sin información de fecha de publicación.

IMAGEN DE LOS BLOQUES RELACIONADOS CON FECHA DE PUBLICACIÓN

  • Público objetivo: Permite seleccionar un valor de público objetivo.
  • Idioma: Permite seleccionar un valor de idioma.
  • Formato edición digital: Permite seleccionar un valor del formato interno de los libros en formato digital. Este criterio solo se aplica si se ha seleccionado la opción de incluir solo libros digitales en el bloque de formato.

IMAGEN DE LOS TRES DESPLEGABLES

Modificación de datos

Criterios de selección de libros relacionados con la modificación de sus datos en DILVE, que permiten configurar el universo de búsqueda de la extracción en función de las fechas de creación o modificación de los libros en DILVE o de ciertos metadatos específicos.

Los criterios indicados en este bloque se aplican siempre en la selección de los libros a incluir en la extracción, independientemente de los criterios de búsqueda indicados en el bloque anterior.

Atención

En la creación de nuevas extracciones se incluye por defecto un intervalo de fechas de alta de los libros. Es importante revisar este bloque al crear nuevas extracciones y seleccionar la opción de No aplicar restricciones de fecha si se quieren incluir todos los libros que cumplan los criterios de búsqueda, independientemente de su fecha de alta o modificación en DILVE.

Bloques de Modificación de datos

Los criterios son mutuamente excluyentes y son los siguientes:

  • Fecha de modificación: Permite seleccionar un intervalo de fechas de modificación de los libros a incluir en la extracción.
  • Fecha de alta: Permite seleccionar un intervalo de fechas de alta de los libros a incluir en la extracción.
  • Libros modificados o dados de alta desde la última extracción: Para extracciones periódicas, permite incluir en la extracción los libros que han sido modificados o dados de alta desde la última ejecución de la extracción.
  • Libros dados de alta desde la última extracción: Para extracciones periódicas, permite incluir en la extracción los libros que han sido dados de alta desde la última ejecución de la extracción.
  • Cambios de precio dede la última extracción: Para extracciones periódicas, permite incluir en la extracción los libros que han tenido cambios de precio para España desde la última ejecución de la extracción.
  • Cambios de disponibilidad desde la última extracción: Para extracciones periódicas, permite incluir en la extracción los libros que han tenido cambios de estado en catálogo o disponibilidad para España desde la última ejecución de la extracción.
  • Cubierta modificada desde la última extracción: Para extracciones periódicas, permite incluir en la extracción los libros que han tenido cambios en su cubierta desde la última ejecución de la extracción. Para la identificación de los libro que hayan sufrido cambios en su cubierta se tiene en cuenta el campo de fecha de modificación de la cubierta. Se puede indicar también Considerar la fecha de modificación del libro si no hay información de fecha de modificación de la cubierta para las casos en los que el libro no tenga información de este metadato.
  • No aplicar restricciones de fecha: Permite no aplicar ningún criterio de selección relacionado con la fecha de modificación o alta de los libros.

IMAGEN DEL BLOQUE DE MODIFICACIÓN DE DATOS

Formato del archivo

Permite indicar el formato del archivo de la extracción, que puede ser ONIX, CSV o SINLI y, para los dos primeros casos, seleccionar el tipo de codificación de caracteres (UTF-8 o ISO-8859-1).

Ofrece también la posibilidad de indicar si se desear comprimir el archivo resultante en formato ZIP o no y si se desea que se incluyan en la extracción los archivos de imágenes de cubierta o PDF textos ricos que se haya subido físicamente a DILVE para los libros incluidos en la extracción.

Bloques de Formato de archivo

Los formatos disponibles son los siguientes:

  • ONIX: versiones 3.1, 3.0 o 2.1 con etiquetas largas o cortas. Se ofrece la posibilidad de seleccionar la codificación de caracteres entre UTF-8 o ISO-8859-1.

IMAGEN DE LOS FORMATOS ONIX

  • CSV: cualquiera de los mapas creados por el usuario. Se ofrece la posibilidad de seleccionar la codificación de caracteres entre UTF-8 o ISO-8859-1.

IMAGEN DE LOS FORMATOS CSV

  • SINLI: para libros físicos de venta en España y para entidades dadas de alta en SINLI y con su buzón asignado en su ficha de entidad. Versiones de la 3 a la 9.

IMAGEN DE LOS FORMATOS SINLI

Además de seleccionar el formato del archivo, se ofrece la posibilidad de indicar:

  • Comprimir en ZIP: para reducir el tamaño del archivo resultante y facilitar su envío.
  • Incluir imágenes: para incluir en la extracción los archivos de imágenes de cubierta que se hayan subido físicamente a DILVE para los libros incluidos en la extracción. Esta opción es de aplicación en ONIX y en CSV. En el caso de que la extracción sea en formato CSV, el mapa debe incluir el campo de imagen de cubierta para que se incluyan las imágenes en la extracción.
  • Incluir archivos PDF: para incluir en la extracción los archivos de PDF de textos ricos que se hayan subido físicamente a DILVE para los libros incluidos en la extracción. Esta opción es de aplicación en ONIX y en CSV. En el caso de que la extracción sea en formato CSV, el mapa debe incluir el campo de PDF texto rico para que se incluyan los archivos de PDF en la extracción.

IMAGEN DE LOS EXTRA

Método de envío y periodicidad

Permite configurar el método de envío de la extracción y su periodicidad, que puede ser puntual (con fecha de ejecución) o programada (diaria, semanal o mensual).

Método de envío

Permite seleccionar el método de envío de la extracción.

En el caso de las extracciones en formato SINLI, el método de envío debe ser necesariamente una lista de buzones SINLI previamente creada por el usuario.

Bloques de Métodos de envío

Los métodos de envío disponibles son los siguientes:

  • Email: una única dirección de correo electrónico.
  • FTP, FTPS, SFTP, etc.: indicando la dirección del servidor, la ruta y las credenciales de acceso. Para las extracciones SFTP, si es necesario abrir algún puerto en el firewall de DILVE, debe contactar con el servicio de asistencia de DILVE.
  • Buzón FTP DILVE: el archivo de la extracción se podrá descargar de la carpeta extracciones del buzón FTP el usuario en DILVE la que se accede desde el servidor ftp.dilve.es con las credenciales de acceso a DILVE.
Tamaño del buzón FTP DILVE

Los buzones FTP de DILVE tienen un espacio limitado, por lo que se recomienda borrar los archivos de extracciones después de descargarlos para evitar problemas de espacio en el buzón. Los archivos se borrarán automáticamente después de 30 días desde su generación.

  • Buzón SFTP DILVE: el archivo de la extracción se podrá descargar de la carpeta extracciones del buzón SFTP el usuario en DILVE. La creación del buzón SFTP de DILVE se realiza a petición del usuario a través del servicio de asistencia de DILVE.
  • Listas: una lista de distribución de correo electrónico previamente creada por el usuario en DILVE. Para configurar una lista de distribución, consulta la sección de listas de distribución.
  • 'Listas SINLI`: una lista de buzones SINLI previamente creada por el usuario en DILVE para el envío de la extracción. Para configurar una lista de distribución para extracciones en formato SINLI, consulta la sección de listas de buzones SINLI.

IMAGEN DE LOS BLOQUES DE MÉTODO DE ENVÍO

Periodicidad

Las extracciones pueden ser puntuales o programadas.

Las extracciones puntuales deben ser ejecutadas manualmente por el usuario desde el listado de extracciones.

Las extracciones programadas se ejecutan automáticamente según la periodicidad indicada (diaria, semanal o mensual) y se reciben los archivos resultantes en el método de envío configurado. Se debe detallar el día y la hora de la primera ejecución y las sucesivas ejecuciones se realizarán según la periodicidad indicada.

Si en los criterios de selección de la extracción se han indicado criterios relacionados con la fecha de modificación o alta de los libros en DILVE, en cada ejecución de la extracción se incluirán los libros que cumplan los criterios de búsqueda y que hayan sido modificados o dados de alta desde la última ejecución de la extracción. para la primera ejecución se considerará el intevalo de la periodicidad indicada (por ejemplo, para una extracción semanal se considerará el intervalo de una semana desde la fecha de la primera ejecución).

IMAGEN DEL BLOQUE DE PERIODICIDAD

Extracción de registros borrados

Permite configurar extracciones específicas para obtener información sobre libros que han sido eliminados de DILVE.

El formato de las extracciones de libros borrados será siempre CSV (solo el ISBN o el ISBN y timestamp de eliminación) y es posible configurar la extracción como puntual, indicando un intervalo de fechas, o periódica para que se ejecute de forma automática (diaria, semanal o mensualmente) recibiendo los ISBN eliminados entre las sucesivas ejecuciones.

Imagen: configuración de extracción de libros borrados

Pantallazo de configuración de extracción de registros borrados