Sin ttulo de diapositiva - PowerPoint PPT Presentation

1 / 136
About This Presentation
Title:

Sin ttulo de diapositiva

Description:

'la pobre calidad de datos ha sido una de las causas de fracaso ... datos no tienen suficiente calidad, entonces, se pueden convertir en fuentes de problemas: ... – PowerPoint PPT presentation

Number of Views:111
Avg rating:3.0/5.0
Slides: 137
Provided by: SIP54
Category:

less

Transcript and Presenter's Notes

Title: Sin ttulo de diapositiva


1
CALIDAD DE INFORMACIÓN
PORTADA
CALIDAD DE INFORMACIÓN
2
CALIDAD DE INFORMACIÓN
ÍNDICE
  • - INTRODUCCIÓN
  • - APROXIMACIONES A LA CALIDAD
  • - MEDICIÓN DE MODELOS CONCEPTUALES
  • - MEDICIÓN DE MODELOS LÓGICOS
  • CALIDAD DE DATOS
  • ASPECTOS DE GESTIÓN

3
CALIDAD DE INFORMACIÓN
ÍNDICE
  • - INTRODUCCIÓN
  • - APROXIMACIONES A LA CALIDAD
  • - MEDICIÓN DE MODELOS CONCEPTUALES
  • - MEDICIÓN DE MODELOS LÓGICOS
  • CALIDAD DE DATOS
  • ASPECTOS DE GESTIÓN

4
CALIDAD DE INFORMACIÓN
INTRODUCCIÓN
PROBLEMAS DE POLUCIÓN DE DATOS
  • Facilidad y bajo coste para registrar datos
  • Redundancia no controlada
  • Grandes cantidades de datos históricos caducados

la mitad del coste total de implementar un
almacén de datos (datawarehouse) puede deberse a
una pobre calidad de datos
Celko (1995)
la pobre calidad de datos ha sido una de las
causas de fracaso más importantes en los
proyectos de reingeniería
Gartner Group
5
CALIDAD DE INFORMACIÓN
INTRODUCCIÓN
Strong et al. (1997)
  • Si los datos no tienen suficiente calidad,
    entonces, se pueden convertir en fuentes de
    problemas
  • Datos no usados
  • Barreras en la accesibilidad de los datos
  • Dificultades en la utilización de los datos y de
    la información

6
CALIDAD DE INFORMACIÓN
INTRODUCCIÓN
Las empresas deben gestionar la información como
un producto importante, capitalizar el
conocimiento como un activo principal y, de esta
manera, sobrevivir y prosperar en la economía
digital Huang et al. (1999)
Datos Información Conocimiento
7
CALIDAD DE INFORMACIÓN
INTRODUCCIÓN
CALIDAD DE LA INFORMACIÓN
CALIDAD DE LA PRESENTACIÓN
CALIDAD DE LA BD
CALIDAD DEL SGBD
CALIDAD MODELO DE DATOS
CALIDAD DE LOS DATOS
8
CALIDAD DE INFORMACIÓN
INTRODUCCIÓN
MUNDO REAL
Valores
Valores
objetos y asociaciones con
sus propiedades y reglas
sus propiedades y reglas
MODELADO CONCEPTUAL
MODELADO CONCEPTUAL
MODELO CONCEPTUAL
Esquema
Esquema
Estrutura
percibida
Estrutura
percibida
(no formalizada)
(no formalizada)
conceptual
conceptual
DISEÑO LOGICO
DISEÑO LOGICO
SGBD
SGBD
Esquema
Esquema
de base
de base
MODELO
MODELO
de datos
de datos
DE BD
DE BD
DISEÑO FISICO
DISEÑO FISICO
MODELO
MODELO
Esquema
Esquema
INTERNO
INTERNO
interno
interno
BASE DE
BASE DE
DATOS
DATOS
FISICA
FISICA
9
CALIDAD DE INFORMACIÓN
INTRODUCCIÓN
Calidad del proceso
Calidad del producto
BD
10
CALIDAD DE INFORMACIÓN
ÍNDICE
  • - INTRODUCCIÓN
  • - APROXIMACIONES A LA CALIDAD
  • - MEDICIÓN DE MODELOS CONCEPTUALES
  • - MEDICIÓN DE MODELOS LÓGICOS
  • CALIDAD DE DATOS
  • ASPECTOS DE GESTIÓN

11
CALIDAD DE INFORMACIÓN
APROXIMACIONES
12
CALIDAD DE INFORMACIÓN
APROXIMACIONES
ROMAN (1985)
Conveniencia Limpieza conceptual Eficiencia
computacional Facilidad de construcción Estructura
ción Precisión, falta de ambigüedad, compleción,
consistencia Analizabilidad . . .
13
CALIDAD DE INFORMACIÓN
APROXIMACIONES
BATINI, CERI y NAVATHE (1992)
Compleción Corrección Minimalidad Expresividad Leg
ibilidad Autoexplicación Extensibilidad
Normalidad
14
CALIDAD DE INFORMACIÓN
APROXIMACIONES
  • Compleción un esquema es completo cuando
    representa todas las características relevantes
    del dominio de aplicación
  • respecto a los requisitos
  • respecto al esquema
  • Corrección un esquema es correcto cuando
    utilizan de forma apropiada los conceptos del
    modelo E/R.
  • sintáctica
  • semántica
  • Minimalidad un esquema es minimal cuando todo
    aspecto de los requisitos aparece sólo una vez en
    el esquema
  • Expresividad un esquema es expresivo cuando
    representa los requisitos de una manera
    natural,sin necesidad de explicaciones
    adicionales.

15
CALIDAD DE INFORMACIÓN
APROXIMACIONES
Legibilidad Es una propiedad del diagrama que
representa al esquema. Un diagrama tiene buena
legibilidad cuando respeta ciertos criterios
estéticos que hacen al diagrama
elegante. Autoexplicación Un esquema es
autoexplicativo cuando un gran número de
propiedades puede representarse utilizando el
propio modelo conceptual, sin otros
formalismos. Extensibilidad Un esquema es
fácilmente adaptado a cambios en los requisitos
cuando se descompone en partes (módulos,
vistas). Normalidad pretende conservar los
datos en una forma limpia, purificada.
(Aplicación de la teoría de la normalización del
modelo relacional).
16
CALIDAD DE INFORMACIÓN
APROXIMACIONES
CARACTERÍSTICAS DE LAS LISTAS
Lindland et al. (1994)
- Muchas definiciones son vagas, complicadas e,
incluso, inexistentes - La lista no es
estructurada y las propiedades se solapan
parcialmente - Se mezclan propiedades de la
especificación con las propiedades del método y
del lenguaje - Presuponen la existencia de
diseño/implementación - Algunos objetivos son
poco realistas, o imposibles
17
CALIDAD DE INFORMACIÓN
APROXIMACIONES
Lindland et al. (1994, 1995)
Lindland et al. (1994, 1995)
MODELO
MODELO
CALIDAD SEMÁNTICA
CALIDAD SEMÁNTICA
CALIDAD SINTÁCTICA
CALIDAD SINTÁCTICA
DOMINIO
DOMINIO
LENGUAJE
LENGUAJE
CALIDAD PRAGMÁTICA
CALIDAD PRAGMÁTICA
CALIDAD SEMÁNTICA PERCIBIDA
CALIDAD SEMÁNTICA PERCIBIDA
CALIDAD SOCIAL
CALIDAD SOCIAL
18
CALIDAD DE INFORMACIÓN
APROXIMACIONES
OBJETIVOS
  • Separar las propiedades directas de la
    especificación de las del lenguaje y del método
  • Separar los objetivos de calidad de los medios
    para alcanzarlos (viabilidad)
  • Disponer de un fundamento matemático
  • Tener propiedades relacionadas directamente con
    la especificación

19
CALIDAD DE INFORMACIÓN
APROXIMACIONES
ELEMENTOS
  • Audiencia unión del conjunto de actores
    individuales, el conjunto de actores sociales
    organizacionales y el conjunto de actores
    técnicos que necesitan relacionarse con el modelo
  • Modelo conjunto de todas las sentencias
    expresadas explícita o implícitamente
  • Lenguaje conjunto de todas las sentencias que
    se pueden expresar de acuerdo al vocabulario y la
    gramática de los lenguajes de modelado utilizados
  • Dominio conjunto de todas las sentencias serían
    correctas y relevantes acerca del problema
  • Interpretación de la audiencia conjunto de
    todas las sentencias de las que la audiencia
    piensa que consta el modelo
  • Conocimiento de los participantes unión de los
    conjuntos de sentencias de todos los actores
    sociales individuales

20
CALIDAD DE INFORMACIÓN
APROXIMACIONES
CALIDAD
Sintáctica corrección sintáctica Semántica
validez y compleción (viables) percibidas Pragmát
ica comprensión (viable) Social acuerdo
(viable), conforme a 2 dimensiones .
Conocimiento vs. acuerdo en la interpretación del
modelo . Acuerdo relativo vs. acuerdo
absoluto
21
CALIDAD DE INFORMACIÓN
APROXIMACIONES
22
CALIDAD DE INFORMACIÓN
APROXIMACIONES
Moody y Schanks (1994, 1998)
MÉTODO DE EVALUACIÓN
STAKEHOLDER
FACTOR DE CALIDAD
PESO
VALORACIÓN
ESTRATEGIA DE MEJORA
23
CALIDAD DE INFORMACIÓN
APROXIMACIONES
ELEMENTOS
  • Factor de calidad propiedad deseable de un
    modelo de datos
  • Stakeholder personas involucradas en la
    construcción o utilización del modelo
  • Estrategias de mejora Técnicas para mejorar la
    calidad de los modelos de datos
  • Método de evaluación modo sistemático de
    evaluar factores de calidad
  • Peso define la importancia relativa de los
    factores de calidad
  • Valores representan la valoración de un factor
    de calidad por un stakeholder

24
CALIDAD DE INFORMACIÓN
APROXIMACIONES
FACTORES DE CALIDAD
Moody (1998)
usuario
usuario
usuario
usuario
integridad
flexibilidad
comprens.
compleción
MODELO DE CALIDAD
corrección
simplicidad
integración
implem.
analista
analista
admin. datos
desarrollador
25
CALIDAD DE INFORMACIÓN
APROXIMACIONES
  • Compleción capacidad del modelo de tener toda
    la información requerida para cumplir los
    requisitos del usuario
  • Integridad grado en el que las reglas del
    negocio que se aplican a los datos están
    definidas en el modelo de datos
  • Flexibilidad facilidad con la que el modelo de
    datos se puede adaptar a los cambios en los
    requisitos
  • Comprensibilidad facilidad con la que el modelo
    de datos puede ser entendido (perceptual y
    operacional)

26
CALIDAD DE INFORMACIÓN
APROXIMACIONES
  • Corrección se refiere a si el modelo cumple las
    reglas de las técnicas de modelado utilizadas
  • Simplicidad significa que el modelo contiene
    los mínimos constructores posibles
  • Integración nivel de consistencia del modelo de
    datos con el resto de los datos de la
    organización
  • Implementabilidad facilidad con la que el
    modelo de datos puede ser implementado dentro de
    las restricciones de tiempo, presupuesto y
    tecnología del proyecto

27
CALIDAD DE INFORMACIÓN
APROXIMACIONES
INTERACCIONES ENTRE FACTORES
Moody y Schanks (1994)
28
CALIDAD DE INFORMACIÓN
APROXIMACIONES
MARCO INTEGRADO PARA LA CALIDAD
Shanks y Darke (1997)
- AMBOS MARCOS COMPARTEN CONCEPTOS AUDIENCIA
STAKEHOLDER OBJETIVO, PROPIEDAD FACTOR DE
CALIDAD ACTIVIDAD ESTRATEGIA -
CONSIDERACIONES TEÓRICAS Y PRÁCTICAS - VÁLIDO
PARA EL PRODUCTO Y EL PROCESO
29
CALIDAD DE INFORMACIÓN
APROXIMACIONES
Theory
MEANS
DOMAIN
Based
classifies
contains
represents
LANGUAGE
GOAL
PROPERTY
MODEL
maps to
interprets
AUDIENCE
ACTIVITY
maps to
OR
is assigned
is achieved by
used for
assigns
WEIGHTING
is assigned
valued by
Practice
RATING
Based
scores
30
CALIDAD DE INFORMACIÓN
APROXIMACIONES
ENFOQUE ONTOLÓGICO
Kesh (1995)
calidad
Funcionamiento
Ontología
Usabilidad
Usabilidad
Mantenibilidad
(usuario)
(diseñador)
Rendimiento
Precisión
Estructura
Contenido
compleción
adecuación al problema
cohesión
validez
validez
consistencia
concisión
31
CALIDAD DE INFORMACIÓN
APROXIMACIONES
32
CALIDAD DE INFORMACIÓN
APROXIMACIONES
GUÍAS DE MODELADO (GoM)
Schuette y Rotthowe (1998)
subjetividad
33
CALIDAD DE INFORMACIÓN
APROXIMACIONES
34
CALIDAD DE INFORMACIÓN
ÍNDICE
  • - INTRODUCCIÓN
  • - APROXIMACIONES A LA CALIDAD
  • - MEDICIÓN DE MODELOS CONCEPTUALES
  • - MEDICIÓN DE MODELOS LÓGICOS
  • CALIDAD DE DATOS
  • ASPECTOS DE GESTIÓN

35
CALIDAD DE INFORMACIÓN
MODELOS CONCEPTUALES
MUNDO REAL
Valores
Valores
objetos y asociaciones con
sus propiedades y reglas
sus propiedades y reglas
MODELADO CONCEPTUAL
MODELADO CONCEPTUAL
MODELO CONCEPTUAL
Esquema
Esquema
Estrutura
percibida
Estrutura
percibida
(no formalizada)
(no formalizada)
conceptual
conceptual
DISEÑO LOGICO
DISEÑO LOGICO
SGBD
SGBD
Esquema
Esquema
de base
de base
MODELO
MODELO
de datos
de datos
DE BD
DE BD
DISEÑO FISICO
DISEÑO FISICO
MODELO
MODELO
Esquema
Esquema
INTERNO
INTERNO
interno
interno
BASE DE
BASE DE
DATOS
DATOS
FISICA
FISICA
36
CALIDAD DE INFORMACIÓN
MODELOS CONCEPTUALES
  • Definir sólo propiedades deseables no es
    suficiente para evaluar la calidad, ... por lo
    que es necesario contar con medidas que permitan
    evaluar la calidad de los modelos conceptuales de
    datos de forma cuantitativa y objetiva, ...
    Moody et al. (1998)
  • - Medir datos puede ayudar a controlar y predecir
    aspectos del modelo de datos durante el proceso
    de desarrollo software (MacDonell et al., 1997)

37
CALIDAD DE INFORMACIÓN
MODELOS CONCEPTUALES
Moody (1998)
  • Compleción
  • Nº de elementos del modelo de datos que no
    corresponden con requisitos de usuario
  • Nº de requisitos de usuario no representados en
    el modelo de datos
  • Nº de elementos de datos que corresponden a
    requisitos de usuario pero definidos de forma
    inexacta
  • Nº de inconsistencias con el modelo de procesos
  • Integridad
  • Nº de reglas del negocio que no se hacen cumplir
    por el modelo de datos
  • Nº de restricciones de integridad incluidas en el
    modelo de datos que no corresponden a políticas
    del negocio
  • Flexibilidad
  • Nº de elementos en el modelo que están sujetos a
    cambios en el futuro
  • Costes estimados de los cambios
  • Importancia estratégica de los cambios

38
CALIDAD DE INFORMACIÓN
MODELOS CONCEPTUALES
Moody (1998)
  • Comprensibilidad
  • Valoración de los usuarios sobre la
    comprensibilidad del modelo
  • Capacidad de los usuarios de interpretar el
    modelo correctamente
  • Valoración de los desarrolladores de aplicaciones
    sobre la comprensibilidad del modelo
  • Corrección
  • Nº de violaciones de las convenciones de modelado
    de datos
  • Nº de violaciones a las formas normales
  • Nº de instancias de redundancia en el modelo
  • Simplicidad
  • Nº de entidades
  • Nº de entidades e interrelaciones
  • Suma ponderada de constructos (aNE bNR cNA)

39
CALIDAD DE INFORMACIÓN
MODELOS CONCEPTUALES
Moody (1998)
  • Integración
  • Nº de conflictos con el modelo de datos
    corporativo
  • Nº de conflictos con los sistemas existentes
  • Valoración de los representantes de todas las
    áreas de negocio
  • Implementabilidad
  • Valoración de riesgo técnico
  • Valoración de riesgo de planificación
  • Estimación del coste de desarrollo
  • Nº de elementos físicos incluidos en el modelo de
    datos

40
CALIDAD DE INFORMACIÓN
MODELOS CONCEPTUALES
Kesh (1995)
  • Calcular la puntuación de los componentes
    ontológicos individuales
  • Combinar las puntuaciones de los componentes
    ontológicos relevantes a cada comportamiento
  • Combinar las puntuaciones de los componentes
    para calcular la puntuación de la calidad

Q w1 . s1 w2 . s2 w3 . s3 w4 . s4 w5 .
s5
41
CALIDAD DE INFORMACIÓN
MODELOS CONCEPTUALES
s1 (o1 o3 o4 o5) / 4 s2 (o2 o3 o5
o6 o7) / 5 s3 (o2 o4 o6) / 3 s4 (o3
o5) / 2 s5 (o4 o5) / 2
42
CALIDAD DE INFORMACIÓN
MODELOS CONCEPTUALES
  • o1 (adecuación de la estructura) valorada por
    los usuarios en una escala de 5 puntos
  • o2 (solidez de la estructura) valorada por un
    grupo de técnicos
  • o3 (consistencia de la estructura) o3 M D1
    donde M Máximo de puntos posibles (5) y D1 está
    basado en el ratio R (número de
    inconsitencias/número de implicacions), dado por
    4n1, donde n1 es el número de interrelaciones
  • o4 (concisión de la estructura) Si n es el
    número de entidades, el mínimo de interrelaciones
    será (n-1), en cuyo caso o4 5. La peor
    situación posible es c2n, en cuyo caso o4 0.
    En general o4 M ((c2n n1) / (c2n (n-1)).
  • o5 (compleción del contenido) se deduce de un
    máximo M los datos que faltan según los informes
    y consultas que se deben generar de la base de
    datos.
  • o6 (cohesión del contenido) para cada entidad
    se mide el tamaño de su clave primaria. Si es
    simple se puntúa el máximo. Si utiliza todos los
    atributos de la entidad se puntúa o6i 0, donde
    i es el número de la entidad. En general o6i M
    ((ne np) / (ne 1)) donde ne es el número de
    atributos de la entidad y np el número de
    atributos que forman la clave primaria. La
    cohesión total es o6 ?o6i / n
  • o7 (validez del contenido) se asigna M si todos
    los atributos son válidos. En general o7 M (1
    ni / ?ne) siendo ni los atributos incorrectos.

43
CALIDAD DE INFORMACIÓN
MODELOS CONCEPTUALES
Gray et al. (1991)
  • Complejidad de una entidad i
  • Complejidad de la arquitectura de datos

44
CALIDAD DE INFORMACIÓN
MODELOS CONCEPTUALES
Gray (1991)
45
CALIDAD DE INFORMACIÓN
MODELOS CONCEPTUALES
Eick (1991)
1

f




qu
qu
qu
qu

3
qu

3
5
4
3
2
1
  • qu1, número de dependencias funcionales que se
    dan en U no expresadas en Si
  • qu2, número de dependencias en existencia que se
    dan en U no expresadas en Si
  • qu3, número de atributos y conexiones de subtipos
    en Si.
  • qu4, número de clases en Si
  • qu5, número de etiquetas en Si

46
CALIDAD DE INFORMACIÓN
MODELOS CONCEPTUALES
47
CALIDAD DE INFORMACIÓN
MODELOS CONCEPTUALES
ISO 9126
48
CALIDAD DE BASES DE DATOS
MODELOS CONCEPTUALES
49
CALIDAD DE INFORMACIÓN
MODELOS CONCEPTUALES
Henderson-Sellers (1994)
COMPLEXITY
Psychological
Computational
Representational
Cognitive Complexity
Problem Complexity
Product or Structural Complexity
50
CALIDAD DE INFORMACIÓN
MODELOS CONCEPTUALES
GOAL Analyse ER diagrams for the purpose
of Evaluating with respect to
their Maintainability from the point of view of
the Software designers in the context
of Software delevopment
organisations
51
CALIDAD DE INFORMACIÓN
MODELOS CONCEPTUALES
  • Number of entities (NE)
  • Number of attributes (NA)
  • Number of derived attributes (NDA)
  • Number of composite attributes (NCA)
  • Number of multivalued attributes (NMVA)
  • Number of relationships (NR)
  • Number of MN relationships (NMNR)
  • Number of 1N relationships (N1NR)

52
CALIDAD DE INFORMACIÓN
MODELOS CONCEPTUALES
  • Number of N-Ary relationships (NN-AryR)
  • Number of binary relationships (NBinaryR)
  • Number of IS_A relationships (NIS_AR)
  • Number of reflexive relationships (NRefR)
  • Number of redundant relationships (NRR)

53
CALIDAD DE INFORMACIÓN
MODELOS CONCEPTUALES
VALIDACIÓN TEÓRICA
54
CALIDAD DE INFORMACIÓN
MODELOS CONCEPTUALES
VALIDACIÓN EMPÍRICA
55
CALIDAD DE INFORMACIÓN
MODELOS CONCEPTUALES
  • Métricas para modelos conceptuales OO
  • Chidamber and Kemerer (1991 1994)
  • Li and Henry (1993)
  • Brito e Abreu and Carapuça (1994)
  • Lorenz and Kidd (1994)
  • Briand et al.s (1997)
  • Marchesi (1998)
  • Harrison et al. (1998)
  • Banisya et al. (1999)

56
CALIDAD DE INFORMACIÓN
MODELOS CONCEPTUALES
CK Metrics (Chidamber and Kemerer,19911994)
  • Metrics
  • DIT The Depth of Inheritance
  • NOC The Number of Children
  • Goal
  • Measure design complexity in relation with their
    impact on external quality attributes such as
    maintainability, reusability, etc.

57
CALIDAD DE INFORMACIÓN
MODELOS CONCEPTUALES
  • Theoretical Validation
  • Chidamber and Kemerer (1994) corroborated that
    both DIT and NOC accomplish Weyukers axioms for
    complexity measures (Weyuker, 1988)
  • Briand et al. (1996) classified the DIT metric as
    a length measure, and the NOC metric as a size
    measure
  • Zuse (1998) has demonstrated that DIT and NOC are
    both above the ordinal scale
  • Poels and Dedene (1999) have demonstrated by
    means of the DISTANCE framework that they can be
    characterised at ratio scale

58
CALIDAD DE INFORMACIÓN
MODELOS CONCEPTUALES
  • Empirical Validation
  • Basili et al. (1996) have have concluded that the
    larger the DIT, the greater the probability of
    fault detection. Also, they observed that the
    larger the NOC, the lower the probability of
    fault detection.
  • Cartwright and Shepperd (1996) found a positive
    correlation between the DIT metric and the number
    of user-reported problems, however, doubting the
    use of inheritance.
  • Li and Henry (1993b) showed that Chidamber and
    Kemerers metrics appeared to be adequate in
    predicting the frequency of changes across
    classes during the maintenance phase.
  • Daly et al. (1996) found that the time to perform
    maintenance tasks was significantly lower in
    systems with three levels of inheritance depth as
    compared to systems with no use of inheritance.

59
CALIDAD DE INFORMACIÓN
MODELOS CONCEPTUALES
  • Empirical Validation
  • Chidamber et al. (1998) have carried out studies
    on three commercial systems, in order to examine
    the relationships between MOOSE metrics and
    productivity, rework effort and design effort.
    None of the three systems investigated showed
    significant use of inheritance, so DIT and NOC
    tended to have minimal values.
  • Chidamber et al. (1998) suggested that low values
    of DIT and NOC indicate that the reuse
    opportunities (via inheritance) were perhaps
    compromised in favour of comprehensibility of the
    overall architecture of the applications.
  • Tang (1998) have investigated the correlation
    between these design metrics and the likelihood
    of the occurrence of OO faults.

60
CALIDAD DE INFORMACIÓN
MODELOS CONCEPTUALES
  • Empirical Validation
  • After carrying about two case studies Briand et
    al. (1998 2000b) have concluded that inheritance
    measures (DIT, NOC, etc) appear not to be
    consistent indicators of class-fault proneness,
    but they suggested to the use of inheritance is
    an important topic for further research.
  • Harrison et al. (2000) used the DIT metric in an
    empirical study, demonstrating that systems
    without inheritance are easier to understand and
    to modify than systems with three or five levels
    of inheritance.
  • Poels and Dedene (2001) use the DIT metric in an
    empirical study, demonstrating that the extensive
    use of inheritance leads to models that are more
    difficult to modify.
  • Briand et al. (2001) have used the metrics NOC,
    DIT (and also CBO metric, but we do not consider
    it in this work) in an empirical study,
    demonstrating that the use of design principles
    leads to OO designs that are easier to maintain.

61
CALIDAD DE INFORMACIÓN
MODELOS CONCEPTUALES
  • Tool
  • The authors of these metrics have developed a
    tool for the metric calculation Chidamber and
    Kemerer (1994) for C code
  • Several commercial and public domain analysers
    for Java CodeWork (2000), Metameta (2000),
    Power-Software (2000), ControlCenter
    (TogetherSoft, 2001) and for C Devanbu (2000),
    ObjectSoft (2000) and Power-Software (2000a)
  • There is at least one tool that can be used to
    collect the CK metrics directly from design
    documents (Number-Six-Software, 2000)

62
CALIDAD DE INFORMACIÓN
MODELOS CONCEPTUALES
63
CALIDAD DE INFORMACIÓN
MODELOS CONCEPTUALES
GOAL Analyse UML Class diagrams for the
purpose of Evaluating with respect to
their Maintainability from the point of view of
the Software designers in the context
of Software delevopment
organisations
64
CALIDAD DE INFORMACIÓN
MODELOS CONCEPTUALES
  • CLASS DIAGRAMS-SCOPE METRICS
  • Number of associations (NAssoc)
  • Number of aggregations (NAgg)
  • Number of aggregation hierarchies (NAggH)
  • Maximum height of aggregation (MaxHagg)
  • Number of generalisations (NGen)
  • Number of generalisation hierarchies (NGenH)
  • Maximum depth of inheritance (MaxDIT)
  • Number of dependencies (NDep)

65
CALIDAD DE INFORMACIÓN
MODELOS CONCEPTUALES
  • CLASS-SCOPE METRICS
  • Number of associations per class (NAssocC)
  • Height of aggregation (HAgg)
  • Number of direct parts (NDP)
  • Number of parts (NP)
  • Number of wholes (NW)
  • Number of dependencies IN (NDepIN)
  • Number of dependencies OUT (NDepOUT)

66
CALIDAD DE INFORMACIÓN
MODELOS CONCEPTUALES
VALIDACIÓN TEÓRICA
67
CALIDAD DE INFORMACIÓN
MODELOS CONCEPTUALES
VALIDACIÓN EMPÍRICA
68
CALIDAD DE INFORMACIÓN
MODELOS CONCEPTUALES
1. DEFINITION Analyse UML class diagrams
complexity metrics For the purpose of
Evaluating With respect to The
capability to be used as early quality
indicators From the point of view of OOIS
designers In the context of Undergraduate
students and professors of the Software
Engineering Area in the Department of
Computer Science in the UCLM
69
CALIDAD DE INFORMACIÓN
MODELOS CONCEPTUALES
  • 2. PLANNING
  • Context selection
  • The experiment run off-line (not industrial
    software development)
  • The subjects were 10 professors and 20 students
    enrolled in the final-year of Computer Science at
    the Department of Computer Science at the UCLM
  • Selection of subjects
  • The subjects are chosen for convenience

70
CALIDAD DE INFORMACIÓN
MODELOS CONCEPTUALES
  • Variables selection
  • The independent variable is the UML class diagram
    structural complexity
  • The dependent variable is the UML class diagram
    maintainability
  • Instrumentation
  • The objects were UML class diagrams
  • The independent variable was measured through the
    metrics
  • The dependent variable was measured by the time
    spent doing the experiment, the maintenance
    time

71
CALIDAD DE INFORMACIÓN
MODELOS CONCEPTUALES
  • Hypotheses formulation
  • Null hypothesis, H0 There is not a significant
    correlation between the structural complexity
    metrics we proposed and the maintenance time
  • Alternative hypothesis, H1 There is a
    significant correlation between the structural
    complexity metrics we proposed and the
    maintenance time
  • Experiment design
  • A within-subject design

72
CALIDAD DE INFORMACIÓN
MODELOS CONCEPTUALES
  • 3. OPERATION
  • Preparation
  • The material consists of nine UML class diagrams
    of different application domains
  • The diagrams have different complexity,
    considering a broad range of metrics values
  • Each subject has to modify the class diagrams
    according to the new requirements and to write
    down the time spent in performing those
    modifications (maintenance time)

73
CALIDAD DE INFORMACIÓN
MODELOS CONCEPTUALES
  • Execution
  • The subjects were given all the material.
  • We explained to them how to carry out the
    experiment
  • We allowed one week to do the experiment
  • We collected all the empirical data
  • Data Validation
  • We checked if the tests were complete and if the
    modifications were done correctly
  • We discarded the test of seven subjects, because
    they included a required modification that was
    done incorrectly

74
CALIDAD DE INFORMACIÓN
MODELOS CONCEPTUALES
  • 4. ANALYSIS AND INTERPRETATION
  • Our goal is to ascertain if any correlation
    exists between each of the proposed metrics and
    the maintenance time
  • For analysing the empirical data we used three
    techniques
  • Statistical techniques
  • Fuzzy classification and regression trees
    (Linares et al., 1996)
  • Fuzzy prototypical knowledge discovery (Olivas,
    2000)

75
CALIDAD DE INFORMACIÓN
MODELOS CONCEPTUALES
  • 5. VALIDITY EVALUATION
  • Threats to conclusion validity
  • The only issue that could affect the statistical
    validity of this study are the size of the sample
    data (243 values, 9 diagrams and 27 subjects)
  • Threats to construct validity
  • The dependent variable we used is the maintenance
    time, so we consider this variable constructively
    valid
  • The construct validity of the measures used for
    the independent variables is guaranteed by Poels
    and Dedenes framework (Poels and Dedene, 1999
    2000a) used to validate them

76
CALIDAD DE INFORMACIÓN
MODELOS CONCEPTUALES
  • Threats to internal validity
  • Differences among subjects
  • Knowledge of the universe of discourse
  • Precision in time values
  • Learning effects
  • Fatigue effects
  • Persistence effects
  • Subject motivation
  • Other factors
  • Threats to external validity
  • Materials and tasks used
  • Subjects

77
CALIDAD DE INFORMACIÓN
MODELOS CONCEPTUALES
  • EXPERIMENT CONCLUSIONS
  • NC, NA, NM, NAssoc, NAgg, NDep, NGen, NAggH,
    NGenH, MaxHAgg, MaxDIT are to some extent
    correlated with maintenance time

78
CALIDAD DE INFORMACIÓN
ÍNDICE
  • - INTRODUCCIÓN
  • - APROXIMACIONES A LA CALIDAD
  • - MEDICIÓN DE MODELOS CONCEPTUALES
  • - MEDICIÓN DE MODELOS LÓGICOS
  • CALIDAD DE DATOS
  • ASPECTOS DE GESTIÓN

79
CALIDAD DE INFORMACIÓN
MODELOS LÓGICOS
- Prácticamente no existen métricas para bases de
datos - Sneed y Foshag (1998) metrics for
databases have been neglected in the metric
community - Medir datos puede ayudar a controlar
y predecir aspectos del modelo de datos durante
el proceso de desarrollo software (MacDonell et
al., 1997) - Un enfoque más riguroso para
asegurar la calidad de las bases de datos
80
CALIDAD DE INFORMACIÓN
MODELOS LÓGICOS
MUNDO REAL
Valores
Valores
objetos y asociaciones con
sus propiedades y reglas
sus propiedades y reglas
MODELADO CONCEPTUAL
MODELADO CONCEPTUAL
MODELO CONCEPTUAL
Esquema
Esquema
Estrutura
percibida
Estrutura
percibida
(no formalizada)
(no formalizada)
conceptual
conceptual
DISEÑO LOGICO
DISEÑO LOGICO
SGBD
SGBD
Esquema
Esquema
de base
de base
MODELO
MODELO
de datos
de datos
DE BD
DE BD
DISEÑO FISICO
DISEÑO FISICO
MODELO
MODELO
Esquema
Esquema
INTERNO
INTERNO
interno
interno
BASE DE
BASE DE
DATOS
DATOS
FISICA
FISICA
81
CALIDAD DE INFORMACIÓN
MODELOS LÓGICOS
  • Bases de datos relacionales
  • Las más implantadas en la actualidad
  • (Leavit, 2000)
  • Bases de datos activas
  • Muchos productos comerciales incluyen actividad
    (Ceri y Widom, 1996 Paton y Díaz, 2000)
  • Bases de datos objeto-relacionales
  • En el año 2003 sustituirán a las relacionales
  • (Leavit, 2000)

82
CALIDAD DE INFORMACIÓN
MODELOS LÓGICOS
  • Métricas propuestas para programas tradicionales
  • Líneas de código
  • Número de sentencias de programación
  • SIZE1. Definida como el número de .
    Li y Henry (1993)
  • Métricas de la Ciencia del Software (Software
    Science). Halstead (1977)
  • Puntos Función. Albrecht y Gaffney (1983)
  • Complejidad ciclomática. McCabe (1976)
  • Fan-in y fan-out. Henry y Kafura (1981)

83
CALIDAD DE INFORMACIÓN
MODELOS LÓGICOS
  • Métricas para modelos lógicos
  • Bases de datos relacionales
  • Ratio de normalidad (Gray et al., 1991)
  • Bases de datos activas
  • Bases de datos objeto-relacionales
  • Adaptación de métricas para sistemas OO

84
CALIDAD DE INFORMACIÓN
MODELOS LÓGICOS
DEFINICIÓN DE MÉTRICAS Bases de Datos Relacionales
OBJETIVO (Goal) Propósito Asegurar la
Asunto mantenibilidad Objeto de las
bases de datos relacionales Punto de vista
desde el punto de vista del diseñador de la
base de datos
85
CALIDAD DE INFORMACIÓN
MODELOS LÓGICOS
PREGUNTAS (Question) 1. Cómo influye la
complejidad de las tablas en la mantenibilidad de
las bases de datos relacionales? 2. Cómo influye
la complejidad entre tablas en la mantenibilidad
de las bases de datos relacionales?
86
CALIDAD DE INFORMACIÓN
MODELOS LÓGICOS
87
CALIDAD DE INFORMACIÓN
MODELOS LÓGICOS
88
CALIDAD DE INFORMACIÓN
MODELOS LÓGICOS
DEFINICIÓN DE MÉTRICAS Bases de Datos Activas
89
CALIDAD DE INFORMACIÓN
MODELOS LÓGICOS
DEFINICIÓN DE MÉTRICAS Bases de Datos
Objeto-Relacionales
90
CALIDAD DE INFORMACIÓN
MODELOS LÓGICOS
VALIDACIÓN EMPÍRICA
EXPERTOS

TP,

D


ACTIVAS

INTRA

ALUMNOS

NS, NO

ALUMNOS

NS, NO


OBJETO
-
EXPERTOS

PCC, TS,
EXPERTOS

PCC, TS,

DRT, RFK,
DRT, RFK,
RELACIONAL

NIC, NSC

NIC, NSC

91
CALIDAD DE INFORMACIÓN
MODELOS LÓGICOS
VALIDACIÓN EMPÍRICA Experimento Relacional
  • Hipótesis
  • Hipótesis nula Diferentes valores de las
    métricas no afectan a la entendibilidad del
    esquema de la base de datos.
  • Hipótesis alternativa 1 El valor de DRT afecta a
    la entendibilidad del esquema de la base de
    datos.
  • Hipótesis alternativa 2 El valor de NFK afecta a
    la entendibilidad del esquema de la base de
    datos.
  • Hipótesis alternativa 3 La combinación de
    valores de DRT y NFK afecta a la entendibilidad
    del esquema de la base de datos.

92
CALIDAD DE INFORMACIÓN
MODELOS LÓGICOS
  • Sujetos
  • Alumnos de la E.S. Informática de la Universidad
    de Castilla-La Mancha que cursaban una asignatura
    anual de bases de datos. Fue realizado por 60
    alumnos, sólo 59 fueron finalmente aceptados.
  • Materiales del experimento
  • La documentación entregada a cada sujeto
    constaba de
  • los esquemas de las bases de datos
  • las tablas con su contenido
  • la hoja de preguntas y respuestas

93
CALIDAD DE INFORMACIÓN
MODELOS LÓGICOS
  • Se realizaron 4 tests diferentes con distintos
    valores para las métricas
  • Material esquema de la BD, tablas, hoja de
    preguntas y respuestas
  • Ejercicios inserción, eliminación y modificación
    de la BD

94
CALIDAD DE INFORMACIÓN
MODELOS LÓGICOS
Diseño
95
CALIDAD DE INFORMACIÓN
MODELOS LÓGICOS
  • Variables Independientes
  • Las variables independientes son DRT y NFK.
  • Cada una de estas variables tiene dos niveles que
    son dos y cinco para DRT y cinco y ocho para NFK.
  • Variables Dependientes
  • Se calcula como el número de respuestas
    correctamente respondidas por cada sujeto en cada
    test.
  • Dimos a los sujetos diez minutos por test
    evaluando después el número de respuestas
    correctas obtenidas en ese intervalo de tiempo.
  • El estudio se centró en el número de respuestas
    correctas obtenidas para cada test.
  • Únicamente se descartó un test por estar en
    blanco.

96
CALIDAD DE INFORMACIÓN
MODELOS LÓGICOS
  • Variables controladas
  • Intentamos minimizar la variabilidad entre
    sujetos escogiéndolos a todos del mismo curso y
    con los mismos conocimientos sobre bases de datos
  • Los efectos de variables irrelevantes fueron
    minimizados haciendo los mismos tests a todos los
    participantes durante el mismo tiempo
  • El orden de ejecución de los cuatro tests varió
    de unos sujetos a otros para contrarrestrar los
    efectos producidos por el aprendizaje.
  • Igualmente se hizo que cada uno de los cuatro
    test trabajara con el mismo número de tablas
    aunque se modificara el valor de las métricas.

97
CALIDAD DE INFORMACIÓN
MODELOS LÓGICOS
  • Procedimiento
  • Los tests se realizaron consecutivamente en el
    transcurso de una hora de clase.
  • Antes de comenzar, fue explicado a los sujetos
    tipo de ejercicios que debían realizar, material
    que se les iba a entregar, tipo de respuestas que
    debían dar y tiempo que tenían para realizar cada
    test del experimento.  
  • A cada sujeto se le entregó la documentación
    completa para los cuatro tests
  • Al finalizar el tiempo asignado a cada test, se
    informó a los sujetos que, inmediatamente,
    dejaban de trabajar en el test que estuvieran y
    pasaban al siguiente.

98
CALIDAD DE INFORMACIÓN
MODELOS LÓGICOS
Resultados
F1,2322.73
99
CALIDAD DE INFORMACIÓN
MODELOS LÓGICOS
VALIDACIÓN EMPÍRICA Réplica Relacional
Sujetos Profesionales de una empresa española
con una experiencia media de tres años en el
campo de las bases de datos. Once personas
desarrollaron el experimento siendo todos ellos
válidos.
100
CALIDAD DE INFORMACIÓN
MODELOS LÓGICOS
  • Variables Dependientes
  • Considerando la amplia experiencia en bases de
    datos relacionales de los sujetos que iban a
    desarrollar el experimento, se decidió calcularla
    en función del tiempo necesario para realizar
    cada uno de los cuatro tests.
  • De esta forma, los tests fueron tomados como
    válidos siempre y cuando estuvieran completados.
  • El estudio, por lo tanto, se centró en los
    tiempos obtenidos para cada test.

101
CALIDAD DE INFORMACIÓN
MODELOS LÓGICOS
  • Procedimiento
  • Los tests se realizaron consecutivamente en el
    transcurso de una hora.
  • Antes de comenzar, fue explicado a los sujetos,
    el tipo de ejercicios a realizar, el material que
    se les iba a entregar, y el tipo de respuestas a
    dar y cómo debían anotar el tiempo que invertían
    en resolver cada uno de los cuatro tests.  
  • Antes de comenzar a estudiar cada caso, los
    sujetos debían anotar la hora de comienzo al
    finalizar los ejercicios correspondientes a un
    test, los sujetos tenían que anotar la hora de
    finalización.
  • De esta forma, cuando un sujeto terminaba un
    test, podía pasar al siguiente sin necesidad de
    esperar al resto de compañeros.

102
CALIDAD DE INFORMACIÓN
MODELOS LÓGICOS
Resultados
F1,402.84
103
CALIDAD DE INFORMACIÓN
MODELOS LÓGICOS
De ambos experimentos se deduce que la métrica
NFK parece ser un indicador sólido de la
entendibilidad del esquema mientras que resulta
más complicado obtener una conclusión para la
métrica DRT
104
CALIDAD DE INFORMACIÓN
MODELOS LÓGICOS
  • Validez de constructo
  • Decidió medirse la entendibilidad de forma
    distinta la primera vez que para la réplica (nro
    de respuestas correctas dadas vs tiempo para
    determinar el estado final de la base de
    datos-tiempo de análisis de la base de datos
    junto al tiempo de ejecución) debido a la
    experiencia de los sujetos de la réplica.
  • Sería conveniente hacer más experimentos,
    variando las operaciones a realizar en la base de
    datos.

105
CALIDAD DE INFORMACIÓN
MODELOS LÓGICOS
  • Validez interna
  • Diferencias entre los esquemas. Seis tablas con
    más o menos claves ajenas.
  • Dominio de los esquemas diferente. Esto pudo
    influir en los resultados obtenidos.
  • Precisión de los valores del tiempo. En la
    réplica del experimento, era responsabilidad de
    los sujetos anotar los tiempos de comienzo y fin
    de cada test. Este procedimiento puede producir
    que algún sujeto introduzca alguna imprecisión.
  • Efectos de aprendizaje. Los tests de cada
    experimento fueron colocados en distinto orden.

106
CALIDAD DE INFORMACIÓN
MODELOS LÓGICOS
  • Validez interna
  • Efectos de fatiga. Tiempo medio de una hora por
    lo que estos efectos son, prácticamente,
    inexistentes. Además, la diferencia en el orden
    ayuda a evitar este efecto.
  • Efectos de persistencia. El segundo experimento
    se llevó a cabo con un nuevo conjunto de sujetos.
  • Motivación de los sujetos. Alta en el caso de los
    alumnos ya que se realizaron ejercicios similares
    en el examen. En el caso de los profesionales, la
    motivación podía ser menor.
  • Otros factores. El plagio y la influencia entre
    los sujetos fueron controlados.

107
CALIDAD DE INFORMACIÓN
MODELOS LÓGICOS
  • Validez externa
  • Materiales y tareas utilizados. Intentamos
    utilizar esquemas y operaciones representativos
    de casos reales aunque sería interesante realizar
    más experimentos con bases de datos relacionales
    de mayor tamaño y complejidad.
  • Sujetos. Debido a la dificultad de conseguir
    profesionales, el experimento se realizó la
    primera vez con estudiantes. En este caso, las
    tareas a realizar no requerían de gran
    experiencia por lo que los resultados obtenidos
    con los estudiantes pueden ser considerados
    correctos (Basili et al., 1999).

108
CALIDAD DE INFORMACIÓN
MODELOS LÓGICOS
  • Validez externa
  • En general, serían necesarios nuevos experimentos
    con un mayor número de sujetos, tanto con
    estudiantes como con profesionales y con una
    mayor diferencia entre los valores que toman las
    métricas para poder concluir si la integridad
    referencial afecta o no a la entendibilidad de
    las bases de datos relacionales y, por tanto, su
    mantenibilidad.
  • Intentamos aumentar la validez externa de las
    métricas realizando el segundo experimento con
    los profesionales, con lo que los resultados
    obtenidos se han podido generalizar
    considerablemente.

109
CALIDAD DE INFORMACIÓN
CALIDAD DE DATOS
  • - INTRODUCCIÓN
  • - APROXIMACIONES A LA CALIDAD
  • - MEDICIÓN DE MODELOS CONCEPTUALES
  • - MEDICIÓN DE MODELOS LÓGICOS
  • CALIDAD DE DATOS
  • ASPECTOS DE GESTIÓN

110
CALIDAD DE BASES DE DATOS
CALIDAD DE DATOS
Wang et al. (1993) y (1995)
111
CALIDAD DE BASES DE DATOS
CALIDAD DE DATOS
ALUMNO
CURSO
Mat.
núm.
núm.
fecha
nombre
nombre
nota
direc
precio
tel.
descr.
112
CALIDAD DE BASES DE DATOS
CALIDAD DE DATOS
113
CALIDAD DE BASES DE DATOS
CALIDAD DE DATOS
VISTA DE PARÁMETROS
DETERMINAR INDICADORES
VISTA DE CALIDAD
INTEGRAR VISTAS DE CALIDAD
ESQUEMA DE CALIDAD
114
CALIDAD DE BASES DE DATOS
CALIDAD DE DATOS
115
CALIDAD DE BASES DE DATOS
CALIDAD DE DATOS
ALUMNO
NOTA
NOTA MEDIA
SELECTIVIDAD
CARRERA
William
Smith
8
7
lt30/10/90, MECgt
lt30/7/95, Esc. Inf.gt
Gene
Hackman
9
6
lt30/10/90, MECgt
lt10/9/96, Esc. Inf.gt
. . .
. . .
116
CALIDAD DE BASES DE DATOS
CALIDAD DE DATOS
Caballero (2004)
  • Marco de Trabajo para la Mejora de la Gestión de
    la Calidad de los Datos y de la Información, con
    dos componentes
  • CALDEA. Modelo de referencia de gestión de
    calidad de datos e información basado en niveles
    de madurez.
  • EVAMECAL. Metodología de evaluación y mejora del
    PGI basada en CALDEA.

117
CALIDAD DE BASES DE DATOS
CALIDAD DE DATOS
118
CALIDAD DE BASES DE DATOS
CALIDAD DE DATOS
ACP

O

BJETIVO
(GEGCDI) Gestión de un Eq
uipo de


Organizar un equipo que se encargue de todas las
iniciativas
un Equipo de Aseguramiento de
de evaluación y mejora de los PGI.

Calidad de Datos y de Información.

(GP) Gestión de un Proyecto para el


Elaborar un proyecto que permita definir todo
s los aspectos de
PGI.

cada uno de los PGI que integran el Sistema de
Información.

(GR) Gestión de Requisitos de


Recoger y elaborar los documentos pertinentes a
los requisitos
Usuario.

de usuario para cada uno de los PGI y las
características de
calidad de dat
os que tienen que tener cada uno de sus
componentes.

(GCI) Gestión de la Calidad de


Definir y documentar los aspectos cuantitativos y
cualitativos
Datos en los componentes del PGI
de calidad de datos para cada uno de los
componentes de los
y en el producto de información.

PGI expresados en términos de dimensiones y
métricas de
calidad de datos.

(FS) Gestión de fuentes de datos y


Identificar y documentar las fuentes y sumideros
de datos y
de los destinos (sumideros) de los
product
os de información, así como los formatos en que
se
productos de información.

intercambiarán los datos con ellos.

(ADM) Gestión de proyecto para la


Asegurar que el lugar donde se va a almacenar los
datos
adquisición, el desarrollo o el
responde a los requisitos establecidos tanto a
nivel técnico del
mantenimiento de una base de
producto comercial elegido, como al esquema
diseñado para
datos o de un almacén de datos.

albergar los datos.



119
CALIDAD DE BASES DE DATOS
CALIDAD DE DATOS
120
CALIDAD DE BASES DE DATOS
CALIDAD DE DATOS
ACP

O

BJETIVO
(VV) Validación y Verificación de los


Elaborar un plan para la validación y
verificación de los
productos de datos.

productos de datos desarrollados en el PGI.

(GIR) Gestión del impacto de


Delimitar, acotar y documentar todos los posibles
impactos y
riesgos y de la pobre calidad de
riesgos derivados de tener una pobre calidad de
datos en los
datos.

componentes del PGI.

(GE) Gestión de la estandarización


Ir creando una cultura organizacional de calidad
de datos a
de la calidad de datos

través de las experiencias propias y/o ajenas.

(GPO) Gestión de políticas de


A partir del conocimiento de calidad de datos y
de las
calidad de datos organizacionales.

necesidades de la organización con respecto a los
productos de
datos establecer y
documentar políticas de calidad de datos
que incidan sobre los componentes del PGI.

121
CALIDAD DE BASES DE DATOS
CALIDAD DE DATOS
Catálogo de
Catálogo de
Definición del
Definición del
estándares de
políticas
PGI.
PGI.

calidad de datos y
or
ganizacionales.

de información.

GE.1.

GE2.

Elección de
Gestión de la Estandarización de la Calidad
de la Información
Elección de
Estándares de
Políticas

Calidad de Datos y

Organizacionales
de Información
Lista con las características
Lista con las características
observadas en cada uno de
observadas en cada uno de
los componentes del PGI o
los componentes del PGI o
del producto de información
del producto de información
que son modificadas por las
que son modificadas por los
políticas de calidad elegidas.

estándares elegidos.


Definición PGI con modelos
GE.3.
ERU
-
PGI, ERU-CDI
-
de datos y procesos

Revisión y
ERU
-
PI.

compleción de las
ERU

Definición revisada del PGI
con modelos de datos y de
procesos

122
CALIDAD DE BASES DE DATOS
CALIDAD DE DATOS
GE.1.Elección de estándares y dimensiones de
calidad de datos y de información


Catálogo de e
stándares de calidad de datos y de información.

Entrada



Definición del PGI.

Productos



Lista con las características observadas en cada
uno de los componentes
del PGI o del producto de información que son
modificadas por los
Salida

estándares elegidos.



Sesiones de Trabajo.

Técnicas y Herramie
ntas



Inspección de los estándares.



EGCDI.



Especialistas o Consultores en estándares de
calidad de datos.

Participantes



Todas aquellas personas que desempeñen un rol
relacionado con los
estándares de calidad de datos y de información e
elegidos



Momento de Realización
Cuando se tenga definido el PGI.

de Actividad




123
CALIDAD DE BASES DE DATOS
CALIDAD DE DATOS
124
CALIDAD DE BASES DE DATOS
CALIDAD DE DATOS
ACP

O

BJETIVO
(GPM) Gestión de Planes de


Elaborar
planes para la medición de los aspectos de
calidad de
Medición para componentes del
datos definidos en la actividad (GCD) Gestión de
la Calidad de
PGI

Datos en los componentes del PGI del nivel de
Definición, así
como los formatos de presentación de resultados.

(GAPM). Gestión de la


Establecer los mecanismos necesarios para
automatizar los
Auto
matización de Planes de
procesos de medición.

Medidas para Componentes del
PGI.

125
CALIDAD DE BASES DE DATOS
CALIDAD DE DATOS
126
CALIDAD DE BASES DE DATOS
CALIDAD DE DATOS
ACP

O

BJETIVO
(GPD) Análisis causal para la


A partir de los indicadores de calidad obtenidos
en la actividad
preven
ción e identificación de
(GPM) Gestión de Planes de Medición para
componentes del
defectos.

PGI se trata de identificar las causas de los
defectos.

(GIDO) Innovación y desarrollo


Esta actividad tiene como objetivo elaborar
propuestas de
organizacio
nal.

mejora para el PI o los componentes del PGI.

127
CALIDAD DE BASES DE DATOS
CALIDAD DE DATOS
  • EVAMECAL
  • Metodología de evaluación y mejora basada en el
    modelo de referencia CALDEA y orientada a la
    mejora continua de los PGI
  • Al estilo de SCAMPI, ISO/IEC 15504
  • Basada en Ballou y Tayi (1996) y adaptada al
    ciclo PDCA de Deming (1986)

128
CALIDAD DE BASES DE DATOS
CALIDAD DE DATOS

Situación Actual
del PGI

PGI

EMC
-
P.1. D
EMC
-
P.2. D
EFINICIÓN
EFINICIÓN
S
A

O
DE LA
ITUACIÓN
CTUAL
DE
BJETIVOS DE
M

EJORA
Informe con Objetivos
de Mejora

PM
-
PGI

EMC
-
D.2. E
EMC
-
D.1. A
JECUCIÓN
NÁLISIS DE
PM
-
PGI

DEL
CAUSAS Y DESARROLLO
DE
PM
-
PGI

Informe de realización

del Plan
EMC
-
C.1. C
-
OMPROBA
CIÓN DE LA EFICACIA

ACCIONES CORRECTORAS
Informe Listado de
Comprobaciones

Conocimiento

sobre PGI

ECM
-
A.1. O
ECM
-
A.2. E
-
BTENER
STANDARI
C

C
ONCLUSIONES
ZAR EL
ONOCIMIENTO
O

BTENIDO
129
CALIDAD DE INFORMACIÓN
ÍNDICE
  • - INTRODUCCIÓN
  • - APROXIMACIONES A LA CALIDAD
  • - MEDICIÓN DE MODELOS CONCEPTUALES
  • - MEDICIÓN DE MODELOS LÓGICOS
  • CALIDAD DE DATOS
  • ASPECTOS DE GESTIÓN

130
CALIDAD DE INFORMACIÓN
ASPECTOS DE GESTIÓN
CAUSAS DE LOS PROBLEMAS DE CALIDAD
Strong et al. (1997)
  • Múltiples fuentes de la misma información
    producen diferentes valores
  • La información se produce utilizando juicios
    subjetivos, produciéndose sesgos
  • Errores sistemáticos en la producción de la
    información produce pérdida de información
  • Grandes volúmenes de información almacenada hace
    difícil el acceso en tiempo razonable
  • Sistemas distribuidos heterogéneos producen
    definiciones, formatos y valores inconsistentes
  • La información no numérica es difícil de indexar
  • No se dispone todavía de análisis automático a
    lo largo de colecciones de datos
  • Al cambiar las tareas de los consumidores de
    información y el entorno organizacional, la
    información que es relevante y útil también
    cambia
  • La facilidad de acceso a la información puede
    entrar en conflicto con los requisitos de
    seguridad, privacidad y confidencialidad
  • La falta de suficientes recursos de computación
    limita el acceso

131
CALIDAD DE INFORMACIÓN
ASPECTOS DE GESTIÓN
POLÍTICA DE CALIDAD
Redman (1996)
  • Todos los empleados de la empresa tienen que
    asumir que los datos y la información así como
    los procesos de negocio que los crean, almacenan,
    procesan y utilizan son propiedad de la empresa y
    que su compartición dentro de la empresa, así
    como con terceros deberá estar sometida a
    consideraciones legales o de privacidad.
  • El director de informática (CIO) será el
    responsable de mantener un inventario actualizado
    de datos, de su disponiblidad, así como de
    informar sobre la calidad de los mismos.
  • Los suministradores y creadores de datos deben
    comprender quién usa los datos y con qué
    propósitos, implementar las medidas de calidad de
    datos para asegurar que se satisfacen los
    requisitos de los usuarios e implementar la
    gestión del proceso para los datos que crean.

132
CALIDAD DE INFORMACIÓN
ASPECTOS DE GESTIÓN
POLÍTICA DE CALIDAD
Redman (1996)
  • Los que almacenan y procesan datos deben
    proporcionar arquitecturas y bases de datos que
    minimicen la redundancia innecesaria,
    salvaguardar los datos de daños o accesos no
    autorizados y diseñar las nuevas tecnologías con
    el fin de promover la calidad de los datos.
  • Los usuarios deben trabajar con los
    suministradores de datos, proporcionar
    retroalimentación, asegurar que los datos se
    intepretan correctamente, asegurar que los datos
    se utilizan sólo para propósitos empresariales
    legítimos, proteger los derechos de los clientes,
    empleados, etc. sobre privacidad.

133
CALIDAD DE INFORMACIÓN
ASPECTOS DE GESTIÓN
TQdM (Total Quality data Management)
English (1999)
1) Identificar un grupo de información que tenga
un impacto significativo con el fin de aportar un
mayor valor añadido. 2) Establecer objetivos y
medidas de la calidad de la información, por
ejemplo asegurar la oportunidad de la
información, midiendo el tiempo que pasa desde
que se conoce un dato hasta que se encuentra
disponible para un determinado proceso. 3)
Identificar la cadena de valor y de costes de la
información, que consiste en una cadena de valor
de negocio extendida y centrada en un grupo de
datos. Esta cadena comprenderá todos los
ficheros, documentos y bases de datos, procesos
de negocio, programas y roles que tengan relación
con el grupo de datos. 4) Determinar los ficheros
o procesos a evaluar. 5) Identificar las fuentes
de validación de datos para evaluar la
precisión. 6) Extraer muestras de datos
aleatorias, aplicando las técnicas estadísticas
adecuadas 7) Medir la calidad de la información,
con el fin de determinar su nivel de fiabilidad y
descubrir los defectos. 8) Interpretar e informar
sobre la calidad de la información.
134
CALIDAD DE INFORMACIÓN
ASPECTOS DE GESTIÓN
Cuestiones para los directivos
Miller (1996)
  • Son todavía válidas las percepciones de nuestras
    necesidades de calidad de información que
    teníamos ayer?
  • Cómo se traducen las necesidades de calidad en
    requisitos tecnológicos?
  • Es nuestra estrategia tecnológica consistente
    con nuestras necesidades de calidad?
  • Están la colección, diseminación y
    procedimientos de verificación internos a la
    altura de los requisitos de calidad?

135
CALIDAD DE INFORMACIÓN
ASPECTOS DE GESTIÓN
136
CALIDAD DE INFORMACIÓN
ASPECTOS DE GESTIÓN
Write a Comment
User Comments (0)
About PowerShow.com