Title: Sin ttulo de diapositiva
1 CALIDAD DE INFORMACIÓN
PORTADA
CALIDAD DE INFORMACIÓN
2 CALIDAD DE INFORMACIÓN
ÍNDICE
- - INTRODUCCIÓN
- - APROXIMACIONES A LA CALIDAD
- - MEDICIÓN DE MODELOS CONCEPTUALES
- - MEDICIÓN DE MODELOS LÓGICOS
- CALIDAD DE DATOS
- ASPECTOS DE GESTIÓN
3 CALIDAD DE INFORMACIÓN
ÍNDICE
- - INTRODUCCIÓN
- - APROXIMACIONES A LA CALIDAD
- - MEDICIÓN DE MODELOS CONCEPTUALES
- - MEDICIÓN DE MODELOS LÓGICOS
- CALIDAD DE DATOS
- ASPECTOS DE GESTIÓN
4 CALIDAD DE INFORMACIÓN
INTRODUCCIÓN
PROBLEMAS DE POLUCIÓN DE DATOS
- Facilidad y bajo coste para registrar datos
- Redundancia no controlada
- Grandes cantidades de datos históricos caducados
la mitad del coste total de implementar un
almacén de datos (datawarehouse) puede deberse a
una pobre calidad de datos
Celko (1995)
la pobre calidad de datos ha sido una de las
causas de fracaso más importantes en los
proyectos de reingeniería
Gartner Group
5 CALIDAD DE INFORMACIÓN
INTRODUCCIÓN
Strong et al. (1997)
- Si los datos no tienen suficiente calidad,
entonces, se pueden convertir en fuentes de
problemas - Datos no usados
- Barreras en la accesibilidad de los datos
- Dificultades en la utilización de los datos y de
la información -
6 CALIDAD DE INFORMACIÓN
INTRODUCCIÓN
Las empresas deben gestionar la información como
un producto importante, capitalizar el
conocimiento como un activo principal y, de esta
manera, sobrevivir y prosperar en la economía
digital Huang et al. (1999)
Datos Información Conocimiento
7 CALIDAD DE INFORMACIÓN
INTRODUCCIÓN
CALIDAD DE LA INFORMACIÓN
CALIDAD DE LA PRESENTACIÓN
CALIDAD DE LA BD
CALIDAD DEL SGBD
CALIDAD MODELO DE DATOS
CALIDAD DE LOS DATOS
8 CALIDAD DE INFORMACIÓN
INTRODUCCIÓN
MUNDO REAL
Valores
Valores
objetos y asociaciones con
sus propiedades y reglas
sus propiedades y reglas
MODELADO CONCEPTUAL
MODELADO CONCEPTUAL
MODELO CONCEPTUAL
Esquema
Esquema
Estrutura
percibida
Estrutura
percibida
(no formalizada)
(no formalizada)
conceptual
conceptual
DISEÑO LOGICO
DISEÑO LOGICO
SGBD
SGBD
Esquema
Esquema
de base
de base
MODELO
MODELO
de datos
de datos
DE BD
DE BD
DISEÑO FISICO
DISEÑO FISICO
MODELO
MODELO
Esquema
Esquema
INTERNO
INTERNO
interno
interno
BASE DE
BASE DE
DATOS
DATOS
FISICA
FISICA
9 CALIDAD DE INFORMACIÓN
INTRODUCCIÓN
Calidad del proceso
Calidad del producto
BD
10 CALIDAD DE INFORMACIÓN
ÍNDICE
- - INTRODUCCIÓN
- - APROXIMACIONES A LA CALIDAD
- - MEDICIÓN DE MODELOS CONCEPTUALES
- - MEDICIÓN DE MODELOS LÓGICOS
- CALIDAD DE DATOS
- ASPECTOS DE GESTIÓN
11 CALIDAD DE INFORMACIÓN
APROXIMACIONES
12 CALIDAD DE INFORMACIÓN
APROXIMACIONES
ROMAN (1985)
Conveniencia Limpieza conceptual Eficiencia
computacional Facilidad de construcción Estructura
ción Precisión, falta de ambigüedad, compleción,
consistencia Analizabilidad . . .
13 CALIDAD DE INFORMACIÓN
APROXIMACIONES
BATINI, CERI y NAVATHE (1992)
Compleción Corrección Minimalidad Expresividad Leg
ibilidad Autoexplicación Extensibilidad
Normalidad
14 CALIDAD DE INFORMACIÓN
APROXIMACIONES
- Compleción un esquema es completo cuando
representa todas las características relevantes
del dominio de aplicación - respecto a los requisitos
- respecto al esquema
- Corrección un esquema es correcto cuando
utilizan de forma apropiada los conceptos del
modelo E/R. - sintáctica
- semántica
- Minimalidad un esquema es minimal cuando todo
aspecto de los requisitos aparece sólo una vez en
el esquema - Expresividad un esquema es expresivo cuando
representa los requisitos de una manera
natural,sin necesidad de explicaciones
adicionales.
15 CALIDAD DE INFORMACIÓN
APROXIMACIONES
Legibilidad Es una propiedad del diagrama que
representa al esquema. Un diagrama tiene buena
legibilidad cuando respeta ciertos criterios
estéticos que hacen al diagrama
elegante. Autoexplicación Un esquema es
autoexplicativo cuando un gran número de
propiedades puede representarse utilizando el
propio modelo conceptual, sin otros
formalismos. Extensibilidad Un esquema es
fácilmente adaptado a cambios en los requisitos
cuando se descompone en partes (módulos,
vistas). Normalidad pretende conservar los
datos en una forma limpia, purificada.
(Aplicación de la teoría de la normalización del
modelo relacional).
16 CALIDAD DE INFORMACIÓN
APROXIMACIONES
CARACTERÍSTICAS DE LAS LISTAS
Lindland et al. (1994)
- Muchas definiciones son vagas, complicadas e,
incluso, inexistentes - La lista no es
estructurada y las propiedades se solapan
parcialmente - Se mezclan propiedades de la
especificación con las propiedades del método y
del lenguaje - Presuponen la existencia de
diseño/implementación - Algunos objetivos son
poco realistas, o imposibles
17 CALIDAD DE INFORMACIÓN
APROXIMACIONES
Lindland et al. (1994, 1995)
Lindland et al. (1994, 1995)
MODELO
MODELO
CALIDAD SEMÁNTICA
CALIDAD SEMÁNTICA
CALIDAD SINTÁCTICA
CALIDAD SINTÁCTICA
DOMINIO
DOMINIO
LENGUAJE
LENGUAJE
CALIDAD PRAGMÁTICA
CALIDAD PRAGMÁTICA
CALIDAD SEMÁNTICA PERCIBIDA
CALIDAD SEMÁNTICA PERCIBIDA
CALIDAD SOCIAL
CALIDAD SOCIAL
18 CALIDAD DE INFORMACIÓN
APROXIMACIONES
OBJETIVOS
- Separar las propiedades directas de la
especificación de las del lenguaje y del método - Separar los objetivos de calidad de los medios
para alcanzarlos (viabilidad) - Disponer de un fundamento matemático
- Tener propiedades relacionadas directamente con
la especificación
19 CALIDAD DE INFORMACIÓN
APROXIMACIONES
ELEMENTOS
- Audiencia unión del conjunto de actores
individuales, el conjunto de actores sociales
organizacionales y el conjunto de actores
técnicos que necesitan relacionarse con el modelo - Modelo conjunto de todas las sentencias
expresadas explícita o implícitamente - Lenguaje conjunto de todas las sentencias que
se pueden expresar de acuerdo al vocabulario y la
gramática de los lenguajes de modelado utilizados - Dominio conjunto de todas las sentencias serían
correctas y relevantes acerca del problema - Interpretación de la audiencia conjunto de
todas las sentencias de las que la audiencia
piensa que consta el modelo - Conocimiento de los participantes unión de los
conjuntos de sentencias de todos los actores
sociales individuales
20 CALIDAD DE INFORMACIÓN
APROXIMACIONES
CALIDAD
Sintáctica corrección sintáctica Semántica
validez y compleción (viables) percibidas Pragmát
ica comprensión (viable) Social acuerdo
(viable), conforme a 2 dimensiones .
Conocimiento vs. acuerdo en la interpretación del
modelo . Acuerdo relativo vs. acuerdo
absoluto
21 CALIDAD DE INFORMACIÓN
APROXIMACIONES
22 CALIDAD DE INFORMACIÓN
APROXIMACIONES
Moody y Schanks (1994, 1998)
MÉTODO DE EVALUACIÓN
STAKEHOLDER
FACTOR DE CALIDAD
PESO
VALORACIÓN
ESTRATEGIA DE MEJORA
23 CALIDAD DE INFORMACIÓN
APROXIMACIONES
ELEMENTOS
- Factor de calidad propiedad deseable de un
modelo de datos - Stakeholder personas involucradas en la
construcción o utilización del modelo - Estrategias de mejora Técnicas para mejorar la
calidad de los modelos de datos - Método de evaluación modo sistemático de
evaluar factores de calidad - Peso define la importancia relativa de los
factores de calidad - Valores representan la valoración de un factor
de calidad por un stakeholder
24 CALIDAD DE INFORMACIÓN
APROXIMACIONES
FACTORES DE CALIDAD
Moody (1998)
usuario
usuario
usuario
usuario
integridad
flexibilidad
comprens.
compleción
MODELO DE CALIDAD
corrección
simplicidad
integración
implem.
analista
analista
admin. datos
desarrollador
25 CALIDAD DE INFORMACIÓN
APROXIMACIONES
- Compleción capacidad del modelo de tener toda
la información requerida para cumplir los
requisitos del usuario - Integridad grado en el que las reglas del
negocio que se aplican a los datos están
definidas en el modelo de datos - Flexibilidad facilidad con la que el modelo de
datos se puede adaptar a los cambios en los
requisitos - Comprensibilidad facilidad con la que el modelo
de datos puede ser entendido (perceptual y
operacional)
26 CALIDAD DE INFORMACIÓN
APROXIMACIONES
- Corrección se refiere a si el modelo cumple las
reglas de las técnicas de modelado utilizadas - Simplicidad significa que el modelo contiene
los mínimos constructores posibles - Integración nivel de consistencia del modelo de
datos con el resto de los datos de la
organización - Implementabilidad facilidad con la que el
modelo de datos puede ser implementado dentro de
las restricciones de tiempo, presupuesto y
tecnología del proyecto
27 CALIDAD DE INFORMACIÓN
APROXIMACIONES
INTERACCIONES ENTRE FACTORES
Moody y Schanks (1994)
28 CALIDAD DE INFORMACIÓN
APROXIMACIONES
MARCO INTEGRADO PARA LA CALIDAD
Shanks y Darke (1997)
- AMBOS MARCOS COMPARTEN CONCEPTOS AUDIENCIA
STAKEHOLDER OBJETIVO, PROPIEDAD FACTOR DE
CALIDAD ACTIVIDAD ESTRATEGIA -
CONSIDERACIONES TEÓRICAS Y PRÁCTICAS - VÁLIDO
PARA EL PRODUCTO Y EL PROCESO
29 CALIDAD DE INFORMACIÓN
APROXIMACIONES
Theory
MEANS
DOMAIN
Based
classifies
contains
represents
LANGUAGE
GOAL
PROPERTY
MODEL
maps to
interprets
AUDIENCE
ACTIVITY
maps to
OR
is assigned
is achieved by
used for
assigns
WEIGHTING
is assigned
valued by
Practice
RATING
Based
scores
30 CALIDAD DE INFORMACIÓN
APROXIMACIONES
ENFOQUE ONTOLÓGICO
Kesh (1995)
calidad
Funcionamiento
Ontología
Usabilidad
Usabilidad
Mantenibilidad
(usuario)
(diseñador)
Rendimiento
Precisión
Estructura
Contenido
compleción
adecuación al problema
cohesión
validez
validez
consistencia
concisión
31 CALIDAD DE INFORMACIÓN
APROXIMACIONES
32 CALIDAD DE INFORMACIÓN
APROXIMACIONES
GUÍAS DE MODELADO (GoM)
Schuette y Rotthowe (1998)
subjetividad
33 CALIDAD DE INFORMACIÓN
APROXIMACIONES
34 CALIDAD DE INFORMACIÓN
ÍNDICE
- - INTRODUCCIÓN
- - APROXIMACIONES A LA CALIDAD
- - MEDICIÓN DE MODELOS CONCEPTUALES
- - MEDICIÓN DE MODELOS LÓGICOS
- CALIDAD DE DATOS
- ASPECTOS DE GESTIÓN
35 CALIDAD DE INFORMACIÓN
MODELOS CONCEPTUALES
MUNDO REAL
Valores
Valores
objetos y asociaciones con
sus propiedades y reglas
sus propiedades y reglas
MODELADO CONCEPTUAL
MODELADO CONCEPTUAL
MODELO CONCEPTUAL
Esquema
Esquema
Estrutura
percibida
Estrutura
percibida
(no formalizada)
(no formalizada)
conceptual
conceptual
DISEÑO LOGICO
DISEÑO LOGICO
SGBD
SGBD
Esquema
Esquema
de base
de base
MODELO
MODELO
de datos
de datos
DE BD
DE BD
DISEÑO FISICO
DISEÑO FISICO
MODELO
MODELO
Esquema
Esquema
INTERNO
INTERNO
interno
interno
BASE DE
BASE DE
DATOS
DATOS
FISICA
FISICA
36 CALIDAD DE INFORMACIÓN
MODELOS CONCEPTUALES
- Definir sólo propiedades deseables no es
suficiente para evaluar la calidad, ... por lo
que es necesario contar con medidas que permitan
evaluar la calidad de los modelos conceptuales de
datos de forma cuantitativa y objetiva, ...
Moody et al. (1998) - - Medir datos puede ayudar a controlar y predecir
aspectos del modelo de datos durante el proceso
de desarrollo software (MacDonell et al., 1997)
37 CALIDAD DE INFORMACIÓN
MODELOS CONCEPTUALES
Moody (1998)
- Compleción
- Nº de elementos del modelo de datos que no
corresponden con requisitos de usuario - Nº de requisitos de usuario no representados en
el modelo de datos - Nº de elementos de datos que corresponden a
requisitos de usuario pero definidos de forma
inexacta - Nº de inconsistencias con el modelo de procesos
- Integridad
- Nº de reglas del negocio que no se hacen cumplir
por el modelo de datos - Nº de restricciones de integridad incluidas en el
modelo de datos que no corresponden a políticas
del negocio - Flexibilidad
- Nº de elementos en el modelo que están sujetos a
cambios en el futuro - Costes estimados de los cambios
- Importancia estratégica de los cambios
38 CALIDAD DE INFORMACIÓN
MODELOS CONCEPTUALES
Moody (1998)
- Comprensibilidad
- Valoración de los usuarios sobre la
comprensibilidad del modelo - Capacidad de los usuarios de interpretar el
modelo correctamente - Valoración de los desarrolladores de aplicaciones
sobre la comprensibilidad del modelo - Corrección
- Nº de violaciones de las convenciones de modelado
de datos - Nº de violaciones a las formas normales
- Nº de instancias de redundancia en el modelo
- Simplicidad
- Nº de entidades
- Nº de entidades e interrelaciones
- Suma ponderada de constructos (aNE bNR cNA)
39 CALIDAD DE INFORMACIÓN
MODELOS CONCEPTUALES
Moody (1998)
- Integración
- Nº de conflictos con el modelo de datos
corporativo - Nº de conflictos con los sistemas existentes
- Valoración de los representantes de todas las
áreas de negocio - Implementabilidad
- Valoración de riesgo técnico
- Valoración de riesgo de planificación
- Estimación del coste de desarrollo
- Nº de elementos físicos incluidos en el modelo de
datos
40 CALIDAD DE INFORMACIÓN
MODELOS CONCEPTUALES
Kesh (1995)
- Calcular la puntuación de los componentes
ontológicos individuales - Combinar las puntuaciones de los componentes
ontológicos relevantes a cada comportamiento - Combinar las puntuaciones de los componentes
para calcular la puntuación de la calidad
Q w1 . s1 w2 . s2 w3 . s3 w4 . s4 w5 .
s5
41 CALIDAD DE INFORMACIÓN
MODELOS CONCEPTUALES
s1 (o1 o3 o4 o5) / 4 s2 (o2 o3 o5
o6 o7) / 5 s3 (o2 o4 o6) / 3 s4 (o3
o5) / 2 s5 (o4 o5) / 2
42 CALIDAD DE INFORMACIÓN
MODELOS CONCEPTUALES
- o1 (adecuación de la estructura) valorada por
los usuarios en una escala de 5 puntos - o2 (solidez de la estructura) valorada por un
grupo de técnicos - o3 (consistencia de la estructura) o3 M D1
donde M Máximo de puntos posibles (5) y D1 está
basado en el ratio R (número de
inconsitencias/número de implicacions), dado por
4n1, donde n1 es el número de interrelaciones - o4 (concisión de la estructura) Si n es el
número de entidades, el mínimo de interrelaciones
será (n-1), en cuyo caso o4 5. La peor
situación posible es c2n, en cuyo caso o4 0.
En general o4 M ((c2n n1) / (c2n (n-1)). - o5 (compleción del contenido) se deduce de un
máximo M los datos que faltan según los informes
y consultas que se deben generar de la base de
datos. - o6 (cohesión del contenido) para cada entidad
se mide el tamaño de su clave primaria. Si es
simple se puntúa el máximo. Si utiliza todos los
atributos de la entidad se puntúa o6i 0, donde
i es el número de la entidad. En general o6i M
((ne np) / (ne 1)) donde ne es el número de
atributos de la entidad y np el número de
atributos que forman la clave primaria. La
cohesión total es o6 ?o6i / n - o7 (validez del contenido) se asigna M si todos
los atributos son válidos. En general o7 M (1
ni / ?ne) siendo ni los atributos incorrectos.
43 CALIDAD DE INFORMACIÓN
MODELOS CONCEPTUALES
Gray et al. (1991)
- Complejidad de una entidad i
- Complejidad de la arquitectura de datos
44 CALIDAD DE INFORMACIÓN
MODELOS CONCEPTUALES
Gray (1991)
45 CALIDAD DE INFORMACIÓN
MODELOS CONCEPTUALES
Eick (1991)
1
f
qu
qu
qu
qu
3
qu
3
5
4
3
2
1
- qu1, número de dependencias funcionales que se
dan en U no expresadas en Si - qu2, número de dependencias en existencia que se
dan en U no expresadas en Si - qu3, número de atributos y conexiones de subtipos
en Si. - qu4, número de clases en Si
- qu5, número de etiquetas en Si
46 CALIDAD DE INFORMACIÓN
MODELOS CONCEPTUALES
47 CALIDAD DE INFORMACIÓN
MODELOS CONCEPTUALES
ISO 9126
48 CALIDAD DE BASES DE DATOS
MODELOS CONCEPTUALES
49 CALIDAD DE INFORMACIÓN
MODELOS CONCEPTUALES
Henderson-Sellers (1994)
COMPLEXITY
Psychological
Computational
Representational
Cognitive Complexity
Problem Complexity
Product or Structural Complexity
50 CALIDAD DE INFORMACIÓN
MODELOS CONCEPTUALES
GOAL Analyse ER diagrams for the purpose
of Evaluating with respect to
their Maintainability from the point of view of
the Software designers in the context
of Software delevopment
organisations
51 CALIDAD DE INFORMACIÓN
MODELOS CONCEPTUALES
- Number of entities (NE)
- Number of attributes (NA)
- Number of derived attributes (NDA)
- Number of composite attributes (NCA)
- Number of multivalued attributes (NMVA)
- Number of relationships (NR)
- Number of MN relationships (NMNR)
- Number of 1N relationships (N1NR)
52 CALIDAD DE INFORMACIÓN
MODELOS CONCEPTUALES
- Number of N-Ary relationships (NN-AryR)
- Number of binary relationships (NBinaryR)
- Number of IS_A relationships (NIS_AR)
- Number of reflexive relationships (NRefR)
- Number of redundant relationships (NRR)
53 CALIDAD DE INFORMACIÓN
MODELOS CONCEPTUALES
VALIDACIÓN TEÓRICA
54 CALIDAD DE INFORMACIÓN
MODELOS CONCEPTUALES
VALIDACIÓN EMPÍRICA
55 CALIDAD DE INFORMACIÓN
MODELOS CONCEPTUALES
- Métricas para modelos conceptuales OO
- Chidamber and Kemerer (1991 1994)
- Li and Henry (1993)
- Brito e Abreu and Carapuça (1994)
- Lorenz and Kidd (1994)
- Briand et al.s (1997)
- Marchesi (1998)
- Harrison et al. (1998)
- Banisya et al. (1999)
56 CALIDAD DE INFORMACIÓN
MODELOS CONCEPTUALES
CK Metrics (Chidamber and Kemerer,19911994)
- Metrics
- DIT The Depth of Inheritance
- NOC The Number of Children
- Goal
- Measure design complexity in relation with their
impact on external quality attributes such as
maintainability, reusability, etc.
57 CALIDAD DE INFORMACIÓN
MODELOS CONCEPTUALES
- Theoretical Validation
- Chidamber and Kemerer (1994) corroborated that
both DIT and NOC accomplish Weyukers axioms for
complexity measures (Weyuker, 1988) - Briand et al. (1996) classified the DIT metric as
a length measure, and the NOC metric as a size
measure - Zuse (1998) has demonstrated that DIT and NOC are
both above the ordinal scale - Poels and Dedene (1999) have demonstrated by
means of the DISTANCE framework that they can be
characterised at ratio scale
58 CALIDAD DE INFORMACIÓN
MODELOS CONCEPTUALES
- Empirical Validation
- Basili et al. (1996) have have concluded that the
larger the DIT, the greater the probability of
fault detection. Also, they observed that the
larger the NOC, the lower the probability of
fault detection. - Cartwright and Shepperd (1996) found a positive
correlation between the DIT metric and the number
of user-reported problems, however, doubting the
use of inheritance. - Li and Henry (1993b) showed that Chidamber and
Kemerers metrics appeared to be adequate in
predicting the frequency of changes across
classes during the maintenance phase. - Daly et al. (1996) found that the time to perform
maintenance tasks was significantly lower in
systems with three levels of inheritance depth as
compared to systems with no use of inheritance.
59 CALIDAD DE INFORMACIÓN
MODELOS CONCEPTUALES
- Empirical Validation
- Chidamber et al. (1998) have carried out studies
on three commercial systems, in order to examine
the relationships between MOOSE metrics and
productivity, rework effort and design effort.
None of the three systems investigated showed
significant use of inheritance, so DIT and NOC
tended to have minimal values. - Chidamber et al. (1998) suggested that low values
of DIT and NOC indicate that the reuse
opportunities (via inheritance) were perhaps
compromised in favour of comprehensibility of the
overall architecture of the applications. - Tang (1998) have investigated the correlation
between these design metrics and the likelihood
of the occurrence of OO faults.
60 CALIDAD DE INFORMACIÓN
MODELOS CONCEPTUALES
- Empirical Validation
- After carrying about two case studies Briand et
al. (1998 2000b) have concluded that inheritance
measures (DIT, NOC, etc) appear not to be
consistent indicators of class-fault proneness,
but they suggested to the use of inheritance is
an important topic for further research. - Harrison et al. (2000) used the DIT metric in an
empirical study, demonstrating that systems
without inheritance are easier to understand and
to modify than systems with three or five levels
of inheritance. - Poels and Dedene (2001) use the DIT metric in an
empirical study, demonstrating that the extensive
use of inheritance leads to models that are more
difficult to modify. - Briand et al. (2001) have used the metrics NOC,
DIT (and also CBO metric, but we do not consider
it in this work) in an empirical study,
demonstrating that the use of design principles
leads to OO designs that are easier to maintain.
61 CALIDAD DE INFORMACIÓN
MODELOS CONCEPTUALES
- Tool
- The authors of these metrics have developed a
tool for the metric calculation Chidamber and
Kemerer (1994) for C code - Several commercial and public domain analysers
for Java CodeWork (2000), Metameta (2000),
Power-Software (2000), ControlCenter
(TogetherSoft, 2001) and for C Devanbu (2000),
ObjectSoft (2000) and Power-Software (2000a) - There is at least one tool that can be used to
collect the CK metrics directly from design
documents (Number-Six-Software, 2000)
62 CALIDAD DE INFORMACIÓN
MODELOS CONCEPTUALES
63 CALIDAD DE INFORMACIÓN
MODELOS CONCEPTUALES
GOAL Analyse UML Class diagrams for the
purpose of Evaluating with respect to
their Maintainability from the point of view of
the Software designers in the context
of Software delevopment
organisations
64 CALIDAD DE INFORMACIÓN
MODELOS CONCEPTUALES
- CLASS DIAGRAMS-SCOPE METRICS
- Number of associations (NAssoc)
- Number of aggregations (NAgg)
- Number of aggregation hierarchies (NAggH)
- Maximum height of aggregation (MaxHagg)
- Number of generalisations (NGen)
- Number of generalisation hierarchies (NGenH)
- Maximum depth of inheritance (MaxDIT)
- Number of dependencies (NDep)
65 CALIDAD DE INFORMACIÓN
MODELOS CONCEPTUALES
- CLASS-SCOPE METRICS
- Number of associations per class (NAssocC)
- Height of aggregation (HAgg)
- Number of direct parts (NDP)
- Number of parts (NP)
- Number of wholes (NW)
- Number of dependencies IN (NDepIN)
- Number of dependencies OUT (NDepOUT)
66 CALIDAD DE INFORMACIÓN
MODELOS CONCEPTUALES
VALIDACIÓN TEÓRICA
67 CALIDAD DE INFORMACIÓN
MODELOS CONCEPTUALES
VALIDACIÓN EMPÍRICA
68 CALIDAD DE INFORMACIÓN
MODELOS CONCEPTUALES
1. DEFINITION Analyse UML class diagrams
complexity metrics For the purpose of
Evaluating With respect to The
capability to be used as early quality
indicators From the point of view of OOIS
designers In the context of Undergraduate
students and professors of the Software
Engineering Area in the Department of
Computer Science in the UCLM
69 CALIDAD DE INFORMACIÓN
MODELOS CONCEPTUALES
- 2. PLANNING
- Context selection
- The experiment run off-line (not industrial
software development) - The subjects were 10 professors and 20 students
enrolled in the final-year of Computer Science at
the Department of Computer Science at the UCLM - Selection of subjects
- The subjects are chosen for convenience
70 CALIDAD DE INFORMACIÓN
MODELOS CONCEPTUALES
- Variables selection
- The independent variable is the UML class diagram
structural complexity - The dependent variable is the UML class diagram
maintainability - Instrumentation
- The objects were UML class diagrams
- The independent variable was measured through the
metrics - The dependent variable was measured by the time
spent doing the experiment, the maintenance
time
71 CALIDAD DE INFORMACIÓN
MODELOS CONCEPTUALES
- Hypotheses formulation
- Null hypothesis, H0 There is not a significant
correlation between the structural complexity
metrics we proposed and the maintenance time - Alternative hypothesis, H1 There is a
significant correlation between the structural
complexity metrics we proposed and the
maintenance time - Experiment design
- A within-subject design
72 CALIDAD DE INFORMACIÓN
MODELOS CONCEPTUALES
- 3. OPERATION
- Preparation
- The material consists of nine UML class diagrams
of different application domains - The diagrams have different complexity,
considering a broad range of metrics values - Each subject has to modify the class diagrams
according to the new requirements and to write
down the time spent in performing those
modifications (maintenance time)
73 CALIDAD DE INFORMACIÓN
MODELOS CONCEPTUALES
- Execution
- The subjects were given all the material.
- We explained to them how to carry out the
experiment - We allowed one week to do the experiment
- We collected all the empirical data
- Data Validation
- We checked if the tests were complete and if the
modifications were done correctly - We discarded the test of seven subjects, because
they included a required modification that was
done incorrectly
74 CALIDAD DE INFORMACIÓN
MODELOS CONCEPTUALES
- 4. ANALYSIS AND INTERPRETATION
- Our goal is to ascertain if any correlation
exists between each of the proposed metrics and
the maintenance time - For analysing the empirical data we used three
techniques - Statistical techniques
- Fuzzy classification and regression trees
(Linares et al., 1996) - Fuzzy prototypical knowledge discovery (Olivas,
2000)
75 CALIDAD DE INFORMACIÓN
MODELOS CONCEPTUALES
- 5. VALIDITY EVALUATION
- Threats to conclusion validity
- The only issue that could affect the statistical
validity of this study are the size of the sample
data (243 values, 9 diagrams and 27 subjects) - Threats to construct validity
- The dependent variable we used is the maintenance
time, so we consider this variable constructively
valid - The construct validity of the measures used for
the independent variables is guaranteed by Poels
and Dedenes framework (Poels and Dedene, 1999
2000a) used to validate them
76 CALIDAD DE INFORMACIÓN
MODELOS CONCEPTUALES
- Threats to internal validity
- Differences among subjects
- Knowledge of the universe of discourse
- Precision in time values
- Learning effects
- Fatigue effects
- Persistence effects
- Subject motivation
- Other factors
- Threats to external validity
- Materials and tasks used
- Subjects
77 CALIDAD DE INFORMACIÓN
MODELOS CONCEPTUALES
- EXPERIMENT CONCLUSIONS
- NC, NA, NM, NAssoc, NAgg, NDep, NGen, NAggH,
NGenH, MaxHAgg, MaxDIT are to some extent
correlated with maintenance time
78 CALIDAD DE INFORMACIÓN
ÍNDICE
- - INTRODUCCIÓN
- - APROXIMACIONES A LA CALIDAD
- - MEDICIÓN DE MODELOS CONCEPTUALES
- - MEDICIÓN DE MODELOS LÓGICOS
- CALIDAD DE DATOS
- ASPECTOS DE GESTIÓN
79 CALIDAD DE INFORMACIÓN
MODELOS LÓGICOS
- Prácticamente no existen métricas para bases de
datos - Sneed y Foshag (1998) metrics for
databases have been neglected in the metric
community - Medir datos puede ayudar a controlar
y predecir aspectos del modelo de datos durante
el proceso de desarrollo software (MacDonell et
al., 1997) - Un enfoque más riguroso para
asegurar la calidad de las bases de datos
80 CALIDAD DE INFORMACIÓN
MODELOS LÓGICOS
MUNDO REAL
Valores
Valores
objetos y asociaciones con
sus propiedades y reglas
sus propiedades y reglas
MODELADO CONCEPTUAL
MODELADO CONCEPTUAL
MODELO CONCEPTUAL
Esquema
Esquema
Estrutura
percibida
Estrutura
percibida
(no formalizada)
(no formalizada)
conceptual
conceptual
DISEÑO LOGICO
DISEÑO LOGICO
SGBD
SGBD
Esquema
Esquema
de base
de base
MODELO
MODELO
de datos
de datos
DE BD
DE BD
DISEÑO FISICO
DISEÑO FISICO
MODELO
MODELO
Esquema
Esquema
INTERNO
INTERNO
interno
interno
BASE DE
BASE DE
DATOS
DATOS
FISICA
FISICA
81 CALIDAD DE INFORMACIÓN
MODELOS LÓGICOS
- Bases de datos relacionales
- Las más implantadas en la actualidad
- (Leavit, 2000)
- Bases de datos activas
- Muchos productos comerciales incluyen actividad
(Ceri y Widom, 1996 Paton y Díaz, 2000) - Bases de datos objeto-relacionales
- En el año 2003 sustituirán a las relacionales
- (Leavit, 2000)
82 CALIDAD DE INFORMACIÓN
MODELOS LÓGICOS
- Métricas propuestas para programas tradicionales
- Líneas de código
- Número de sentencias de programación
- SIZE1. Definida como el número de .
Li y Henry (1993) - Métricas de la Ciencia del Software (Software
Science). Halstead (1977) - Puntos Función. Albrecht y Gaffney (1983)
- Complejidad ciclomática. McCabe (1976)
- Fan-in y fan-out. Henry y Kafura (1981)
83 CALIDAD DE INFORMACIÓN
MODELOS LÓGICOS
- Métricas para modelos lógicos
- Bases de datos relacionales
- Ratio de normalidad (Gray et al., 1991)
- Bases de datos activas
- Bases de datos objeto-relacionales
- Adaptación de métricas para sistemas OO
84 CALIDAD DE INFORMACIÓN
MODELOS LÓGICOS
DEFINICIÓN DE MÉTRICAS Bases de Datos Relacionales
OBJETIVO (Goal) Propósito Asegurar la
Asunto mantenibilidad Objeto de las
bases de datos relacionales Punto de vista
desde el punto de vista del diseñador de la
base de datos
85 CALIDAD DE INFORMACIÓN
MODELOS LÓGICOS
PREGUNTAS (Question) 1. Cómo influye la
complejidad de las tablas en la mantenibilidad de
las bases de datos relacionales? 2. Cómo influye
la complejidad entre tablas en la mantenibilidad
de las bases de datos relacionales?
86 CALIDAD DE INFORMACIÓN
MODELOS LÓGICOS
87 CALIDAD DE INFORMACIÓN
MODELOS LÓGICOS
88 CALIDAD DE INFORMACIÓN
MODELOS LÓGICOS
DEFINICIÓN DE MÉTRICAS Bases de Datos Activas
89 CALIDAD DE INFORMACIÓN
MODELOS LÓGICOS
DEFINICIÓN DE MÉTRICAS Bases de Datos
Objeto-Relacionales
90 CALIDAD DE INFORMACIÓN
MODELOS LÓGICOS
VALIDACIÓN EMPÍRICA
EXPERTOS
TP,
D
ACTIVAS
INTRA
ALUMNOS
NS, NO
ALUMNOS
NS, NO
OBJETO
-
EXPERTOS
PCC, TS,
EXPERTOS
PCC, TS,
DRT, RFK,
DRT, RFK,
RELACIONAL
NIC, NSC
NIC, NSC
91 CALIDAD DE INFORMACIÓN
MODELOS LÓGICOS
VALIDACIÓN EMPÍRICA Experimento Relacional
- Hipótesis
- Hipótesis nula Diferentes valores de las
métricas no afectan a la entendibilidad del
esquema de la base de datos. - Hipótesis alternativa 1 El valor de DRT afecta a
la entendibilidad del esquema de la base de
datos. - Hipótesis alternativa 2 El valor de NFK afecta a
la entendibilidad del esquema de la base de
datos. - Hipótesis alternativa 3 La combinación de
valores de DRT y NFK afecta a la entendibilidad
del esquema de la base de datos.
92 CALIDAD DE INFORMACIÓN
MODELOS LÓGICOS
- Sujetos
- Alumnos de la E.S. Informática de la Universidad
de Castilla-La Mancha que cursaban una asignatura
anual de bases de datos. Fue realizado por 60
alumnos, sólo 59 fueron finalmente aceptados. - Materiales del experimento
- La documentación entregada a cada sujeto
constaba de - los esquemas de las bases de datos
- las tablas con su contenido
- la hoja de preguntas y respuestas
93 CALIDAD DE INFORMACIÓN
MODELOS LÓGICOS
- Se realizaron 4 tests diferentes con distintos
valores para las métricas - Material esquema de la BD, tablas, hoja de
preguntas y respuestas - Ejercicios inserción, eliminación y modificación
de la BD
94 CALIDAD DE INFORMACIÓN
MODELOS LÓGICOS
Diseño
95 CALIDAD DE INFORMACIÓN
MODELOS LÓGICOS
- Variables Independientes
- Las variables independientes son DRT y NFK.
- Cada una de estas variables tiene dos niveles que
son dos y cinco para DRT y cinco y ocho para NFK. - Variables Dependientes
- Se calcula como el número de respuestas
correctamente respondidas por cada sujeto en cada
test. - Dimos a los sujetos diez minutos por test
evaluando después el número de respuestas
correctas obtenidas en ese intervalo de tiempo. - El estudio se centró en el número de respuestas
correctas obtenidas para cada test. - Únicamente se descartó un test por estar en
blanco.
96 CALIDAD DE INFORMACIÓN
MODELOS LÓGICOS
- Variables controladas
- Intentamos minimizar la variabilidad entre
sujetos escogiéndolos a todos del mismo curso y
con los mismos conocimientos sobre bases de datos
- Los efectos de variables irrelevantes fueron
minimizados haciendo los mismos tests a todos los
participantes durante el mismo tiempo - El orden de ejecución de los cuatro tests varió
de unos sujetos a otros para contrarrestrar los
efectos producidos por el aprendizaje. - Igualmente se hizo que cada uno de los cuatro
test trabajara con el mismo número de tablas
aunque se modificara el valor de las métricas.
97 CALIDAD DE INFORMACIÓN
MODELOS LÓGICOS
- Procedimiento
- Los tests se realizaron consecutivamente en el
transcurso de una hora de clase. - Antes de comenzar, fue explicado a los sujetos
tipo de ejercicios que debían realizar, material
que se les iba a entregar, tipo de respuestas que
debían dar y tiempo que tenían para realizar cada
test del experimento. - A cada sujeto se le entregó la documentación
completa para los cuatro tests - Al finalizar el tiempo asignado a cada test, se
informó a los sujetos que, inmediatamente,
dejaban de trabajar en el test que estuvieran y
pasaban al siguiente.
98 CALIDAD DE INFORMACIÓN
MODELOS LÓGICOS
Resultados
F1,2322.73
99 CALIDAD DE INFORMACIÓN
MODELOS LÓGICOS
VALIDACIÓN EMPÍRICA Réplica Relacional
Sujetos Profesionales de una empresa española
con una experiencia media de tres años en el
campo de las bases de datos. Once personas
desarrollaron el experimento siendo todos ellos
válidos.
100 CALIDAD DE INFORMACIÓN
MODELOS LÓGICOS
- Variables Dependientes
- Considerando la amplia experiencia en bases de
datos relacionales de los sujetos que iban a
desarrollar el experimento, se decidió calcularla
en función del tiempo necesario para realizar
cada uno de los cuatro tests. - De esta forma, los tests fueron tomados como
válidos siempre y cuando estuvieran completados. - El estudio, por lo tanto, se centró en los
tiempos obtenidos para cada test.
101 CALIDAD DE INFORMACIÓN
MODELOS LÓGICOS
- Procedimiento
- Los tests se realizaron consecutivamente en el
transcurso de una hora. - Antes de comenzar, fue explicado a los sujetos,
el tipo de ejercicios a realizar, el material que
se les iba a entregar, y el tipo de respuestas a
dar y cómo debían anotar el tiempo que invertían
en resolver cada uno de los cuatro tests. - Antes de comenzar a estudiar cada caso, los
sujetos debían anotar la hora de comienzo al
finalizar los ejercicios correspondientes a un
test, los sujetos tenían que anotar la hora de
finalización. - De esta forma, cuando un sujeto terminaba un
test, podía pasar al siguiente sin necesidad de
esperar al resto de compañeros.
102 CALIDAD DE INFORMACIÓN
MODELOS LÓGICOS
Resultados
F1,402.84
103 CALIDAD DE INFORMACIÓN
MODELOS LÓGICOS
De ambos experimentos se deduce que la métrica
NFK parece ser un indicador sólido de la
entendibilidad del esquema mientras que resulta
más complicado obtener una conclusión para la
métrica DRT
104 CALIDAD DE INFORMACIÓN
MODELOS LÓGICOS
- Validez de constructo
- Decidió medirse la entendibilidad de forma
distinta la primera vez que para la réplica (nro
de respuestas correctas dadas vs tiempo para
determinar el estado final de la base de
datos-tiempo de análisis de la base de datos
junto al tiempo de ejecución) debido a la
experiencia de los sujetos de la réplica. - Sería conveniente hacer más experimentos,
variando las operaciones a realizar en la base de
datos.
105 CALIDAD DE INFORMACIÓN
MODELOS LÓGICOS
- Validez interna
- Diferencias entre los esquemas. Seis tablas con
más o menos claves ajenas. - Dominio de los esquemas diferente. Esto pudo
influir en los resultados obtenidos. - Precisión de los valores del tiempo. En la
réplica del experimento, era responsabilidad de
los sujetos anotar los tiempos de comienzo y fin
de cada test. Este procedimiento puede producir
que algún sujeto introduzca alguna imprecisión. - Efectos de aprendizaje. Los tests de cada
experimento fueron colocados en distinto orden.
106 CALIDAD DE INFORMACIÓN
MODELOS LÓGICOS
- Validez interna
- Efectos de fatiga. Tiempo medio de una hora por
lo que estos efectos son, prácticamente,
inexistentes. Además, la diferencia en el orden
ayuda a evitar este efecto. - Efectos de persistencia. El segundo experimento
se llevó a cabo con un nuevo conjunto de sujetos.
- Motivación de los sujetos. Alta en el caso de los
alumnos ya que se realizaron ejercicios similares
en el examen. En el caso de los profesionales, la
motivación podía ser menor. - Otros factores. El plagio y la influencia entre
los sujetos fueron controlados.
107 CALIDAD DE INFORMACIÓN
MODELOS LÓGICOS
- Validez externa
- Materiales y tareas utilizados. Intentamos
utilizar esquemas y operaciones representativos
de casos reales aunque sería interesante realizar
más experimentos con bases de datos relacionales
de mayor tamaño y complejidad. - Sujetos. Debido a la dificultad de conseguir
profesionales, el experimento se realizó la
primera vez con estudiantes. En este caso, las
tareas a realizar no requerían de gran
experiencia por lo que los resultados obtenidos
con los estudiantes pueden ser considerados
correctos (Basili et al., 1999).
108 CALIDAD DE INFORMACIÓN
MODELOS LÓGICOS
- Validez externa
- En general, serían necesarios nuevos experimentos
con un mayor número de sujetos, tanto con
estudiantes como con profesionales y con una
mayor diferencia entre los valores que toman las
métricas para poder concluir si la integridad
referencial afecta o no a la entendibilidad de
las bases de datos relacionales y, por tanto, su
mantenibilidad. - Intentamos aumentar la validez externa de las
métricas realizando el segundo experimento con
los profesionales, con lo que los resultados
obtenidos se han podido generalizar
considerablemente.
109 CALIDAD DE INFORMACIÓN
CALIDAD DE DATOS
- - INTRODUCCIÓN
- - APROXIMACIONES A LA CALIDAD
- - MEDICIÓN DE MODELOS CONCEPTUALES
- - MEDICIÓN DE MODELOS LÓGICOS
- CALIDAD DE DATOS
- ASPECTOS DE GESTIÓN
110 CALIDAD DE BASES DE DATOS
CALIDAD DE DATOS
Wang et al. (1993) y (1995)
111 CALIDAD DE BASES DE DATOS
CALIDAD DE DATOS
ALUMNO
CURSO
Mat.
núm.
núm.
fecha
nombre
nombre
nota
direc
precio
tel.
descr.
112 CALIDAD DE BASES DE DATOS
CALIDAD DE DATOS
113 CALIDAD DE BASES DE DATOS
CALIDAD DE DATOS
VISTA DE PARÁMETROS
DETERMINAR INDICADORES
VISTA DE CALIDAD
INTEGRAR VISTAS DE CALIDAD
ESQUEMA DE CALIDAD
114 CALIDAD DE BASES DE DATOS
CALIDAD DE DATOS
115 CALIDAD DE BASES DE DATOS
CALIDAD DE DATOS
ALUMNO
NOTA
NOTA MEDIA
SELECTIVIDAD
CARRERA
William
Smith
8
7
lt30/10/90, MECgt
lt30/7/95, Esc. Inf.gt
Gene
Hackman
9
6
lt30/10/90, MECgt
lt10/9/96, Esc. Inf.gt
. . .
. . .
116 CALIDAD DE BASES DE DATOS
CALIDAD DE DATOS
Caballero (2004)
- Marco de Trabajo para la Mejora de la Gestión de
la Calidad de los Datos y de la Información, con
dos componentes - CALDEA. Modelo de referencia de gestión de
calidad de datos e información basado en niveles
de madurez. - EVAMECAL. Metodología de evaluación y mejora del
PGI basada en CALDEA.
117 CALIDAD DE BASES DE DATOS
CALIDAD DE DATOS
118 CALIDAD DE BASES DE DATOS
CALIDAD DE DATOS
ACP
O
BJETIVO
(GEGCDI) Gestión de un Eq
uipo de
Organizar un equipo que se encargue de todas las
iniciativas
un Equipo de Aseguramiento de
de evaluación y mejora de los PGI.
Calidad de Datos y de Información.
(GP) Gestión de un Proyecto para el
Elaborar un proyecto que permita definir todo
s los aspectos de
PGI.
cada uno de los PGI que integran el Sistema de
Información.
(GR) Gestión de Requisitos de
Recoger y elaborar los documentos pertinentes a
los requisitos
Usuario.
de usuario para cada uno de los PGI y las
características de
calidad de dat
os que tienen que tener cada uno de sus
componentes.
(GCI) Gestión de la Calidad de
Definir y documentar los aspectos cuantitativos y
cualitativos
Datos en los componentes del PGI
de calidad de datos para cada uno de los
componentes de los
y en el producto de información.
PGI expresados en términos de dimensiones y
métricas de
calidad de datos.
(FS) Gestión de fuentes de datos y
Identificar y documentar las fuentes y sumideros
de datos y
de los destinos (sumideros) de los
product
os de información, así como los formatos en que
se
productos de información.
intercambiarán los datos con ellos.
(ADM) Gestión de proyecto para la
Asegurar que el lugar donde se va a almacenar los
datos
adquisición, el desarrollo o el
responde a los requisitos establecidos tanto a
nivel técnico del
mantenimiento de una base de
producto comercial elegido, como al esquema
diseñado para
datos o de un almacén de datos.
albergar los datos.
119 CALIDAD DE BASES DE DATOS
CALIDAD DE DATOS
120 CALIDAD DE BASES DE DATOS
CALIDAD DE DATOS
ACP
O
BJETIVO
(VV) Validación y Verificación de los
Elaborar un plan para la validación y
verificación de los
productos de datos.
productos de datos desarrollados en el PGI.
(GIR) Gestión del impacto de
Delimitar, acotar y documentar todos los posibles
impactos y
riesgos y de la pobre calidad de
riesgos derivados de tener una pobre calidad de
datos en los
datos.
componentes del PGI.
(GE) Gestión de la estandarización
Ir creando una cultura organizacional de calidad
de datos a
de la calidad de datos
través de las experiencias propias y/o ajenas.
(GPO) Gestión de políticas de
A partir del conocimiento de calidad de datos y
de las
calidad de datos organizacionales.
necesidades de la organización con respecto a los
productos de
datos establecer y
documentar políticas de calidad de datos
que incidan sobre los componentes del PGI.
121 CALIDAD DE BASES DE DATOS
CALIDAD DE DATOS
Catálogo de
Catálogo de
Definición del
Definición del
estándares de
políticas
PGI.
PGI.
calidad de datos y
or
ganizacionales.
de información.
GE.1.
GE2.
Elección de
Gestión de la Estandarización de la Calidad
de la Información
Elección de
Estándares de
Políticas
Calidad de Datos y
Organizacionales
de Información
Lista con las características
Lista con las características
observadas en cada uno de
observadas en cada uno de
los componentes del PGI o
los componentes del PGI o
del producto de información
del producto de información
que son modificadas por las
que son modificadas por los
políticas de calidad elegidas.
estándares elegidos.
Definición PGI con modelos
GE.3.
ERU
-
PGI, ERU-CDI
-
de datos y procesos
Revisión y
ERU
-
PI.
compleción de las
ERU
Definición revisada del PGI
con modelos de datos y de
procesos
122 CALIDAD DE BASES DE DATOS
CALIDAD DE DATOS
GE.1.Elección de estándares y dimensiones de
calidad de datos y de información
Catálogo de e
stándares de calidad de datos y de información.
Entrada
Definición del PGI.
Productos
Lista con las características observadas en cada
uno de los componentes
del PGI o del producto de información que son
modificadas por los
Salida
estándares elegidos.
Sesiones de Trabajo.
Técnicas y Herramie
ntas
Inspección de los estándares.
EGCDI.
Especialistas o Consultores en estándares de
calidad de datos.
Participantes
Todas aquellas personas que desempeñen un rol
relacionado con los
estándares de calidad de datos y de información e
elegidos
Momento de Realización
Cuando se tenga definido el PGI.
de Actividad
123 CALIDAD DE BASES DE DATOS
CALIDAD DE DATOS
124 CALIDAD DE BASES DE DATOS
CALIDAD DE DATOS
ACP
O
BJETIVO
(GPM) Gestión de Planes de
Elaborar
planes para la medición de los aspectos de
calidad de
Medición para componentes del
datos definidos en la actividad (GCD) Gestión de
la Calidad de
PGI
Datos en los componentes del PGI del nivel de
Definición, así
como los formatos de presentación de resultados.
(GAPM). Gestión de la
Establecer los mecanismos necesarios para
automatizar los
Auto
matización de Planes de
procesos de medición.
Medidas para Componentes del
PGI.
125 CALIDAD DE BASES DE DATOS
CALIDAD DE DATOS
126 CALIDAD DE BASES DE DATOS
CALIDAD DE DATOS
ACP
O
BJETIVO
(GPD) Análisis causal para la
A partir de los indicadores de calidad obtenidos
en la actividad
preven
ción e identificación de
(GPM) Gestión de Planes de Medición para
componentes del
defectos.
PGI se trata de identificar las causas de los
defectos.
(GIDO) Innovación y desarrollo
Esta actividad tiene como objetivo elaborar
propuestas de
organizacio
nal.
mejora para el PI o los componentes del PGI.
127 CALIDAD DE BASES DE DATOS
CALIDAD DE DATOS
- EVAMECAL
- Metodología de evaluación y mejora basada en el
modelo de referencia CALDEA y orientada a la
mejora continua de los PGI - Al estilo de SCAMPI, ISO/IEC 15504
- Basada en Ballou y Tayi (1996) y adaptada al
ciclo PDCA de Deming (1986)
128 CALIDAD DE BASES DE DATOS
CALIDAD DE DATOS
Situación Actual
del PGI
PGI
EMC
-
P.1. D
EMC
-
P.2. D
EFINICIÓN
EFINICIÓN
S
A
O
DE LA
ITUACIÓN
CTUAL
DE
BJETIVOS DE
M
EJORA
Informe con Objetivos
de Mejora
PM
-
PGI
EMC
-
D.2. E
EMC
-
D.1. A
JECUCIÓN
NÁLISIS DE
PM
-
PGI
DEL
CAUSAS Y DESARROLLO
DE
PM
-
PGI
Informe de realización
del Plan
EMC
-
C.1. C
-
OMPROBA
CIÓN DE LA EFICACIA
ACCIONES CORRECTORAS
Informe Listado de
Comprobaciones
Conocimiento
sobre PGI
ECM
-
A.1. O
ECM
-
A.2. E
-
BTENER
STANDARI
C
C
ONCLUSIONES
ZAR EL
ONOCIMIENTO
O
BTENIDO
129 CALIDAD DE INFORMACIÓN
ÍNDICE
- - INTRODUCCIÓN
- - APROXIMACIONES A LA CALIDAD
- - MEDICIÓN DE MODELOS CONCEPTUALES
- - MEDICIÓN DE MODELOS LÓGICOS
- CALIDAD DE DATOS
- ASPECTOS DE GESTIÓN
130 CALIDAD DE INFORMACIÓN
ASPECTOS DE GESTIÓN
CAUSAS DE LOS PROBLEMAS DE CALIDAD
Strong et al. (1997)
- Múltiples fuentes de la misma información
producen diferentes valores - La información se produce utilizando juicios
subjetivos, produciéndose sesgos - Errores sistemáticos en la producción de la
información produce pérdida de información - Grandes volúmenes de información almacenada hace
difícil el acceso en tiempo razonable - Sistemas distribuidos heterogéneos producen
definiciones, formatos y valores inconsistentes - La información no numérica es difícil de indexar
- No se dispone todavía de análisis automático a
lo largo de colecciones de datos - Al cambiar las tareas de los consumidores de
información y el entorno organizacional, la
información que es relevante y útil también
cambia - La facilidad de acceso a la información puede
entrar en conflicto con los requisitos de
seguridad, privacidad y confidencialidad - La falta de suficientes recursos de computación
limita el acceso
131 CALIDAD DE INFORMACIÓN
ASPECTOS DE GESTIÓN
POLÍTICA DE CALIDAD
Redman (1996)
- Todos los empleados de la empresa tienen que
asumir que los datos y la información así como
los procesos de negocio que los crean, almacenan,
procesan y utilizan son propiedad de la empresa y
que su compartición dentro de la empresa, así
como con terceros deberá estar sometida a
consideraciones legales o de privacidad. - El director de informática (CIO) será el
responsable de mantener un inventario actualizado
de datos, de su disponiblidad, así como de
informar sobre la calidad de los mismos. - Los suministradores y creadores de datos deben
comprender quién usa los datos y con qué
propósitos, implementar las medidas de calidad de
datos para asegurar que se satisfacen los
requisitos de los usuarios e implementar la
gestión del proceso para los datos que crean.
132 CALIDAD DE INFORMACIÓN
ASPECTOS DE GESTIÓN
POLÍTICA DE CALIDAD
Redman (1996)
- Los que almacenan y procesan datos deben
proporcionar arquitecturas y bases de datos que
minimicen la redundancia innecesaria,
salvaguardar los datos de daños o accesos no
autorizados y diseñar las nuevas tecnologías con
el fin de promover la calidad de los datos. - Los usuarios deben trabajar con los
suministradores de datos, proporcionar
retroalimentación, asegurar que los datos se
intepretan correctamente, asegurar que los datos
se utilizan sólo para propósitos empresariales
legítimos, proteger los derechos de los clientes,
empleados, etc. sobre privacidad.
133 CALIDAD DE INFORMACIÓN
ASPECTOS DE GESTIÓN
TQdM (Total Quality data Management)
English (1999)
1) Identificar un grupo de información que tenga
un impacto significativo con el fin de aportar un
mayor valor añadido. 2) Establecer objetivos y
medidas de la calidad de la información, por
ejemplo asegurar la oportunidad de la
información, midiendo el tiempo que pasa desde
que se conoce un dato hasta que se encuentra
disponible para un determinado proceso. 3)
Identificar la cadena de valor y de costes de la
información, que consiste en una cadena de valor
de negocio extendida y centrada en un grupo de
datos. Esta cadena comprenderá todos los
ficheros, documentos y bases de datos, procesos
de negocio, programas y roles que tengan relación
con el grupo de datos. 4) Determinar los ficheros
o procesos a evaluar. 5) Identificar las fuentes
de validación de datos para evaluar la
precisión. 6) Extraer muestras de datos
aleatorias, aplicando las técnicas estadísticas
adecuadas 7) Medir la calidad de la información,
con el fin de determinar su nivel de fiabilidad y
descubrir los defectos. 8) Interpretar e informar
sobre la calidad de la información.
134 CALIDAD DE INFORMACIÓN
ASPECTOS DE GESTIÓN
Cuestiones para los directivos
Miller (1996)
- Son todavía válidas las percepciones de nuestras
necesidades de calidad de información que
teníamos ayer? - Cómo se traducen las necesidades de calidad en
requisitos tecnológicos? - Es nuestra estrategia tecnológica consistente
con nuestras necesidades de calidad? - Están la colección, diseminación y
procedimientos de verificación internos a la
altura de los requisitos de calidad?
135 CALIDAD DE INFORMACIÓN
ASPECTOS DE GESTIÓN
136 CALIDAD DE INFORMACIÓN
ASPECTOS DE GESTIÓN