Title: Het organiseren van data en informatie
1Het organiseren van data en informatie
- Hoofdstuk 3
- Fundamentals of information systems
- Ralph Stair George Reynolds
Hoorcollege ICT in Organisatie, Beleid en
Management (IOBM) Marco Spruit
http//www.cs.uu.nl/staff/spruit.html
2Principes en Leerdoelen 1/3
- Data Databases Data mining Business
intelligence - Data management en data modellering zijn centrale
aspecten in het organiseren van data en
informatie - Definieer algemene data management concepten en
termen, en licht de voordelen van de
databasebenadering in data management uit - Beschrijf het relationele database model en
schets de basiskenmerken hiervan
3Principes en Leerdoelen 2/3
- Een goed ontworpen en goed beheerde database is
een extreem waardevol hulpmiddel in het
ondersteunen van de besluitvorming - Stel de standaard functies vast die door alle
database management systems uitgevoerd worden - Bepaal de populaire database management systems
voor eindgebruikers
4Principes en Leerdoelen 3/3
- Het aantal en soorten van database toepassingen
zal zich verder blijven ontwikkelen en zal
concrete zakelijke voordelen blijven opleveren - Benoem en bespreek huidige database toepassingen
5Waarom leren over Database Systemen?
- Databasesystemen (Ned gegevensbanken)
verwerken en organiseren (grote) hoeveelheden
gegevens - Informatiekunde waar/hoe is de informatie?
- Databasegebruik in allerlei functies
- Marketing manager klantgegevens
- Bedrijfsjurist eerdere vonnissen, precedenten
6Flashback 1/2 Data versus Informatie
- Data ruwe feiten
- Alfanumeriek, beeld, geluid, video
- Voorbeeld spruit 1
- Informatie verzameling van feiten die dusdanig
zijn georganiseerd dat er toegevoegde waarde
aanwezig is boven de ruwe feiten - Voor mensen begrijpelijk en bruikbaar!
7Flashback 2/2 Informatiesystemen
Componenten van een computer-gebaseerd
informatiesysteem
- Geconfigureerd om data te verzamelen,
manipuleren, bewaren, en transformeren naar
informatie
8Introductie
- Database een georganiseerde verzameling gegevens
- Database management system (DBMS) een
verzameling programmas om een database mee te
beheren - Manipuleert de database
- Verschaft een interface tussen de database en de
gebruiker (zowel database als andere applicaties) - Database administrator (DBA) een IT professional
die de databases van een organisatie beheert en
onderhoudt
9Data Management
- Zonder data en de mogelijkheid om ermee te
(ver-)werken, kan een organisatie de meeste
bedrijfsactiviteiten niet succesvol uitvoeren - Betalen van werknemers
- Versturen van facturen
- Bestellen van nieuwe voorraden
- Data bestaat uit ruwe feiten
- Om data te transformeren in betekenisvolle
informatie, moet het eerst worden geordend worden
op een betekenisvolle wijze
10De Datahiërarchie 1/3
- Bit (een binair getal) een circuit dat óf AAN óf
UIT staat - Byte acht bits
- Karakter basis eenheid van informatie
- Elke byte representeert een character
- Kan een hoofdletter, kleine letter, numeriek
getal, speciaal symbool zijn - Veld (kolom rubriek) bijv. een naam, nummer, of
andere combinatie van karakters die een aspect
van een zakelijk object of activiteit beschrijven
11Bits-Byte-Karakter Decimaal versus Binair
- Wikipedia voorbeeld bij getalsystemen
Bits Byte Karakter
In 256 128 64 32 16 8 4 2 1 Uit
001101010 0 0 1 1 0 1 0 1 0 106
001101010 64 32 8 2 106
100010000 1 0 0 0 1 0 0 0 0 272
100010000 256 16 272
57 -32 -16 -8 0 0 -1 111001
57 1 1 1 0 0 1 111001
12De Datahiërarchie 2/3
- Record (rij) een verzameling van gerelateerde
velden - File (tabel dossier) een verzameling van
gerelateerde records - Database (gegevensbank) een verzameling van
geïntegreerde en gerelateerde files - Datahiërarchie bits, karakters, velden, records,
files, en databases
13De Datahiërarchie 3/3
Figuur 3.1 De datahiërarchie
14Entiteiten, Attributen, en Sleutels 1/2
- Entiteit een gegeneraliseerde klasse van mensen,
plaatsen, of dingen (objecten) waarvoor data
wordt verzameld/onderhouden - Attribuut Een kenmerk van een entiteit
- Data item De waarde van een attribuut
- Sleutel Een veld of verzameling velden in een
record dat gebruikt wordt om het record te
identificeren - Primaire sleutel Een sleutel waarmee ieder
record uniek geïdentificeerd kan worden
15Entiteiten, Attributen, en Sleutels 2/2
Figuur 3.2 Sleutels en Attributen
16Entiteiten, Attributen, en Terroristen
- p.112,1 Van attributen data naar
terrorismebestrijding - http//news.cnet.com/8301-13578_3-10059987-38.html
?partrsssubjnewstag2547-1_3-0-20
17 De Databasebenadering 1/4
- De traditionele benadering van database
management voor iedere toepassing worden aparte
data bestanden aangemaakt - Resulteert in dataredundantie (duplicatie)
- Dataredundantie conflicteert met data-integriteit
- De databasebenadering van database management
een vijver van gerelateerde data wordt gedeeld
door meerdere toepassingen - Significante voordelen t.o.v. de traditionele
benadering
18 De Databasebenadering 2/4
Figure 3.3 De databasebenadering van Data
Management
19 De Databasebenadering 3/4
Tabel 3.1 Voordelen van de databasebenadering
20 De Databasebenadering 4/4
Tabel 3.2 Nadelen van de databasebenadering
21Data Modellering 1/2
- Data model een diagram van data entiteiten en
hun onderlinge relaties - Entiteit-relatie (ER) diagram een type data
model dat gebruik maakt van eenvoudige grafische
symbolen om de organisatie van en relaties
tussen de data te tonen
22Data Modellering 2/2
1-n relatie gt
1-1 relatie gt
Figuur 3.4 Entiteit-Relatie (ER) Diagram voor
een Klantorder DB
23Het Relationele Database Model 1/2
- Relationele model alle data elementen worden
geplaatst in tweedimensionale tabellen
(relaties), die het logische equivalent zijn van
bestanden (files) - In het relationele model geldt
- Elke rij in een tabel representeert een data
entiteit - Kolommen van de tabel representeren attributen
- Domein de toegestane waarden voor data
attributen - Data dictionary gedetailleerde beschrijving van
alle data die in de database voorkomt
24Het Relationele Database Model 2/2
Figuur 3.5 Een Relationeel Database Model
25Datamanipulatie 1/2
- Selecteren het elimineren van rijen volgens
bepaalde criteria - Projecteren het elimineren van kolommen in een
tabel - Samenvoegen het combineren van twee of meer
tabellen - Verbinden het relateren of verbinden van twee of
meer tabellen via gedeelde data attributen
26Datamanipulatie 2/2
Wie is de manager van de Sales Manual en sinds
wanneer is hij in dienst?
Figuur 3.7 Het verbinden van tabellen om de
vraag te kunnen beantwoorden
27Overzicht van Database Types
- Flat file
- Simpel databaseprogramma waarin records geen
relatie met elkaar hebben - Voorbeeld Excel
- Single user
- Slechts één persoon kan tegelijkertijd gebruik
maken van de database - Voorbeelden Access, FileMaker
- Multi-user
- Meerdere mensen hebben tegelijkertijd toegang tot
hetzelfde database systeem - Voorbeelden zie volgende slide
28http//www.dbm.nl/site/jsp/nieuws.jsp?art_iID1073
4
29Datamanipulatie en Rapportage 1/2
- Structured Query Language (SQL) Dé standaard
vraagtaal voor relationele databases - Query-By-Example (QBE) een visuele benadering om
SQL vragen te formuleren - Data manipulation language (DML) Commandos die
de data in een database manipuleren - Database programmas kunnen rapporten documenten,
en allerlei andere vormen van uitvoer produceren
30Manipulatie en Rapportage 2/2
Table 3.3 Voorbeelden van SQL Commandos
31Database Beheer
- Database administrator (DBA) Stuurt aan en voert
uit alle activiteiten binnen de database omgeving - Plannen, ontwerpen, aanmaken, opereren,
beveiligen, monitoren en onderhouden van de
database systemen (Figuur 3.16!) - Vaststellen en invoeren van beleid en procedures
- Werknemers trainen
32Selecteren van een Database Systeem
- Belangrijke database eigenschappen die overwogen
dienen te worden - Grootte van de database
- Kosten van het systeem
- Aantal gelijktijdige gebruikers
- Uitvoeringssnelheid (lezen/schrijven)
- Integratiemogelijkheden met andere systemen
- Leverancier overwegingen
- Open-source?
33Verbinden van Databases met Internet
- Verbinden van databases met het Internet is
belangrijk voor veel organisaties en mensen - Semantische Web
- Ontwikkeling van een naadloze integratie van
traditionele databases met het Internet - Laat mensen een aantal traditionele databases
tegelijkertijd benaderen en manipuleren via het
Internet - W3C The Semantic Web provides a common
framework that allows data to be shared and
reused across application, enterprise, and
community boundaries. http//www.w3.org/2001/sw/
SW-FAQ
34Over Databases, Internet, en De Wet
- Wat vindt onze overheid eigenlijk van al die
databases en het internet?
35Data Warehouses, Marts, Mining 1/3
- Data warehouse verzamelt bedrijfsinformatie uit
meerdere bronnen in de organisatie - Data mart een deelverzameling van een data
warehouse - Data mining een informatieanalyse gereedschap
voor het blootleggen van patronen en relaties in
een data warehouse of data mart
36MBI afstudeervoorbeeld Data mining
- MBI scriptie van A. Vleugel Data mining finding
patterns in historical data to improve the
forecasting procedure of employee service
providers
.
37Data Warehouses, Marts, Mining 2/3
Figuur 3.17 Elementen van een Data Warehouse
38Data Warehouses, Marts, Mining 3/3
Tabel 3.5 Regelmatig voorkomende Data Mining
toepassingen
39De Weerbarstige Werkelijkheid
40Business Intelligence 1/2
- Business intelligence (BI) het verzamelen van de
juiste informatie, tijdig, in een bruikbare vorm,
en het analyseren van deze informatie om het
zaken doen op een positieve manier te beïnvloeden - Transformeert data naar bruikbare informatie, die
vervolgens gedistribueerd wordt door de gehele
organisatie
41Business Intelligence 2/2
- Competitive intelligence een aspect van business
intelligence dat zich beperkt tot informatie over
concurrenten en de manieren waarop deze kennis
strategie, tactieken, en de dagelijkse gang van
zaken beïnvloedt - Counterintelligence de stappen die een
organisatie neemt om informatie te beschermen die
gezocht wordt door vijandige intelligence
verzamelaars
http//www.fas.org/irp/ops/ci/cistrategy2007.pdf
42Wie zijn de Business Intelligence leveranciers
tot 2007?
BI Leverancier Omzet (M) 2006 Markt aandeel 2006 Groei 2005-2006
1 Business Objects 894 14 7
2 SAS 679 11 17
3 Cognos 622 10 10
4 Microsoft 480 8 28
5 Hyperion 322 5 12
IDC Research (2006), The BI Tools Market in 2006
43Wie zijn de Business Intelligence leveranciers in
2008?
BI Grootmacht Marktaandeel 2007 BI Prooi in 2007
1 SAP (7) 26,3 Business Objects (1)
2 IBM (12) 14,7 Cognos (3)
3 Oracle (8) 10,6 Hyperion (5)
4 SAS (2)
5 Microsoft (4)
44Gedistribueerde Databases
- Gedistribueerde database
- De data kan verspreid zijn over verschillende
kleinere databases die onderling verbonden zijn
via telecommunicatie apparaten - Bedrijven krijgen meer flexibiliteit in hoe
databases georganiseerd en gebruikt worden - Gerepliceerde database
- Bevat een identieke verzameling van frequent
gebruikte data
45Online Analytical Processing (OLAP)
- Software waarmee gebruikers data kunnen verkennen
vanuit verschillende perspectieven
Tabel 3.6 Vergelijking van OLAP en Data Mining
46Objectgeoriënteerde Databases
- Objectgeoriënteerd database management systeem
(OODBMS) - Programmas die een objectgeoriënteerdee database
manipuleren en een gebruikersinterface en
verbindingen naar andere toepassingen verschaffen - Object-relational database management system
(ORDBMS) - Een DBMS met speciale ondersteuning voor audio,
video, en geografische data
47Samenvatting 1/3
- Datahiërarchie bits, karakters, velden, records,
files, en databases - Entiteit een gegeneraliseerde klasse van mensen,
plaatsen, of dingen (objecten) waarvoor data
wordt verzameld/onderhouden - Attribuut Een kenmerk van een entiteit
- Data model een diagram van data entiteiten en
hun onderlinge relaties - Relationele model alle data elementen worden
geplaatst in tweedimensionale tabellen (relaties)
48Samenvatting 2/3
- Selecteren het elimineren van rijen volgens
bepaalde criteria - Projecteren het elimineren van kolommen in een
tabel - Een database management system (DBMS) is een
groep programmas die als interface gebruikt
worden tussen - Database en toepassingsprogrammas
- Database en de gebruiker
- Data dictionary gedetailleerde beschrijving van
alle data die in de database voorkomt
49Samenvatting 3/3
- Data warehouse database die bedrijfsinformatie
verzamelt over alle aspecten van
bedrijfsprocessen, producten, klanten - Data mining een informatieanalyse gereedschap
voor het blootleggen van patronen en relaties in
een data warehouse - Business intelligence (BI) het verzamelen van de
juiste informatie, tijdig en bruikbaar, en het
analyseren van deze informatie om het zaken doen
positief te beïnvloeden