Daniel T.Larose - Odkrywanie wiedzy z danych.pdf

(149232 KB) Pobierz
113101428 UNPDF
M
o
z
p
|
M
p
e
s
p
o
l
l
7
.
z
4
e
e
d
1
M
v
E
K
f
N
d
\
0
l
113101428.002.png
Dane oryginau
Daniel T. Larose
Discovering Knowledgein Data. An Introduction
toDATAMINING
Copyright O 2005by JohnWiley & Sons,Inc.
All Rights Reserved.This translation publishedunderlicense.
Projekt okadkii stron t5rtuowych
Joanna Sobieraj
Redaktorinicjujcy Agnieszka Grabarczyk
RedaktorKrystyna Jurkowska
Copyright @ for the Polish edition
by Wydawnictwo Naukowe PWN SA
Warszawa 2006
ISBN- 13: 978-83 -01-14836-2
ISBN-10: 83-01-14836-5
Wydawnictwo Naukowe PWN SA
00-251 Warszawa, ul. Miodowa 10
tel.022 69 54 32r
faks 022 69 54 031
e-mail:pwn@pwn.com.Pl
www.pwn.pl
113101428.003.png
Q
u
AJ
11
Al
'' p t 1
p uQ
p l
1
p 1
'
o
l3
a
J
113101428.004.png
s
l
d
x
0
3
1
e
p
x
x
3
:
:
:
.
'
:
:
:
:
:
:
.
x
I
l
o
4
'
,
s
d
s
n
p
x
o
.
x
0
p
1
.
.
.
.
x
J
,
;
f
:
'
.
:
:
.
O
3
d
1
e
p
c
t
e
c
p
x
'
'
X
. "
*
.
.
.
.
'
.
.
.
.
.
.
.
i
i
.
X
X
X
X
t
t
d
p
a
p
I
l
,
'
o
e
p
l
'
'
'
'
o
t
.
:
x
l
e
v
l
3
u
J
n
I
.
.
.
.
.
J
s
e
.
|
.
'
6
.
:
.
:
.
.
.
.
I
I
I
o
'
'
5
)
,
I
I
.
.
'
.
4
r
)
l
I
'
I
I
g
l
I
'
g
e
r
I
I
.
I
7
l
J
.
,
l
7
1
d
o
p
,
z
1
o
p
(
J
s
p
,
z
.
.
.
.
x
l
l
113101428.005.png
2.3. obsugabrakujcychdanych
.,...'.
29
2'4. Identyfikacjabdnychklasyfikacji
3f
2.5. Graficzne metody identyfikacji punktw oddalonych
33
2.6. Przeksztatcanie danych
35
2.6.1. Normalizacjamin-max
35
f .6.2. Standaryzacja
36
f.7. Metody numeryczne identyfikacji punktw oddalonych
38
2.8. Literatura
...'..'
39
2.9' wiczenia
39
3. Eksploracyjna analiza danych (EDA)
3.1. Testowanie hipotez a eksploracyjna analiza danych
3.2. Poznawanie zbioru danych
3.3. Postpowanie ze skorelowanymi zmiennymi
3.4, Badanie zmiennych jakociowych
3.5. Wykorzystanie EDA do odkrycia nieprawidowych pl .
3.6. Badanie zmiennych numerycznych
3.7. Badanie relacji wielowymiarowych
3.8. Wybieranie interesujcegopodzbioru danych do dalszych bada . ' ,
3.9. Dyskretyzacja
3.10. Podsumowanie
3.11. Literatura
3.If,wiczenia...
4I
41
A'
44
45
51
52
60
63
63
65
65
66
4, Podejciastatystyczne do szacowania i przewidywania . . .
68
4.L. ZadaniaeksploracjidanychwOdkrywaniuwiedzyzdanych
. . . . . . . 68
4,2. Podejciastatystycznedo szacowania i przewidywania . . . .
69
4.3. Metody jednowymiarowe: miary rodka i rozpitoci
'72
4.4. Wnioskowanie statystyczne
4.5. Jak wiarygodne snasze szacowania?
73
4.6, Szacowanie ptzedziauufnoci
74
4.7. Metodydwuwymiarowe: prostaregresjaliniowa
. . . .. . - 76
,79
4.8. Niebezpieczestwaekstrapolacji...
4,9. Pruedzaly ufnociwartociredniejy dla danegox
.
81
4.I0. Wzedziay ufnoci przewidywania losowo wybranej wartociy dla danegox ' . .
81
4.11. Regresja wielokrotna
83
4.l2.Weryfikacjazozemodelu
.'.....
85
4.l3.Literatura. ..
89
4.|4.wiczenia...
.:....
89
Algorytm t-najbliszych s,siadw
91
5.1. Metody nadzorowane i nienadzorowane .
9I
5.2. Metodologiamodelowanianadzorowanego.
..-....
9f
5'3. Kompromis obcieniowo-wariacyjny
94
5.4. Zadanie klasyfikacji
96
5.5. Algorytm k-najb|Lzszychssiadw
9.7
5.6. odlego
99
5.7. Funkcjadecyzyjna
....-..loz
69
113101428.001.png
Zgłoś jeśli naruszono regulamin