Spis treści Wprowadzenie 13 Ewa Frątczak Rozdział 1. Wprowadzenie - wybrane zagadnienia wielowymiarowej analizy statystycznej... 21 1.1. Czym jest wielowymiarowa analiza statystyczna i do czego służy?... 21 1.2. Organizacja danych na użytek wielowymiarowej analizy statystycznej... 22 1.3. Skalowanie zmiennych i techniki graficzne... 28 1.4. Zagadnienie pomiaru odległości... 36 1.5. Rozkład normalny jednej zmiennej... 42 1.6. Rozkład normalny wielu zmiennych... 44 1.7. Próba losowa i estymatory największej wiarygodności... 47 1.8. Rozkłady statystyk z próby ( X i S)... 49 1.9. Informacje ogólne o systemie SAS... 51 Literatura... 54 Rozdział 2. Algebra macierzy... 55 2.1. Macierze... 55 2.1.1. Definicja macierzy... 55 2.1.2. Szczególne przypadki macierzy... 56 2.1.3. Wektory... 57 2.1.4. Równość macierzy... 58 2.1.5. Macierz transponowana... 58 2.2. Operacje na macierzach... 58 2.2.1. Dodawanie, odejmowanie macierzy i mnożenie macierzy przez liczbę... 59 2.2.2. Mnożenie macierzy przez macierz... 61 2.2.3. Iloczyn skalarny i norma wektorów... 62 2.3. Wyznacznik macierzy... 63 2.3.1. Minory... 64 2.4. Macierz odwrotna i rozwiązywanie układów równań liniowych... 65 2.4.1. Macierz odwrotna... 65 2.4.2. Rozwiązywanie układów równań liniowych... 66 2.5. Przestrzenie liniowe... 67 2.5.1. Liniowa zależność i niezależność wektorów... 67 2.5.2. Baza... 68 2.5.3. Rząd macierzy... 69 2.6. Wektory i macierze blokowe... 70 2.7. Macierze ortogonalne, macierze idempotentne... 72 2.7.1. Macierze ortogonalne... 72 2.7.2. Macierze idempotentne... 73 2.8. Wartości własne i wektory własne, diagonalizacja macierzy... 73 2.8.1. Macierze podobne... 75 2.8.2. Ślad macierzy... 75 2.8.3. Diagonalizacja macierzy... 76 2.8.4. Dekompozycja spektralna... 76 2.9. Formy kwadratowe... 77 2.10. Zastosowania w analizie statystycznej... 78
2.10.1. Macierz momentów... 80 2.10.2. Macierz korelacji... 81 Literatura...81 Elżbieta Gołata Rozdział 3. Wybrane zagadnienia metody reprezentacyjnej... 83 3.1. Wprowadzenie do estymacji statystycznej... 83 3.2. Operat losowania... 84 3.3. Wybrane schematy losowania próby... 85 3.3.1. Losowanie proste... 85 3.3.2. Losowanie warstwowe... 86 3.3.2.1. Losowanie warstwowe proporcjonalne... 87 3.3.2.2. Losowanie warstwowe optymalne... 88 3.3.3. Losowanie systematyczne... 88 3.4. Metoda reprezentacyjna w procedurach SAS... 89 3.5. Losowanie proste... 97 3.5.1. Losowanie proste zastosowanie procedury SURVEYSELECT... 97 3.5.2. Losowanie proste zastosowanie procedury SURVEYMEANS... 102 3.6. Losowanie warstwowe... 104 3.6.1. Losowanie warstwowe proporcjonalne zastosowanie procedury SURVEYSELECT... 104 3.6.2. Losowanie warstwowe proporcjonalne zastosowanie procedury SURVEYMEANS... 106 3.6.3. Losowanie warstwowe optymalne zastosowanie procedury SURVEYSELECT... 110 3.6.4. Losowanie warstwowe optymalne zastosowanie procedury SURVEYMEANS... 112 3.7. Losowanie systematyczne... 114 3.7.1. Losowanie systematyczne zastosowanie procedury SURVEYSELECT... 114 3.7.2. Losowanie systematyczne zastosowanie procedury SURVEYMEANS... 115 Literatura... 116 Rozdział 4. Analiza skupień... 117 4.1. Metody analizy skupień... 117 4.1.1. Wprowadzenie... 117 4.1.2. Charakterystyka obiektów... 119 4.1.3. Metody grupowania... 120 4.1.4. Własności metod grupowania... 133 4.1.5. Ocena poprawności grupowania... 135 4.1.6. Ocena zgodności wyników grupowania uzyskanych za pomocą różnych metod... 136 4.2. Zasady przeprowadzania grupowania... 139 4.2.1. Wybór zmiennych diagnostycznych... 140 4.2.2. Wybór mierników podobieństwa lub niepodobieństwa obiektów... 140 4.2.3. Normalizacja... 142 4.2.4. Rozkład populacji... 144 4.2.5. Obiekty nietypowe... 145 4.2.6. Ustalenie liczby grup... 145 4.3. Procedury analizy skupień występujące w systemie SAS... 150
4.3.1. Procedura CLUSTER... 151 4.3.2. Procedura FASTCLUS... 152 4.4. Przykłady... 153 4.4.1. Przykład 1... 153 4.4.2. Przykład 2... 171 Literatura... 174 Rozdział 5. Analiza korespondencji... 177 5.1. Wprowadzenie... 177 5.2. Geneza analizy korespondencji... 178 5.3. Tablica kontyngencji... 179 5.4. Tablica korespondencji... 181 5.5. Odległość χ 2........185 5.6. Bezwładność... 188 5.7. Pozostałe zagadnienia analizy korespondecji... 189 5.8. Przykład analizy... 193 5.9. Mapy asymetryczne i symetryczne... 196 5.10. Analiza korespondencji w Systemie SAS... 199 5.11. Przykłady analizy korespondencji w Systemie SAS... 200 Literatura... 208 Aneta Ptak-Chmielewska Rozdział 6. Metoda głównych składowych i analiza czynnikowa... 209 6.1. Metoda głównych składowych... 209 6.1.1. Zapis formalny modelu, podstawy matematyczne metody... 210 6.1.2. Zagadnienie wyboru liczby głównych składowych i wyznaczanie wag... 214 6.1.3. Interpretacja i wykorzystanie analizy głównych składowych... 215 6.1.4. Analiza głównych składowych w systemie SAS... 217 6.1.5. Przykłady zastosowań z wykorzystaniem SAS... 218 6.2. Analiza czynnikowa... 227 6.2.1. Formalny zapis modelu analizy czynnikowej... 228 6.2.2. Metody estymacji modelu analizy czynnikowej... 231 6.2.3. Weryfikacja modelu z wykorzystaniem testów... 234 6.2.4. Zagadnienie rotacji czynników... 234 6.2.5. Factor scores czyli przypisywanie wag... 236 6.2.6. Zastosowanie analizy czynnikowej... 237 6.2.7. Analiza czynnikowa w systemie SAS... 238 6.2.8. Przykłady zastosowań z wykorzystaniem SAS... 240 Literatura... 251 Aneta Ptak-Chmielewska, Rozdział 7. Analiza dyskryminacji... 253 7.1. Wprowadzenie... 253 7.2. Sformułowanie modelu... 255 7.3. Dostosowanie punktów odcięcia... 262 7.4. Nadanie ocen punktowych - score... 264 7.5. Ocena modelu... 265 7.6. Oszacowanie błędów klasyfikacji... 268 7.7. Klasyfikacja do więcej niż do dwóch grup... 269
7.8. Założenia i ograniczenia analizy dyskryminacyjnej... 270 7.9. Analiza dyskryminacji w systemie SAS... 271 Literatura... 286 Tomasz Klimanek Rozdział 8. Statystyka Małych Obszarów... 287 8.1. Wprowadzenie i podstawowe definicje... 287 8.1.1. Istota Statystyki Małych Obszarów... 287 8.1.2. Estymacja dla małych domen a podejście metody reprezentacyjnej... 288 8.1.3. Estymatory SMO... 288 8.2. Estymacja bezpośrednia dla domen... 290 8.3. Estymacja syntetyczna... 294 8.3.1. Idea estymacji syntetycznej - zmienne pomocnicze... 294 8.3.2. Estymacja syntetyczna regresyjna... 299 8.4. Estymacja złożona... 303 8.5. Kody programów i tablice wynikowe... 313 8.5.1. Kody programów... 313 8.5.2. Tablice wynikowe... 321 Literatura... 331
Contents Introduction...13 Ewa Frątczak Chapter 1. Selected aspects of multivariate analysis... 1.1. What is the multivariate statistical analysis and what is it used for?... 1.2. Organization of data for multivariate analysis... 1.3. Scaling and graphical techniques... 1.4. Distance measurement... 1.5. Normal distribution... 1.6. Multivariate normal distribution... 1.7. Sampling and Maximum Likelihood Estimators... 1.8. The sampling distribution of X and S... 1.9. General information about SAS... Bibliography... Chapter 2. Matrix algebra... 2.1. Matrices... 2.1.1. Definition of a matrix... 2.1.2. The special cases of matrices... 2.1.3. Vectors... 2.1.4. Equality of matrices... 2.1.5. The transpose of a matrix... 2.2. Matrix operations... 2.2.1. Addition, subtraction and scalar multiplication... 2.2.2. Matrix multiplication... 2.2.3. Inner product and a norm of vectors... 2.3. Determinant of a matrix... 2.3.1. Minors... 2.4. Inverse matrix and solution of systems of linear equations...... 2.4.1. Inverse matrix... 2.4.2. Solution of system of linear equations... 2.5. Linear spaces... 2.5.1. Linear dependence and independence of vectors... 2.5.2. Basis... 2.5.3. Rank of a matrix... 2.6. Partitioned vectors and matrices... 2.7. Orthogonal matrices, idempotent matrices... 2.7.1. Orthogonal matrices... 2.7.2. Idempotent matrices... 2.8. Eigenvalues, eigenvectors, diagonalization of a matrix... 2.8.1. Similar matrices... 2.8.2. Trace of a matrix... 2.8.3. Diagonalization of a matrix... 2.8.4. Spectral decomposition of a matrix... 2.9. Quatradic forms... 2.10. Applications in statistical analysis... 2.10.1. Moments matrix... 2.10.2. Correlation matrix... Bibliography... 21 21 22 28 36 42 44 47 49 51 54 55 55 55 56 57 58 58 58 59 61 62 63 64 65 65 66 67 67 68 69 70 72 72 73 73 75 75 76 76 77 78 80 81 81
Elżbieta Gołata Chapter 3. Sampling selected aspects... 3.1. Introduction to statistical estimation... 3.2. Sampling frame... 3.3. The sample selection schemes... 3.3.1. Simple sampling... 3.3.2. Stratified sampling... 3.3.2.1. Stratified sampling with proportional allocation... 3.3.2.2. Stratified sampling with optimal allocation... 3.3.3. Systematic sampling... 3.4. Sampling in SAS procedures... 3.5. Simple sampling... 3.5.1. Simple sampling the SURVEYSELECT procedure... 3.5.2. Simple sampling the SURVEYMEANS procedure... 3.6. Stratified sampling... 3.6.1. Stratified sampling with proportional allocation the SURVEYSELECT procedure... 3.6.2. Stratified sampling with proportional allocation the SURVEYMEANS procedure... 3.6.3. Stratified sampling with optimal allocation the SURVEYSELECT procedure... 3.6.4. Stratified sampling with optimal allocation the SURVEYMEANS procedure... 3.7. Systematic sampling... 3.7.1. Systematic sampling the SURVEYSELECT procedure... 3.7.2. Systematic sampling the SURVEYMEANS procedure... Bibliography... Chapter 4. Cluster analysis... 4.1. Methods of cluster analysis... 4.1.1. Introduction... 4.1.2. Description of objects... 4.1.3. Method of clustering... 4.1.4. Property of methods of clustering... 4.1.5. Assessing validity of clustering... 4.1.6. Assessing goodness of fit of clustering results acchieved by different methods... 4.2. Principles of clustering... 4.2.1. Choosing diagnostic variables... 4.2.2. Choosing similarity and dissimilarity measures of objects... 4.2.3. Normalization... 4.2.4. Population distribution... 4.2.5. Outliers... 4.2.6. Choosing the number of clusters... 4.3. Procedures of cluster analysis in SAS... 4.3.1. Procedure CLUSTER... 4.3.2. Procedure FASTCLUS... 83 83 84 85 85 86 87 88 88 89 97 97 102 104 104 106 110 112 114 114 115 116 117 117 117 119 120 133 135 136 139 140 140 142 144 145 145 150 151 152
4.4. Examples... 4.4.1. Example 1... 4.4.2. Example 2... Bibliography... Chapter 5. Correspondence analysis... 5.1. Introduction... 5.2. Genesis of correspondence analysis... 5.3. Contingency table... 5.4. Correspondence table... 5.5. Distance χ 2... 5.6. Inertia...... 5.7. Other issues of correspondence analysis... 5.8. Example of analysis... 5.9. Asymetric and symetric maps... 5.10. Correspondence analysis in SAS... 5.11. Examples of correspondence analysis in SAS... Bibliography. Aneta Ptak-Chmielewska Chapter 6. Principal components method and factor analysis... 6.1. Principal components method... 6.1.1. Model formulation, mathematical background... 6.1.2. Number of principal components selection and weights... 6.1.3. Interpretation and application of principal components... 6.1.4. Principal components analysis in SAS... 6.1.5. Examples of application in SAS... 6.2. Factor analysis... 6.2.1. Factor analysis model formulation... 6.2.2. Methods of model estimation... 6.2.3. Model verification using tests... 6.2.4. Factor rotations... 6.2.5. Factor scores weights... 6.2.6. Application of factor analysis... 6.2.7. Factor analysis in SAS... 6.2.8. Examples of application in SAS... Bibliography.. Aneta Ptak-Chmielewska, Chapter 7. Discriminant analysis... 7.1. Introduction... 7.2. Model formulation... 7.3. Cut-offs adjustment... 7.4. Scores... 7.5. Model evaluation... 7.6. Estimation of classifications errors... 7.7. Multigroup classification... 7.8. Assumptions and limitations of discriminant analysis... 7.9. Discriminant analysis in SAS... Bibliography... 153 153 171 174 177 177 178 179 181 185 188 189 193 196 199 200 208 209 209 210 214 215 217 218 227 228 231 234 234 236 237 238 240 251 253 253 255 262 264 265 268 269 270 271 286
Tomasz Klimanek Chapter 8. Small area statistics... 8.1. Introduction and basic definitions... 8.1.1. The idea and meaning of the small area stasistics... 8.1.2. Smal area estimation and classical approach in sampling methodology... 8.1.3. Estimators of small area statistics... 8.2. Direct estimation... 8.3. Synthetic estimation... 8.3.1. Idea of the synthetic estimation auxiliary variables... 8.3.2. Regression synthetic estimation... 8.4. Composite estimation... 8.5. Codes of programmes and results tables... 8.5.1. Codes of programmes... 8.5.2. Results tables... Bibliography. 287 287 287 288 288 290 294 294 299 303 313 313 321 331