Autoreferat. dr Jakub Paderewski
|
|
- Irena Rosińska
- 6 lat temu
- Przeglądów:
Transkrypt
1 Załącznik nr do wniosku o przeprowadzenie postępowania habilitacyjnego Autoreferat dr Katedra Doświadczalnictwa i Bioinformatyki Wydział Rolnictwa i Biologii Szkoła Główna Gospodarstwa Wiejskiego w Warszawie Warszawa 2018
2 Imię i nazwisko: Jakub Bartłomiej Paderewski Posiadane dyplomy, stopnie naukowe: Magister matematyki, Uniwersytet Warszawski, Wydział Matematyki, Informatyki i Mechaniki. Temat pracy magisterskiej Metoda optymalizacji genetycznej sieci neuronowych. Promotor: dr Nguyen Hung Son Doktorat w dyscyplinie agronomia, Szkoła Główna Gospodarstwa Wiejskiego w Warszawie, Wydział Rolnictwa i Biologii. Przydatność Modelu AMMI do badania reakcji roślin rolniczych na warunki środowiskowe. Promotor: prof. dr hab. Wiesław Mądry. Informacje o poprzednim zatrudnieniu w jednostkach naukowych : Zatrudniony w Szkole Głównej Gospodarstwa Wiejskiego w Warszawie, Wydział Rolnictwa i Biologii, Katedra Statystyki Matematycznej i Doświadczalnictwa. Później Katedra została przemianowana na Katedrę Biometrii, obecnie, po reorganizacji nosi nazwę Katedry Doświadczalnictwa i Bioinformatyki. == 2 ==
3 Wskazane osiągnięcia wynikające z art. 16 ustawy 2 Osiągnięcie naukowe Zastosowanie modelu AMMI do oceny reakcji odmian pszenicy ozimej na warunki środowiskowe w Polsce składa się z cyklu pięciu publikacji naukowych. Przedstawione publikacje opisują zastosowanie modelu AMMI (ang. additive main effects and multiplicative interactions), wprowadzają jego modyfikacje oraz przedstawiają możliwości wnioskowania w zastosowaniu danych o plonowaniu pszenicy ozimej. 1. Yield response of winter wheat to agro-ecological conditions using Additive Main Effects and Multiplicative Interaction and Cluster Analysis, 2011;, Hugh G. Gauch, Wiesław Mądry, Tadeusz Drzazga and Paulo C. Rodrigues. Crop Science (2011) 51: (IF2011 czasopisma 1,641, punktacja MNISW ) Celem tego artykułu było przedstawienie połączonej analizy składowych głównych modelu AMMI oraz analizy skupień dla danych uzyskanych z pomiarów plonu ziarna pszenicy ozimej (Triticum aestivum L.) zebranych w doświadczeniach przedrejestrowych przeprowadzonych przez wiele lat w niepełnej trzykierunkowej klasyfikacji genotyp lokalizacja rok (GLY) i wykazanie przydatności tej procedury do badania wzorców adaptacji odmian. Rozpatrywane dane dla plonu ziarna pszenicy ozimej (Triticum aestivum L.) pochodziły z przedrejestrowych doświadczeń odmianowych prowadzonych przez stacje hodowlane. W pierwszym etapie analizy statystycznej przeanalizowaliśmy dane osobno dla każdej kombinacji warunków środowiskowych (kombinacje lokalizacji i roku badań, GxL). Użyto programu SAS i procedury GLM, w której genotypy były traktowane jako czynnik stały, a powtórzenia i bloki jako czynniki losowe. W ten sposób obliczono najlepszy nieobciążony estymator liniowy (BLUE, best linear unbiased estimator) średnie poprawione dla genotypów oraz średni kwadrat dla błędu w każdych warunkach środowiskowych. Tak uzyskane średnie poprawione plonu genotypów dla każdej stacji doświadczalnej i każdego roku osobno roku połączono w jedną trzy-kierunkową klasyfikację. W tej niekompletnej klasyfikacji dla kombinacji genotypy x miejscowości x lata (GxLxY), opisującej 21 genotypów, 15 lokalizacji i 14 lat, było 4410 podklas, z których tylko 951 miało określony średni plon (średnie poprawione plonu analizowanego modelem mieszanym analizy == 3 ==
4 wariancji w każdym roku i każdej stacji doświadczalnej osobno), co stanowiło zaledwie 21,6% wszystkich podklas. W drugim etapie przeprowadziliśmy wieloczynnikową analizę średnich poprawionych plonu genotypów w niekompletnej, ale spójnej, trójkierunkowej klasyfikacji GxLxY według mieszanego modelu ANOVA. Genotypy i lokalizacje zostały uznane za stałe czynniki stałe, a lata jako czynnik losowy. Korzystając z metody REML oszacowaliśmy średnie poprawione dla plonu w klasyfikacji GxL (estymatory BLUE) średnie kombinacji GxLxY poprzez lata. Dla dwukierunkowej klasyfikacji genotyp x miejscowość (kombinacje GxL z 315 podklasami) określono również liczbę lat badań dla każdej kombinacji GxL, która zmieniała się od 0 do 11, przy średniej równej Klasyfikacja GxL została przeanalizowana za pomocą modelu AMMI przy użyciu połączonej analizy AMMI i analizy skupień. Do grupowania genotypów o podobnych efektach interakcji została wykorzystana hierarchiczna analiza skupień metodą Warda (w której miara odmienności był kwadrat odległości euklidesowej). Dwadzieścia jeden genotypów zostało podzielone na trzy grupy. Genotypowe profile efektów interakcji GL zostały użyte do opisania wzorców interakcji genotyp środowisko (GE) na plon ziarna. Aby podzielić średnie genotypów na odrębne jednorodne podgrupy zastosowano metodę niehierarchicznej analizy skupień opracowaną przez Calińskiego i Corstena. Dzięki temu takie podgrupy genotypów byłyby homogeniczne w sensie średniej genotypowej oraz typu interakcji. W tym badaniu 11 genotypów zgrupowanych w trzech podgrupach wykazało szeroką adaptację. Spośród nich odmiana TONACJA została zidentyfikowana jako dobra odmiana kontrolna do doświadczeń przedrejestrowych. Jedna odmiana miała wąską (specyficzną) adaptację, a dziewięć wykazało relatywnie słabą adaptację. Podsumowując uzyskane wyniki badań dotyczących plonu ziarna genotypów pszenicy ozimej na zróżnicowane warunki środowiskowe w szerokim zakresie czasowo-przestrzennym zauważyliśmy, że wszystkie nowoczesne genotypy wyhodowane w Polsce w latach oznaczono szeroką zdolnością adaptacyjną. Ta cecha agronomiczna nie została przypisana większości wcześniej uzyskanych genotypów, wyjątkiem były genotypy: KOBRA, KORWETA i DED315/89. Większość genotypów starszych i pośrednich wiekiem była stosunkowo słabo dostosowana do rozpatrywanych warunków środowiskowych, co zostało zademonstrowane przez ich względnie niską lub bardzo niską ocenę plonu ziarna we wszystkich stacjach doświadczalnych. Oznacza to, że współczesne polskie odmiany pszenicy ozimej są bardziej produktywne niż stare, nie tylko na żyznych glebach (środowiska == 4 ==
5 o wysokim potencjale plonotwórczym), ale także w mniej korzystnych warunkach środowiskowych. Wyniki badania opisują postęp genetyczny w hodowli odmian pszenicy ozimej uzyskany w Polsce w trakcie okresu 23 lat (od 1982 do 2004) w średnim plonie na hektar uprawy oraz poprawę stopnia szerokiej zdolności adaptacyjnej nowych odmian, czyli stabilność produkcji w warunkach produkcyjnych. Łączna analiza AMMI i analiza skupień była w tamtym czasie unikalna w porównaniu z innymi proponowanymi w literaturze procedurami opartymi na AMMI. To podejście do analizy AMMI adaptowanej do niepełnej trójczynnikowej klasyfikacji GxLxY dla plonu ziarna z wielośrodowiskowej serii przedrejestrowych doświadczeń odmianowych przeprowadzanej przez 23 lata na pszenicy ozimej okazało się efektywne w opisie różnych wzorów reakcji genotypów na warunki agroekologiczne w stacjach doświadczalnych rozmieszczonych na większości polskich obszarów uprawy pszenicy ozimej. Opracowana metodyka statystyczna zastosowana w tej pracy była bardziej efektywna w przewidywaniu i wizualizacji różnych wzorców reakcji genotypów w porównaniu do tradycyjnej analizy AMMI, w której nie stosowane jest grupowanie genotypów. Połączona analiza AMMI i analiza skupień okazała się skuteczna do opisania wyodrębnionych schematów reakcji plonu na warunki agroekologiczne w miejscowościach. 2. AMMI analysis of four-way Genotype Location Management Year data from a wheat trial in Poland,, Hugh G. Gauch, Wieslaw Mądry and Edward Gacek. Crop Science (2016) 56: (IF2016 czasopisma 1,629, punktacja MNISW , ujednolicona punktacja MNISW ) Rozpatrywane (analizowane) dane dla plonu ziarna pszenicy ozimej (Triticum aestivum L.) pochodziły z porejestrowych doświadczeń odmianowych (PDO). W każdej miejscowości i roku doświadczenia dwu-czynnikowe odmianowo-agrotechniczne były założone w doświadczalnym układzie strip-plot (pasów prostopadłych) z dwoma powtórzeniami. Ze względu na układ kombinacji doświadczalnych w serii tych doświadczeń, dane stanowiły czteroczynnikową (czterokierunkową) klasyfikację (tabelę) o postaci genotyp x miejscowość x poziom intensywności agrotechniki x rok (GxLxMxY). Celem badań było zastosowanie dwuczynnikowego (klasycznego) modelu AMMI do analizy danych w klasyfikacji GxLxMxY i wnioskowania o adaptacji odmian do warunków środowiskowych i agrotechnicznych. Zaproponowana metodyka statystyczna była efektywna do określenia megaśrodowisk (rejonów uprawy pszenicy ozimej w Polsce, w których odmiany wykazują == 5 ==
6 podobną interakcję genotypowo-środowiskową) oraz pozwoliła dokonać rekomendacji odmian zaadaptowanych do tych megaśrodowisk. Jak w każdej analizie AMMI, dodatkowym rezultatem opracowanej metody była redukcja błędu losowego (wytłumienie szumu losowego w danych), która przyczyniła się do zwiększenia precyzji ocen czynnikowych efektów głównych i interakcyjnych. Analiza statystyczna rozpoczęła się od analiz układów strip-plot w każdej stacji doświadczalnej. Następnie połączono tak uzyskane dane w tabelę czterokierunkową genotyp x miejscowość x poziom agrotechniki x rok (GxLxMxY). Tabela została zawężona do podzbioru nie zawierającego braków danych (wszystkie podklasy GxLxMxY miały określony plon). Tą tabelę analizowano za pomocą cztero-czynnikowego modelu mieszanego ANOVA. Określono, które interakcje są istotne. Zbiór średnich dla tej cztero-czynnikowej klasyfikacji GxLxMxY przeorganizowano w dwukierunkową klasyfikację genotyp x środowisko (GxE), w której 120 środowisk zostało zdefiniowanych jako kombinacje lokalizacji (L), poziomu agrotechniki (M) i roku obserwacji (Y). Ten dwukierunkowy zestaw danych analizowano modelem AMMI. W celu diagnostyki liczby składowych głównych w modelu AMMI zastosowano procedurę sprawdzianu krzyżowego (Cross-Validation) z pojedynczą obserwacją w zbiorze testowym (Leave-One-Out). Zasada działania tej analizy jest następująca: z oryginalnego zestawu danych pojedyncza obserwacja jest usuwana (brak wartości w zbiorze uczącym) i adekwatny model, tu EM AMMI, jest użyty do predykcji tej wartości. Powtarza się to dla każdej wartości w zbiorze danych (exhausting version). Średni kwadrat różnic między wartościami ukrytymi podczas estymacji parametrów modelu a wartościami przewidywanymi przez model (statystyka RMSPD, root mean square prediction differences) jest najmniejszy dla modelu najdokładniej przewidującego nieznane wartości. Wnioskowanie jest trudniejsze jeśli model jest bardziej złożony. Dlatego warto również rozważyć uproszczenie modelu, jeśli wiąże się ono tylko z nieznacznym pogorszeniem właściwości predykcyjnych modelu. Model AMMI1 był w stanie zakumulować 26% interakcyjnej sumy kwadratów. Była to wartość o 80% większa od sumy kwadratów dla efektów głównych genotypu i dlatego jest ona znacząca. Suma kwadratów dla drugiej składowej głównej była znacznie niższa niż suma kwadratów dla genotypowych efektów głównych. Ponadto łączna suma kwadratów dla dalszych składowych (od drugiej wzwyż) zgadzała się z oszacowaniem błędu doświadczalnego. Stąd też wspólne rozważania dotyczące dokładności predykcyjnej i oszczędnego modelu doprowadziły do wyboru modelu AMMI1. == 6 ==
7 Pierwsza składowa główna miała ewidentną interpretację geograficzną, kontrastującą północno-wschodnią Polską (chłodniejszy klimat) i południowo-zachodnią Polską (cieplejszy klimat). Metodologiczne znaczenie tego artykułu to przedstawienie rozszerzenia analizy AMMI z analizy danych dwuczynnikowych (np. klasyfikacji GxE) do analizy danych w klasyfikacji wieloczynnikowej, takich jak rozpatrywany czteroczynnikowy zbiór danych GLMY. Uzyskane wyniki pozwoliły na konstrukcję mega środowiskowego podziału obszaru Polski i określenia rekomendacji genotypów dla takich mega środowisk. 3. An R function for imputation of missing cells in two-way data sets by EM-AMMI algorithm;. Communications in Biometry and Crop Science (2013) 8: (SJR2013 czasopisma 0,237, punktacja MNISW ) W doświadczalnictwie rolniczym stosowane są różne metody do potwierdzenia i interpretacji interakcji (na przykład genotypu z warunkami środowiskowymi). Część metod statystycznych do analizy danych w dwukierunkowej klasyfikacji pod kątem opisu interakcji wymaga, aby dane były kompletne, to znaczy nie mogą mieć brakujących wartości w podklasach (np. stosowane w naukach agronomicznych analizy AMMI lub GGE). W artykule zaproponowano kod programu w języku R do estymacji brakujących wartości za pomocą algorytmu EM-AMMI. Ponadto zawiera procedurę i) do sprawdzania powtarzalności tego algorytmu oraz ii) do określenia liczby składowych głównych (PCs) uzasadnionych w modelu. Pierwsza z nich może zostać użyta do oceny, czy brakujące dane zostały jednoznacznie wyznaczone, co jest szczególnie ważne w przypadku małych zbiorów danych. Druga procedura pozwala wybrać odpowiednią liczbę składowych głównych na bazie statystyki RMSPD (root mean square prediction differences, średni kwadrat z różnic między wartościami przewidywanymi przez model a wartościami obserwowanymi). Sprawdzenie liczby składowych głównych w modelu powinno być standardem w analizie danych przez modele oparte na rozkładzie według wartości osobliwych (SVD decomposition). Krótki opis procedur jest następujący: Procedura EM.AMMI() estymuje brakujące kombinacje w dwukierunkowej tabeli zgodnie z metodą największej wiarygodności (expectation maximization AMMI, EM AMMI). Wyniki uzyskane procedurą są wiarygodne, gdy istnieją powiązania między plonami genotypów w różnych środowiskach i między plonami uzyskiwanymi w środowiskach przez różne odmiany. Statystyk musi podjąć decyzję o liczbie składowych głównych używanych do oszacowania brakujących wartości. == 7 ==
8 Aby sprawdzić, czy wynik procedury EM.AMMI() jest powtarzalny, procedura repeat.em.ammi() powtarza procedurę EM-AMMI wiele razy, za każdym razem z innym układem wartości początkowych. Wiarygodność wartości estymowanych (co implikuje powtarzalność) jest większa w przypadku większych zbiorów danych, silniejszych relacji między wierszami, silniejszych relacji między kolumnami, a także mniejszej liczbie brakujących wartości. Optymalna liczba składowych głównych to ta, która ma najmniejszą wartość RMSPD. Do określenia tej liczby może być użyta metoda sprawdzianu krzyżowego (Cross-Validation, C V). Popularną wersją metody C-V jest wersja z jedną wartością usuwaną ze zbioru modelującego (Leave One Out, L O O C V). Do tego celu napisano procedurę CV.LOO( ). W oryginalnym zestawie danych, przed uruchomieniem EM-AMMI, ukrywana jest jedna obserwacja, która później będzie używana jako zestaw danych walidacyjnych (wartość oceniająca predykcję). Estymację brakujących wartości wykonuje procedura EM.AMMI( ), oparta na zestawie danych modelujących, który jest zbiorem danych bez tej jednej obserwacji. Taką procedurę powtarza się dla każdej obserwacji w zbiorze danych. Różnice pomiędzy ukrytą wartością a tym, co jest przypisane przez model EM.AMMI() (różnice w przewidywaniu) są podniesione do kwadratu, uśrednione i pierwiastkowane (statystyka RMSPD). Podsumowując, autor zaprezentował opracowany przez siebie kod komputerowy, który umożliwia obliczenia analizy statystycznej EM-AMMI, która w tym czasie nie była oprogramowana. Proponowane dodatkowe analizy również zostały zamieszczone i przedstawione na ilustrujących przykładach. 4. The usefulness of EM-AMMI to study the influence of missing data pattern and application to Polish post-registration winter wheat data;, Paulo C. Rodrigues. Australian Journal of Crop Science (2014) 8: (SJR2014 czasopisma 0,463, punktacja MNISW2014 5) Badanie interakcji genotypowo-środowiskowej (GEI) ma kluczowe znaczenie w doświadczalnictwie rolniczym, ponieważ zrozumienie jej umożliwia znaczną poprawę cech genotypowych roślin uprawnych. Genotypy i środowiska stanowią dwukierunkową klasyfikację czynnikową. Dane fenotypowe dla tych doświadczeń mogą być uporządkowane w dwukierunkowych tabelach z genotypami i środowiskami (przy czym środowiska mogą stanowić kombinacje lokalizacja-rok). W programach hodowli roślin niektóre genotypy == 8 ==
9 są często odrzucane, a inne dodawane w zamian z roku na rok, co powoduje brakujące wartości w takich zbiorach danych. Są to dostępne metody które radzą sobie z brakującymi wartościami w tabelach danych, ale niektóre metody nie mogą być stosowane w takich przypadkach. Jedną z najczęściej stosowanych alternatyw dla metod, które akceptują brakujące wartości, jest uzupełnienie wartości w brakujących komórkach przy użyciu metody EM-AMMI. W niniejszym opracowaniu zostało przedstawione studium wpływu struktury brakujących wartości na efektywność algorytmu EM-AMMI. Cztery scenariusze były rozważane: i) pierwszy, z brakującymi komórkami (podklasami kombinacji GE) występującymi całkowicie losowo; i trzy z następującymi wzorami braków danych (nielosowe), to jest ii) obserwacje występowały blokowo a bloki przy głównej diagonali, iii) wzór diagonalny (obserwowane kombinacje ulokowane były przy głównej diagonali a braki danych w prawym górnym i lewym dolnym rogu tabeli) i iv) wzór blokowo-przekątny z odmianami kontrolnymi (występującymi we wszystkich środowiskach). Schematy odzwierciedlają najczęściej spotykane schematy brakujących danych w wieloletnich seriach doświadczeń odmianowych. Wyniki zostały porównane pod względem precyzji szacowania brakujących komórek i selekcji genotypów. Podczas modelowania dwukierunkowych tabeli danych, przeprowadzenie diagnostyki modelu w celu wyboru najbardziej dostosowanego modelu AMMI (tj. wybranie "właściwej" liczby składników multiplikatywnych) ma kluczowe znaczenie dla analizy AMMI i dokonania właściwych zaleceń dla rolnictwa. W tym artykule badano trzy czynniki: odsetek brakujących wartości, liczbę składowych głównych w modelu AMMI i wzór brakujących komórek. Wszystkie trzy czynniki wykazały istotną interakcję między sobą w odniesieniu do statystyki RMSPD (opisującej różnice między wartościami obserwowanymi a wartościami estymowanymi przez procedurę EM-AMMI). Wnioskiem z przeprowadzonych danych jest to, że algorytm EM-AMMI może być stosowany również w przypadkach nielosowych braków danych ale trzeba się wtedy liczyć z niewielką utratą dokładności estymacji. Zaobserwowano dużą stratę dokładności przy dopasowywaniu modelem EM-AMMI, który jest zbyt złożony, tj. zawiera zbyt wiele składowych głównych. Podsumowując, rozpatrywano właściwości analizy statystycznej na podstawie symulacji komputerowych i w oparciu o prawdziwe dane (dane pszenicy ozimej z doświadczeń porejestrowych w Polsce). Te właściwości metody EM-AMMI nie były wcześniej badane. W pracy przedstawiono w sposób graficzny diagnozę modeli opartą na statystyce Cross- Validation i statystyce RMSPD. == 9 ==
10 5. Constrained AMMI model: application to polish winter wheat post-registration data; and Paulo C. Rodrigues. Crop Science (2018) 58: (IF2017 czasopisma 1,635, punktacja MNISW ) Ograniczona analiza składowych głównych (C-PCA, constrained principal component analysis) opisuje dane z dwuwymiarowej tabela przy założeniu liniowej zależności parametrów składowych głównych od znanych dodatkowych parametrów (tj. macierzy objaśniających). W tym badaniu użyliśmy C-PCA do uogólnienia modelu AMMI i zaproponowania ograniczonego modelu AMMI (Constrained-AMMI). Ograniczony model AMMI był przedstawiony, gdy (i) tylko parametry składowych głównych dla środowisk miały macierz zmiennych objaśniających, (ii) tylko parametry składowych głównych dla genotypów miały macierz zmiennych objaśniających oraz (iii) oba typy parametrów miały macierze zmiennych objaśniających. Zmiennymi objaśniającymi dla danych o plonowaniu odmian pszenicy ozimej były: mrozoodporność, wysokość, wyleganie, czas do kłoszenia, dojrzałości woskowata i podatność na choroby. W środowiskach (zdefiniowanych jako 3-czynnikowe kombinacje miejscowości x poziomu agrotechniki x rok), zmiennymi objaśniającymi były: rok, współrzędne geograficzne miejscowości, klasyfikacja gleby, odczyn gleby, wielkość opadów (skumulowane opady określono dla czterech okresów: i) zima, ii) kwiecień i maj, iii) czerwiec, iv) lipiec i sierpień) oraz poziom agrotechniki. Opracowano model C-AMMI i porównano go ze standardowym modelem AMMI. Opis nowego modelu zawiera zarówno badania symulacyjne jak i analizy danych rzeczywistych. Procedura walidacji krzyżowej (Cross-Validation) została dostosowana do diagnozowania tej grupy modelów. Metoda L O O C V (Leave One Out Cross-Validation) wraz ze statystyką RMSPD (Root Mean Squares of Predictive Differences) została użyta w celu selekcji zmiennych objaśniających ze zbioru objaśniającego (zarówno dla zmiennych objaśniających środowiska jak i genotypy). Weryfikacja krzyżowa była również używana do porównywania modeli C(G) AMMI, C(E) AMMI i AMMI, każdy z nich z dwoma składowymi głównymi. Manuskrypt zawiera charakterystykę genotypów, środowisk w Polsce, nowe podejście do konstruowania megaśrodowisk (Mega Environments). Wśród zalet modelu C-AMMI można wymienić następujące: zrozumienie interakcji GE wydaje się być bardziej interesujące i użyteczne niż precyzyjne opisanie reakcji plonu genotypów na badane środowiska, ponieważ pozwala to przewidzieć wydajność w innych środowiskach opisanych tym układem == 10 ==
11 parametrów środowiskowych. W naszej aplikacji model C(GE) AMMI wyjaśniał nieco mniejszą zmienność (tj. sumę kwadratów) danych, ale zaobserwowano duży zysk pod względem możliwości interpretacji: parametry genotypowe i parametry środowiskowe mają znaczenie fizyczne i biologiczne, ponieważ zależą one od objaśniających je współzmiennych genotypowych i środowiskowych. Metoda C V i statystyka RMSPD pozwala na wybór liczby składowych głównych w modelu, co jest bardzo użyteczne przy ocenie przydatności zmiennych objaśniających. Opracowana analiza C AMMI może zostać zastosowana do oceny innych doświadczeń wielośrodowiskowych (multi-environments trias) z innymi roślinami uprawnymi i innym opisem warunków środowiskowych. Należy jednak zachować ostrożność przy wyborze zmiennych środowiskowych lub genotypowych. Jeśli użyte zostanie zbyt wiele zmiennych, analiza C-AMMI dąży do bycia zwykłą analizą AMMI, z ocenami parametrów genotypowych i/lub środowiskowych opisanymi za pomocą regresji liniowej. Z drugiej strony brak odpowiednich zmiennych objaśniających uniemożliwia odtworzenie rzeczywistego wzorca interakcji. Podsumowując, autorzy postawili sobie za cel opracowanie nowej analizy statystycznej. Opracowaną metodę zastosowano do opisu plonowania odmian pszenicy ozimej oraz do danych symulacyjnych. Analiza została połączona ze standardowymi typami wykresów, ale też zaprezentowano nowy typ wykresu składowych głównych. Podsumowanie powyższych prac: W pierwszych dwóch artykułach przedstawiono zastosowanie analizy AMMI do danych o większej liczby czynników niż dwa. W pierwszym artykule dane uśredniono przez trzeci czynnik (lata) za pomocą estymatorów BLUE, uzyskując kompletną klasyfikację dwukierunkową. W drugim artykule analizowano dane bez brakujących wartości traktując kombinację czynników opisujących warunki środowiskowe (miejscowość, poziom intensywności agrotechniki, rok) jako pojedynczy czynnik środowiskowy. W trzecim prezentowanym artykule napisałem kod komputerowy, który pozwala prowadzić obliczenia dla analizy statystycznej (EM-AMMI), ponieważ brakowało takiego oprogramowania. Analiza ta jest stosowana zamiast analizy AMMI gdy w zbiorze danych są brakujące informacje. Ponadto artykuł zawiera narzędzie do diagnozowania modeli metodą == 11 ==
12 Cross-Validation. Czwarty artykuł prezentuje badanie dotyczące właściwości proponowanej wcześniej procedury EM-AMMI. Piąta praca zawiera proponowaną przeze mnie modyfikację analizy AMMI, która może zwiększyć efektywność modelu AMMI. Opracowane procedury zostały zastosowane przeze mnie do oceny plonu odmian pszenicy ozimej. Prezentowane prace są przydatne dla osób, które chcą analizować interakcje genotypu ze środowiskiem, która występuje podczas serii doświadczeń wielo środowiskowych. Prace skupiały się na uprawach pszenicy, ale takie analizy można zastosować dla innych gatunków roślin rolniczych. Jestem pierwszym autorem we wszystkich prezentowanych artykułach i byłem głównym wykonawcą. Poprawki po recenzjach i odpowiedzi na recenzje były w 95% wykonany przeze mnie, również czuwałem nad ostateczną formą tekstu. Prezentowane materiały pokazują moje kompleksowe umiejętności w zakresie analizy statystycznej zbiorów danych agronomicznych. Inne osiągnięcia naukowe i badawcze Mój wkład koncentruje się głównie na analizie statystycznej agrotechnicznych lub ekologicznych zbiorów danych. Moją specjalnością jest adaptacja (gdy istnieje potrzeba modyfikacji) i zastosowanie metody rozkładu macierzy według wartości osobliwych (SVD, Singular Value Decomposition), która jest zasadniczym elementem modelu AMMI lub GGE. Dlatego bywałem zapraszany do współpracy w takich właśnie przypadkach. 1. Mastalerczuk G., Borawska-Jarmułowicz B., Kalaji H.M., Dąbrowski P., Paderewski J Gas-exchange parameters and morphological features of festulolium (Festulolium braunii K. Richert A. Camus) in response to nitrogen dosage. Photosynthetica, 55, 1, (IF2017=1,740, MNISW2017=25) Opracowałem analizę cech morfologicznych festulolium w odpowiedzi na dawkowanie azotu analizowałem według analizy GGE dostosowanej do projektu 3-czynnikowego. Podobny problem został opracowany przeze mnie także w następujących artykułach: 2. Javed S., Rauf S., Paderewski J., Malinowski D.P., Saleem U., Shahzad M Evaluation of Egyptian clover (Trifolium alexandrinum L.) germplasm through redundancy analysis for forage yield and its components. Crop Science, 56 (3), (IF2016=1,629, MNISW2016=30) == 12 ==
13 3. Hussain M.M., Rauf S., Paderewski J., ul Haq I., Sienkiewicz-Paderewska D., Monneveux P Multitraits evaluation of Pakistani ecotypes of berseem clover (Trifolium alexandrinum L.) under full-irrigation and water restriction conditions. Journal of Applied Botany and Food Quality, 88, (IF2015=1,085, MNISW2015=20) 4. Hussain M.M., Kausar M., Rauf S., Farukh Zafar Khan M., Paderewski J., Khan M., ul Haq I., Raza A.B.M Selection for some functional markers for adaptability of Helianthus argophyllus Helianthus annuus derived population under abiotic stress conditions. Helia 2018, 41(68), (SJR2018=0,427, MNISW2016=5) Przy czym, w ostatnim artykule zastosowałem połączenie analizy SVD z analizą skupień, a ponadto obliczyłem statystykę LOD (statystyka charakterystyczna dla analizy materiału genetycznego). Zastosowanie procedury SVD (z opracowanymi dodatkowymi elementami) zostało wykonane przeze mnie w następujących artykułach: 5. Sienkiewicz-Paderewska D., Paderewski J Możliwość zastosowania metody GGE biplot do oceny stanu i identyfikacji zagrożeń zespołu Alopecuretum pratensis opisanego na terenie Parku Krajobrazowego Podlaski Przełom Bugu. Woda-Środowisko-Obszary Wiejskie, 11 (3), (MNISW2011=6) 6. Sienkiewicz-Paderewska D., Paderewski J Habitat preferences of plant associations from Molinio-Arrhenatheretea class described in the 'The Bug Ravine Landscape Park' by GGE biplot analysis. Grassland Science in Europe, 17, (MNISW2012=10) 7. Sienkiewicz-Paderewska D., Paderewski J Habitat preferences of plant communities: new approach based on the GGE biplot analysis. Polish Journal of Ecology, 63, (3), (IF2015=0,500, MNISW2015=15) 8. Sienkiewicz-Paderewska D., Narewska S., Narewski D., Olszewski T., Paderewski J Floristic diversity and utilization value of the semi-natural grassland in the lower section of the Bug River Valley. (in English) Łąkarstwo w Polsce (Grassland Science in Poland), 20, (MNISW2017=7) Zastosowanie modelu AMMI do analizy plonu wielośrodowiskowego wykonałem również (t.j. poza artykułami przedstawionymi jako główne osiągnięcia postępowania habilitacyjnego) w następujących pracach. W większości z nich należało rozważyć więcej niż == 13 ==
14 dwa czynniki, podczas gdy metoda SVD (i w konsekwencji AMMI) została opracowana do analizy doświadczeń dwuczynnikowych. 9. Mądry W., Derejko A., Studnicki M., Paderewski J., Gacek E Response of winter wheat cultivars to crop management and environment in post-registration trials. Czech Journal of Genetics and Plant Breeding, 53 (2), (IF2017=0,467, MNISW2017=20) 10. Mądry W., Paderewski J., Gozdowski D., Rozbicki J., Golba J., Piechociński M., Studnicki M., Derejko A Adaptation of winter wheat cultivars to crop managements and Polish agricultural environments. Turkish Journal of Field Crops, 18 (1), (IF2013=0,641, MNISW2013=20) 11. Mądry W., Gacek E, Paderewski J., Gozdowski D., Drzazga T Adaptive yield response of winter wheat cultivars across environments in Poland using combined AMMI and cluster analyses. International Journal of Plant Production, 5 (3), (IF2011=1,100, MNISW2011=13) 12. Mądry W., Paderewski J., Rozbicki J., Gozdowski D., Golba J., Piechociński M., Studnicki M., Derejko A Plonowanie odmian pszenicy ozimej w różnych środowiskach - jednoroczna seria PDOiR. Biuletyn Instytutu Hodowli i Aklimatyzacji Roślin, 263, (MNISW2012=4) 13. Paderewski J., Mądry W Zastosowania modelu AMMI do analizy reakcji odmian na środowiska. Biuletyn Instytutu Hodowli i Aklimatyzacji Roślin, 263, (MNISW2012=4) 14. Paderewski J., Mądry W., Rozbicki J Yielding of old and modern Polish wheat cultivars under different nitrogen inputs as assessed by combined using AMMI and cluster analyses. Plant Breeding and Seed Science, 62, (MNISW2010=6) 15. Drzazga T., Paderewski J., Mądry W., Krajewski P Ocena rodzajów reakcji plonowania odmian pszenicy ozimej w doświadczeniach PDO na przestrzennie zmienne warunki przyrodnicze w kraju. Biuletyn Instytutu Hodowli i Aklimatyzacji Roślin, 253, (MNISW2010=6) 16. Paderewski J., Mądry W., Pilarczyk W., Drzazga T Retrospektywne badanie reakcji plonu odmian pszenicy ozimej na warunki środowiskowe w miejscowościach za pomocą łącznej analizy AMMI i skupień : ocena postępu genetycznego w plonowaniu. Biuletyn Instytutu Hodowli i Aklimatyzacji Roślin, 250, (MNISW2010=6) == 14 ==
15 17. Mądry W., Paderewski J., Drzazga T Ocena reakcji plonu ziarna rodów hodowlanych pszenicy ozimej na zmienne warunki środowiskowe za pomocą analizy AMMI. Fragmenta Agronomica,23 (4), (MNISW2010=6) 18. Paderewski J., Mądry W Addytywno-multiplikatywny model AMMI do statystycznej analizy danych z serii doświadczeń genotypowych. Colloquium Biometryczne, 36, (MNISW2010=6) Pierwszym artykułem naukowym, w którym miałem wkład związany z analizą SVD jest publikacja napisana w 2004 roku, w której współpracowałem przy opisie teorii i znaczenia analizy PCA, wykorzystanej w tym artykule do charakterystyki zmienności genetycznej. 19. Sieczko L., Mądry W., Zieliński A., Paderewski J., Urbaś-Szwed K Zastosowanie analizy składowych głównych w badaniach nad wielocechową charakterystyką zmienności genetycznej w kolekcji zasobów genowych pszenicy ozimej (Triticulum durum L.). Colloquium Biometryczne, (MNISW2010=6) Artykuły, w których wybrałem i wykonałem inne techniki statystyczne: 20. Studnicki M., Paderewski J., Piepho H.P., Wójcik-Gront E Prediction accuracy and consistency in cultivar ranking for factor-analytic linear mixed models for winter wheat multienvironmental trials. Crop Science, 57 (5), (IF2017=1,635, MNISW2017=35) Zaadaptowałem statystykę MSEP do projektu eksperymentu z tylko dwoma powtórzeniami. Napisałem program w języku R i wykonałem porównanie modeli za pomocą analizy MSEP. 21. Kozak M., Paderewski J., Zieliński A Numerical problems connected with accuracy of variance estimation. Model Assisted Statistics and Applications, 1 (3), (SJR2006=0,101, MNISW2010=7) Przekształciłem formuły dla estymatora wariancji dla populacji skończonej. Ta metoda drastycznie zmniejszyła czas obliczeń w stosunku do oryginalnych wzorów. Napisałem algorytm R i miałem udział w jego opisaniu. 22. Paderewski J., Sienkiewicz-Paderewska D Multidimensional scaling for describing the risks for grasslands ecosystems located in the Polish Landscape Parks. Grassland Science in Europe, 15, (MNISW2010=5) Zastosowałem analizę NMDS (non metric multidimensional saling analysis) niemetryczne wielowymiarowe skalowanie z 2-wymiarowym wykresem do analizy zagrożeń == 15 ==
16 występujących dla ekosystemów łąkowych na podstawie ankiet wypełnianych przez dyrekcje Parków Krajobrazowych. 23. Sienkiewicz-Paderewska D., Narewska S., Narewski D., Olszewski T., Paderewski J Ecological and syntaxonomical spectra of grass species of the grassland communities occurring in in the lower section of the Bug River Valley. (in English) Łąkarstwo w Polsce (Grassland Science in Poland), 20, (MNISW2017=7) Obliczyłem wybrane miary ekologiczne (technika statystyki opisowej). Zaprojektowałem i wykonałem wykresy w celu zobrazowania wyników. Prace, w których miałem mniejszy udział, polegający głównie na konsultacjach i pisaniu małych fragmentów tekstu: 24. Kozak M., Bakinowska E., Paderewski J Polish agricultural universities students graphical perception. Model Assisted Statistics and, 4 (4), (SJR2009=0,179, MNISW2010=7) Warszawa miejscowość podpis == 16 ==
Metody statystyczne wykorzystywane do oceny zróżnicowania kolekcji genowych roślin. Henryk Bujak
Metody statystyczne wykorzystywane do oceny zróżnicowania kolekcji genowych roślin Henryk Bujak e-mail: h.bujak@ihar.edu.pl Ocena różnorodności fenotypowej Różnorodność fenotypowa kolekcji roślinnych zasobów
Interakcja odmian pszenicy ozimej w zmiennych warunkach środowiskowych na podstawie wyników badań ankietowych
NR 235 BIULETYN INSTYTUTU HODOWLI I AKLIMATYZACJI ROŚLIN 2005 TADEUSZ OLEKSIAK DARIUSZ R. MAŃKOWSKI Pracownia Ekonomiki Nasiennictwa i Hodowli Roślin Zakład Nasiennictwa i Nasionoznawstwa Instytut Hodowli
METODY CHEMOMETRYCZNE W IDENTYFIKACJI ŹRÓDEŁ POCHODZENIA
METODY CHEMOMETRYCZNE W IDENTYFIKACJI ŹRÓDEŁ POCHODZENIA AMFETAMINY Waldemar S. Krawczyk Centralne Laboratorium Kryminalistyczne Komendy Głównej Policji, Warszawa (praca obroniona na Wydziale Chemii Uniwersytetu
Analiza korespondencji
Analiza korespondencji Kiedy stosujemy? 2 W wielu badaniach mamy do czynienia ze zmiennymi jakościowymi (nominalne i porządkowe) typu np.: płeć, wykształcenie, status palenia. Punktem wyjścia do analizy
Tab.1 Powierzchnia i liczba ankietowanych pól
Monitoring wpływu stosowania kwalifikowanego materiału siewnego roślin zbożowych i okopowych na produkcję roślinną metodyka i wyniki. Materiał Materiał źródłowy stanowią wyniki badań ankietowych gospodarstw
1.7. Eksploracja danych: pogłębianie, przeszukiwanie i wyławianie
Wykaz tabel Wykaz rysunków Przedmowa 1. Wprowadzenie 1.1. Wprowadzenie do eksploracji danych 1.2. Natura zbiorów danych 1.3. Rodzaje struktur: modele i wzorce 1.4. Zadania eksploracji danych 1.5. Komponenty
ZASTOSOWANIE TECHNIK CHEMOMETRYCZNYCH W BADANIACH ŚRODOWISKA. dr inż. Aleksander Astel
ZASTOSOWANIE TECHNIK CHEMOMETRYCZNYCH W BADANIACH ŚRODOWISKA dr inż. Aleksander Astel Gdańsk, 22.12.2004 CHEMOMETRIA dziedzina nauki i techniki zajmująca się wydobywaniem użytecznej informacji z wielowymiarowych
Propensity Score Matching
Zajęcia 2 Plan dzisiejszych zajęć 1 Doświadczenia Idealne doświadczenie Nie-idealne doświadczenia 2 Idealne doświadczenie Nie-idealne doświadczenia Plan idealnego doświadczenia (eksperymentu) Plan doświadczenia
STATYSTYKA I DOŚWIADCZALNICTWO Wykład 5
STATYSTYKA I DOŚWIADCZALNICTWO Wykład 5 Jednoczynnikowa analiza wariancji i porównania wielokrotne (układ losowanych bloków randomized block design RBD) Układ losowanych bloków Stosujemy, gdy podejrzewamy,
METODY STATYSTYCZNE W BIOLOGII
METODY STATYSTYCZNE W BIOLOGII 1. Wykład wstępny 2. Populacje i próby danych 3. Testowanie hipotez i estymacja parametrów 4. Planowanie eksperymentów biologicznych 5. Najczęściej wykorzystywane testy statystyczne
Elementy statystyki wielowymiarowej
Wnioskowanie_Statystyczne_-_wykład Spis treści 1 Elementy statystyki wielowymiarowej 1.1 Kowariancja i współczynnik korelacji 1.2 Macierz kowariancji 1.3 Dwumianowy rozkład normalny 1.4 Analiza składowych
Ocena rodzajów reakcji plonowania odmian pszenicy ozimej w doświadczeniach PDO na przestrzennie zmienne warunki przyrodnicze w kraju
NR 253 BIULETYN INSTYTUTU HODOWLI I AKLIMATYZACJI ROŚLIN 2009 TADEUSZ DRZAZGA 1 JAKUB PADEREWSKI 2 WIESŁAW MĄDRY 2 PAWEŁ KRAJEWSKI 3 1 Hodowla Roślin Rolniczych Nasiona Kobierzyc 2 Katedra Doświadczalnictwa
Analiza składowych głównych. Wprowadzenie
Wprowadzenie jest techniką redukcji wymiaru. Składowe główne zostały po raz pierwszy zaproponowane przez Pearsona(1901), a następnie rozwinięte przez Hotellinga (1933). jest zaliczana do systemów uczących
Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski
Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski Książka jest nowoczesnym podręcznikiem przeznaczonym dla studentów uczelni i wydziałów ekonomicznych. Wykład podzielono na cztery części. W pierwszej
1. Jednoczynnikowa analiza wariancji 2. Porównania szczegółowe
Zjazd 7. SGGW, dn. 28.11.10 r. Matematyka i statystyka matematyczna Tematy 1. Jednoczynnikowa analiza wariancji 2. Porównania szczegółowe nna Rajfura 1 Zagadnienia Przykład porównania wielu obiektów w
STATYSTYKA I DOŚWIADCZALNICTWO Wykład 4
STATYSTYKA I DOŚWIADCZALNICTWO Wykład 4 Inne układy doświadczalne 1) Układ losowanych bloków Stosujemy, gdy podejrzewamy, że może występować systematyczna zmienność między powtórzeniami np. - zmienność
Ekonometria. Wprowadzenie do modelowania ekonometrycznego Estymator KMNK. Jakub Mućk. Katedra Ekonomii Ilościowej
Ekonometria Wprowadzenie do modelowania ekonometrycznego Estymator Jakub Mućk Katedra Ekonomii Ilościowej Jakub Mućk Ekonometria Wykład 1 Estymator 1 / 16 Agenda 1 Literatura Zaliczenie przedmiotu 2 Model
SYSTEMY UCZĄCE SIĘ WYKŁAD 10. PRZEKSZTAŁCANIE ATRYBUTÓW. Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska.
SYSTEMY UCZĄCE SIĘ WYKŁAD 10. PRZEKSZTAŁCANIE ATRYBUTÓW Częstochowa 2014 Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska INFORMACJE WSTĘPNE Hipotezy do uczenia się lub tworzenia
Porównanie błędu predykcji dla różnych metod estymacji współczynników w modelu liniowym, scenariusz p bliskie lub większe od n
Porównanie błędu predykcji dla różnych metod estymacji współczynników w modelu iowym, scenariusz p bliskie lub większe od n Przemyslaw.Biecek@gmail.com, MIM Uniwersytet Warszawski Plan prezentacji: 1 Motywacja;
Modelowanie jako sposób opisu rzeczywistości. Katedra Mikroelektroniki i Technik Informatycznych Politechnika Łódzka
Modelowanie jako sposób opisu rzeczywistości Katedra Mikroelektroniki i Technik Informatycznych Politechnika Łódzka 2015 Wprowadzenie: Modelowanie i symulacja PROBLEM: Podstawowy problem z opisem otaczającej
Ocena stabilności plonowania odmian pszenicy ozimej na podstawie doświadczeń porejestrowych w Polsce
NR 260/261 BIULETYN INSTYTUTU HODOWLI I AKLIMATYZACJI ROŚLIN 2011 HENRYK BUJAK 1 GWIDON TRATWAL 2 1 Uniwersytet Przyrodniczy we Wrocławiu, Katedra Genetyki, Hodowli Roślin i Nasiennictwa 2 Stacja Doświadczalna
PRZEWODNIK PO DOBREJ PRAKTYCE EKSPERYMENTALNEJ. Maria Kozłowska
PRZEWODNIK PO DOBREJ PRAKTYCE EKSPERYMENTALNEJ Maria Kozłowska Poznań 2014 Przewodnik po dobrej praktyce eksperymentalnej Recenzent: prof. dr hab. Stanisław Franciszek Mejza Copyright by M. Kozłowska Copyright
Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar... 1. Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16
Spis treści Przedmowa.......................... XI Rozdział 1. Pomiar: jednostki miar................. 1 1.1. Wielkości fizyczne i pozafizyczne.................. 1 1.2. Spójne układy miar. Układ SI i jego
Hierarchiczna analiza skupień
Hierarchiczna analiza skupień Cel analizy Analiza skupień ma na celu wykrycie w zbiorze obserwacji klastrów, czyli rozłącznych podzbiorów obserwacji, wewnątrz których obserwacje są sobie w jakimś określonym
Skuteczność oceny plonowania na podstawie doświadczeń polowych z rzepakiem ozimym o różnej liczbie powtórzeń
TOM XXXIII ROŚLINY OLEISTE OILSEED CROPS 2012 Maria Ogrodowczyk Instytut Hodowli i Aklimatyzacji Roślin Państwowy Instytut Badawczy, Oddział w Poznaniu Adres do korespondencji: mogrod@nico.ihar.poznan.pl
ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH
1 ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH WFAiS UJ, Informatyka Stosowana II stopień studiów 2 Wnioskowanie statystyczne dla zmiennych numerycznych Porównywanie dwóch średnich Boot-strapping Analiza
Próba oceny technologii uprawy pszenicy ozimej na podstawie danych ankietowych gospodarstw indywidualnych Część II. Ocena technologii uprawy
NR 244 BIULETYN INSTYTUTU HODOWLI I AKLIMATYZACJI ROŚLIN 2007 ZBIGNIEW LAUDAŃSKI 1, 2 DARIUSZ R. MAŃKOWSKI 1 LESZEK SIECZKO 2 1 Pracownia Ekonomiki Nasiennictwa i Hodowli Roślin Zakład Nasiennictwa i Nasionoznawstwa,
STATYSTYKA MATEMATYCZNA
STATYSTYKA MATEMATYCZNA 1. Wykład wstępny. Teoria prawdopodobieństwa i elementy kombinatoryki 2. Zmienne losowe i ich rozkłady 3. Populacje i próby danych, estymacja parametrów 4. Testowanie hipotez 5.
Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część
Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część populacji, którą podaje się badaniu statystycznemu
JEDNOCZYNNIKOWA ANALIZA WARIANCJI, ANOVA 1
Powtórzenie: ANOVA 1 JEDNOCZYNNIKOWA ANALIZA WARIANCJI, ANOVA 1 Obserwowana (badana) cecha Y Czynnik wpływający na Y (badany) A A i i ty poziom czynnika A (i=1..a), n i liczba powtórzeń w i tej populacji
Szacowanie wartości hodowlanej. Zarządzanie populacjami
Szacowanie wartości hodowlanej Zarządzanie populacjami wartość hodowlana = wartość cechy? Tak! Przy h 2 =1 ? wybitny ojciec = wybitne dzieci Tak, gdy cecha wysokoodziedziczalna. Wartość hodowlana genetycznie
Statystyczna analiza danych w programie STATISTICA 7.1 PL (wykład 3) Dariusz Gozdowski
Statystyczna analiza danych w programie STATISTICA 7.1 PL (wykład 3) Dariusz Gozdowski Katedra Doświadczalnictwa i Bioinformatyki Wydział Rolnictwa i Biologii SGGW Dwuczynnikowa analiza wariancji (2-way
Ocena interakcji genotypu i środowiska w doświadczeniu proweniencyjno - rodowym z sosną zwyczajną IBL Jan Kowalczyk IBL
Ocena interakcji genotypu i środowiska w doświadczeniu proweniencyjno - rodowym z sosną zwyczajną IBL 2004 Jan Kowalczyk IBL Interakcja GxE Zachodzi wtedy gdy reakcja genotypów jest różna w różnych środowiskach
NOWOŚCI W STATISTICA WSPIERAJĄCE PLANOWANIE BADAŃ I ANALIZĘ ICH WYNIKÓW W NAUKACH PRZYRODNICZYCH
NOWOŚCI W STATISTICA WSPIERAJĄCE PLANOWANIE BADAŃ I ANALIZĘ ICH WYNIKÓW W NAUKACH PRZYRODNICZYCH Dariusz R. Mańkowski, Instytut Hodowli i Aklimatyzacji Roślin PIB, Radzików; Paweł Januszewski, StatSoft
Ocena stabilności plonowania wybranych odmian pszenicy ozimej na podstawie wyników badań ankietowych z lat
NR 228 BIULETYN INSTYTUTU HODOWLI I AKLIMATYZACJI ROŚLIN 2003 TADEUSZ OLEKSIAK DARIUSZ R. MAŃKOWSKI Pracownia Ekonomiki Nasiennictwa i Hodowli Roślin Zakład Nasiennictwa i Nasionoznawstwa Instytut Hodowli
Matematyka i statystyka matematyczna dla rolników w SGGW
Było: Testowanie hipotez (ogólnie): stawiamy hipotezę, wybieramy funkcję testową f (test statystyczny), przyjmujemy poziom istotności α; tym samym wyznaczamy obszar krytyczny testu (wartość krytyczną funkcji
Zmienne zależne i niezależne
Analiza kanoniczna Motywacja (1) 2 Często w badaniach spotykamy problemy badawcze, w których szukamy zakresu i kierunku zależności pomiędzy zbiorami zmiennych: { X i Jak oceniać takie 1, X 2,..., X p }
INFORMATYKA W SELEKCJI
INFORMATYKA W SELEKCJI INFORMATYKA W SELEKCJI - zagadnienia 1. Dane w pracy hodowlanej praca z dużym zbiorem danych (Excel) 2. Podstawy pracy z relacyjną bazą danych w programie MS Access 3. Systemy statystyczne
Statystyczna analiza danych w programie STATISTICA (wykład 2) Dariusz Gozdowski
Statystyczna analiza danych w programie STATISTICA (wykład ) Dariusz Gozdowski Katedra Doświadczalnictwa i Bioinformatyki Wydział Rolnictwa i Biologii SGGW Weryfikacja (testowanie) hipotez statystycznych
Mikroekonometria 3. Mikołaj Czajkowski Wiktor Budziński
Mikroekonometria 3 Mikołaj Czajkowski Wiktor Budziński Zadanie 1. Wykorzystując dane me.hedonic.dta przygotuj model oszacowujący wartość kosztów zewnętrznych rolnictwa 1. Przeprowadź regresję objaśniającą
Sposoby prezentacji problemów w statystyce
S t r o n a 1 Dr Anna Rybak Instytut Informatyki Uniwersytet w Białymstoku Sposoby prezentacji problemów w statystyce Wprowadzenie W artykule zostaną zaprezentowane podstawowe zagadnienia z zakresu statystyki
Wykład 2: Tworzenie danych
Wykład 2: Tworzenie danych Plan: Statystyka opisowa a wnioskowanie statystyczne Badania obserwacyjne a eksperyment Planowanie eksperymentu, randomizacja Próbkowanie z populacji Rozkłady próbkowe Wstępna/opisowa
A N N A L E S U N I V E R S I T A T I S M A R I A E C U R I E - S K Ł O D O W S K A L U B L I N P O L O N I A
A N N A L E S U N I V E R S I T A T I S M A R I A E C U R I E - S K Ł O D O W S K A L U B L I N P O L O N I A VOL. LXVII (3) SECTIO E 2012 1 Katedra Genetyki, Hodowli Roślin i Nasiennictwa, Uniwersytet
Dopasowywanie modelu do danych
Tematyka wykładu dopasowanie modelu trendu do danych; wybrane rodzaje modeli trendu i ich właściwości; dopasowanie modeli do danych za pomocą narzędzi wykresów liniowych (wykresów rozrzutu) programu STATISTICA;
Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.
Wnioskowanie statystyczne obejmujące metody pozwalające na uogólnianie wyników z próby na nieznane wartości parametrów oraz szacowanie błędów tego uogólnienia. Przewidujemy nieznaną wartości parametru
KARTA KURSU. Kod Punktacja ECTS* 1
KARTA KURSU Nazwa Nazwa w j. ang. Wprowadzenie do statystyki Introduction to statistics Kod Punktacja ECTS* 1 Koordynator Prof. dr hab. Jerzy Wołek Zespół dydaktyczny Prof. dr hab. Jerzy Wołek doktoranci
PRZEWODNIK PO PRZEDMIOCIE
Nazwa przedmiotu: PROGNOZOWANIE Z WYKORZYSTANIEM SYSTEMÓW INFORMATYCZNYCH Kierunek: Informatyka Rodzaj przedmiotu: obowiązkowy w ramach treści kierunkowych Rodzaj zajęć: wykład, laboratorium I KARTA PRZEDMIOTU
REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ MODEL REGRESJI WIELORAKIEJ. Analiza regresji i korelacji
Statystyka i opracowanie danych Ćwiczenia 5 Izabela Olejarczyk - Wożeńska AGH, WIMiIP, KISIM REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ MODEL REGRESJI WIELORAKIEJ MODEL REGRESJI LINIOWEJ Analiza regresji
LABORATORIUM Z FIZYKI
LABORATORIUM Z FIZYKI LABORATORIUM Z FIZYKI I PRACOWNIA FIZYCZNA C w Gliwicach Gliwice, ul. Konarskiego 22, pokoje 52-54 Regulamin pracowni i organizacja zajęć Sprawozdanie (strona tytułowa, karta pomiarowa)
Ekonometria. Prognozowanie ekonometryczne, ocena stabilności oszacowań parametrów strukturalnych. Jakub Mućk. Katedra Ekonomii Ilościowej
Ekonometria Prognozowanie ekonometryczne, ocena stabilności oszacowań parametrów strukturalnych Jakub Mućk Katedra Ekonomii Ilościowej Jakub Mućk Ekonometria Wykład 4 Prognozowanie, stabilność 1 / 17 Agenda
NR 240/241 BIULETYN INSTYTUTU HODOWLI I AKLIMATYZACJI ROŚLIN 2006
NR 240/241 BIULETYN INSTYTUTU HODOWLI I AKLIMATYZACJI ROŚLIN 2006 PAWEŁ JANKOWSKI ANDRZEJ ZIELIŃSKI WIESŁAW MĄDRY Katedra Biometrii, Szkoła Główna Gospodarstwa Wiejskiego w Warszawie Analiza interakcji
Analiza składowych głównych
Analiza składowych głównych Wprowadzenie (1) W przypadku regresji naszym celem jest predykcja wartości zmiennej wyjściowej za pomocą zmiennych wejściowych, wykrycie związku między wielkościami wejściowymi
Elementy modelowania matematycznego
Elementy modelowania matematycznego Modelowanie algorytmów klasyfikujących. Podejście probabilistyczne. Naiwny klasyfikator bayesowski. Modelowanie danych metodą najbliższych sąsiadów. Jakub Wróblewski
Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1.
tel. 44 683 1 55 tel. kom. 64 566 811 e-mail: biuro@wszechwiedza.pl Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: gdzie: y t X t y t = 1 X 1
Plonowanie odmian żyta ozimego uprawianych na dwóch poziomach intensywności agrotechniki w warunkach Dolnego Śląska
NR 265 BIULETYN INSTYTUTU HODOWLI I AKLIMATYZACJI ROŚLIN 2012 ANDRZEJ LATUSEK HENRYK BUJAK Katedra Genetyki, Hodowli Roślin i Nasiennictwa Uniwersytet Przyrodniczy we Wrocławiu Plonowanie odmian żyta ozimego
5. WNIOSKOWANIE PSYCHOMETRYCZNE
5. WNIOSKOWANIE PSYCHOMETRYCZNE Model klasyczny Gulliksena Wynik otrzymany i prawdziwy Błąd pomiaru Rzetelność pomiaru testem Standardowy błąd pomiaru Błąd estymacji wyniku prawdziwego Teoria Odpowiadania
K wartość kapitału zaangażowanego w proces produkcji, w tys. jp.
Sprawdzian 2. Zadanie 1. Za pomocą KMNK oszacowano następującą funkcję produkcji: Gdzie: P wartość produkcji, w tys. jp (jednostek pieniężnych) K wartość kapitału zaangażowanego w proces produkcji, w tys.
Statystyka i Analiza Danych
Warsztaty Statystyka i Analiza Danych Gdańsk, 20-22 lutego 2014 Zastosowania analizy wariancji w opracowywaniu wyników badań empirycznych Janusz Wątroba StatSoft Polska Centrum Zastosowań Matematyki -
Analiza głównych składowych- redukcja wymiaru, wykł. 12
Analiza głównych składowych- redukcja wymiaru, wykł. 12 Joanna Jędrzejowicz Instytut Informatyki Konieczność redukcji wymiaru w eksploracji danych bazy danych spotykane w zadaniach eksploracji danych mają
Ocena zmienności i współzależności cech rodów pszenicy ozimej twardej Komunikat
NR 249 BIULETYN INSTYTUTU HODOWLI I AKLIMATYZACJI ROŚLIN 2008 WŁADYSŁAW KADŁUBIEC 1 RAFAŁ KURIATA 1 JAROSŁAW BOJARCZUK 2 1 Katedra Genetyki, Hodowli Roślin i Nasiennictwa Uniwersytetu Przyrodniczego we
STATYSTYKA OD PODSTAW Z SYSTEMEM SAS. wersja 9.2 i 9.3. Szkoła Główna Handlowa w Warszawie
STATYSTYKA OD PODSTAW Z SYSTEMEM SAS wersja 9.2 i 9.3 Szkoła Główna Handlowa w Warszawie Spis treści Wprowadzenie... 6 1. Podstawowe informacje o systemie SAS... 9 1.1. Informacje ogólne... 9 1.2. Analityka...
STATYSTYKA I DOŚWIADCZALNICTWO Wykład 6
STATYSTYKA I DOŚWIADCZALNICTWO Wykład 6 Metody sprawdzania założeń w analizie wariancji: -Sprawdzanie równości (jednorodności) wariancji testy: - Cochrana - Hartleya - Bartletta -Sprawdzanie zgodności
Regresja wielokrotna jest metodą statystyczną, w której oceniamy wpływ wielu zmiennych niezależnych (X1, X2, X3,...) na zmienną zależną (Y).
Statystyka i opracowanie danych Ćwiczenia 12 Izabela Olejarczyk - Wożeńska AGH, WIMiIP, KISIM REGRESJA WIELORAKA Regresja wielokrotna jest metodą statystyczną, w której oceniamy wpływ wielu zmiennych niezależnych
Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.
Wnioskowanie statystyczne obejmujące metody pozwalające na uogólnianie wyników z próby na nieznane wartości parametrów oraz szacowanie błędów tego uogólnienia. Przewidujemy nieznaną wartości parametru
Wielowymiarowe metody statystyczne w badaniach cech morfologicznych żyta ozimego
Wielowymiarowe metody statystyczne w badaniach cech morfologicznych żyta ozimego Helena Kubicka-Matusiewicz 1, Agnieszka Pyza 1, Leszek Sieczko 2 1) Polska Akademia Nauk, Ogród Botaniczny - Centrum Zachowania
Analiza wariancji - ANOVA
Analiza wariancji - ANOVA Analiza wariancji jest metodą pozwalającą na podział zmienności zaobserwowanej wśród wyników eksperymentalnych na oddzielne części. Każdą z tych części możemy przypisać oddzielnemu
Budowa sztucznych sieci neuronowych do prognozowania. Przykład jednostek uczestnictwa otwartego funduszu inwestycyjnego
Budowa sztucznych sieci neuronowych do prognozowania. Przykład jednostek uczestnictwa otwartego funduszu inwestycyjnego Dorota Witkowska Szkoła Główna Gospodarstwa Wiejskiego w Warszawie Wprowadzenie Sztuczne
Sterowanie wielkością zamówienia w Excelu - cz. 3
Sterowanie wielkością zamówienia w Excelu - cz. 3 21.06.2005 r. 4. Planowanie eksperymentów symulacyjnych Podczas tego etapu ważne jest określenie typu rozkładu badanej charakterystyki. Dzięki tej informacji
weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja)
PODSTAWY STATYSTYKI. Teoria prawdopodobieństwa i elementy kombinatoryki. Zmienne losowe i ich rozkłady 3. Populacje i próby danych, estymacja parametrów 4. Testowanie hipotez 5. Testy parametryczne (na
INSTYTUT METEOROLOGII I GOSPODARKI WODNEJ PAŃSTWOWY INSTYTUT BADAWCZY Oddział we Wrocławiu. Görlitz
Görlitz 17.11.2014 Pakiet programów MIKE opracowany na Politechnice Duńskiej, zmodyfikowany przez Duński Instytut Hydrauliki, Zasady działania modeli: MIKE NAM - model konceptualny o parametrach skupionych,
Stosowana Analiza Regresji
Stosowana Analiza Regresji Wykład VIII 30 Listopada 2011 1 / 18 gdzie: X : n p Q : n n R : n p Zał.: n p. X = QR, - macierz eksperymentu, - ortogonalna, - ma zera poniżej głównej diagonali. [ R1 X = Q
Zastosowania modelu AMMI do analizy reakcji odmian na środowiska
NR 263 BIULETYN INSTYTUTU HODOWLI I AKLIMATYZACJI ROŚLIN 2012 JAKUB PADEREWSKI WIESŁAW MĄDRY Katedra Doświadczalnictwa i Bioinformatyki, SGGW, Warszawa Zastosowania modelu AMMI do analizy reakcji odmian
Porównanie generatorów liczb losowych wykorzystywanych w arkuszach kalkulacyjnych
dr Piotr Sulewski POMORSKA AKADEMIA PEDAGOGICZNA W SŁUPSKU KATEDRA INFORMATYKI I STATYSTYKI Porównanie generatorów liczb losowych wykorzystywanych w arkuszach kalkulacyjnych Wprowadzenie Obecnie bardzo
W POSZUKIWANIU ODMIAN O SZEROKIEJ ADAPTACJI DO ŚRODOWISKA, NA PRZYKŁADZIE PSZENICY JAREJ
W POSZUKIWANIU ODMIAN O SZEROKIEJ ADAPTACJI DO ŚRODOWISKA, NA PRZYKŁADZIE PSZENICY JAREJ Magdalena Wijata, Grzegorz Sobczyński, Marcin Studnicki, Dariusz Gozdowski, Stanisław Samborski, Jan Rozbicki Katedra
parametrów strukturalnych modelu = Y zmienna objaśniana, X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających,
诲 瞴瞶 瞶 ƭ0 ƭ 瞰 parametrów strukturalnych modelu Y zmienna objaśniana, = + + + + + X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających, α 0, α 1, α 2,,α k parametry strukturalne modelu, k+1 parametrów
Wykład Centralne twierdzenie graniczne. Statystyka matematyczna: Estymacja parametrów rozkładu
Wykład 11-12 Centralne twierdzenie graniczne Statystyka matematyczna: Estymacja parametrów rozkładu Centralne twierdzenie graniczne (CTG) (Central Limit Theorem - CLT) Centralne twierdzenie graniczne (Lindenberga-Levy'ego)
Znaczenie interakcji genotypowo-środowiskowej na plonowanie i cechy składowe plonu u wybranych gatunków zbóż ozimych
NR 253 BIULETYN INSTYTUTU HODOWLI I AKLIMATYZACJI ROŚLIN 2009 PAWEŁ DOPIERAŁA 1 LESZEK KORDAS 2 1 KWS LOCHOW POLSKA Sp. z o.o. 2 Katedra Kształtowania Agroekosystemów, Uniwersytet Przyrodniczy we Wrocławiu
Komputerowa Analiza Danych Doświadczalnych
Komputerowa Analiza Danych Doświadczalnych Prowadząca: dr inż. Hanna Zbroszczyk e-mail: gos@if.pw.edu.pl tel: +48 22 234 58 51 konsultacje: poniedziałek, 10-11, środa: 11-12 www: http://www.if.pw.edu.pl/~gos/students/kadd
KORELACJE I REGRESJA LINIOWA
KORELACJE I REGRESJA LINIOWA Korelacje i regresja liniowa Analiza korelacji: Badanie, czy pomiędzy dwoma zmiennymi istnieje zależność Obie analizy się wzajemnie przeplatają Analiza regresji: Opisanie modelem
Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl
Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyczna teoria korelacji i regresji (1) Jest to dział statystyki zajmujący
Badanie zależności skala nominalna
Badanie zależności skala nominalna I. Jak kształtuje się zależność miedzy płcią a wykształceniem? II. Jak kształtuje się zależność między płcią a otyłością (opis BMI)? III. Jak kształtuje się zależność
WYDZIAŁ BUDOWNICTWA LĄDOWEGO I WODNEGO
Zał. nr 4 do ZW WYDZIAŁ BUDOWNICTWA LĄDOWEGO I WODNEGO KARTA PRZEDMIOTU Nazwa w języku polskim STATYSTYKA STOSOWANA Nazwa w języku angielskim APPLIED STATISTICS Kierunek studiów (jeśli dotyczy): Specjalność
Weryfikacja hipotez statystycznych
Weryfikacja hipotez statystycznych Hipoteza Test statystyczny Poziom istotności Testy jednostronne i dwustronne Testowanie równości wariancji test F-Fishera Testowanie równości wartości średnich test t-studenta
TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa.
TESTY NIEPARAMETRYCZNE 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa. Standardowe testy równości średnich wymagają aby badane zmienne losowe
Matematyka - Statystyka matematyczna Mathematical statistics 2, 2, 0, 0, 0
Nazwa przedmiotu: Kierunek: Matematyka - Statystyka matematyczna Mathematical statistics Inżynieria materiałowa Materials Engineering Rodzaj przedmiotu: Poziom studiów: forma studiów: obowiązkowy studia
Kurs Chemometrii Poznań 28 listopad 2006
Komisja Nauk Chemicznych Polskiej Akademii Nauk Oddział w Poznaniu Wydział Technologii Chemicznej Politechniki Poznańskiej w Poznaniu GlaxoSmithKline Pharmaceuticals S.A. w Poznaniu Stowarzyszenie ISPE
MODELE LINIOWE. Dr Wioleta Drobik
MODELE LINIOWE Dr Wioleta Drobik MODELE LINIOWE Jedna z najstarszych i najpopularniejszych metod modelowania Zależność między zbiorem zmiennych objaśniających, a zmienną ilościową nazywaną zmienną objaśnianą
Rozpoznawanie obrazów
Rozpoznawanie obrazów Laboratorium Python Zadanie nr 1 Regresja liniowa autorzy: A. Gonczarek, J.M. Tomczak, S. Zaręba, M. Zięba, J. Kaczmar Cel zadania Celem zadania jest implementacja liniowego zadania
Ocena wartości hodowlanej. Dr Agnieszka Suchecka
Ocena wartości hodowlanej Dr Agnieszka Suchecka Wartość hodowlana genetycznie uwarunkowane możliwości zwierzęcia do ujawnienia określonej produkcyjności oraz zdolność przekazywania ich potomstwu (wartość
Summary in Polish. Fatimah Mohammed Furaiji. Application of Multi-Agent Based Simulation in Consumer Behaviour Modeling
Summary in Polish Fatimah Mohammed Furaiji Application of Multi-Agent Based Simulation in Consumer Behaviour Modeling Zastosowanie symulacji wieloagentowej w modelowaniu zachowania konsumentów Streszczenie
Ekonometria ćwiczenia 3. Prowadzący: Sebastian Czarnota
Ekonometria ćwiczenia 3 Prowadzący: Sebastian Czarnota Strona - niezbędnik http://sebastianczarnota.com/sgh/ Normalność rozkładu składnika losowego Brak normalności rozkładu nie odbija się na jakości otrzymywanych
Działania prowadzone w ramach zadania
ZAD. 7.1 ANALIZA FUNKCJONOWANIA RYNKU NASIENNEGO ORAZ TWORZENIE SYSTEMÓW INFORMACJI WSPIERAJĄCYCH PODEJMOWANIE STRATEGICZNYCH DECYZJI W SEKTORZE HODOWLANO NASIENNYM ROŚLIN UPRAWNYCH. PW Ulepszanie Roślin
Monitorowanie i Diagnostyka w Systemach Sterowania na studiach II stopnia specjalności: Systemy Sterowania i Podejmowania Decyzji
Monitorowanie i Diagnostyka w Systemach Sterowania na studiach II stopnia specjalności: Systemy Sterowania i Podejmowania Decyzji Analiza składników podstawowych - wprowadzenie (Principal Components Analysis
pochodzenia Kod kraju Hodowla Roślin Strzelce sp. z o.o., ul. Główna 20, Strzelce 2 Augusta 2002
Kod kraju pochodzenia 12. Soja Uwagi ogólne Wyniki z doświadczeń PDO dla soi opracowano po dwuletnim okresie w 2011 i 2012 roku. Doświadczenia przeprowadzono w trzech punktach doświadczalnych: SDOO w Przecławiu,
Przedmowa Wykaz symboli Litery alfabetu greckiego wykorzystywane w podręczniku Symbole wykorzystywane w zagadnieniach teorii
SPIS TREŚCI Przedmowa... 11 Wykaz symboli... 15 Litery alfabetu greckiego wykorzystywane w podręczniku... 15 Symbole wykorzystywane w zagadnieniach teorii mnogości (rachunku zbiorów)... 16 Symbole stosowane
Ewaluacja sprawdzianu 2009 klas szóstych szkoły podstawowej na podstawie sprawozdania sporządzonego przez OKE w Jaworznie
Zespół Szkolno - Przedszkolny w Rudzicy im. Jana Pawła II Ewaluacja sprawdzianu 2009 klas szóstych szkoły podstawowej na podstawie sprawozdania sporządzonego przez OKE w Jaworznie Rudzica 2009 SPIS TREŚCI
Prognoza terminu sadzenia rozsady sałaty w uprawach szklarniowych. Janusz Górczyński, Jolanta Kobryń, Wojciech Zieliński
Prognoza terminu sadzenia rozsady sałaty w uprawach szklarniowych Janusz Górczyński, Jolanta Kobryń, Wojciech Zieliński Streszczenie. W uprawach szklarniowych sałaty pojawia się następujący problem: kiedy
ALGORYTMY SZTUCZNEJ INTELIGENCJI
ALGORYTMY SZTUCZNEJ INTELIGENCJI Sieci neuronowe 06.12.2014 Krzysztof Salamon 1 Wstęp Sprawozdanie to dotyczy ćwiczeń z zakresu sieci neuronowych realizowanym na przedmiocie: Algorytmy Sztucznej Inteligencji.
PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com
Analiza korelacji i regresji KORELACJA zależność liniowa Obserwujemy parę cech ilościowych (X,Y). Doświadczenie jest tak pomyślane, aby obserwowane pary cech X i Y (tzn i ta para x i i y i dla różnych