BASH - WPROWADZENIE Bioinformatyka 4
DLACZEGO BASH? Praca na klastrach obliczeniowych Brak GUI Środowisko programistyczne Szybkie przetwarzanie danych Pisanie własnych skryptów W praktyce przetwarzanie i przechowywanie danych biologicznych nie byłoby możliwe bez komputerów o dużej mocy obliczeniowej i o dużych zasobach pamięci dyskowej BIOINFORMATYKA 2017/2018 MAGDA MIELCZAREK 2
PRACOWNIA BIOSTATYSTYKI # PROJEKT ANALIZA SEKWENCJI DNA CAŁEGO GENOMU Technologia NGS (Next Generation Sequencing) Sekwencje DNA całego genomu 32 krów: 16 osobników podatnych na zapalenie wymienia 16 osobników zdrowych BIOINFORMATYKA 2017/2018 MAGDA MIELCZAREK 3
PRACOWNIA BIOSTATYSTYKI # PROJEKT 7000000 Liczba SNP w genomie 6000000 5000000 4000000 3000000 2000000 1000000 0 chore zdrowe BIOINFORMATYKA 2017/2018 MAGDA MIELCZAREK 4
PRACOWNIA BIOSTATYSTYKI # PROJEKT PRZECHOWYWANIE DANYCH 1 genom surowe dane pliki pośrednie pliki końcowe 6,1 TB 4,9 TB 44,8 GB + dane dodatkowe BIOINFORMATYKA 2017/2018 MAGDA MIELCZAREK 5
PRACOWNIA BIOSTATYSTYKI # PROJEKT PRZETWARZANIE I ANALIZA DANYCH przyrównanie; 8 rdzeni; 25 GB (genom) ~ 19 GB paralelizacja - przyspieszenie obliczeń max 24 rdzenie czas analiz dla wszystkich prób tygodnie? BIOINFORMATYKA 2017/2018 MAGDA MIELCZAREK 6
PODSTAWOWE DEFINICJE Linux system operacyjny, które oferuje kompletne środowisko programistyczne Powłoka interfejs wiersza poleceń zapewniający komunikację z systemem operacyjnym oraz jego kontrolę Bash powłoka (środowisko domyślne) Skrypt powłoki plik tekstowy zawierający sekwencje poleceń Katalog domowy - folder domowy użytkownika; zawiera pliki określające ustawienia każdego użytkownika, przeznaczony na zapisywanie danych, np. dokumentów, obrazów, itp.; standardowo /home/nazwa_użytkownika BIOINFORMATYKA 2017/2018 MAGDA MIELCZAREK 7
TERMINAL (CTRL + ALT + T) nazwaużytkownika@nazwahosta:~$ $ user # superuser Polecenia są wpisywane i wykonywane w terminalu powłoki Terminal interaktywny program narzędziowy umożliwiający komunikację użytkownika ze środowiskiem powłoki Po otwarciu okna terminalu dostępny jest wiersz poleceń BIOINFORMATYKA 2017/2018 MAGDA MIELCZAREK 8
POPULARNE POLECENIA mkdir tworzenie katalogu ls listowanie zawartości katalogu mv zmiana nazwy, przeniesienie cp - kopiowanie rm - usuwanie cd poruszanie się w powłoce cat wypisywanie i łączenie plików touch tworzenie plików head wypisanie pierwszych 10 linijek tekstu tail wypisanie ostatnich 10 linijek tekstu less wypisywanie plików BIOINFORMATYKA 2017/2018 MAGDA MIELCZAREK 9
POPULARNE POLECENIA grep wypisywanie linii pasujących do wzorca cut - selekcja wybranych obszarów sort - sortowanie wc zliczanie znaków, linii pwd wyświetlenie bieżącego katalogu history huuura! Nie trzeba robić notatek history > moje_notatki.txt POMOC: man komenda komenda --help BIOINFORMATYKA 2017/2018 MAGDA MIELCZAREK 10
KATALOGI BIOINFORMATYKA 2017/2018 MAGDA MIELCZAREK 11
PLIKI BIOINFORMATYKA 2017/2018 MAGDA MIELCZAREK 12
ZMIENNE Przechowywanie danych Brak deklaracji typu zmiennych zmienna=wartość (operacja przypisania) zmienna = wartość (operacja równości) zmienna=5 echo $zmienna Przykład: owoc=jabłka liczba=3 echo "Liczba owocow: $liczba $owoc. echo Liczba owocow: $liczba $owoc. BIOINFORMATYKA 2017/2018 MAGDA MIELCZAREK 13
PROSTE OPERACJE ARYTMETYCZNE a=4 b=5 let wynik=a+b wynik=$[a+b] let a++ let b-- let a+=6 let b-=1 BIOINFORMATYKA 2017/2018 MAGDA MIELCZAREK 14
PROSTE OPERACJE ARYTMETYCZNE bc kalkulator, zaawansowany program narzędziowy do obliczeń matematycznych; umożliwia wykonywanie operacji zmiennoprzecinkowych echo "10*5.5" bc Spróbuj: suma=a+b echo $suma suma=$a+$b echo $suma Jaki wynik uzyskałaś/eś? BIOINFORMATYKA 2017/2018 MAGDA MIELCZAREK 15
ŚCIEŻKA bezwzględna: zawsze prawdziwa niezależnie od tego, w którym katalogu znajduje się użytkownik cd /home/users-groups/katalog1/katalog2/katalog3/katalog4 względna: wymaga ustalenia katalogu, w którym znajduje się użytkownik i podania ścieżki względem tego położenia użytkownik jest w katalog2 i chce przejść do katalog4 cd katalog3/katalog4 BIOINFORMATYKA 2017/2018 MAGDA MIELCZAREK 16
UPRAWNIENIA * a all, wszyscy * u user, użytkownik * g group, grupa * o others, inni * + dodanie prawa * - odebranie prawa * r read, uprawnienie do czytania * w -write, uprawnienie do zapisu lub zmiany zawartości * x execute, uprawnienie do wykonania, lub przejrzenia zawartości katalogu * - brak danego uprawnienia chmod g+rx plik chmod o-w plik BIOINFORMATYKA 2017/2018 MAGDA MIELCZAREK 17
UPRAWNIENIA * a all, wszyscy * u user, użytkownik * g group, grupa * o others, inni * + dodanie prawa * - odebranie prawa chmod 766 plik chmod 644 plik * r Cyfra read, uprawnienie do czytania Prawa Litera * w -write, 0 uprawnienie do brak zapisu praw lub zmiany zawartości * x execute, uprawnienie do wykonania, lub przejrzenia zawartości 1 katalogu wykonywanie x * - brak 2 danego uprawnienia pisanie w 3 wykonywanie i pisanie wx 4 czytanie r 5 czytanie i wykonywanie rx 6 czytanie i pisanie rw 7 czytanie, pisanie i wykonywanie rwx BIOINFORMATYKA 2017/2018 MAGDA MIELCZAREK 18
UPRAWNIENIA BIOINFORMATYKA 2017/2018 MAGDA MIELCZAREK 19