Informatyka Arkusze 1 1 Wprowadzenie. Arkusze klakulacyjne to programy służące do prowadzenia wyliczeń. Wyniki mogą być przedstawiane w postaci tabelarycznej i graficznej. Współczesne arkusze klakulacyjne, zawarte np. w pakiecie Open Office lub Microsoft Office oferują znacznie więcej możliwości, pełnią np. funkcje prostych baz danych, z których mogą korzystać inne aplikacje danego pakietu biurowego. Zagadnienie arkuszy kalkulacyjnych zostanie omówione na przykładzie aplikacji Calc z pakietu Open Office 1.1.3, jednak znakomita większość przykładów ma bezpośrednie analogie w programie Excel, będącym składnikiem Microsoft Office. Okno programu Calc składa się z następujących elementów: Rysunek 1 Widok okna programu Calc. 1. Menu, analogicznie jak w innych aplikacjach systemu Windows zawierający wszystkie funkcje programu. 2. Pasek funkcji, zawierający ikony najbardziej podstawowych poleceń, takich jak Cofnij i Ponów. 3. Pasek obiektów arkusza kalkulacyjnego zawierający ikony najczęściej używanych poleceń, 1
związanych głównie z formatowaniem komórek i ich zawartości. 4. Pasek formuły zawierający polecenia służące do tworzenia formuł wyliczeniowych. 5. Przestrzeń robocza tu do komórek wpisuje się wartości oraz formuły wyliczeniowe, tu również rozmieszcza się elementy graficzne, np. wykresy. 6. Pasek arkuszy tu można tworzyć, usuwać, oraz przełączać przestrzenie robocze, klikając odpowiednio puste miejsce lub wybrane zakładki. W programie Calc zakładki nazywają się arkuszami, w programie Excel stosuje się nazwę skoroszyty. 2 Podstawowe pojęcia Na rysunku 1 w przestrzeni roboczej widoczna jest tabela zawierające opis 10 róznych zabytków. Każdy zabytek opisany jest w jednym wierszu. Opis składa się z identyfikatora numerycznego, jednoznacznie identyfikującego dany obiekt, nazwy rodzajowej, oraz opisu 4 cech: surowca, stanu zachowania (gdzie 1 = zły, 2 = średni, 3 = dobry, 4 = doskonały), datowania (gdzie daty bez dodatkowego opisu są datami BC) oraz wagi zabytku. W języku statystyki opisywana tabela jest tzw. macierzą. Wiersze zawierają komplet danych o poszczególnych obiektach, a kolumny grupują wartości konkretnych cech, nazywanych tu zmiennymi. Operując pojęciami z zakresu informatyki moglibyśmy natomiast powiedzieć, że opisywana tabela stanowi prostą, tabelaryczną bazę danych, gdzie wiersze to rekordy, a kolumny to pola. 3 Formuły i adresowanie komórek W arkuszu kalkulacyjnym wszystkie dane wpisywane są w komórkach. W razie potrzeby komórki można ze sobą scalać poleceniem Format/Scalaj komórki, można także zmieniać ich rozmiary i elastycznie formatować. Każda komórka jest identyfikowana przez nazwę kolumny i numer rzędu. Nazwa bieżącej komórki jest wyświetlana w polu oznaczonym literą A na rysunku 1. Nazwę taką na rysunku 1 jest to H18 określamy jako adres komórki. Do komórek można wpisywać wartości, czyli liczby bądź słowa, które będą wyświetlane w niezmienionej postaci. Można także wpisywać formuły wyliczeniowe, czyli wzory bądź zestawy poleceń dla programu. W takim wypadku program nie wyświetla samej formuły, tylko jej wynik. Aby dany zapis został zinterpretowany jako formuła, należy wpisując go do komórki poprzedzić znakiem =. Najwygodniej kliknąć ikonę oznaczoną na rysunku 1 literą C - program przejdzie wtedy automatycznie do trybu edycji formuły. W tym trybie formułę można wprowadzać wygodnie w polu na pasku formuły (4), nie można jednak wykonywać większości standardowych operacji na komórkach. Aby powrócić do standardowego trybu należy wprowadzić formułę i zatwierdzić ją klawiszem Enter, względnie przerwać wprowadzanie wciskając klawisz Escape. Jeden z najprostszych przykładów formuły to zapis =2+2 wprowadzony do dowolnej komórki. Program wyświetli wynik 4. W praktyce formuły tego typu, gdzie wszystkie dane zostały wprowdzone ręcznie, są zupełnie niepraktyczne. Wielką zaletą arkusza kalkulacyjnego jest możliwość wtawiania do formuł nie tylko samych wartości, ale odwołań do komórek, które te wartości zawierają. Dzięki temu raz przygotowany arkusz można wykorzystywać wielokrotnie, nie zmianiając zawartych w nim formuł, tylko wstawiając do komórek nowe dane. 2
Przykładem formuły tego typu jest =A2+1 wstawione w pole A3. Jeśeli w polu A2 została wpisana wartość 1, wynikiem formuły wstawionej w polu A3 będzie 2, tak, jak jest to widoczne na rysunku 1. Interesująca właściwość arkusza klakulacyjnego ujawinia się podczas próby przekopiowania ww. formuły i wklejenia jej w jedno bądź więcej pól leżących poniżej A3. Wszystkie odwołania do komórek zostają zmodyfikowane stosownie do odległości, jaka dzieli komórkę nową od starej. I tak na przykład w polu A4 formuła będzie miała postać =A3+1 (przesunięcie o 1 rząd w dół), a w polu B5 - =B4+1 (przesunięcie o 2 pola w dół i jedną kolumnę w prawo). Opisywana właściwość jest bardzo przydatna podczas kopiowania dużych ilości danych. W opisywanym przykładzie umożliwia szybkie stworzenie numeracji w kolumnie A. Czasem jednak istnieje potrzeba, by formuła, mimo ewentualnego przekopiowania w inne miejsce zawsze odwoływała się do danych z konkretnej komórki. Można to osiągnąć, wstawiając w adresie komórki przed odwołanie do wiersza i/lub kolumny znak $. Na przykład, chcąc zablokować odwołanie do wiersza w formule wprowadzonej do komórki A3, należy ją zmodyfikować następująco: =A$2+1. Zapis =$A$2+1 zablokuje zarówno odwołanie do wiersza, jak i kolumny. Na marginesie trzeba zwrócić uwagę, że zarówno podczas kopiowania, jak i wklejania można zaznaczyć więcej niż jedną komórkę. Takie zaznaczenia, jak i w ogóle wszelkie zbiory komórek arkusza klakulacyjnego nazywamy zakresami. W celu skopiowania komórki należy ją zaznaczyć klikając tylko raz lewym klawiszem myszy, a następnie kliknąć raz prawym klawiszem i wybierać z menu kontekstowego opcję kopiuj. Dwukrotne kliknięcie komórki powoduje przejście do trybu edycji formuły jego anulowanie wymaga wciśnięcia klawisza Escape (patrz wyżej). Wklejając zakres danych należy zaznaczyć dokładnie taki sam zakres komórek (właściwą ilość rzędów i kolumn), jaki został skopiowany. Ewentualnie można zaznaczyć tylko jedną komórkę, wówczas zakres zostanie wklejony automatycznie. Najszybszym sposobem przekopiowania danych jest zaznaczenie pożądanej komórki lub zakresu poprzez jednokrotne kliknięcie lewym klawszem myszy, a następnie przeciągnięcie metodą Drag and Drop uchwytu widocznego w prawym dolnym rogu zaznaczonej komórki/zakresu na żądany zakres pól. Funkcja ta w przypadku kopiowania wartości liczbowych ma specjalną właściwość zwiększa kopiowaną liczbę wraz z odległością (w wierszach) od oryginalnej komórki. Tę właściwość można także wykorzystać do szybkiego numerowania komórek. 4 Funkcje i zakresy komórek Zamiast ręcznie tworzyć formułę wyliczeniową bardzo często można skorzystać z gotowych funkcji dostępnych w programie. Jedną z najczęściej używanych jest funkcja suma, posiadająca własną ikonę na pasku formuły (na lewo od znaku = wskazywanego na rysunku 1 literą C ). Funkcję tę można wygodnie używać zaznaczając komórkę leżącą bezpośrednio pod zebranym w kolumnie zakresem danych numerycznych (funkcja sumuje, oczywiście, tylko liczby) a następnie klikając ww. ikonę suma na pasku formuły. Program sam wstawi do komórki tzw. szkielet funkcji, czyli nazwę funkcji, a jednocześnie poda jej argument (w nawiasie). Argumentem funkcji suma jest zakres komórek, których wartości mają zostać dodane, np. =SUMA(F2:F11) doda wartości pół od F2 do F11. Zakres jest więc zaznaczany w tym wypadku poprzez użycie operatora :. Inne działanie ma operator ;, który umożliwia zliczenie sumy osobnych komórek, zamiast 3
ciągłych zakresów. Oba operatory można dowolnie łaczyć, np. składnia =SUMA(F2:F5;F7:F11) spowoduje dodanie wszystkich pól z kolumny F, widocznej na rysunku 1, z wyjątkiem pola F6. 5 Formatowanie Na początku edycji przestrzeń robocza nie jest sformatowana. Aby przygotować arkusz do wydruku należy upewnić się, że został on właściwie sformatowany wybierając opcję Podgląd wydruku z menu Plik. W razie potrzeby należy dodać linie siatki, klikając i przytrzymując ikonę oznaczoną na rysunku 1 literą B. Bardziej precyzyjne formatowanie komórek jest możliwe po wybraniu opcji Komórki z menu format lub Formatuj komórki z menu kontekstowego, po zaznaczeniu żądanego zakresu komórek do sformatowania. 6 Analiza zmiennych na poziomie nominalnym Dane zgromadzone w tabeli na rysunku 1 mają rózny charakter. Do podstawowych zadań związanych ze statystyczną obróbką danych należy rozpoznanie poziomu pomiaru (skali pomiarowej), jaki można zastosować do analizy poszczególnych zmiennych. I tak na przykład zmienną materiał w kolumnie C na rysunku 1 można opisać za pomocą najmniej precyzyjnej skali pomiarowej, tj. skali nominalnej. Bez względu na poziom pomiaru, dla każdej zmiennej można określić: częstość występowania określonych wartości zmiennej, określana symbolem C*, f ( fi ) lub n położenie zakresu wartości zmiennej, czyli najczęsciej występujące wartości. Do zliczania częstości występowania zmiennych kategorycznych, tj. opisywanych na poziomie nominalnym przydatna jest funkcja LICZ.JEŻELI(zakres_danych;kryterium). Funkcja zlicza w badanym zakresie komórek wszelkie wystąpienia określonej wartości - słowa lub liczby. Funkcja ta ma 2 argumenty po pierwsze zakres przeszukiwanych danych, a po drugie kryterium, czyli poszukiwaną wartość. Przykładowo, w przykładzie zilustrowanym na rysunku 1, chcąc sprawdzić ilość zabytków metalowych należy zastosować funkcję =LICZ.JEŻELI($C$2:$C$11;$B$15), gdzie zakres C2-C11 obejmuje wszystkie wartości zmiennej materiał, a w polu B15 przechowywana jest wartość metal. Funkcje wstawia się do arkusza wybierając opcję Wstaw/Funkcja lub klikając ikonę Autopilot na pasku funkcji. Po zaznaczeniu pożądanej funkcji należy klikną klawisz Dalej i przejśc kilkuetapową procedurę. W jej trakcie wybiera się ww. zakres oraz kryterium. Częstości procentowe poszczególnych kategorii najłatwiej policzyć stosując wzór: częstość danej kategorii podzielić przez ilość wszystkich obiektów. Otrzymane wyniki należy sformatować do formatu procentowego stosując ikonę % a następnie ikony zmiany miejsc dziesiętnych na pasku obiektów, lub ww opcję formatowania komórek. Częstości można obrazowo przedstawić na wykresie. Aby szybko wykonać prosty wykres w programie Calc należy zaznaczyć zakres danych oraz ich etykiety. Następnie należy wybrać opcję Wykres z menu Wstaw, lub kliknąć ikonę oznaczoną na rysunku 1 jako D a następnie wybrać 4
opcję Wykres. Gdy kursor myszy ulegnie zmianie, należy zaznaczyć obszar wykresu. Po zweryfikowaniu poprawności zakresu danych oraz doboru etykiet, należy wybrać typ wykresu i ewentualnie inne szczegóły. Dla zmiennych na poziomie nominalnym najczęściej używa się wykresów słupkowych lub kołowych. Po wstawieniu do arkusza, wykres może być w dowolnym momencie modyfikowany i formatowany. Dla zmiennych opisanych na poziomie nominalnym miarą położenia może być jedynie tzw. (kategoria) modalna, nazywana też modą lub dominantą. Określa ona najliczniejszą grupę wartości zmiennej. W przypadku analizowanego przykładu, dla rozkładu zmiennej materiał moda to kategoria metal (4 obiekty). 7 Analiza zmiennych na poziomie porządkowym Zmienne analizowane na poziomie porządkowym umożliwiają zastosowanie nieco bardziej precyzyjnych narzędzi statystycznych. Po pierwsze, można nieco bardziej oprecyzyjnie obliczyć miarę położenia wartości zmiennej, określając medianę, czyli taką wartość zmiennej, która dzieli cały rozkład wartości na pół. Funkcja do wyliczania mediany z zakresu danych jest dostępna w arkuszu kalkulacyjnym. Dla przykładu ukazanego na rysunku 1 byłoby to =MEDIANA(D2:D11), dające wynik 3. Po drugie, ponieważ wartości zmiennej opisanej na skali porządkowej mają ze sobą pewien związek (znadują się w hierarchii względem siebie), obliczenie częstości poszczególnych kategorii zmiennej może być przetworzone do postaci tzw. częstości skumulowanej. I tak na przykład, na rysunku 1 częstość skumulowana występowania zabytków w stanie dobrym bądź doskonałym wynosi 6 (częstość występowania zabytków w stanie dobrym=5 + częstość skumulowana występowania zabytków w stanie doskonałym=1 = 6). Dla zmiennych porządkowych istnieje zatem pewien sens stosowania wykresów liniowych. W szczególności w archeologii dość często wykorzystuje się wykres liniowy częstości skumulowanej, określany jako ogiwa. 5