mgr inż. Anton Smoliński anton.smolinski@zut.edu.pl Lokalizacja Oprogramowania 7/10/2016 Wykład 1 Wprowadzenie do przedmiotu
Założenia przedmiotu Efekty kształcenia Zakres materiału Literatura Kryteria oceny
Efekty kształcenia Student posiada wiedzę z zakresu lokalizacji oprogramowania, stosowanej metodyki pracy, używanych technologii, standardów i sposobu korzystania z nich przez firmy z branży tłumaczeniowej oraz IT. Student potrafi przygotować projekt do lokalizacji, jest w stanie wykryć błędy lokalizacji, potrafi korzystać z narzędzi CAT (Computer-Aided Translation), jest w stanie przetwarzać dane wielojęzyczne w sposób zgodny ze standardami branżowymi. Student jest w stanie przybliżyć programiście problemy związane z dalszą lokalizacją tworzonego produktu oraz jest w stanie wykonać pobieżne testy internacjonalizacj i tworzonego oprogramowania.
Zakres materiału Wykłady Wprowadzenie do lokalizacji oprogramowania Narzędzia wspomagania tłumaczeń Lokalizacyjne formaty danych i standardy branżowe Metody lokalizacji interfejsów Internacjonalizacja i testowanie Zarządzanie projektem lokalizacyjnym Przebieg projektu lokalizacyjnego Tłumaczenie maszynowe
Zakres materiału Ćwiczenia (laboratoria) Strony kodowe Wyrażenia regularne Systemy CAT Tłumacze maszynowi Zarządzanie projektem lokalizacyjnym Przygotowanie Interfejsu do lokalizacji Projekt aplikacji wielojęzycznej
Literatura Yves Savourel, XML Internationalization and Localization, Sams Publishing, n.d., 2001, ISBN-10: 0672320967, ISBN-13: 978-0672320965 Bert Esselink, A Practical Guide to Localization, John Benjamins Publishing Company, n.d., 2000, ISBN- 10: 1588110060, ISBN-13: 978-1588110060 John Yunker, Beyond Borders: Web Globalization Strategies, New Riders, n.d., 2002, ISBN-10: 0735712085, ISBN-13: 978-0735712089 Andrzej Zydroń, Coping with Babel: How to Localize XML, LISA, n.d., 2004
Kryteria Oceny Ćwiczenia (laboratoria) Obecność + wykonywanie zadań (4 spotkania: 0, 0.5 lub 1pkt) Projekt aplikacji wielojęzycznej (0-3pkt) Formuła oceny końcowej (excel): if(sum(b3:f3)-1>5;5; if(sum(b3:f3)-1<3;2; SUM(B3:F3)-1)) Średnia za projekt w zeszłym roku: 2,01pkt Średnia ocena za laboratoria w zeszłym roku: 4,28
Kryteria Oceny Wykład Obecność nieobowiązkowa (wykłady na godz. 9:00) Kolokwium Pytania ustalane z grupą obecną na wykładzie Automatyczne losowanie pytań z ustalonej listy 5 pytań, każde za 0, 0.5 lub 1pkt Suma pkt = ocena Kolokwium na ostatnim wykładzie: 27/01/2017 (godz. 8:15) Ocena za przedmiot 0.41 * ocena za ćwiczenia 0.59 * ocena za wykład
Kontakt z prowadzącym E-mail anton.smolinski@zut.edu.pl Konsultacje Piątki od godz. 10 Gabinet 102 Wi2 Materiały z wykładów: http://antons.pl zakładka Dydaktyka -> Lokalizacja oprogramowania lub zakładka Dokumenty -> wykłady
Wstęp do lokalizacji oprogramowania Dlaczego warto tłumaczyć oprogramowanie Najpopularniejsze języki internetu Zapotrzebowanie na lokalizację Rodzaj projektów lokalizacyjnych Historia lokalizacji Globalizacja, internacjonalizacja, lokalizacja, tłumaczenie Problemy lokalizacyjne Strony kodowe
Dlaczego warto tłumaczyć oprogramowanie 90% konsumentów twierdzi, że zdecydowanie bardziej woli czytać strony w swoim języku, mimo że znają języki obce 72% konsumentów korzysta z produktów w swoich językach i twierdzi, że o kupnie produktu decyduje informacja w ich języku 56% konsumentów twierdzi, że dostępność produktu w ich języku jest ważniejsza niż cena
Dlaczego warto tłumaczyć oprogramowanie 40% konsumentów nigdy nie dokonuje zakupów na stronach obcojęzycznych 2000 w Stanach zjednoczonych tylko 9% populacji zna drugi język Tylko 2% treści na świecie jest tłumaczonej Ankieta Harvard Business Review
Najpopularniejsze języki internetu
Zapotrzebowanie na lokalizację Wymogi prawne wielu państw Chęć dotarcia na nowe rynki (zwiększenie sprzedaży) Rosnące zapotrzebowanie na rozwojowych rynkach Polityka korporacji Ułatwienie korzystania z produktów Poprawienie postrzegania korporacji
Rodzaj projektów lokalizacyjnych Ogromne Uczestnictwo przy dużych projektach tłumaczonych na wiele języków. Poszukuje się małych agencji bądź indywidualnych tłumaczy do korekt bądź tłumaczenia. Małe Pozyskanie bezpośredniego klienta, przygotowanie i przetłumaczenie jego aplikacji na konkretny rynek Nowe Uczestnictwo w etapie powstawania oprogramowania i dostosowywania go na różne rynki
Historia lokalizacji (gier) Pac-man 1970 Lokalizacja obudów automatów do gier Super Mario Bros 1980 Box and Docs Od 1990 tzw. partial localization Tłumaczenie interfejsów użytkownika + napisy do dialogów Full localization Zatrudnianie aktorów do nagrywania ścieżek dźwiękowych Od 2000 sim-ship model Tworzenie oprogramowania wielojęzycznego a nie tłumaczenie/lokalizowanie gotowego produktu
Różnica w lokalizacji gier a oprogramowania użytkowego Projekty gier są większe Od 500tys 1mln słów Wiele materiałów audio/video Wiele tematów Kontekst wypowiedzi (płeć bohatera, wybory itp.) Gry są nowymi projektami, podczas gdy projekty oprogramowania najczęściej są aktualizacją
Globalizacja Internacjonalizacja Lokalizacja Tłumaczenie
Definicje pojęć Budowanie marki na międzynarodowych rynkach, ujednolicenie standardów i polityk Globalizacja Rozwijanie produktów i treści w celu ich łatwego dostosowywania na różne rynki językowe i kulturowe. Stosowanie standardów, oddzielanie kodu od treści. Internacjonalizacja Zamiana wyświetlanych treści na inny język Tłumaczenie Przetworzenie produktu do innego środowiska kulturowego z zachowaniem różnic lokalnej kultury Lokalizacja
Problemy związane z lokalizacją Kultura i religia (np. McDonald s w Hong Kongu oferuje dania z ryżem a w Indiach mięso jagnięce zamiast wołowego) Lokalizacja dat i standardów metrycznych (cale, stopy, metry, cm, dd/mm/yy, mm/dd/yy itp., w Etiopii rok ma 13 miesięcy, więc rok 2007 to dla nich 2000) Wiele języków oficjalnych (Indie, większość państw Afryki) Poprawność polityczna
Problemy związane z lokalizacją Wiele pojęć - Homonimy słowa zakazane Dwuznaczność niektórych pojęć Żarty słowne Związki frazeologiczne Przysłowia Schematy myślowe
Lokalizacja produktu 1. Przygotowanie materiału do tłumaczenia i jego dostarczenie 2. Tłumaczenie 3. Korekta 4. Tzw. spotchecking 5. Przetworzenie materiału do wymaganego formatu 6. Ocena jakości u zleceniodawcy 7. Wprowadzenie uwag od zleceniodawcy 8. Wygenerowanie zlokalizowanego materiału u klienta
Podział na rodzaje projektów lokalizacyjnych Oprogramowanie (aplikacje, GUI) Pomoc internetowa (pliki HTML/Web) Dokumentacja (drukowana, online, uzupełniająca) EULA (End User Licence Agreement, teksty prawne i prawnicze) Często stosowany jest również podział związany z dziedziną: Life Sciences, Medical, IT, etc.
Systemy CAT środowisko pracy tłumacza Edycja, korekta, zarządzanie terminologią, projektem w jednym środowisku
Strony kodowe i standard Unicode
Czym są strony kodowe? wariant przypisania poszczególnym kodom binarnym różnych znaków pisarskich w ramach danego systemu kodowania (ciocia wikipedia) Zestawienie znaku z odpowiadającym mu ciągiem bitów czyli konwersja na postać cyfrową Każdy język miał własną tablicę kodów, przez co złe jej ustawienie powodowało wyświetlanie się krzaczków zamiast niektórych liter
Czym są strony kodowe? Jeden bajt = jeden znak Bajt = 8 bitów, czyli 2 8 =256 możliwości Prócz znaków kodowane są też instrukcje sterujące (np. spacja, twarda spacja, enter, tabulator itp.) Znaki dialektyczne wymagały więc przełączenia strony kodowej na dany język Np. ISO-8859-2 (ISO Latin-2), Windows-1250
Unicode Ujednolicona strona kodowa dla wszystkich języków Kodowanie UTF-8: Znaki zwyczajne (alfabet angielski) = 1bajt Znaki dialektyczne (np. polskie) = 2bajty Znaki specjalne (chińskie) = 3bajty Kodowanie UTF-16: Wszystkie znaki kodowane na 2 bajtach Prócz stron kodowych za tzw. krzaczki mogą odpowiadać fonty brak wizualizacji danego znaku
Kodowanie wiadomości SMS Kodowanie w wiadomościach SMS odbywa się na 7bitach tabela ASCII (alfabet angielski) 160 (znaków SMS) * 7 (bitów na znak) = 1120 bitów = 140 bajtów Użycie znaków specjalnych (np. polskich) zmienia kodowanie na UTF-8 lub UTF-16 co powoduje mniejszą liczbę znaków którą można przesłać w wiadomości Dodatkowo przy kilku wiadomościach dodawane są znaki sterujące, by traktować je jako 1 wiadomość.
Ćwiczenie na koniec Policz ile bitów/bajtów będzie zajmować wiadomość: Zażółć gęślą jaźń Kodowana za pomocą ASCII, UTF-8 i UTF-16
Koniec mgr inż. Anton Smoliński