Hana Marková Pseudospektrum matice

Podobne dokumenty
MATEMATIKA 3. Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci

Komplexní analýza. Martin Bohata. Katedra matematiky FEL ČVUT v Praze Martin Bohata Komplexní analýza Mocninné řady 1 / 18

Aproximace funkcí 1,00 0,841 1,10 0,864 1,20 0,885. Body proložíme lomenou čarou.

1 Soustava lineárních rovnic

Linea rnı (ne)za vislost

Necht je funkce f spojitá v intervalu a, b a má derivaci v (a, b). Pak existuje bod ξ (a, b) tak, že f(b) f(a) b a. Geometricky

Kristýna Kuncová. Matematika B2 18/19

Matematika (KMI/PMATE)

Edita Pelantová, katedra matematiky / 16

Kristýna Kuncová. Matematika B3

Úvodní informace. 18. února 2019

Numerické metody minimalizace

Kapitola 4: Soustavy diferenciálních rovnic 1. řádu

Funkce zadané implicitně. 4. března 2019

Inverzní Z-transformace

Komplexní analýza. Martin Bohata. Katedra matematiky FEL ČVUT v Praze Martin Bohata Komplexní analýza Úvod 1 / 32

Numerické metody 8. května FJFI ČVUT v Praze

Lineární algebra - iterační metody

Kristýna Kuncová. Matematika B2

(1) Derivace. Kristýna Kuncová. Matematika B2 17/18. Kristýna Kuncová (1) Derivace 1 / 35

Matematika 2, vzorová písemka 1

Stochastické modelování v ekonomii a financích Konzistence odhadu LWS. konzistence OLS odhadu. Předpoklady pro konzistenci LWS

Katedra aplikované matematiky FEI VŠB Technická univerzita Ostrava

Vybrané kapitoly z matematiky

Elementární funkce. Edita Pelantová. únor FJFI, ČVUT v Praze. katedra matematiky, FJFI, ČVUT v Praze

5. a 12. prosince 2018

Euklidovský prostor. Funkce dvou proměnných: základní pojmy, limita a spojitost.

GEM a soustavy lineárních rovnic, část 2

Matematika III Stechiometrie stručný

Katedra aplikované matematiky FEI VŠB Technická univerzita Ostrava

(13) Fourierovy řady

Co nám prozradí derivace? 21. listopadu 2018

Diferenciální rovnice základní pojmy. Rovnice se

podle přednášky doc. Eduarda Fuchse 16. prosince 2010

Obsah. Limita posloupnosti a funkce. Petr Hasil. Limita posloupnosti. Pro a R definujeme: Je-li a < 0, pak a =, a ( ) =. vlastní body.

Průvodce studiem V této kapitole se budeme zabývat diferenciálním počtem pro funkce více

(A B) ij = k. (A) ik (B) jk.

(a). Pak f. (a) pro i j a 2 f

Petr Hasil. c Petr Hasil (MUNI) Nekonečné řady MA III (M3100) 1 / 187

Kapitola 2. Nelineární rovnice

Numerické metody a statistika

DFT. verze:

Stavový popis Stabilita spojitých systémů (K611MSAP) Katedra aplikované matematiky Fakulta dopravní ČVUT. čtvrtek 20. dubna 2006

1 Definice. A B A B vlastní podmnožina. 4. Relace R mezi množinami A a B libovolná R A B. Je-li A = B relace na A

x2 + 2x 15 x 2 + 4x ) f(x) = x 2 + 2x 15 x2 + x 12 3) f(x) = x 3 + 3x 2 10x. x 3 + 3x 2 10x x 2 + x 12 10) f(x) = log 2.

algebrou úzce souvisí V druhém tematickém celku se předpokládá základní znalosti z matematické analýzy

Cauchyova úloha pro obyčejnou diferenciální rovnici

Laplaceova transformace

(2) Funkce. Kristýna Kuncová. Matematika B2. Kristýna Kuncová (2) Funkce 1 / 25

Operace s funkcemi [MA1-18:P2.1] funkční hodnota... y = f(x) (x argument)

kontaktní modely (Winklerův, Pasternakův)

Geometrická nelinearita: úvod

Nekomutativní Gröbnerovy báze

Tvarová optimalizace pro 3D kontaktní problém

Univerzita Karlova v Praze Matematicko-fyzikální fakulta

Funkce více proměnných: limita, spojitost, derivace

Matematická analýza 2. Kubr Milan

Algebra I Cvičení. Podstatná část příkladů je převzata od kolegů, jmenovitě Prof. Kučery, Doc. Poláka a Doc. Kunce, se

Funkce více proměnných: limita, spojitost, parciální a směrové derivace, diferenciál

Paradoxy geometrické pravděpodobnosti

David Nádhera Kontinuace implicitně zadané křivky

Obsah. 1 Konstrukce (definice) Riemannova integrálu Výpočet Newtonova Leibnizova věta Aplikace výpočet objemů a obsahů 30

Lineární algebra II, přednáška Mgr. Milana Hladíka, Ph.D.

fakulty MENDELU v Brně (LDF) s ohledem na disciplíny společného základu (reg. č. CZ.1.07/2.2.00/28.

Kristýna Kuncová. Matematika B2 18/19. Kristýna Kuncová (1) Vzorové otázky 1 / 36

Obsah. Petr Hasil. (konjunkce) (disjunkce) A B (implikace) A je dostačující podmínka pro B; B je nutná podmínka pro A A B: (A B) (B A) A (negace)

Sb ırka pˇr ıklad u z matematick e anal yzy II Petr Tomiczek

Pojem množiny nedefinujeme, pouze připomínáme, že množina je. Nejprve shrneme pojmy a fakta, které znáte ze střední školy.

Matematika 1 Jiˇr ı Fiˇser 24. z aˇr ı 2013 Jiˇr ı Fiˇser (KMA, PˇrF UP Olomouc) KMA MAT1 24. z aˇr ı / 52

MATEMATIKA 1 ALEŠ NEKVINDA. + + pokud x < 0; x. Supremum a infimum množiny.

Určitý (Riemannův) integrál a aplikace. Nevlastní integrál. 19. prosince 2018

Rovnice proudění Slapový model

Metody, s nimiž se seznámíme v této kapitole, lze použít pro libovolnou

Teorie. kuncova/ Definice 1. Necht f je reálná funkce a a R. Jestliže existuje.

Matematika prˇedna sˇka Lenka Prˇibylova 7. u nora 2007 c Lenka Prˇibylova, 200 7

Odpřednesenou látku naleznete v kapitolách skript Abstraktní a konkrétní lineární algebra.

Petr Beremlijski, Marie Sadowská

Statistika (KMI/PSTAT)

7. Aplikace derivace

Karel Vostruha. evolučních rovnic hyperbolického typu

Západočeská univerzita v Plzni Fakulta aplikovaných věd Katedra matematiky

MATEMATIKA 3 NUMERICKÉ METODY. Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci

Definice Řekneme, že PDA M = (Q,Σ,Γ,δ,q 0,Z 0,F) je. 1. pro všechna q Q a Z Γ platí: kdykoliv δ(q,ε,z), pak δ(q,a,z) = pro všechna a Σ;

Internet a zdroje. (Zdroje na Internetu) Mgr. Petr Jakubec. Katedra fyzikální chemie Univerzita Palackého v Olomouci Tř. 17.

Anna Kratochvílová Anna Kratochvílová (FJFI ČVUT) PDR ve zpracování obrazu / 17

Zobecněné metriky Různé poznámky 12. METRIZACE. Miroslav Hušek, Pavel Pyrih KMA MFF UK. 12. Poznámky

Univerzita Karlova v Praze Matematicko-fyzikální fakulta

ÚVOD DO ARITMETIKY Michal Botur

Ústav teorie informace a automatizace RESEARCH REPORT. Pavel Boček, Karel Vrbenský: Implementace algoritmu MIDIA v prostředí Google Spreadsheets

TGH01 - Algoritmizace

FAKULTA STAVEBNÍ. Stavební statika. Telefon: WWW:

Obsah. 1.2 Integrály typu ( ) R x, s αx+β

1 Dedekindovy řezy (30 bodů)

Mendelova univerzita v Brně user.mendelu.cz/marik

Teorie plasticity. Varianty teorie plasticity. Pružnoplastická matice tuhosti materiálu

Numerické metody KI/NME. Doc. RNDr. Jiří Felcman, CSc. RNDr. Petr Kubera, Ph.D.

Okrajový problém podmínky nejsou zadány v jednom bodu nejčastěji jsou podmínky zadány ve 2 bodech na okrajích, ale mohou být

Matematický ústav UK Matematicko-fyzikální fakulta. Ukázky aplikací matematiky

Matematická analýza pro učitele (text je v pracovní verzi)

6 Dedekindovy řezy (30 bodů)

Transkrypt:

Univerzita Karlova v Praze Matematicko-fyzikální fakulta DIPLOMOVÁ PRÁCE Hana Marková Pseudospektrum matice Katedra numerické matematiky Vedoucí diplomové práce: Doc. RNDr. Vladimír Janovský, DrSc. Studijní program: Numerická a výpočtová matematika 2009

Ráda bych poděkovala doc. RNDr. Vladimíru Janovskému, DrSc. za vedení diplomové práce, poskytnuté materiály a programové vybavení. Velký dík patří rovněž celé mojí rodině a přátelům za podporu při studiu. Prohlašuji, že jsem svou diplomovou práci napsala samostatně a výhradně s použitím citovaných pramenů. Souhlasím se zapůjčováním práce a jejím zveřejňováním. V Praze dne 7. 8. 2009 Hana Marková 2

Obsah 1 Úvodem 5 2 Základní pojmy 6 2.1 Vlastní čísla, vektory, spektrum................ 6 2.2 Normy, vlastnosti matic.................... 7 2.3 Tři základní definice pseudospektra.............. 11 2.4 SVD rozklad, čtvrtá definice.................. 14 3 Pseudospektrum lineárních operátorů 18 3.1 Změna norem v Banachových prostorech........... 21 4 Výpočet pseudospektra 22 4.1 Mřížková metoda....................... 22 4.1.1 Iterační metody pro výpočet s min (zi A)...... 23 4.1.2 Projekce do podprostorů s nižší dimenzí....... 25 4.1.3 Volba mřížky...................... 27 4.2 Kontinuační techniky...................... 28 4.3 Chudé pseudospektrum................... 32 4.4 Metody Krylovových podprostorů............... 33 5 Chování pseudospektra 35 5.1 Dynamické systémy se spojitým časem............ 36 5.1.1 Aplikace odhadů.................... 42 5.2 Dynamické systémy s diskrétním časem............ 43 6 Lasery 48 6.0.1 Matematické problémy spjaté s teorií laserů..... 51 Literatura 62 3

Název práce: Pseudospektrum matice Autor: Hana Marková Katedra (ústav): Katedra numerické matematiky Vedoucí diplomové práce: Doc. RNDr. Vladimír Janovský, DrSc. e-mail vedoucího: janovsky@karlin.mff.cuni.cz Abstrakt: V předložené práci studujeme vlastnosti, výpočetní metody a chování pseudospektra matice či lineárního operátoru. Nejprve zavedeme související pojmy, posléze definujeme pseudospektrum matice čtyřmi různými způsoby a shrneme jeho základní vlastnosti. Dále zobecníme teorii o pseudospektru pro lineární operátory na Banachových prostorech. Posléze uvádíme přehled základních metod výpočtu včetně stěžejních možností jeho urychlení, především se však věnujeme výpočtům na mřížce a metodě kontinuace křivky. Nakonec odvodíme odhady, které nám umožní získat přesnější představu o chování dynamických systémů. V poslední kapitole na teorii laserů ukážeme praktické použití. Klíčová slova: pseudospektrum, SVD, kontinuace křivky, dynamický systém Title: Matrix Pseudospectrum Author: Hana Marková Department: Department of Numerical Mathematics Supervisor: Doc. RNDr. Vladimír Janovský, DrSc. Supervisor s e-mail address: janovsky@karlin.mff.cuni.cz Abstract: In the present work we study properties, calculation methods and behaviour of pseudospectrum of matrix or linear operator. First we introduce related terms, then we define pseudospectrum in four different ways and show its basic properties. Consequently, we generalize the theory of pseudospectrum for linear operators in Banach spaces. Basic methods of computation including fundamental possibilities of speeding up follow, but especially we go through computations on grid and path following technique. In the end we derive bounds which outline behaviour of dynamical systems. The last chapter contains practical example, which relates to laser theory. Keywords: pseudospectrum, SVD, path following, dynamical system 4

Kapitola 1 Úvodem V případě, že vyšetřujeme chování matic a lineárních operátorů, nejčastěji hledáme vlastní čísla, resp. spektrum. Tímto způsobem lze získat informaci o lineárních i nelineárních systémech, včetně jejich stability, resonance apod. Ukázalo se, že tato metoda může selhat, pokud matice není normální (nemá ortogonální vlastní vektory). Pokusíme se ukázat, že v těchto případech nalezení pseudospektra pravděpodobně povede k daleko lepším výsledkům. Pro každé ε > 0 je ε-pseudospektrum dané matice či operátoru neprázdná množina v komplexní rovině, přičemž spektrum lze získat jako speciální limitní případ. 40 30 20 10 0 10 20 30 40 10 0 10 20 30 40 50 60 5

Kapitola 2 Základní pojmy 2.1 Vlastní čísla, vektory, spektrum Ke správnému pochopení pojmu pseudospektra matice je nutné znát alespoň základní pojmy, které se týkají vlastních čísel a vektorů. Definice 2.1. Necht A C N N, v C N a λ C. Pokud Av = λv, (2.1) potom v je vlastní vektor matice A a λ jeho odpovídající vlastní číslo. Definice 2.2. Množina všech vlastních čísel matice A se nazývá spektrum matice. Jedná se o neprázdnou podmnožinu komplexní roviny C, kterou budeme značit σ(a). Definice 2.3. Matici (zi A) 1 nazveme resolventou matice A v bodě z, z C, z / σ(a). I C N N značí jednotkovou matici. Spektrum matice lze definovat i za pomoci resolventy. Definice 2.4. Spektrum matice A je množina všech bodů z C takových, že resolventa (zi A) 1 neexistuje. 6

Vlastní čísla mají smysl pouze pro čtvercové matice. Necht pro matici A existuje množina všech vlastních vektorů, tzn. množina N lineárně nezávislých vektorů v 1,...,v N, pro které platí Av j = λ j v j. Pokud označíme V matici typu N N, která má jako j-tý sloupec vektor v j (jedná se tedy o matici vlastních vektorů), a Λ diagonální matici typu N N, která má na diagonále prvky λ j, z (2.1) získáme rovnost AV = VΛ. (2.2) Jelikož jsou vektory v j lineárně nezávislé, matice V je regulární, a proto existuje inverzní matice V 1. Dostáváme, že A = VΛV 1. (2.3) Matice s množinou všech vlastních vektorů je tedy diagonalizovatelná. Rozkladem matice A se budeme později znovu zabývat, je na něm založena jedna z metod výpočtu pseudospektra. Na A se lze dívat i jako na lineární operátor. Na rozdíl od případu, kdy A považujeme za klasickou matici, ne všechna z σ(a) musí být nutně vlastními čísly, proto je potřeba pozměnit definici. Lineárními operátory se budeme podrobněji zabývat v následující kapitole, na tomto místě uved me pouze základní definici spektra. Definice 2.5. Necht A je uzavřený operátor definovaný na Banachově (či Hilbertově) prostoru. Potom spektrum σ(a) operátoru A je množina všech takových z C, pro která resolventa (zi A) 1 neexistuje jako omezený operátor definovaný na celém prostoru. 2.2 Normy, vlastnosti matic Jak uvidíme, pojem pseudospektra je závislý na normě, proto je potřeba zavést vhodnou maticovou normu. Definujeme tedy skalární součin a normu matice A za pomoci váhové matice W. Poté jednoduchou transformací B = WAW 1 získáme matici B, pro kterou je problém hledání pseudospektra spojen s Euklidovskou normou a příslušným skalárním součinem. 7

Necht A je reálná nebo komplexní matice na Hilbertově prostoru se skalárním součinem (, ) a normou. Definice 2.6. Necht je dána regulární váhová matice W. Pak skalární součin (, ) a normu definujeme jako (u,v) = (Wu,Wv) 2, u = Wu 2, kde (u,v) 2 = u H v, u 2 = u H u je Euklidovská norma. Vektor u H je hermitovsky sdružený vektor k u, jedná se o transponovaný vektor, ve kterém jsou původní složky nahrazeny komplexně sdruženými. Přesnou definici zavedeme pro libovolnou matici. Definice 2.7. Hermitovsky sdruženou matici A H C N N k A C N N získáme z A tak, že provedeme její transpozici a místo každého z prvků zapíšeme jeho komplexně sdruženou hodnotu, tzn. (A ij ) H = A ji, kde indexy označují jednotlivé i,j-té prvky pro 1 i,j N a horní vodorovná čárka komplexně sdruženou matici. Věta 2.8. Necht X je Hilbertův prostor se skalárním součinem (, ) a necht A : X X je lineární spojitý operátor. Pak existuje právě jeden spojitý lineární operátor A : X X takový, že (Au,v) = (u,a v), u,v X. A se nazývá adjungovaný operátor k A. Po úpravách dostáváme, že A = (W H W) 1 A H (W H W). 8

Pokud W = I, potom (u,v) = (u,v) 2, u = u 2 a A = A H. Pro obecnou W se zbavíme problémů tím, že zavedeme novou matici B = WAW 1. (2.4) Je-li v = Au pro nějaké u a v, potom z (2.4) máme (Wv) = W(Au) = B(Wu). Z definice normy matice A generované normou vektoru, dostáváme A = max u 0 Au u, A = max u 0 Au u = max u 0 W 1 BWu u = max u 0 BWu 2 u 2 = B 2. Odtud plyne, že A = B 2. Tím jsme ukázali, že v maticovém případě můžeme dále bez obav využívat Euklidovskou normu. Připomeňme ještě tři základní maticové pojmy. Definice 2.9. Matice A C N N je normální, pokud A H A = AA H. Je-li A R N N, pak A H = A T, kde A T značí matici transponovanou k A. Definice 2.10. Matice A C N N je hermitovská, pokud A H = A. 9

Definice 2.11. Matici A C N N nazveme unitární, pokud kde A 1 je inverzní matice k A. A 1 = A H, Dále připomeňme vztah normální matice a diagonalizovatelnosti. Věta 2.12. Matice A C N N je normální právě tehdy, když je unitárně diagonalizovatelná, tj. existuje diagonální matice Λ C N N a unitární matice U C N N tak, že A = UΛU H, přičemž Λ obsahuje vlastní čísla λ 1,...,λ N a sloupce matice U jsou jim po řadě odpovídající vlastní vektory. Navíc platí, že U H U = UU H = I. Většina známých aplikací analýzy vlastních čísel vyžaduje, aby matice či operátory byly normální, nebo se k tomu alespoň blížily. Pojem normálnosti matice zavedeme ještě dalším způsobem. K tomu budeme potřebovat Schurův rozklad a definici čísla podmíněnosti. Podobně jako v (2.3) máme: Definice 2.13. Necht A C N N, potom A lze zapsat jako A = UTU 1, (2.5) kde U je unitární (tedy U 1 = U H ) a T horní trojúhelníková matice. Tento rozklad nazýváme Schurův. Matice T je podobná A, má tudíž stejnou množinu vlastních čísel. Protože je navíc trojúhelníková, vlastní čísla leží na diagonále T. Je-li A navíc normální (tedy např. hermitovská či reálná symetrická), potom existuje unitární matice V taková, že a platí: A = VTV H (2.6) 10

T je diagonální. Jelikož TT H = T H T, obsahuje pouze vlastní čísla. Pro A existuje množina všech vlastních vektorů v j, které jsou ortonormální, tj. v j = 1, vektory v j tvoří sloupce matice V. V 2 = V 1 2 = V H 2 = 1. Definice 2.14. Číslem podmíněnosti matice A rozumíme číslo κ(a) = A A 1. (2.7) Platí, že κ(a) 1 pro libovolnou matici A a maticovou normu. Čím je κ(a) větší, tím je matice hůře podmíněná, což znamená, že i relativně malé změny v koeficientech způsobí relativně velké změny řešení. Existuje-li matice V z (2.6), matice A je normální, pokud: κ(v) = V V 1 = 1. Naopak, κ(v) = V V 1 >> 1 (2.8) znamená, že matice A není normální, navíc pokud vlastní vektory matice A existují, nejsou ani zdaleka ortogonální. Budeme požadovat, aby podmínka (2.8) byla splněna pro libovolnou matici vlastních vektorů V. Pro tyto matice může klasická analýza vlastních čísel selhat. 2.3 Tři základní definice pseudospektra Nyní zavedeme pojem pseudospektra konečně-dimenzionální matice. Necht značí normu na C N, prostoru komplexních vektorů délky N, a také indukovanou normu na C N N, prostoru komplexních matic typu N N. Necht A je matice C N N nebo lineární operátor na konečně-dimenzionálním 11

prostoru. V aplikované matematice nás často zajímá, zda je matice singulární či regulární. Již pro malou perturbaci se odpověd může rychle změnit, proto je vhodnější zjišt ovat, zda je A 1 velká. Podobně, místo toho, jestli je z vlastní číslo matice A, tzn. je-li (zi A) singulární, je lepší se ptát, zda je (zi A) 1 velká. To nás vede k první definici pseudospektra: Definice 2.15. Necht A C N N a ε > 0 libovolné. Pak ε-psudospektrum σ ε (A) matice A je množina z C takových, že (zi A) 1 > ε 1. (2.9) Pro z σ(a) zavedeme, že (zi A) 1 =. Pro normu resolventy platí, že (zi A) 1 = (zi B) 1 2, (2.10) kde B je dáno rovností (2.4). I zde budeme požadovat, aby rovnost (2.10) platila pro z C včetně bodů spektra σ(a) = σ(b), ve kterých nabývá hodnotu. Platí, že spektrum je obsaženo v ε-pseudospektru pro každé ε > 0. Pseudospektrum je tedy otevřená podmnožina komplexní roviny ohraničená křivkou funkce (zi A) 1 = ε 1. Jinými slovy, na normu resolventy se lze dívat jako na funkci dvou proměnných z a A, která je konstantní, rovná ε 1. Na základě této definice vidíme, že pojem pseudospektra má smysl především pro nenormální matice, pro které norma (zi A) 1 může být velká, i když je bod z daleko od spektra. Tedy má smysl pro matice, které splňují podmínku (2.8). Druhá definice pseudospektra souvisí s perturbacemi původní matice A: 12

Definice 2.16. σ ε (A) je množina z C takových, že pro E C N N, E < ε. z σ(a + E) Jinými slovy, ε-psudospektrum je množina vlastních čísel perturbované matice (A + E), E < ε. Je vidět, že pseudospektra s různými ε jsou vnořené množiny, σ ε1 (A) σ ε2 (A), 0 < ε 1 ε 2, a dále, že průnik všech pseudospekter je spektrum, σ ε (A) = σ(a). ε>0 Třetí charakterizace pseudospektra je následující: Definice 2.17. σ ε (A) je množina z C takových, že pro v C N, v = 1. (zi A)v < ε (2.11) Číslo z v (2.11) (a ekvivalentně dalších definicích) se nazývá ε-pseudovlastní číslo A a v je odpovídající ε-pseudovlastní vektor. Tedy, ε-pseudospektrum je množina ε-pseudovlastních čísel. Věta 2.18. Pro libovolnou matici A C N N jsou výše uvedené definice ε-pseudospektra ekvivalentní. 13

2.4 SVD rozklad, čtvrtá definice Dříve, než uvedeme čtvrtou definici pseudospektra, se budeme zabývat SVD rozkladem, který využijeme i v dalších kapitolách. Věta 2.19. Mějme matici A C M N. Pak existuje rozklad A takový, že A = UΣV H, kde U C M M je unitární, Σ C M N je diagonální s nezápornými reálnými čísly na diagonále a V H je hermitovsky sdružená matice k V C N N, která je unitární. Tento rozklad se nazývá SVD rozklad A. Je zvykem, že prvky Σ i,i přerovnáme tak, aby tvořily nerostoucí řadu, tzn. aby byly na diagonále seřazeny od největšího k nejmenšímu. V tom případě je diagonální matice Σ určena maticí A jednoznačně. Diagonální prvky Σ se nazývají singulární čísla A. Sloupce matice U, resp. V jsou levé, resp. pravé singulární vektory odpovídající příslušným singulárním číslům. Speciální případ rozkladu jsme odvodili v (2.6). Singulárními čísly jsou zde absolutní hodnoty vlastních čísel. Pokud = 2, normou matice je největší singulární číslo a normou inverzní matice je obrácená hodnota nejmenšího singulárního čísla. Tedy (zi A) 1 2 = [s min (zi A)] 1, (2.12) kde s min (zi A) značí nejmenší singulární číslo (zi A). Z toho lze odvodit čtvrtou definici: Definice 2.20. Je-li = 2, pak σ ε (A) je množina z C takových, že s min (zi A) < ε. (2.13) σ ε (A) jsou množiny v rovině ohraničené křivkou funkce s min (zi A) = ε. 14

Z (2.12) je zřejmé, že (2.13) je ekvivalentní s (2.9), a tedy i se všemi ostatními definicemi pseudospektra. Nyní se budeme zabývat nenormálností. Nejprve si všimneme, že pokud U je unitární, tzn. U 1 = U H, pak (zi UAU H ) 1 = [ U(zI A)U H] 1 = U(zI A) 1 U H, proto (zi UAU H ) 1 2 = (zi A) 1 2, z C. Norma resolventy je tedy invariantní vzhledem k unitárním transformacím. Tyto transformace zachovávají úhly a velikosti vektorů. Odsud máme, že to samé musí být pravda i pro pseudospektrum: σ ε (A) = σ ε (UAU H ), ε 0. Pro normální matici je ε-pseudospektrum sjednocením otevřených ε-okolí bodů spektra, ekvivalentně norma resolventy splňuje (zi A) 1 2 = 1 dist(z,σ(a)), kde dist(z,σ(a)) značí vzdálenost bodu od množiny v komplexní rovině. Otevřené okolí bodu spektra budeme značit ε = {z C : z < ε}. Věta 2.21. Pro libovolnou matici A C N N σ ε (A) σ(a) + ε, ε > 0, pokud je navíc A normální a = 2, pak σ ε (A) = σ(a) + ε, ε > 0. (2.14) Obráceně, je-li = 2, pak (2.14) implikuje, že A je normální. 15

1 2 2 0.8 0.4 0.6 0.3 0.4 2.5 0.2 2.5 0.2 0.1 0 3 0 3 0.2 0.1 0.4 3.5 0.2 3.5 0.6 0.3 0.8 0.4 1 0.5 1 1.5 2 2.5 4 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 2 4 Obr. 2.1: σ ε (A) normální matice Obr. 2.2: σ ε (A) nenormální matice Doplňme, že použitý součet má obvyklý význam, tj. σ(a) + ε = {z : z = z 1 + z 2,z 1 σ(a),z 2 ε } = = {z : dist(z,σ(a)) < ε}. Předpokládejme nyní, že A je diagonalizovatelná. Necht V C N N je matice vlastních vektorů A stejně jako v (2.3). Pokud = 2, pak číslo podmíněnosti matice V z (2.7) je κ(v) = V 2 V 1 2 = s max(v) s min (V), kde s max (V) a s min (V) jsou po řadě největší a nejmenší singulární číslo matice V. Připomeňme, že 1 κ(v) < a κ(v) = 1 právě tehdy, když A je normální. Číslo podmíněnosti V nám dává horní odhad čísel podmíněnosti jednotlivých vlastních čísel matice A. Toto tvrzení je známo jako Bauer-Fikeova věta: Věta 2.22. Necht A C N N je diagonalizovatelná, A = VΛV 1. Potom ε > 0 a normu = 2 platí, že σ(a) + ε σ ε (A) σ(a) + εκ(v). 16

Tedy, pokud je A perturbována pomocí E, potom se poloha vlastních čísel změní nejvýše o κ(v) E 2. Kapitolu zakončíme několika základními vlastnostmi pseudospektra. Věta 2.23. Necht A C N N a ε > 0 je libovolné. Potom 1. σ ε (A) je neprázdná, otevřená a omezená množina s nejvýše N komponentami, každá obsahuje jedno či více vlastních čísel matice A. 2. Je-li = 2, pak σ ε (A H ) = σ ε (A). 3. Je-li = 2, ( pak σ ε (A 1 ) A 2 ) = σ ε (A 1 ) σ ε (A 2 ), A1 0 kde A 1 A 2 =. 0 A 2 4. Pro libovolné c C je σ ε (A + ci) = c + σ ε (A). 5. Pro libovolné nenulové c C je σ c ε (ca) = cσ ε (A). 17

Kapitola 3 Pseudospektrum lineárních operátorů Teorii o pseudospektru z minulé kapitoly lze zobecnit pro lineární operátory na nekonečně-dimenzionálních prostorech, zaměříme se na Banachovy prostory. Necht X je komplexní Banachův prostor, úplný normovaný lineární prostor na C s normou. Budeme uvažovat operátory A : X X s definičním oborem D(A) X. Dále označíme B(X) množinu omezených a C(X) množinu uzavřených operátorů na X. Pro A B(X) budeme bez újmy na obecnosti předpokládat, že D(A) = X. Uzavřenost operátoru A znamená, že pokud posloupnost {u k } z D(A) konverguje k limitě u X a pokud {Au k } konverguje k limitě v X, potom u D(A) a Au = v. Neomezený uzavřený operátor již nutně musí mít D(A) X, přestože mnoho takových operátorů je definováno tak, že D(A) je hustý v X, tzn. D(A) = X. Dále budeme pracovat pouze s uzavřenými operátory. Pro A C(X) a E B(X) platí, že A + E C(X), definiční obor D(A + E) = D(A). 18

Definice 3.1. Necht A C(X). Omezený inverzní operátor A 1 B(X) je takový operátor, že AA 1 je identita na X a A 1 A je identita na D(A). Toto je jediný druh inverzního operátoru, který nás bude zajímat, a kdykoliv použijeme výraz jako A 1 či (zi A) 1, budeme tím myslet omezený inverzní operátor na X. Věta 3.2. Necht pro A C(X) existuje omezený inverzní operátor A 1. Pak pro libovolný operátor E B(X), E < 1 A 1 existuje k A+E omezený inverzní operátor (A + E) 1 splňující (A + E) 1 A 1 1 E A 1. 1 Naopak, pro libovolné µ > existuje E B(X), E < µ tak, že A 1 (A + E)u = 0 pro nějaké nenulové u X. Nyní aplikujeme předchozí větu na operátor (zi A), kde z je komplexní konstanta. Necht je dán operátor A C(X) a z C, resolventou A v z rozumíme, pokud existuje, operátor (zi A) 1 B(X). Resolventní množina ρ(a) je množina čísel z C, pro která (zi A) 1 existuje. Z uvedené věty dále plyne, že ρ(a) je otevřená. Navíc, (zi A) 1 je analytická funkce proměnné z ρ(a). Spektrum A C(X) je doplňkem resolventní množiny v komplexní rovině, tzn. σ(a) = C \ ρ(a). Jelikož ρ(a) je otevřená, σ(a) je uzavřená. Pro A B(X) je σ(a) omezená a neprázdná množina. Pro A C(X) může být σ(a) neomezená nebo prázdná. Pokud Au = λu pro nějaké nenulové u X a A C(X), pak u a λ se nazývají vlastní vektor a vlastní číslo A. Spektrum σ(a) obsahuje všechna vlastní čísla A, ale může být i větší. Z věty také vyplývá, že pro libovolné A C(X) a z ρ(a) platí (zi A) 1 1 dist(z,σ(a)). 19

Odsud dostáváme, že čím více se z blíží ke spektru, tím větší je (zi A) 1, tzn. tím více se blíží k. Proto opět (zi A) 1 definujeme jako pro z σ(a). Věta 3.3. Necht A C(X). Norma resolventy (zi A) 1 je funkce ze z C do (0, ] s následujícími vlastnostmi: Je spojitá a neomezená a nabývá hodnotu na σ(a). Pokud z / σ(a), pak také z / σ(a + E) pro libovolný operátor 1 E B(X), který splňuje E. (zi A) 1 1 Naopak, pro libovolné µ > existuje operátor E B(X), (zi A) 1 E < µ takový, že (A + E)u = zu pro nějaké nenulové u X. Na základě poslední uvedené věty tedy víme, že každé z, které neleží v σ(a), také není obsaženo v σ(a + E) pro dostatečně malou E. Dříve jsme zavedli tři ekvivalentní definice ε-pseudospektra matice A. Nyní je aplikujeme na lineární operátory na Banachově prostoru. Věta 3.4. Necht A C(X) a ε > 0 je libovolné. Pseudospektrum σ ε (A) operátoru A je množina z C definovaná jednou z následujících ekvivalentních podmínek: (zi A) 1 > ε 1, z σ(a + E) pro nějaký operátor E B(X) s E < ε, z σ(a) nebo (zi A)u < ε pro nějaké u D(A) s u = 1. Pokud (zi A)u < ε, potom z je ε-pseudovlastní číslo A a u je odpovídající ε-pseudovlastní vektor. Věta 3.5. Necht A C(X), pseudospektrum {σ ε (A)} ε>0 má následující vlastnosti: Lze ho definovat pomocí jedné z podmínek uvedené v předchozí větě. Definice jsou ekvivalentní. 20

Každé σ ε (A) je neprázdná otevřená podmnožina C a každá omezená souvislá komponenta σ ε (A) má neprázdný průnik s σ(a). Dále platí σ ε (A) = σ(a) ε>0 a naopak, pro libovolné δ > 0 σ ε+δ (A) σ ε (A) + δ, kde δ je otevřené okolí o poloměru δ. 3.1 Změna norem v Banachových prostorech Pro malé plné matice jsou všechny normy ekvivalentní, proto se dvě různé normy resolventy liší nejvýše o konstantu. Pokud přejdeme od jedné normy k druhé, v mnoha případech se pseudospektrum příliš nezmění. Ovšem bylo by chybou předpokládat, že rozdíl mezi 2 a 1, nebo obecněji, mezi Hilbertovými a Banachovými prostory, je vždy malý. Pokud uvažujeme nekonečně-dimenzionální operátory nebo jejich maticové diskretizace, rozdíly mezi p-normami mohou být libovolně velké! 21

Kapitola 4 Výpočet pseudospektra V této kapitole popíšeme jednotlivé způsoby výpočtu pseudospektra. Jelikož se jedná o množiny v komplexní rovině, výpočtem budeme rozumět zobrazení hranice σ ε (A) pro různá ε. Nejprve se budeme zabývat hledáním vlastních čísel plných matic. Na matice s nižší dimenzí (menší než cca 1000) lze aplikovat standardní přímé metody příbuzné QR algoritmu, pro získání výsledku je potřeba O(N 3 ) operací. Matice s větší dimenzí vyžadují speciální zacházení, je možné využít metody Krylovových podprostorů - nenaleznou se všechna vlastní čísla, ale pouze ta, která se zdají být v komplexní rovině podstatná. 4.1 Mřížková metoda Všechny algoritmy vycházejí z definice pseudospektra. Připomeňme, že σ ε (A) = { z C : (zi A) 1 > ε 1}, pro = 2 σ ε (A) = {z C : s min(zi A) < ε}. (4.1) První výpočetní metoda se ihned nabízí. Vytvoříme sít v komplexní rovině a v každém bodě z této sítě vypočteme SVD rozklad matice (zi A). Získáme tak množinu jejích singulárních čísel, z ní vybereme to nejmenší. 22

Splňuje-li nerovnost (4.1), je součástí pseudospektra. Z obdržených dat poté vykreslíme obrys pseudospektra. Je-li A hermitovská, obrázek bude symetrický dle reálné osy, výpočetní čas se o polovinu zkrátí. Je zřejmé, že popsaný algoritmus není ani zdaleka optimální. SVD rozklad matice typu N N provedený v každém bodě mřížky ν ν vyžaduje O(ν 2 N 3 ) operací. Jistého urychlení můžeme dosáhnout tím, že vezmeme hrubší mřížku, nicméně ve většině případů nedostaneme uspokojivý výsledek. Proto se pokusíme nalézt metody jiné. 4.1.1 Iterační metody pro výpočet s min (zi A) Náročnost SVD rozkladu je způsobena tím, že při něm dochází k výpočtu všech singulárních čísel (zi A). Proto budeme hledat pouze nejmenší singulární číslo pomocí nějaké iterační metody. Postupy jsou založeny na faktu, že s min (zi A) = nejmenší vlastní číslo (zi A) H (zi A) = = nejmenší kladné vlastní číslo ( 0 zi A zi A H 0 ). Výpočet se pokusíme urychlit pomocí metody inverzních iterací. Označme B = (zi A) a připomeňme, že nejmenší vlastní číslo B H B odpovídá největšímu vlastnímu číslu B 1 B H, tzn. inverzi. Hledáme-li tedy nejmenší vlastní číslo B H B, stačí na inverzi celého výrazu aplikovat mocninnou metodu. Ta používá násobení B 1 a B H, to lze zrealizovat pomocí LU rozkladu matice B. Výpočet tohoto rozkladu v jednom bodě mřížky ovšem vyžaduje O(N 3 ) operací, čímž dostáváme stejnou složitost jako u úplného SVD rozkladu. Proto později provedeme další úpravy, nejdříve se krátce zmíníme o mocninné metodě a LU rozkladu. Mocninná metoda Tato metoda nám umožňuje jednoduše vypočítat jedno vlastní číslo λ, nejčastěji to největší, a jemu odpovídající vlastní vektor v. 23

Věta 4.1. Necht A je matice typu N N, která má N různých vlastních čísel λ 1,λ 2,...,λ N, která jsou seřazena sestupně podle velikosti v absolutní hodnotě, tzn. λ 1 > λ 2 λ 3... λ N {(. Pokud je počáteční )} vektor x 0 vhodně zvolen, potom posloupnosti {x k } = x (k) 1,x (k) 2,...,x (k) N a {c k } počítané rekurzivně tak, že y k = Ax k, x k+1 = 1 y k, c k+1 { } x (k) kde c k+1 = max i, konvergují k vlastnímu vektoru v 1 a vlastnímu 1 i N číslu λ 1, tj. lim x k = v 1, k a platí Av 1 = λv 1. lim k c k = λ 1 LU rozklad Definice 4.2. Matice A se nazývá silně regulární, jestliže všechny její hlavní minory, tj. determinanty matic A k, k = 1,...,N, jsou nenulové, kde a 11 a 1k A k =..... a k1 a kk Věta 4.3. Necht A je silně regulární reálná matice typu N N. Pak existuje právě jedna dolní trojúhelníková matice L s jedničkami na diagonále a horní trojúhelníková matice U tak, že A = LU. Přitom platí, že u kk = deta k deta k 1, k = 2,...,N. 24

Předpokládejme, že před výpočtem singulárních čísel provedeme Schurův rozklad (viz (2.5)), čímž nahradíme matici A unitárně ekvivalentní horní trojúhelníkovou maticí T. Potom je matice (zi A) unitárně ekvivalentní k horní trojúhelníkové matici (zi T) pro libovolné z, obě matice mají stejná singulární čísla a σ ε (T) = σ ε (A). Jelikož je v každém bodě z matice (zi T) trojúhelníková, není potřeba provádět LU rozklad, a tudíž na výpočet jejího nejmenšího singulárního čísla stačí pouze O(N 2 ) operací. Schurův rozklad je proveden pouze jednou, předtím, než začneme zpracovávat jednotlivé body mřížky, což vyžaduje O(N 3 ) operací. Jelikož tato metoda konverguje obvykle v několika málo krocích, dostáváme celkovou složitost O(N 3 + ν 2 N 2 ). V mnoha aplikacích je možné dosáhnout dokonce až O(ν 2 N 2 ). Je velmi pravděpodobné, že se konvergence zpomalí, pokud největší vlastní číslo (zi A) 1 (zi A) H není dostatečně odděleno od ostatních. Tehdy je vhodné použít některou z více důmyslných metod, např. Lanczosovu. Ta aproximuje nejmenší singulární číslo (zi A) tak, že využívá lineární kombinace výsledků jednotlivých kroků získaných pomocí metody inverzních iterací. Poznámka 4.4. Počítáme-li s min (zi A) iteračně, může se stát, že již během výpočtu zjistíme, že bod z nemůže být v pseudospektru. Je-li např. s min (zi A) > 1, my chceme vykreslit křivky, které používají 10 1, je samozřejmě vhodné s iteracemi předčasně skončit. 4.1.2 Projekce do podprostorů s nižší dimenzí Dalším, naprosto odlišným způsobem, jak zrychlit výpočet, je redukovat dimenzi N matice A. Provedeme ortogonální projekci A na odpovídající invariantní podprostor dimenze M < N. Jedná se o jednoduchou, ale důležitou techniku, která je často opomíjena, přitom lze dosáhnout výrazného zrychlení. Definice 4.5. Necht T : V V lineární zobrazení vektorového prostoru V. Potom W je invariatním podprostorem V, pokud T(W) je obsaženo ve W. Říkáme, že W je T-invariantní. 25

Je-li v vlastní vektor T, tj. T v = λv, pak W = span {v} je T-invariantní. Metoda založená na diagonalizaci matice Necht V je matice typu N M taková, že jejími sloupci jsou zvolené lineárně nezávislé vlastní vektory A a která splňuje AV = VΛ, kde Λ je diagonální matice typu M M obsahující odpovídající vlastní čísla, viz. (2.2). Definice 4.6. Necht A je komplexní matice typu N M, N M. QR rozkladem matice A rozumíme součin A = QR, kde Q je unitární matice typu N N a R je horní trojúhelníková typu N M. Poznámka 4.7. Jelikož dolních N M řádků matice R obsahuje nuly, je často užitečné použít rozdělení R, popř. i Q: ( ) R1 A = QR = Q = ( ) ( ) R Q 0 1 Q 1 2 = Q 0 1 R 1, kde R 1 je horní trojúhelníková matice typu M M, Q 1 je typu N M, Q 2 typu N (N M), přičemž Q 1 i Q 2 mají ortogonální sloupce. Pokud V = QR, tedy provedeme QR-rozklad matice V, kde Q je typu N M a R je typu M M, dostáváme Q H V = R a Q = VR 1. Odsud Q H BQ = Q H BVR 1 = Q H VΛR 1 = RΛR 1. T = RΛR 1 je typu M M, horní trojúhelníková, jedná se o maticovou reprezentací projekce A na podprostor generovaný zvolenými vlastními vektory. Matice A bývá v aplikacích nediagonalizovatelná, z čehož plyne špatná podmíněnost úloh souvisejících s vlastními čísly. Sice se v praxi ukazuje, že využití diagonalizace často nezpůsobuje mnoho potíží, nicméně, už jen z principu bychom se jí měli vyhýbat. 26

Metoda založená na částečném Schurově rozkladu Předpokládejme unitární transformaci ve tvaru [ ] T X A = Q Q H, (4.2) 0 Y kde Q C N N je unitární matice, T C M M je horní trojúhelníková matice, X C M (N M) a Y C (N M) (N M) jsou libovolné. Je-li Q 1 C N M matice složená z prvních M sloupců Q, potom z (4.2) plyne BQ 1 = Q 1 T. Tedy pokud Tx = λx, pak B(Q 1 x) = λ(q 1 x). Na diagonále matice T se nachází M vlastních čísel matice B a T reprezentuje projekci A na odpovídající invariantní podprostor. Dodejme, že transformace (4.2) se nazývá částečný Schurův rozklad. Jelikož jsou X a Y libovolné, zbývá vyřešit, jak nalézt matici Q 1 C N M, která má ortonormální sloupcové vektory takové, že T = Q 1 H BQ 1 je horní trojúhelníková matice. To lze provést mnoha způsoby, my budeme uvažovat ten nejjednodušší - výpočet kompletního Schurova rozkladu, viz (2.5). Poté přerovnáme diagonální prvky tak, abychom ty důležité přesunuli do horního levého rohu. Ortogonální projekce nezvyšují normu resolventy v žádném z bodů z. Je-li σ ε (T) pseudospektrum promítnuté matice, potom σ ε (T) σ ε (A), přičemž pseudospektrum T se monotónně zvětšuje a přibližuje k pseudospektru A v závislosti na tom, jak postupně zvětšujeme podprostor. 4.1.3 Volba mřížky Zbývá položit si otázku, jak určit mřížku, na které se bude pseudospektrum σ ε (A) počítat. Obecně je doporučováno odvodit hranice mřížky z vlastních čísel obdržených ze Schurova rozkladu. Pokud před začátkem samotného výpočtu známe největší hodnotu ε, která nás bude zajímat, existují metody, jak vyloučit nezajímavé body z výpočetní oblasti. Pro malé matice schopnost upravit ε po výpočtu většinou převáží 27

výhody spojené s těmito metodami. Nicméně pro velmi velké matice, kde je každý výpočet singulárních čísel drahý, bývají daleko důležitější. 4.2 Kontinuační techniky Jednou z motivací pro použití iteračních metod je aplikace kontinuačních technik, tj. přímého sledování hraniční křivky, kde využíváme singulární vektor vypočítaný v jednom z bodů jako počáteční vektor pro bod sousední. Tato technika má dvě potenciální výhody. Za prvé lze hraniční křivku určit s velkou přesností, pokud je to požadováno. Za druhé je vysoce pravděpodobné, že se sníží množství výpočtů s min (zi A), jelikož zde nevyužíváme žádnou mřížku. Naopak problémy mohou nastat v oblastech mezi dvěma vlastními čísly. Dále je nutné vyřešit, jak pracovat s místy, kde hranice není hladká, či s pseudospektrem, pokud je složeno z více komponent. Proto je vhodné tuto techniku používat především v případě, kdy se potřebujeme soustředit na určitou část hranice. Například ji lze využít v programu, kde uživatel klikne myší na bod v komplexní rovině a počítač vykreslí okraj pseudospektra procházející tímto bodem, popř. také numericky vypočítá horní a dolní meze založené na křivce. Takto lze získat kvalitní informace a graficky pěkné obrázky. Věta 4.8. Necht bod z 0 σ ε a s min je jednoduché singulární číslo matice (z 0 I A). Pak hranice σ ε je na okolí z 0 reálnou analytickou křivkou. Necht dále u min a v min jsou levý a pravý singulární vektor příslušné k s min. Pak výraz i v min H u min v minh u min definuje pozitivně orientovaný tečný směr v z 0. Definice 4.9. Necht z C. Pak (s min,u min,v min ) nazveme minimální singulární trojicí matice (zi A), pokud s min je nejmenší singulární číslo (zi A) a u min,v min C N jsou po řadě odpovídající levý a pravý singulární vektor. 28

V dalším textu bude R, resp. I značit zobrazení, které prvkům (číslům, vektorům, maticím) přiřazuje jejich reálnou, resp. imaginární část. Tato zobrazení nám pomohou zformulovat podmínky na přeškálování. Nyní popíšeme algoritmus, pomocí něhož lze za předpokladů předchozí věty prodloužit souvislou část hranice σ ε (A), vycházíme-li z bodu z 0. Necht z 0 σ ε a necht je dána pevná velikost kroku τ. Generujeme posloupnost bodů {z k } C, z k 1 z k : Jako první krok vypočteme (s, u, v), tzn. minimální singulární trojici matice (z 0 I A). Jelikož se jedná o metodu prediktor-korektor, odhadneme polohu bodu ẑ k = z k 1 + τi vh u. Nyní znovu spočteme (s,u,v), tentokrát pro matici (ẑ k I A). Následně upravíme polohu bodu z k = ẑ k (s ε). Tím jsme v H u u H v získali nový bod křivky. Celý postup (kromě prvního kroku) opakujeme pro další body tak dlouho, dokud není hranice vykreslena celá. Je uváděno, že pouze jeden opravný krok stačí, aby byla zaručena malá relativní chyba s ε ε. Kontinuační myšlenka Uvažujme singulární trojici (s,u,v) libovolné matice B C N N, s R, s 0, u,v C N tak, že: Bv = su, B H u = sv, (4.3) v H v = 1, u H u = 1. (4.4) Jedná se o základní podmínky vycházející z definice singulárních vektorů a odpovídajícího singulárního čísla. Všimneme si, že platí su H u = u H Bv = (u H Bv) H = v H B H u = sv H v. Je-li s > 0, potom u H u = v H v. (4.5) 29

Dále vidíme, že I(v H v) = I(u H u) = 0. Odsud, v případě, že s > 0, lze škálovací podmínky (4.4) přepsat jako R(v H v) = 1. (4.6) Jelikož platí (4.5), podmínku (4.6) zřejmě můžeme nahradit R(u H u) = 1, popř. R(v H v) + R(u H u) = 2. Co se týče jednoznačnosti, platí, že je-li (s, u, v) singulární trojice matice B, potom (s, u, v) je také singulární trojice matice B. Poznámka 4.10. Je-li s > 0 jednoduché singulární číslo matice B, potom (s,u,v) a (s, u, v) jsou jedinými řešeními (4.3) a (4.6). Dále budeme uvažovat B = (zi A), z = x + iy. Položme s = ε, ε > 0 je pevný parametr. Naším cílem nyní bude přepsat podmínky (4.3) a (4.6) pro levý a pravý singulární vektor u a v, které přísluší k singulárnímu číslu ε, u = R(u) + ii(u) a v = R(v) + ii(v), u i v závisejí na z = x + iy. To nás vede k definování kde f : R 2+4N R 1+4N, (4.7) ξ R 1 R 1 R N R N R N R N f(ξ) R 2N R 2N R 1. ψ 1 = ε ( R(u) I(u) ( R(v) ψ 2 = ε I(v) ξ = (x,y, R(u), I(u), R(v), I(v)), f(ξ) = (ψ 1,ψ 2,ψ 3 ), ) ( xi R(A) yi + I(A) + yi I(A) xi R(A) ) + ( xi R(A T ) yi I(A T ) yi I(A T ) xi R(A T ) ) ( R(v) I(v) ) ( R(u) I(u) ) ) (4.8) (4.9) ψ 3 = (R(v)) T R(v) + (I(v)) T I(v) 1. (4.10) 30

Obecněji, rovnice definuje křivku v R 2+4N. f(ξ) = f(x,y, R(u), I(u), R(v), I(v)) = 0 (4.11) Je možné zavést křivku pro libovolné k-té singulární číslo, 1 k N. Je-li k = 1, pracujeme s tím největším, naopak k = N vede na nejmenší singulární číslo. Nás tedy zajímá poslední zmíněný případ k = N, jelikož dostáváme spojitou část hranice pseudospektra, tj. σ ε. Necht z σ ε splňuje předpoklady věty. Pak z souvisí s kořenem f(ξ) = 0, kde ξ = (x,y, R(u), I(u), R(v), I(v)), z = x + iy, ε = s min ((x + iy)i A), u min = R(u)+iI(u), v min = R(v)+iI(v). Odsud máme, že kořen ξ souvisí s minimální singulární trojicí (ε,u min,v min ). Z poznámky víme, že pro minimální singulární trojici (ε, u min, v min ) máme druhé řešení. Dostáváme f(x, y, R(u), I(u), R(v), I(v)) = 0. Tento jev souvisí s orientací křivky: Definice 4.11. Necht Df(ξ) R (1+4N) (2+4N) je diferenciál funkce f v ξ. Řekneme, že δξ R 2+4N je směrnice, platí-li, že Df(ξ)δξ = 0, δξ T δξ = 1. (4.12) Definice 4.12. Necht δξ splňuje (4.12) a (δx,δy) R 2 značí první dvě složky δξ R 2+4N. Řekneme, že směrnice je pozitivně orientovaná, pokud ( ) δx δy det R(v H min u min ) I(v H > 0. (4.13) min u min ) To je ve shodě s orientací σ ε v z = x + iy: Necht δz = δx + iδy. Pak δz δz = i v min H u min v minh u min. 31

Abychom mohli algoritmus inicializovat, potřebujeme znát výchozí bod. Proto musíme vyřešit následující úlohu: Necht je dáno ε > 0, najděte bod z 0 = x 0 + iy 0, z 0 σ ε. Uvažujme (x t,y t ) R 2, z t = x t + iy t C inicializační odhad bodu na σ ε. Vypočteme minimální singulární trojici (s min,u min,v min ) matice z t I A. Položme ξ t = (x t,y t, R(u min ), I(u min ), R(v min ), I(v min )) R 2+4N. Obecně, s min > 0. Definujme f jako v (4.7), kde v (4.8) - (4.10) položíme ε = s min. Potom f(ξ t ) = 0. Zkonstruujeme pozitivně orientovanou směrnici δξ t v ξ t jako v (4.12) a (4.13). Uvažujme f definovanou jako v (4.7) - (4.10), kde ε > 0 je dáno. Iterace ( ) Df(ξ) ξ ξ T f(ξ) δξ t začínající v ξ t lokálně konvergují do bodu ξ 0 R 2+4N, f(ξ 0 ) = 0. Necht (x 0,y 0 ) R 2 značí první dvě složky ξ 0 a necht z 0 = x 0 + iy 0. Pak z 0 σ ε. Tedy, získali jsme výchozí bod hranice σ ε. 4.3 Chudé pseudospektrum V této části zmíníme algoritmus, který vychází z definice pseudospektra využívající perturbace matice: σ ε (A) = σ(a + E). E <ε Postup je následující: Budeme volit libovolné matice E s E = ε a vykreslovat přes sebe spektra σ(a + E) vypočítaná pomocí standardních algoritmů pro vlastní čísla plných matic. Výsledkem je chudé pseudospektrum, množina vlastních čísel obklopující spektrum, jejíž hustota závisí na počtu použitých perturbací a jejich pravděpodobnostním rozdělení. Lze ukázat, že libovolný bod pseudospektra lze dostat i v případě, že E bude mít hodnost 1. Je-li E vygenerována jako plně-dimenzionální matice, potom 32

znormování (tedy E < ε) vyžaduje O(N 3 ) operací, zatímco na konstrukci a znormování matice s hodností 1 stačí O(N 2 ) operací. Pochopitelně matice s hodností 1 budou mít odlišné statistické vlastnosti než matice s nezávislými náhodnými prvky. Pokud nás zajímá ε-pseudospektrum pro další hodnoty ε, celý postup je nutné zopakovat. Obrázky získané z perturbací mají intuitivní charakter a poskytují nám pouze dolní odhady na σ ε (A), které navíc nemusejí být dostatečně ostré. Sice lze získat levnou aproximaci, ale vzhledem k rozvoji rychlých výpočtů σ ε (A) na mřížce zájem o tuto techniku klesá. 4.4 Metody Krylovových podprostorů Doposud jsme se zabývali metodami, které spadají do oblasti práce s plnými maticemi, kde je všech N 2 prvků matice zpracováváno přímo a základní maticové výpočty vyžadují O(N 3 ) operací. Pro matice s vysokým řádem (tisíc a víc) lze využít vhodné metody spojené s Krylovovými podprostory. K problematice lze přistupovat dvěma způsoby. Za prvé lze pseudospektrum matice nebo operátoru aproximovat pomocí posloupnosti Krylovových podprostorů. Víme, že existují procesy blízké metodám, které byly popsány v části o projekcích do podprostorů nižšího řádu. Místo počítaní vlastních čísel v těchto podprostorech můžeme hledat rovnou pseudospektrum. Za druhé lze Krylovovy metody použít bodově k urychlení výpočtu normy resolventy pro jednotlivé hodnoty z. Zabývejme se nejdříve první z možností, popíšeme nejjednodušší způsob. Začneme od libovolného počátečního vektoru a použijeme Arnoldiho metodu obvyklým způsobem, čímž získáme posloupnost vektorů Hessenbergovy matice, která je unitárně ekvivalentní k matici A. Poté postupně vypočteme pseudospektrum částí této Hessenbergovy matice a tyto vezmeme jako aproximace pseudospektra A. Je vhodné brát spíše obdélníkové části s dimenzí ve tvaru (N +1) N než čtvercové. Pseudospektrum obdélníkové matice A lze definovat pomocí (2.13). Nicméně kvůli přímému využití Arnoldiho metody (její nároky rostou se zvyšujícím se počtem iterací) obdržené výsledky nebývají uspokojivé a často je potřeba použít metodu jinou. 33

Připomeňme, že Hessenbergovou maticí rozumíme téměř trojúhelníkovou matici, přesněji, horní Hessenbergova matice má nulové prvky pod první subdiagonálou, dolní Hessenbergova matice naopak nad první superdiagonálou. V druhém z případů, tzn. pokud metody Krylovových podprostorů aplikujeme na jednotlivé body z C či na lokální oblasti, máme potenciál pro rychlou konvergenci v libovolné přesnosti. Pro problémy vysokých dimenzí se jedná o nejefektivnější metody. Poznámky k metodám Krylovových podprostorů Tyto metody jsou poměrně nové, řeší velké řídké systémy Ax = b. Vycházejí z metody konjugovaných gradientů, za všechny jmenujme především GMRES. Tyto metody většinou konvergují rychle, ale analýza je složitá. Jejich chování závisí na vlastních číslech, ale také na dalších vlastnostech matic spojených především s nenormálností. Pomocí Krylovových iterací lze získat aproximace řešení ve tvaru x k = x 0 + q k, kde x 0 je počáteční odhad a q k bereme z Krylovova podprostoru K k (A,r 0 ) = span { r 0,Ar 0,...,A k 1 r 0 }. Vektor r 0 značí počáteční reziduum, r 0 = b Ax 0. Konstrukce a analýza takových metod úzce souvisí s polynomiální strukturou Krylovových podprostorů. Libovolný vektor v K k (A,r 0 ) lze zapsat jako polynom v A krát r 0, a tedy q k = q k (A)r 0 pro nějaké q k P k 1, kde P k 1 značí množinu polynomů stupně k 1 nebo menšího. Jádrem GMRES metody je Arnoldiho proces, mechanizmus vytvoření ortonormální báze pro Krylovův podprostor. První vektor báze je u 1 = r 0 / r 0 a k-tá iterace Arnoldiho procesu stanovuje vektor u k+1 tak, že span {u 1,...,u k+1 } = K k+1 (A,r 0 ). Nový bázový vektor je vypočítán aplikováním kroku Gram-Schmidtova algoritmu tak, aby byl vektor Au k K k+1 (A,r 0 ) kolmý k bázovým vektorům K k (A,r 0 ): k u k+1 = Au k (Au k,u j )u j. j=1 34

Kapitola 5 Chování pseudospektra Nyní se pokusíme popsat dva hlavní důvody, proč má smysl pseudospektrum počítat. Za prvé lze získat představu o tom, jak se systém chová, např. je možné vyšetřovat stabilitu a resonanci pro různé fyzikální a numerické procesy a rychlost konvergence iterací. Jevy týkající se chování jsou typicky vyjádřeny pomocí norem funkcí matic či operátorů A k, e ta či p(a), kde p je polynomiální či racionální funkce. Je-li A neomezený operátor, s pojmem e ta lze pracovat pomocí různých metod používaných v teorii semigrup. Za druhé pseudospektrum může pomoci při řešení problémů souvisejících s diagonalizací, především u vysoce nenormálních matic, kde většinou dostaneme přesnější výsledky než při práci s vlastními čísly. Díky pseudospektru sice obecně nemůžeme získat exaktní informace týkající se norem funkcí matic či operátorů, nicméně většinou nám poskytne daleko ostřejší odhady, než pokud bychom pracovali pouze s vlastními čísly. Všeobecně vzato lze získat odhady f(a) pro libovolnou funkci f. Na nenormální matice a operátory lze pohlížet z mnoha stran, zaměříme se na přechody v dynamických systémemech závislých na čase, kde jsou vlastní čísla zavádějící. Omezíme se na situaci, kdy máme lineární dynamický systém definovaný pomocí pevné matice či operátoru. Budou nás zajímat případy, ve kterých se chování systému při přechodu odlišuje od chování ve velkých časech z důvodu nenormálnosti. 35

Pokud vlastní čísla selhávají v zachycení přechodů, můžeme pomocí pseudospektra získat lepší výsledek? Ukazuje se, že většinou ano. Přestože pseudospektrum nám jen zřídka dává přesnou informaci, zachytí a vypočte přechody, které vlastní čísla nezjistí. Ve většině následujících odhadů budeme používat tyto pojmy: Definice 5.1. { x H Ax } W(A) = : x x H x CN,x 0... numerický rozsah A, tzn. rozsah Rayleighových koeficientů; α(a) = sup Re z... spektrální abscisa A; z σ(a) α ε (A) = sup Re z... ε-pseudospektrální abscisa A; z σ ε(a) ω ( A) = sup Re z... numerická abscisa A; z W(A) ρ(a) = sup z... spektrální poloměr A; z σ(a) ρ ε (A) = sup z... ε-pseudospektrální poloměr A; z σ ε(a) µ ( A) = sup z... numerický poloměr A; z W(A) Všechna čísla souvisí s pseudospektrem A. 5.1 Dynamické systémy se spojitým časem Mějme matici nebo lineární operátor A a rovnici závislou na čase: du dt = Au. 36

Budeme vyšetřovat růst a pokles řešení u(t) = e ta u(0), tzn. velikost e ta jakožto funkce proměnné t. Máme tedy A - matici či hustě definovaný uzavřený lineární operátor na Banachově prostoru s normou. Nejdříve musíme upřesnit význam e ta. Je-li A matice či omezený operátor, e ta lze definovat jako konvergentní mocninnou řadu. Pro neomezený operátor A C(X) s definičním oborem D(A) význam e ta vychází z teorie semigrup. Semigrupa C 0 je třída omezených operátorů {T(t)} 0 t< s vlastnostmi takovými, že T(0) je identita, T(t + s) = T(t)T(s) pro s,t 0 a T(t)u je spojitá funkce proměnné t pro každé u X. Infinitezimální generátor semigrupy je operátor A definovaný podmínkou Au = lim t 0 T(t)u u t s definičním oborem D(A) takovým, že uvažujeme množinu všech vektorů u X, pro které limita existuje. A je hustě definovaný uzavřený operátor a určuje semigrupu jednoznačně. Tedy, kdykoliv použijeme e ta a A bude neomezený operátor, jedná se o zkratku pro semigrupu C 0 generovanou A. Víme, že pokud A je matice či uzavřený lineární operátor generující semigrupu C 0, pak existují konstanty ω R a M 1 tak, že e ta Me ωt, t 0. Dále uved me, že libovolné z C s Re z > ω leží v resolventní množině A a platí (zi A) 1 = 0 e zt e ta dt. Vrat me se nyní k úvodnímu příkladu. Pro t lze očekávat, že vlastní čísla, obecněji spektrum, budou směrodatná, asymptotickou rychlost růstu e ta lze získat pomocí spektrální abscisy A. Rovnice lim t t 1 log e ta = α(a) (5.1) 37

platí pro libovolnou matici či omezený operátor A v Banachově prostoru. Problémy mohou nastat v případě neomezených operátorů, kde levá strana rovnosti (5.1) může být větší než pravá. V Hilbertových prostorech stačí nahradit α(a) limitou lim ε 0 α ε (A). Nyní rozebereme případ t 0. Pokud A je matice či lineární operátor takový, že generuje semigrupu C 0 v Banachově prostoru, existuje dostatečně přesný a jednoduchý výsledek. Počáteční růst e ta je roven d e ta dt = lim t 1 log e ta = ω(a). (5.2) t 0 t=0 Tedy chování v případě, že t 0, je určeno numerickou abscisou ω(a). Nejvíce nás budou konečné nenulové hodnoty t (tedy ne okrajové t a t 0). Pro ně lze odvodit mnoho různých odhadů. Samotná vlastní čísla dávají dolní odhad platný pro matice či lineární operátory v libovolné normě: e ta e tα(a), t 0. (5.3) Sdružený dolní odhad vychází z numerické abscisy ω(a), e ta e tω(a), t 0. (5.4) Dále platí, že e ta = e tω(a) + o(t), pokud t 0. (5.5) Obecně dostáváme, že e ta 1, t 0 právě tehdy, když ω(a) 0. Rovnost (5.5) ukazuje, že numerický rozsah nám může poskytnout přesnou informaci o chování matice. Nicméně díky němu nezískáme odpověd na otázku, zda existuje konstanta C taková, že e ta C, t 0, tj. je-li A stabilní. Postačující podmínkou je sice ω(a) 0, nicméně více nejsme schopni říci. Pro získání přesnějších informací využijeme normu resolventy, tj. pseudospektrum. Necht A je matice či uzavřený lineární operátor generující semigrupu C 0. Je-li (zi A) 1 = pro nějaké z s Re z > 0 a K > 1, K Re z 38

potom sup e ta K. t 0 ε-pseudospektrální abscisa α ε (A) je konečná pro každé ε > 0. Vezmeme-li v komplexní rovině hodnotu z nejvíce vpravo a stejně jako dříve (zi A) 1 = K, máme Re z sup e ta α ε(a), ε > 0. (5.6) t 0 ε Tento dolní odhad je v praxi velmi užitečný. Ukazuje, že pokud pseudospektrum matice s α(a) 0 významně zasahuje do pravé části roviny ve smyslu α ε (A) > ε pro nějaké ε, musí zde být nárůstová část přechodu. Nyní definujeme Kreissovu konstantu pro A ve vztahu k levé části roviny (namísto otevřeného jednotkového okolí): Definice 5.2. K(A) sup ε>0 α ε(a) ε = sup (Re z) (zi A) 1 Re z>0 Pokud vezmeme v (5.6) maximum přes všechna ε, dostaneme e ta K(A). (5.7) sup t 0 Chceme-li odvodit horní odhady na e ta je přirozené začít tím, že definujeme e ta jako Cauchyho integrál resolventy. Jelikož stejnou techniku budeme používat pro odhady norem dalších funkcí operátorů, provedeme to pro obecnou funkcí f, která je analytická na okolí spektra σ(a). Nejdříve připomeňme Cauchyho integrální formuli: Věta 5.3. Necht U je otevřená podmnožina komplexní roviny C, f : U C je holomorfní funkce a uzavřená množina D = {z : z z 0 r} je obsažena v U. Necht γ je kružnice tvořící hranici D. Pak pro každé z 0 uvnitř D platí: f(z 0 ) = 1 2πi γ f(z) z z 0 dz. (5.8) 39

Necht A je matice či omezený operátor a necht Γ značí kladně orientovanou uzavřenou křivku či sjednocení křivek ohraničující σ(a), které jsou navíc obsaženy v oblasti analyticity f. Potom f(a) lze zavést analogicky jako v (5.8): f(a) = 1 (zi A) 1 f(z)dz. 2πi Γ Pro e ta potom dostáváme e ta = 1 2πi Γ e zt (zi A) 1 dz. Abychom odhadli f(a), můžeme jednoduše odhadnout normu Cauchyho integrálu integrálem f(z) (zi A) 1. Pokud Γ ohraničuje σ ε (A), norma resolventy je omezena ε 1, a tedy kde L značí délku křivky Γ. f(a) L 2πε max z Γ f(z), V případě, že chceme odhadnout e ta, bylo by přirozené integrovat přes křivku Re z = const. Pokud je ovšem nekonečně dlouhá, nelze získat žádný horní odhad z konečné pseudospektrální abscisy α ε (A), nemáme-li k dispozici žádné další informace. Na druhou stranu, pokud má σ ε (A) konečné ohraničení délky L ε, platí e ta L εe tαε(a), ε > 0, t 0. 2πε Dostáváme odhad, který lze v mnoha případech ještě zesílit. Nyní uvedeme Kreissovu větu pro matice a e ta : Věta 5.4. Je-li A matice typu N N, potom K(A) e ta enk(a), t 0, (5.9) kde K(A) je Kreissova konstanta pro A ve vztahu k levé části roviny. 40

Z této nerovnosti plyne, že pro matice nebo třídu matic s pevnou dimenzí se každá růstová část přechodu musí odrazit ve pseudospektru v závislosti na konstantním faktoru en. Tento faktor nelze vynechat a je v jistém smyslu přesný. Existují konečně-dimenzionální operátory, pro které e ta může přesáhnout K(A) o libovolný faktor. Z předchozích několika odhadů získáváme odhad časového rozmezí, ve kterém se růstová část přechodu musí projevit. Víme, že pokud má matice či operátor vlastní číslo z v pravé části roviny, musí existovat exponenciální zvětšení v čase 1/Re z. To samé platí, pokud z je ε-pseudovlastní číslo pro dostatečně malou hodnotu ε. Necht máme z s Re z = a > 0, předpokládejme (zi A) 1 = K a nějaké K > 1. Pak pro libovolné τ > 0, sup e ta 0<t τ e aτ (1 + eaτ 1 K pro ). (5.10) Tato nerovnost vypadá komplikovaně, ale stačí si všimnout, že výraz v závorce je blízký 1, pokud je τ dostatečně malé, přesněji e aτ << K. Odsud máme, že pro libovolné takové τ > 0 existuje t v intervalu [0,τ], pro které e ta je přibližně stejně velké jako e aτ či větší. Jinými slovy, v tomto čase se z chová přibližně jako vlastní číslo. Pokud se τ blíží k, pravá strana rovnosti se monotónně zvětšuje, v čase τ = dostáváme (5.6). Odhad má tu nepříjemnou vlastnost, že ho nelze aplikovat v konkrétním čase, ale pouze na supremum přes časový interval [0, τ]. Přidáme-li při odvození horní odhad, získáme bodový odhad. Je-li e ta M pro všechna t 0, pak pro libovolné τ 0 a K definované jako dříve, ale nyní s a < 0 a < K/M 1, pak e τa e aτ eaτ 1 K/M = 1 (eaτ 1)(1 K/M). (5.11) K/M Ve speciálním případě a = K = 0, z (5.11) pomocí l Hospitalova pravidla dostaneme e τa τm 1 (zi A) 1. 41