PROSTE A POZYTECZNE NIERÓWNOśCI MACIERZOWE TOMASZ TKOCZ Streszczenie. Tekst zawiera notatki do referatu z Seminarium Fizyki Teoretycznej. Jest to w zasadzie tłumaczenie(z uzupełnionymi pewnymi skrótami myślowymi i innym podejściem do triku Weyla) odpowiedniego rozdziału książki[3]. 1. Wstęp W fizyce statystycznej kluczowe znaczenie ma suma statystyczna. W mechanicekwantowejmaonapostaćz=tre β(ĥ µˆn) (β= 1 kt,ĥ hamiltonianukładu,µ potencjałchemiczny, ˆN operatorliczbycząstek jeśli w układzie jest ona zachowana). Zatem bardzo ważne znaczenie jest umiećszacowaćwyrażeniatre A,gdzieAjestmacierząiniechtobędziedla nas motywacją, choć nie wiem jaka ona była naprawdę, żeby sobie dzisiaj obejrzeć kilka klasycznych nierówności. Przyjrzymy się nierównościom: Peierlsa Bogolubowa Höldera Goldena Thompsona O ich zastosowaniach nie będzie tu wspomniane. Aby jednak wszystkich (pragmatyków?) uspokoić: nierówności te stosują się! Hasłowo, niektóre zastosowania, to dowody wypukłości różnych ważnych funkcji termodynamicznych, np. energii swobodnej dowody istnienia granicy termodynamicznej oszacowania i porównywanie sumy statystycznej różnych modeli(np. Isinga i Heisenberga przykład z[3]) dowód braku uporządkowania dalekiego zasięgu w modelu Hubbarda(w wymiarach 1 i 2 i temperaturach dodatnich) twierdzenie Komy Tasakiego(por.[2]) ostro też te nierówności stosuje Pan Wojtkiewicz podając oszacowania(zgóryizdołu)sumystatystycznejwmodeluhubbarda(por. [4]) Chciałbym podziękować Panu J. Wojtkiewiczowi opiekunowi referatu za pokazanie mi tytułowych nierówności. 1
2. Nierówność Peierlsa Bogolubowa RozważaćbędziemyoperatorylinioweA: C n C n (omacierzya)oraz na C n mamyzadanyiloczynskalarny<,>.przypomnijmysobiekilkafaktów z algebry liniowej. Twierdzenie 1 (spektralne).jeśliajestsamosprzężony(a =A),to istniejebazaortonormalnau 1,...,u n orazliczbyrzeczywisteλ 1,...λ n takie, że Ax= λ k <x,u k >u k. Definicja1.NiechA operatorsamosprzężony.dlaf:r Rdefiniujemyoperatorf(A): C n C n f(a)x:= f(λ k )<x,u k >u k. Uwaga1.Jeślifrozwijasięwotoczeniu0wszereg(f(x)= f (k) (0) k=0 k! x k, x R),tof(A)= f (k) (0) k=0 k! A k,dlaatakiego,że A R.Zatempodanaadhocdefinicjaf(A)dlapożądnychfpokrywasięztąznanąskądinąd (np.dlafunkcjie,ln, ). Dowód.Rozwijamyf(λ k )wszeregmającnauwadze,że A =max 1in λ i R f (l) (0) f(a)x = f(λ k )<x,u k >u k = λ l l! k<x,u k >u k l=0 f (l) (0) = λ l f (l) (0) l! k<x,u k >u k = A l. l! l=0 Koniec przypomnienia. Przechodzimy do sedna tego paragrafu. Twierdzenie2.Niechf: R Rbędziefunkcjąwypukłą,Aoperatorem samosprzężonym. Wówczas dla dowolnego x, x = 1 zachodzi l=0 f(<ax,x>)<f(a)x,x>. Dowód. Mamy wobec rozkładu spektralnego dla A, że ( ) ( n ) f(<ax,x> = f < λ k <x,u k > =f <x,u k > 2 λ k <x,u k > 2 f(λ k )=<f(a)x,x>, gdzieskorzystaliśmyznierównościjensena(dlawag <x,u k > 2 sumującychsiędo x 2 =1). 2
Z powyższego mamy natychmiast Wniosek1.Jeśli(v k )jestbaząortonormalną,to trf(a) f(<av k,v k >). Dowód.Wystarczyzauważyć,żeogólnie<Av k,v k >jestwspółrzędną(k,k) macierzyoperatoraawbazie(v k ),więc trf(a)= <f(a)v k,v k > f(<av k,v k >). Twierdzenie 3(Nierówność Peierlsa Bogolubowa). Dla operatorów samosprzężonycha,bifunkcjiwypukłejf: R Rzachodzi trf(a)e B ( ) trae B tre B f tre B. Dowód.Niech(v k )będziebaząorotonormalnąztwierdzeniaspektralnego dlab,zaśµ 1,...,µ k odpowiadającymiimwartościamiwłasnymi.mamy wobec nierówności z twierdzenia 2 i nierówności Jensena, że trf(a)e B tre B = = f 1 n e µ k ( n <f(a)e B v k,v k > e µ k e µ k <f(a)v k,v k > e µ k e µ k <Av k,v k > ) e µ k e µ k f(<av k,v k >) ( ) trae B =f tre B. Identycznie dowodzimy(ale nie wynika ono z powyższego twierdzenia, bo niekonieczniee A+B =e A e B ) Twierdzenie 4(Nierówność Peierlsa Bogolubowa ). Dla operatorów samosprzężonych A, B zachodzi tre A+B ( tr(ae B ) tre B exp ) tre B. Dowód.Zpoprzedniegodowoduwidać,żetre B jesttylkoczynnikiemnormującym,więcmożnabezutratyogólnościzałożyć,żetre B =1(wrazie czego rozważając zamiast B operator B + ci, dla odpowiedniej stałej c). 3
Wówczas((v k ),(µ k )matosamoznaczeniecopowyżej) tre A+B = = <e A+B v k,v k > = exp e µ k e <Av k,v k > exp ( ) tr(ae B ). e <(A+B)v k,v k > ( n e µ k <Av k,v k > ) Jako ciekawostkę zauważmy na zakończenie tego paragrafu takie przyjemne zastosowanie głównego narzędzia twierdzenia 2 Wniosek2.NiechC: C n C n będzieoperatoremdodatniookreślonymi samosprzężonym. Wówczas detc n c kk, gdzie[c ij ]jestmacierzącwbaziestandardowej(e k ). Dowód.Dodatniaokreślonośćoznacza,żedlakażdegox 0<Cx,x>>0, więc w szczególności wartości własne C są liczbami rzeczywistymi dodatnimi orazc kk >0.Biorącf(x)= lnxwtwierdzeniu2mamy <lnce k,e k >=<f(c)e k,e k >f(<ce k,e k >)= lnc k k, więclnc kk <lnce k,e k >ipowysumowaniu n n ln c kk trlnc= lnλ k =ln λ k =lndetc, czyli teza. 3. Nierówność Höldera Będziemy chcieli odejść na chwilę od operatorów samosprzężonych. Ale w ogólności jest też coś na kształt twierdzenia spektralnego(gdy dim V = i operator jest zwarty nazywa się to rozkładem Schaudera). Niech więc A będzieterazdowolnymendomorfizmemprzestrzeni C n.bierzemyt:=a A. Wtedy T jest oczywiście samosprzężony, ale też nieujemny, bo <Tx,x>=<Ax,Ax>= Ax 2 0 (widaćpocoa AzamiastAA ).Zatemztwierdzeniaspektralnegoistnieje bazaortonormalna(u k )iwartościwłasnenieujemne(λ k )dlat.możemy więc zdefiniwać A := T= A A. 4
Mamy (1) A x 2 = < A x, A x>=< A A x,x>=< A 2 x,x> = <A Ax,x>=<Ax,Ax>= Ax 2, czylidefiniującu:im A imawzoremu( A x):=axmamypoprawnie określoną(boker A =kera wobec(1))izometrięnaswójobraz,którą łatworozszerzamydoizometrii C n.zatem ( n ) Ax = U( A x)=u λ k <x,u k >u k = λ k <x,u k >Uu k = λ k <x,u k >v k, gdzie(v k )pewnabazaortonormalna(obrazbazy(u k )przyu).zatemzachodzi Wniosek3.DlaA: C n C n istniejąbazyortonormalne(u k ),(v k )iliczby µ 1 (A)...µ n (A)0 wartościwłasne A zwanewartościami osobliwymi A takie, że Ax= Uwaga2.µ k (A )=µ k (A) µ k (A)<x,u k >v k Dowód.WobecU A =AjestA = A U imamy AA v k =A A U v k =A A u k =Aµ k (A)u k =µ k (A) 2 v k, więc A v k =µ k (A)v k,cooznacza,że A, A majątesamewartościwłasne. Definicja2. A p :=(tr A p ) 1/p, p [1, ]. Uwaga 3. ( n ) (tr A p ) 1/p 1/p = µ k (A) p = (µ 1 (A),...,µ n (A)) p max µ k (A) p k = µ 1 (A)= A = A, czyli A = A. Możemy już teraz sformułować główne twierdzenie tego rozdziału Twierdzenie5(NierównośćHöldera).Dlar,p,q [1, ]takich,że 1 r = 1 p +1 q idowolnychoperatorówa,b: Cn C n zachodzi AB r A p B q 5
Dowód można łatwo przeprowadzić w oparciu o zwykłą(dla p-tych norm ciągów) nierówność Höldera jeśli tylko udowodnimy, że (2) µ k (AB) r µ k (A) r µ k (B) r, bowiemwówczasstądiuwagi3mamy AB r r = µ k (AB) r µ k (A) r µ k (B) r ( n ) r/p ( n µ k (A) r ) p/r Dowód(2)zaśwynikazdwóchrzeczy µ k (B) r ) p/r ) r/p = A r p B r q. Lemat1.Dlaliczbrzeczywistych0a 1...a n,0b 1...b n, takich,żedlakażdego,...,n k b j k a j zachodzi dlakażdego,...,n. k b j a j, Dowód. Jest to w zasadzie zasada majoryzacyjna Hardy ego Littlewooda Póly zastosowana do funkcji exp. Dowód można znaleźć w[1] lub(bardziej geometryczny) w[3]. Lemat2.DladowolnychoperatorówA,B: C n C n ikażdego,...,n zachodzi k k µ j (AB) µ j (A)µ j (B). Dowód. Użyjemy sztuczki Weyla z algebrą przekształceń antysymetrycznych,potożebyzgrabniewydobyćiloczyn k µ j (A).Wprzestrzeniodwzorowańk-liniowychantysymetrycznych k (C n ) definiujemydlaoperatoraa: C n C n jegok-tąpotęgędziubkowąa k : k (C n ) k (C n ) wzorem (A k ω)(v 1,...,v k ):=ω(av 1,...,Av k ), dlaϕ k (C n ),v 1,...,v k C n.(możnaotymmyślećnp.jakopool backu stałejformyωprzyprzekształceniua).zauważmyteż,żedlatapotęga dziubkowa operatora A staje się jego zwykłym sprzężeniem Banachowskim. Pocotowszystko?Mamy (3) µ 1 (A k ) = największawartośćwłasna A k (5) = największawartośćwłasna A k (4) = µ 1 (A )... µ k (A )=µ 1 (A)... µ k (A), 6
skąd k µ j (AB) (3) = µ 1 ((AB) k) =µ 1 (B k A k ) = B k A k B k k =µ 1 (B k )µ 1 (A k ) k k µ j (A) µ j (B), (3) = czyli teza lematu. Pozostaje jeszcze udowdnić (4) największawartośćwłasna A k =µ 1 (A)... µ k (A). (5) A k = A k Dla dowodu(4) weźmy operator S samosprzężony nieujemny(takim jest zawsze A )owartościachwłasnychλ 1...λ n 0dlabazyortonormalnej(u k )(tzn.su k =λ k u k ).Zauważmy,że(pamiętamy,żejeśli(du k ) oznaczabazędualnądo(u k ),todu i1... du ik,1i 1 <...i k njest baząortonormalną k (C n ) ) ales du l =λ l du l,więc S k du i1... du ik =(S du i1 )... (S du ik ), S k du i1... du ik =λ i1... λ ik du i1... du ik, czylis k mawektorywłasnedu i1... du ik owartościachwłasnychλ i1... λ ik.ponieważjestichtylecodim k (C n ),więcsątowszystkiewektory własne,więciwszystkiewartościwłasne,anajwiększa,toλ 1... λ k ito trzeba było tu pokazać. (5)udowodnimywdwóchmałychkrokach.Popierwsze(A k ) =(A ) k, bo wystarczy sprawdzić, że <A k ω,η>=<ω,a k η>, ω,η k (C n ), aletęrównośćwystarczysprawdzićnabazieortonormalnejω=dx I,η= dx J dualnejdobazystandardowej(e k )(używamydalejmultiindeksówi= (i 1,...,i k ));wówczas,skoro(det I (v 1,...,v k )oznaczawyznacznikmacierzy powstałejprzezwybraniewierszyi 1,...,i k zkolumv 1,...v k ) A k dx I = L det L (Ae i1,...,ae ik )dx L, to <dx I,(A ) k dx J > = det I (A e j1,...,a e jk )=det I (A T e j1,...,a T e jk ) = det J (Ae i1,...,ae ik )=<A k dx I,dx J >. 7
Po drugie A k = = (A k ) (A k )= (A ) k A k (AA ) k =( 4 AA ) k = A k. 4. Nierówność Goldena Thompsona Celem tutaj jest dowód następującego Twierdzenie 6(Nierówność Goldena Thompsona). Dla operatorów samosprzężonycha,b:c n C n zachodzi Potrzebne będzie kilka lematów. tre A+B tr(e A e B ). Lemat3.DlaoperatorówsamosprzężonychA,B:C n C n dodatnich(tzn. <Ax,x>>0,dlakażdegox 0)zachodzi AB p sp A p B p s, p1,s2. Dowód.Ustalmyp,sjakwzałożeniachioznaczmyC :=A p,d:=b p, f(α):= C α D α s/p funkcjaciągłana(0,1].sprawdźmyczyprzedłuża sięonana[0,1],tzn.chcemyobliczyćlim α 0+ f(α).szacujemy C α D α s/α Hölder C α 2s/α D α 2s/α = (trctrd) α/2s α 0+ 1, dalej, biorąc za v dowolny jednostkowy wektor własny dla D o wartości własnej µ mamy z drugiej strony C α D α s/p porównaniep-tychnormciągów C α Dα = C α D α C α D α v = µ α λ α k<v,u k >u k ( µ min 1kn λ k ) α α 0+ 1, gdzie korzystaliśmy jeszcze z twierdzenia spektralnego dla C(oczywiście (u k )oznaczabazęortonormalnawektorówwłasnychodpowiadającychwartościomwłasnym(λ k )).Zatemf(0)=1.Zauważmy,żeteza,tonierówność ( 1 f f(1)=f(1)f(0), p) co równoważnie można zapisać jako ( ( 1 f p 1+ 1 1 ) ) 0 p 8 f(1) 1/p f(0) 1 1/p,
czyli wystarczy udowodnić wypukłość funkcji ln f. Wobec jej ciągłości wyniknie, to z nierówności ( ) α+β (6) f f(α) 1/2 f(β) 1/2. 2 Do jej dowodu przydadzą się trzy rzeczy. (7) X p pq=(tr X pq ) 1/q = X p q, p,q1 X dowolny (8) XY p YX p, X,Y dowolnetakie,żexysamosprzężony, bo wobec lematu 1(zasady majoryzacyjnej) i definicji p-tej normy macierzowejwystarczypokazać,żedlakażdego,...,n Jednak mamy k k µ j XY µ j YX. k µ j (XY) = µ 1 (XY) k )=maxmodułówwartościwłasnychy k X k = r(y k X k )=r(x k Y k )=r((yx) k ) (YX) k =µ 1 ((YX) k) k = µ j YX, gdzie przez r(x) oznaczamy promień spektralny operatora X i korzystamy zeznanychfaktów,żeogólnier(xy)=r(yx),boxyiyxmajątesame wartościwłasneorazr(x) X,bojeśliujestjednostkowymwektorem własnymowartościwłasnejλ,to λ = Xu X. (9) X p = X p, oczywiste, wobec uwagi 2. Wracamydodowodu(6).Bezutratyogólnościzałóżmy,żeβα.Mamy ( ) α+β f = C α+β 2 D α+β (7) 2 2 2s/(α+β) = C α+β 2 D α+β 2 2 s/(α+β) = D α+β 2 C α+β C α+β 2 1/2 s/(α+β) = Dα D β α C α+β D α+β 2 2 (8) = D α C α+β D β 1/2 Hölder s/(α+β) D α C α 1/2 s/α Cβ D β 1/2 s/β (9) = f(α) 1/2 f(β) 1/2. Przy okazji można stąd udowodnić taki przyjemny 9
Wniosek 4. Przy założeniach lematu 3 zachodzi także nierówność tr(ab) n tr(a n B n ). Dowód. Korzystając z cykliczności śladu otrzymujemy tr(ab) n = tr A 1/2 (A 1/2 BA 1/2 )... (A 1/2 BA 1/2 ) A 1/2 B }{{} n 1 = tr(a 1/2 BA 1/2 )=tr B 1/2 A 1/2 2n = B 1/2 A 1/2 2n 2n lemat 3 B n/2 A n/2 2 2=tr(A n/2 B n A n/2 )=tr(a n B n ). Lemat4.DladowolnychoperatorówX,Y:C n C n zachodzi e X+Y = lim n (e1 n X e 1 n Y ) n = lim (e 1 2n X e 1 n Y e 1 2n X ) n, n gdzie zbieżność jest w normie operatorowej. Dowód.NiechA n :=e 1 n X e 1 n Y,B n :=e 1 n (X+Y).Chemyudowodnić,że A n n B n n n 0,ale An, Bn e 1 n ( X + Y ) A n B n C n 2, bo pierwsze wyrazy odpowiednich szeregów się redukują i stała C zależy tylkoodoperatorówx,y(niezależyodn).mamystąd A n n Bn n = An n 1 (A n B n )+An n 2 (A n B n )B n +An n 3 (A n B n )Bn 2 +...+A n (A n B n )Bn n 2 +(A n B n )Bn n 1 ne X + Y A n B n C n e X + Y n 0. Dowód drugiej równości jest identyczny. Lemat5.DlaoperatorówsamosprzężonychA,B: C n C n zachodzi Dowód.Niechnajpierwp2;wtedy ale lewa strona wynosi e A+B p e A e B p, p1. e 1 2n A e 1 2n B 2n lemat 3 2np e A e B p, e 1 2n A e 1 2n B 2n p = (e 1 2n B e 1 n A e 1 2n B ) n lemat4 p n e( A+B), skąd teza w tym przypadku. 10
Jeśli1p<2,tomamyzpoprzedniegoprzypadku e A+B p = e A+B 2 2 2p e 1 2 A e 1 2 B 2 2p = e 1 2 A e 1 2 B 2 p = e 1 2 B e A e 1 2 B p (8) e A e B p. Teraz łatwo zakończyć dowód wyjściowego twierdzenia. Dowód twierdzenia 6. Pamiętając, że założenia A + B jest też samosprzężony, mamy tre A+B = e 1 2 (A+B) 2 lemat 5 2 e 1 2 A e 1 2 B 2 2 ( = tr e 1 2 B e A e 1 B) 2 =tr(e A e B ). Jako zastosowanie wszystkiego podamy jeszcze bardzo ważny Wniosek5.Funkcjaf:{operatorysamosprzężone ( C n C n } Rzadanawzoremf(A):=ln tre A) jestwypukła. Dowód. Po prostu sprawdzamy definicję wypukłości f(αa+(1 α)b) = ln Golden Thompson (tre αa+(1 α)b) ( ) ln tr(e αa e (1 α)b ) Hölder ln ((tre A ) α (tre B ) 1 α) = αf(a)+(1 α)f(b). Literatura [1] M. Kuczma, An introduction to the theory of functional equations and inequalities. Cauchy s equation and Jensen s inequality, Prace naukowe Uniwersytetu Śląskiego w Katowicach, nr 489, Państwowe Wydawnictwo Naukowe i Uniwersytet Śląski, Warszawa Kraków Katowice 1985 [2] T. Koma, H. Tasaki, Decay of Superconducting and Magnetic Correlations in One and Two Dimensional Hubbard Models, Phys. Rev. Lett. 68, 2348(1992) [3] B. Simon, The tatistical Mechanics of Lattice Gases, Princeton, New Jersey, Princeton University Press [4] J. Wojtkiewicz, Estimations of free energy for the Hubbard model 11