Poznámky ze Speiální teorie relativity 1
Obsah Úvodem 3 1 Výhozí prinipy STR 4 2 Lorentzova transformae 4 3 Relativistiká kinematika 6 3.1 Skládání ryhlostí........................... 6 3.1.1 Efekt strhávání světla médiem............... 6 3.2 Dilatae času............................. 7 3.3 Kontrake délek............................ 7 4 Minkowského prostoročas 8 4.1 Časoprostorový invariant....................... 8 4.2 Čtyřvektory.............................. 8 4.3 Snižování a zvyšování indexů.................... 9 4.4 Matie Lorentzovy transformae.................. 10 4.5 Inverzní Lorentzova transformae.................. 10 4.6 Infinitezimální transformae..................... 11 5 Relativistiká mehanika 12 5.1 Zákony zahování a relativistiká hmotnost............ 12 5.2 Relativistiká dynamika bez 4-vektorů............... 12 5.3 4-ryhlost, 4-zryhlení, 4-síla..................... 13 6 Relativistiká elektrodynamika 15 6.1 Tensor elektromagnetikého pole.................. 17 6.2 Maxwellovy rovnie.......................... 18 6.3 Poznámka ke kalibrai poteniálů.................. 20 6.4 Vlnová rovnie............................ 22 6.5 Dopplerův jev............................. 23 6.6 Lorenzova 4-síla............................ 23 6.7 Hustota Lorenzovy čtyřsíly..................... 24 6.8 Zákony zahování v elektrodynamie................ 24 Referene 25 2
Úvodem Následujíí text shrnuje a rozšiřuje mé poznámky ze Speiální teorie relativity přednášené v základním kurzu fyziky v zimním semestru 1999/2000 na MFF UK. Nečiním si nároky na úplnost a bezhybnost textu i když alespoň o tu se snažím), doufám jen, že materiál by mohl být užitečný studentům, kteří se seznamují s čtyřvektorovým formalismem a speiální relativitou. Z mého dnešního pohledu jsem se rozhodl přidat několik odstavů osvětlujííh infinitezimální Lorentzovy transformae a jejih vyjádření pomoí rapidity, ož je užitečné pro kurz z Kvantové teorie pole. Komentáře a připomínky rád přijmu na adrese qitek@matfyz.z Jiří Kvita, 2004 3
1 Výhozí prinipy STR Speiální teorie relativity STR), Obená teorie relativity OTR), ineriální soustava IS) 2 Lorentzova transformae Budeme se zabývat transformaí souřadni t, x, y, z) t, x, y, z ) mezi soustavani IS a IS ve standardní konfigurai, čímž budeme rozumět skutečnost, že v čase t = t = 0 osy obou systémů splývají a IS se pohybuje vůči IS podél osy x ryhlostí v. Lze ukázat, že transformae musí být lineární v následujíím odstavi budeme používat čtyřvektorový formalismus, a tak je možné jej při prvím čtení přeskočit): Uvažujme hodiny, které jsou v klidu vzhledem k soustavě S: dxi dt = 0. Budiž τ čas naměřený hodinami. Pak z požadavku homogenity času musí být dt dτ = konst. Celkově můžeme oba požadavky zapsat jako V IS ze stejnýh důvodů Na druhou stranu však máme dx µ dτ = konst d2 x µ dτ 2 = 0. d 2 x µ dτ 2 = 0. dx µ dτ = x µ dx ν x ν dτ, d 2 x µ dτ 2 = x µ d 2 x ν x ν dτ 2 }{{} 0 Aby byl výraz, jak požadujeme, nulový, musí nutně platit 2 x µ x ν x σ = 0 ož znamená, že transformae je lineární. Z linearity pak můžeme psát x = y = µ, ν, σ Ax + Bt + Cy + Dz + E F x + Gt + Hy + Iz + J t = Kx + Lt + My + Nz + O. Lorentzovu transformai odvodíme v následujííh kroíh: + 2 x µ dx ν dx σ x ν x σ dτ dτ. Věnujme se nejprve transformai souřadni y, z kolmýh na x. Z relativity toho, která soustava se pohybuje musí být transformační vztahy invariantní vůči takzvané xz-inverzi x x, y y, z z, t t. Náš výběr souřadnýh soustav požaduje y = 0 y = 0 a tedy y = Hy. Ze symetrie vůči xz-inverzi je ovšem y = Hy a tedy H 2 = 1. Pro v 0 musí být y = y a získáváme tak první triviální transformační vztahy y = y, z = z. 1) 4
Pro počátek souřadni IS x = 0 pozorovaný z IS musí platit x = vt. Odtud C = D = E = 0, x = B A t, x = vt B A = v Máme tedy s uvážením symetrie a relativity pohybu) x = Ax vt), x = Ax + vt ) Nyní budeme aplikovat prinip konstantní ryhlosti světla: světelný signál vyslaný v čase t = t = 0 urazí v jednotlivýh soustaváh vzdálenosti x = t, x = t, přičemž x a x budou tytéž světobody pozorované z IS a IS. x = t x = t t = Ax vt) t = Ax + vt ) t = ta v) t = t A + v) Vynásobením posledníh dvou rovni dostaneme A 2 = 1 1 v 2 / 2 a pro A volíme kladné znaménko s ohledem na to, že pro v 0 musí být x = x : 1 A γ = 1 v2 /. 2 Nyní nám stačí z nalezenýh rovni x = γx vt), x = γx + vt ) 2) eliminovat x. Vyjádříme-li si x = γ 2 x vt) + γvt, bude a podle identity bude konečně t = 1 vγ [x1 γ2 ) + γ 2 vt] 1 γ 2 = v γv 2 γ t = γ t v ) 2 x. 3) Zavedením β v, γ 1 1 β 2 4) pak Lorentzova transformae zní x = γx βt) t = γt βx) y = y z = z. 5) 5
3 Relativistiká kinematika 3.1 Skládání ryhlostí Opět uvažujme dvě ineriální soustavy IS a IS v obvyklé konfigurai, a těleso, které se vůči soustavě IS pohybuje ryhlostí u = d x dt. Zajímá nás, jak vypadá jeho relativní ryhlost vůči soustavě IS u = d x dt. S použitím vztahů pro Lorentzovu transformai 2) nalezneme u 1 = dx dt = γdx vdt) γdt v 2 dx) = u 1 v 1 vu1 2 6) u 2 = dy dy dt = γdt v dx) = u 2 γ ) 7) 1 vu1 2 2 u 3 = dz dz dt = γdt v dx) = u 3 γ ) 8) 1 vu1 2 2 Všimněme si, že skládáním podsvětelnýh ryhlostí stále získáme podsvětelné ryhlosti, a že objekt pohybujíí se ryhlostí světla se bude stejnou ryhlostí pohybovat v kterékoli ineriální soustavě při v < ). Často se ještě definuje rozdíl ryhlostí vzájemná ryhlost) dvou těles, jak ji vidíme z dané ineriální soustavy: u w,. Tato ryhlost je relevantní například v případě, kdy nás zajímá čas, za který se dvě tělesa minou, pozorujeme-li je v dané ineriální soustavě rozdíl ryhlostí například vystupuje ve vztahu pro tok bombardujííh části ve formulíh pro účinný průřez). 3.1.1 Efekt strhávání světla médiem Začněme následujíím problémem dle [2], str. 77): nehme šířit světlo průhledným tekouím médiem kapalinou, plynem). Otázka zní, zda je světlo strháváno ve směru proudění drag effet). Fizeau v roe 1851 ukázal, že podle jeho interpretae) éter vskutku strhávání způsobuje, ale jen částečně, a to tak, že pozorovaná ryhlost světla byla u = u + v1 1/n 2 ). Z dnešního pohledu jde o to, jakou ryhlostí se světlo šíří vzhledem k ineriální soustavě IS, která se vůčí médiu pohybuje ryhlostí v. Ryhlost světla v daném prostředí je u = /n, v naší soustavě, kde médium teče, bude podle relativistikého skládání ryhlostí ) u = u + v u + v) 1 u v 1 + u v 2 u + v 1 1/n 2) 2 a STR nám tak ryhle dává elegentní vysvětlení. 6
3.2 Dilatae času V IS uvažujme v počátku umístěné nehybné hodiny x 0). Protože t = γt βx), bude pro časové intervaly mezi dvěma událostmi, které obě nastaly v x 0 např. dvě po sobě jdouí tiknutí hodinek), platit t = t 2 t 1 = γt 2 t 1 ) = γ t, 9) tedy v IS vidíme, že pohybujíí se hodiny v IS jdou pomaleji, uběhne na nih kratší interval než v IS jest vždy γ 1). V praxi bývá problém nalézt hodiny, jejihž hod je jen málo ovlivněn zryhlením. Ideální laboratoří jsou například rozpady části minony vznikajíí v horníh vrstváh atmosféry s dobou života kolem 2, 197 10 6 s by bez dilatae svýh vnitřníh hodin i při ryhlosti světla urazily pouhýh 600m). Dilatae času je však pozorovatelná i s makroskopikými hodinami, první pokus byl proveden roku 1971 Hafele, Keating, Siene 177, 166, 1972) s přesnými esiovými hodinami a komerčními aerolinkami! Další zajímavou aplikaí jsou svazky části v uryhlovačíh, které, majíe stejný náboj, podléhají elektrostatiké repulzi na určité typiké časové škále, která se pozorována z laboratoře) prodlužuje s ryhlostí oběhu. Notoriky známý paradox dvojčat je typikým příkladem toho, že lidé si na rlativitu a závěry z ní plynouí ještě stále nezvykli. Dvojče, které je vysláno na okružní estu Vesmírem, se vrátí na Zemi, kde jeho protějšek zestárl, nebot viděl bratra či sestru pohybovat se a sledoval, jak mu plyne pomaleji čas. Argumenty lze zdánlivě obrátit a tvrdit, že totéž přee vidělo i dvojče kosmonaut: bratr se vzdaloval, letěl, a také mu plynul čas pomaleji. Přesto, když se setkají, je nutné, aby existovala jediná fyzikální realita. Problém je, že situae zdaleka není tak symetriká, aby bylo možno pohledy rovnoenně obrátit: na estovatele působilo zryhlení, které vytváří onen skrytý rozdíl mezi oběma pozorovateli, paradox je tak vlastně plně vysvětlitelný až v rámi obené relativity. 3.3 Kontrake délek V ineriální soustavě IS uvažujme tyč, jejíž kone mají souřadnie x 1 a x 2, délka tyče je tedy L = x 2 x 1. Proved me nyní měření délky tyče v IS, a to tak, že ve stejný čas t 1 = t 2 odečteme souřadnie konů tyče, a získáme tak události t 1, x 1) a t 2, x 2). Zajímá nás délka tyče v IS Protože dostáváme jednoduše L = x 2 x 1. x 1 = γx 1 + vt 1), x 2 = γx 2 + vt 1), L = 1 γ x 2 x 1 ) = L γ. 10) V IS tedy naměřím pohybujíí se tyči kratší délku než v její klidové soustavě. Efekt má své kořeny v relativitě současnosti museli jsme současně udělat rysky 7
pro odečtení vzdálenosti). Podotkněme, že náš výsledek neznamená, že relativistiky se pohybujíí objekty vypadají kontrahovány, do reálného vzhledu objektů vstupují také efekty toho, že paprsky z různýh částí tělesa k nám vyrazily v odlišný čas. 4 Minkowského prostoročas 4.1 Časoprostorový invariant Minkowského prostoročas je jeviště pro fyzikální dění 1 a vyjadřuje oboustrannou provázanost časové a prostorovýh souřadni v Lorentzově transformai. Jde o pseudoeuklidovský prostor E 3 R, jehož prvky jsou události. V klasiké fyzie je invariantní veličinou vzdálenost l) 2 = x) 2 + y) 2 + z) 2. V jakémkoli vztažné soustavě je pak l) 2 veličina nezávislá na výběru ineriálního systému. Ve speiální relativitě však musíme započítat i časovou odlehlost událostí: s 2 ) = 2 t) 2 + l) 2 11) s) 2 = 2 t) 2 + x) 2 + y) 2 + z) 2. 12) Že jde skutečně o invariant vůči Lorentzově transformai, tj. s ) 2 = s) 2, lze ověřit přímo dosazením transformačníh vztahů. 4.2 Čtyřvektory Zaved me konveni, kdy klasiké 3-vektory budou mít složky značené indexy psanými latinkou, kdežto čtyřvektory, prvky Minkowského prostoročasu, budou mít složky indexované řekými písmeny, tedy např. x µ značí x 0 t, x 1 x, x 2 y, x 3 z. Řeký, prostoročasový, index tedy bude nabývat hodnot 0, 1, 2, 3 a čtyřvektor má tvar x µ = t, x, y, z) t, x) řeký index poneháváme na zdůraznění, že jde o 4-vektor). Klasiky můžeme psát invariant pomoí Kronekerova symbolu jako skalární součin l) 2 = δ i j x i x j V našem případě musíme zavést nový Minkowského tensor η abyhom mohli psát analogiky kde s) 2 = η µν x µ x ν, 13) 1 0 0 0 0 1 0 0 η µν = 14) 0 0 1 0 0 0 0 1 1 V obené relativitě se pak i toto jeviště mění s hmotou a energií a samo vstupuje do hry. 8
je speiální případ metrikého tensoru. V obené relativitě je obeně s) 2 = g µν x µ x ν 15) a metriký tensor nám říká, jak utvořit inavriantní vzdálenost ze souřadniovýh odlehlostí. Vzdálenost závisí na křivosti plohy, podél které měřím, dle plohy se tvoří různě i invariant, tj. tensor poskytuje informai o geometrii, ve které měřím vzdálenost. Pro ilustrai ještě přejděme ke sférikým souřadniím a místo pišme d). Lze ukázat diferenováním převodníh vztahů mezi sférikými a kartézskými souřadniemi), že v tomto případě je ds) 2 = 2 dt 2 + dr 2 + r 2 dϑ 2 + sin 2 ϑ dϕ 2 ) g µν dx µ dx ν 1 0 0 0 0 1 0 0 g µν = 0 0 r 2. 0 0 0 0 r 2 sin 2 ϑ Zde již matiové elementy nejsou konstanty a podléhaly by derivování! V obené relativitě bereme difereniál ds, nebot jde o lokální infinitezimální veličinu harakterizujíí zakřivení prostoru v daném bodě. Uvědomme si, že prostoročasový interval ds může být i veličina záporná. V literatuře se lze setkat s definií skalárního součinu čtyřvektorů, kde záporné znaménko přísluší všem prostorovým souřadniím a kladné je u časové souřadnie viz. přednášky z teorie pole na MFF nebo učebnie R. P. Feynmana). Jedná se však o pouhou konveni výběru skalárního součinu se signaturou 1,3) nebo 3,1), fyzika zůstává stejná pokud různé konvene nepomíháte:) Nadefinujeme dále veličinu vlastní čas. Předpokládejme, že objekt je v klidu v dané IS, tedy dx i 0 i, Jediná souřadnie, která se může měnit, je čas, který označíme pro odlišení jako τ 4.3 Snižování a zvyšování indexů 2 dτ 2 = η µν dx µ dx ν. 16) Nadále budeme uvažovat konveni, kde vektory mají indexy nahoře a formy dole. Pomoí Minkowského tensoru lze však indexy zvyšovat a snižovat. Index snížíme zapůsobením bilineární formy, výsledným produktem pak bude lineární) forma: E µ η µν = E ν 17) Podotkněme, že Minkovského tensor je symetriký a lze tedy prohazovat indexy. Zaved me dále inversní Minkowského tensor definičním vztahem η µν je tedy inversní matie a ukazuje se, že jest opět Pak lze s indexy praovat třeba následovně: η µα η αν = δ µ ν 18) 1 0 0 0 η µν 0 1 0 0 = 19) 0 0 1 0 0 0 0 1 9
E α = η αν E ν = η αν η νµ E µ = δ α µe µ = E α 20) Skalární součin dvou vektorů lze pak psát jako A B = η µν A µ B ν = A ν B ν = A µ B µ. 21) Uvědomme si, že skalární součin je bilineární forma, která dvěma vektorům přiřadí podle jistýh pravidel reálné či komplexní číslo a je výhodné jej representovat jako působení formy prvek duálního prostoru) na vektor. Obdobně lze i úžit tensory, jako příklad si uved me úžení tensoru ve dvou indexeh: T αβσ γβσ = T α γ. Má-li tensor právě dva indexy, pak jde v tomto případě o stopu 2 : Tr T = T σ σ = η σα T σα T. 4.4 Matie Lorentzovy transformae Protožev transformae je kvůli zahování prostoročasového intervalu lineární, můžeme přehod od jednoho systému k druhému vyjádřit pomoí matie Takže například x µ = Λ µ ν x ν. 22) t = x 0 = Λ 0 0 x 0 + Λ 0 1 x 1 + Λ 0 2 x 2 + Λ 0 3 x 3. Srovnáním se vztahy pro Lorentzovu transfomai x x 1 = γx 1 vt) γx 1 γ v t) 23) a zavedením β = v t x 0 = γt v 2 x1 ) γt γ v x 24) γ βγ 0 0 Λ µ βγ γ 0 0 ν =, 25) 0 0 1 0 0 0 0 1 ož je matie speiální Lorentzovy transformae tj. v má směr osy x +, v čase t = 0 počátky obou systémů splývají, stejně tak osy x x ). 4.5 Inverzní Lorentzova transformae Invariane prostoročasového intervalu x y) 2 x µ y µ )x µ y µ ) = x µ y µ)x µ y µ ) x y ) 2 implikuje η µν Λ µ ρ Λ ν σ = η ρσ, 2 Tr z anglikého Trae, případně též Sp z němekého Spur:) 10
tedy matiově Λ T η Λ = η Λ 1 = η Λ T η. x µ = Λ µ νx ν x µ = Λ µ ν x ν 4.6 Infinitezimální transformae Nejprve si ze vztahů Lorentzovy transformae spočtěme S uvážením, že x t = γx βt t + βx) = γ1 + β)x t), x + t = γx βt + t βx) = γ1 β)x + t). γ1 ± β) = 1 ± β 1 β a zadefinováním rapidity 3 φ 1 + β φ ln 1 β nalezneme x t = e φ x t) x + t = e φ x + t). Přímočaře tak můžeme ověřit zahování prostoročasového intervalu x 2 2 t 2 = x 2 2 t 2. Po jednoduhém dosazení dále nalezneme matiově pak a nalezneme x x = x osh φ t sinh φ t = x sinh φ + t osh φ, ) ) ) t osh φ sinh φ t = sinh φ osh φ x γ = osh φ, βγ = sinh φ. Uvažujme nyní infinitezimální transformai φ = ε tedy malé ryhlosti) ) osh ε sinh ε Λε) = 1 ) e ε + e ε e ε + e ε sinh ε osh ε 2 e ε + e ε e ε + e ε = 3 Často se rapidita definuje ještě s faktorem 1/2 před logaritmem. 11
A tedy = 1 2 [ ) ] [ ) ] 2 2ε 0 ε + Oε) 1 + 2ε 2 ε 0 }{{} iεn x Λε) = 1 + iεn x. Libovolnou Lorentzovu transformai podél osy x pak můžeme zapsat jako Λφ) = expiφn x ), kde generátor boostu podél osy x ) 0 i N x =. i 0 Ve třeh rozměreh nalezneme x = exp iφn v ) x v 0 i 0 0 0 0 i 0 0 0 0 i i 0 0 0 0 0 0 0 0 0 0 0 N x = N 0 0 0 0 y = N i 0 0 0 z =. 0 0 0 0 0 0 0 0 0 0 0 0 i 0 0 0 Tyto vztahy jsou hojně užívány v relativistiké kvantové mehanie a teorii pole, kde se zkoumá Lorentzova a Poinaréova grupa. 5 Relativistiká mehanika 5.1 Zákony zahování a relativistiká hmotnost 5.2 Relativistiká dynamika bez 4-vektorů Relativistiky je tedy možné hybnost zadefinovat obdobně jako klasiky p = m v, pouze m zde representuje relativistikou hmotnost m = γm 0. Relativistikou 3-sílu pak můžeme definovat obdobně, totiž jako časovou změnu impulsu Zryhlení lze vyjádřit jako F = d p dt a = d v dt = 1 m = v dm dt + m d v dt. 26) F v dm ). 27) dt Zkusme si nyní odvodit konečný výraz pro zryhlení. S použitím de = 2 dm, dt = F d s = F d s dt dt = F v dt 28) a za předpokladu, že síla nemění klidovou hmotnost částie viz diskuse u čtyřsíly) si nejprve spočítáme dm dt = 1 d 2 dt E) = 1 d m0 2 2 + T ) = 1 dt dt 2 dt = 1 2 F v. 29) 12
Zryhlení pak bude a = 1 m F 1 ) 2 v F v 30) Zryhlení tedy není obeně kolineární s působíí silou. Uvažujme dva důležité speiální případy: F je kolineární s v, pro jednoduhost uvažme i stejný smysl obou vektorů, tj. F = k v, kde k > 0. Pak a = 1 ) F v2 m 2 F 31) a tedy m a = F 1 γ 2 32) F = m 0 γ 3 a 33) Můžeme tak přirozeně zavést rovnoběžnou hmotnost m = m 0 γ 3. Všimněme si, že pro udělování kostantního zryhlení potřebujeme, aby síla rostla s γ 3! Síla je kolmá na směr pohybu, F v = 0, a tak a odpovídajíí kolmá hmotnost je m = m 0 γ. 5.3 4-ryhlost, 4-zryhlení, 4-síla F = m 0 γ a 34) V klasiké mehanie je ryhlost definována jako tečna k trajektorii: v i = dxi dt. V relativitě však nemůžeme použít difereniál dt, nebot nejde o invariant, ale nabízí se vzít vlastní čas dτ. Je tedy rozumné nadefinovat čtyřryhlost jako Spočtěme si výraz dt dτ = 1 u µ dxµ dτ dt ηµν dx µ dx = ν = dt dx µ dτ dt dx η µ dx ν µν dt dt 35) 36) dx µ dt je rovno z definie x µ výrazu dxµ dt =, v), nebot dx 0 = dt. Skalární součin pod odmoninou je pak 2 v 2 a tedy dt dτ = 2 v γ 37) 2 pro lepší zapamatování se uvědomme, že vztah připomíná zdiferenovaný vztah pro dilatai času) a konečně u µ = γ, v) 38) Čtyřryhlost je normalizovaná: η µν u µ u ν = η µν dx µ dτ dx ν dτ = ds2 dτ 2 = γ2 2 + v 2 ) = 2. 39) 13
Reálné čtyřryhlosti jsou časupodobné, skalární součin dvou čtyřryhlostí je záporný. Každý objekt se tedy v čtyřrozměrném prostoročase pohybuje právě ryhlostí světla. Obdobně nadefinujeme čtyřzryhlení a µ dvµ dτ. 40) Všimněme si, že z u u = 2 = konst plyne ortogonalita 4-ryhlosti a 4-zryhlení: Protože 0 = d u u) = 2u a dτ a µ = γ a µ = γ = dγ dγ, v dt dt + γ d v dt 1 dγ dt = dγ dv i dv i dt 4 v a γ ) 1 2 v v 2 Vidíme, že a µ = γ0, a) pouze v případeh a v = 0 = γ3 v a 2 ). ), v a vγ4 + γ 2 a. 41) v = 0, ož nastane v klidovém systému studované částie. a µ 0 a = 0 v klidovém systému částie. S využitím identity nalezneme a můžeme si tak spočíst 2 ɛ ijk ɛ ilm = δ jl δ km δ jm δ kl u a) 2 = u 2 a 2 u a) 2 α 2 a 2 = a µ a µ = γ 6 a 2 ) v a)2 2 a ve shodě s našimi předhozími výsledky nalezneme, že pro v a je α = γ 3 a pro v a je α = γ 2 a Nadefinujme čtyřsílu F µ = γ d dt γm 0, m 0 γ v) = γ F µ dpµ dτ = dm 0 dτ uµ + m 0 a µ 42) 1 de dt, d p ) dt = γ ) 1 de dt, F, 14
kde F je již dříve zavedená Lorentzova 3-síla. Spočtěmě si skalární součin F µ u µ = dm 0 dτ uµ u µ + m 0 a µ u µ = 2 dm 0 }{{} dτ 0 F µ u µ = γ 2 de dt + γ2 F v = γ F v de ). dt Síla zahovávajíí klidovou hmotnost je tedy harakterizována tím, že ) F µ u µ = 0 F v = de F v dt F µ = γ, F 43) a platí tak pro ni vztah známý z Newtonovy mehaniky změna energie je pak čistě kinematiká. F d r = de, 6 Relativistiká elektrodynamika Už klasiká elektrodynamika KED) je invariantní vůči Lorentzově transformai, přepisem Maxwellovýh rovni do čtyřvektorového hávu tak tedy v prinipu nemůžeme získat ni nového, vztahy však nabudou nového symetričtějšího tvaru a nově rozpoznáme např. příčný Dopplerův efekt. Samotná invariane rovni elektrodynamiky se dokone stala stimulem pro speiální relativitu, jejíž kořeny tak musíme hledat od Einsteina a Lorentze až k Maxwellovi. Připomeňme si několik výsledků KED: rot H = j + D t div B = 0 44) div D = ϱ rot E = B t. 45) Je výhodné zavést elektromagnetiké poteniály a nejednoznačnost v jejih volbě určit Lorenzovou kalibrační podmínkou: 1 2 ϕ t + div A = 0 46) B = rot A E A = grad ϕ t. 47) Budeme-li uvažovat lineární homogenní isotropní prostředí, lze použít lineární materiálové vztahy D = εe B = µ H 48) Celkovou proudovou hustotu j si můžeme rozložit Kvasnia, X.I) na vodivý proud σe a prudovou hustotu J vnějšíh zdrojů: j = J + σe. Totální proud získáme připočtením Maxwellova proudu D t. Za těhto podmínek pak přejdou vlnové rovnie pro poteniály do výhodného tvaru 15
ϕ 1 2 ϕ 2 t 2 = ϱ ε 49) A 1 2 2 A t 2 = µ j. 50) Zdroje vystupujíí v těhto rovniíh určují výsledné pole, nejsou jimi však dány pohybové rovnie těhto zdrojů. Z rovni plyne na zdroje jediné omezení, a to rovnie kontinuity vyplývajíí přímo z Maxwellovýh rovni: ϱ t div j = 0. 51) Poteniály A a ϕ mají dohromady čtyři nezávislé složky, jsou však vázány Lorenzovou kalibrační podmínkou. Celkem máme tedy tři nezávislé veličiny namísto původně šesti složek vektorů B a E. Za to jsme ovšem zaplatili zvýšením řádu rovni z prvního Maxwell) na druhý. Čtyři složky poteniálů byt provázané) nás vedou k myšlene zavést poteniál jediný, čtyřpoteniál. Pokusme se jej nadefinovat následovně později výhody této definie oeníme): ϕ A µ =, A ) 52) Ještě si nadefinujme čtyřgradient µ = 1 ) t,, 53) s jehož pomoí bude čtyřdivergene čtyřvektoru zapsatelná jako A µ x µ = η µν µ A ν = ν A ν = A 54) Z definie snadno ověříme, že Lorenzova podmínka se pak dá zapsat elegantně jako A µ x µ Aµ,µ = 0, 55) kde jsme použili značení derivae jako,, ož značí, že veličina je derivována podle všeh indexů horníh i dolníh!), ktreré následují za čárkou. Dále si zadefinujme čtyřrozměrnou analogii Laplaeova operátoru, a uvidíme, že se vlastně jedná o operátor d Alembertův skalární součin dvou čtyřgradientů): = η µν µ ν = 1 2 2 t 2 + 56) Jde přesně o operátor vystupujíí ve vlnové rovnii. S výhodou můžeme dále zadefinovat hustotu čtyřproudu čtyřproud): Vlnové rovnie pak přejdou v jedinou J µ = ϱ, j ) 57) A ρ = µj ρ 58) 16
uvědomme si, že µ označuje permeabilitu vakua). Ověřme si pro zajímavost ekvivaleni rovni pro index µ = 0: A 0 = ϕ = 1 ϕ + 1 3 2 ϕ t 2 = µj 0 = µϱ = ϱ ε. 59) Použitím 2 = 1 εµ skutečně získáme první z nehomogenníh) vlnovýh rovni pro poteniály. Do elegantního tvaru nám také přejde rovnie kontinuity, rozepsáním si snadno ověříme, že ji lze zapsat jako čtyřdivergeni čtyřproudové hustoty: J µ,µ = 0. 60) Čeká nás však ještě úkol ověřit, zda nově zavedené veličiny jsou skutečně čtyřvektory. Uvědomíme-li si, že klasiká hustota proudu je j = ϱ v, pak můžeme psát J µ = ϱ, ϱ v) = dq, v). 61) dv Ovšem objem V není relativistiký invariant, tím je zase pouze vlastní objem V 0 : dv 0 = γdv ϱ = dq dv = dq dv 0 dv 0 dv = γ dq dv 0 = γϱ 0, 62) J µ = ϱ 0 γ, v) = ϱ 0 u µ. 63) Vidíme, že čtyřprudová hustota J µ je pouze násobkem čtyřryhlosti u µ, nebot ϱ 0 je skalár, invariant. Čtyřproud je tedy čtyřvektor. Z vlnové rovnie plyne, že čtyřvektorem je i A µ, nebot d Alembertián se dá vpodstatě hápat jako skalár, byt jde o operátor, a máme tedy rovnii, v níž na jedné straně je násobek čtyřvektoru, čímž i na levé straně musí vystupovat čtyřvektor-čtyřpoteniál. Připomeňme však, že z definie je čtyřvektor veličina transformujíí se následujíím způsobem: A µ = Λ µ ν A ν. 64) 6.1 Tensor elektromagnetikého pole Nejprve několik poznámek ke klasikým vektorům elektromagnetikého pole: B je takzvaný axiální vektor, při inverzi souřadni nemění svůj směr v kontrastu s polárními, které mění znaménko. Axiální vektory vznikají vektorovým součinem dvou polárníh vektorů, původně jde totiž o tensory. Tak jest například B ij = i A j j A i. 65) Jde o antisymetriký tensor, jenž má tři nezávislé složky na diagonále jsou nuly a dále B ij = B ji ), které můžeme ztotožnit se složkami nějakého vektoru následujíím vztahem: B k = 1 2 ɛkij B ij. 66) Inverzní vztah pak zní: B ij = ɛ ijk B k. 67) 17
V Minkowského prostoru zavedeme antisymetriký tensor, jenž bude mít šest nezávislýh složek a nebude již tedy rozumné jej ztotožnit s jedním vektorem, ale se dvěma: E a B. Pokusme se tedy o čtyřrozměrné rozšíření tensoru Bij následujíím způsobem: F µν = A ν,µ A µ,ν. 68) Pokusme se zjistit, jak tensor vypadá. Vidíme, že jeho prostorová část je shodná s původním klasikým tensorem: F ij = B ij = ɛ ijk B k. 69) Jde opět o tensor antisymetriký, tj i jeho stopa bude F i i = 0. Jak je tomu s časovými složkami? F 0j = A j,0 A 0,j = A j,0 + A 0,j = 1 A j t + 1 ϕ = Ej x j 70) pokud zvedáme nahoru latinský index, ni se neděje, zvednutím nuly však musíme změnit znaménko, nebot v naší konveniη 00 = 1) Vidíme, že časové složky jsou složkami vektoru elektriké intenzity. Konečně se můžeme podívat na výsledný tvar tensoru elektromagnetikého pole: 0 E1 E 1 F µν = F µν = E2 E3 0 B 3 B 2 E 2 B 3 0 B 1 E 3 B 2 B 1 0 0 E 1 E 2 E 3, 71) E1 0 B 3 B 2 E2 B 3 0 B 1. 72) E3 B 2 B 1 0 Nejdůležitější vektory elmag. pole E a B určují Lorenzovu sílu a tím tedy i působení pole) jsou svázány do jednoho tensoru a to opět velie výhodně, jak uvidíme za hvíli). Obě pole jsou provázaná a nemá tak smysl hovořit o samostatném elektrikém či magnetikém poli. E a B jsou totiž složky tensoru a nejsou invarianty, závisí na pozorovateli. Mám-li však alespoň jednu složku tensoru F µν nenulovou, nemohu již najít takový ineriální systém, kde by byly nulové všehny složky. Lze však najít systémy, kde např. jeden pozorovatel pozoruje pouze pole magnetiké, zatímo druhý třeba pouze elektriké a třetí obě. Tensor elektromagnetikého pole se obeně transformuje jako dvakrát kontravariantní vektor každý index se transformuje pomoí matie Lorentzovy transformae) F µν = Λ µ αλ ν βf αβ 73) 6.2 Maxwellovy rovnie Nyní si odvodíme základní soustavu rovni elektrodynamiky za pomoi námi zavedenýh novýh veličin z předhozího odstave. Nejprve si ale trošku zaderivujeme, spočtěme si čtyřdivergeni tensoru elmag. pole jde o úžení tensoru): F µν, ν = A ν, µ ν A µ, ν ν 74) 18
Pokud u prvního členu v rozdílu prohodíme pořadí derivaí, získáme derivovanou) Lorenzovu kalibrační podmínku, a tedy první člen je identiká nula. Ve druhém členu máme stopu přes d Alembertián a získáme tak vlnový operátor. S použitím vlnové rovnie pro čtyřpoteniál dostaneme výsledek F µν, ν = A µ = µj µ 75) Dále si ukážeme, že v této soustavě jsou zahrnuty všehny Maxwellovy rovnie ve vakuu. Spočtěme si nejprve prostorové složky rovnie: pro µ = i Rozepsáním jednotlivý složek 1 2 E i t F i0, 0 +F ij, j = µj i + ɛ ijk j B k = µj i, kde ve druhém členu poznáváme vektorový součin nabla-operátoru s vektorem magnetiké induke, tj. εµ E1 t + rot B) i = µj i Uvážíme-li, že D = ε E, B = µ H a J i = j i, dostaneme rot H = j + D t. Podíváme-li se na časovou složku rovnie, získáme F 0ν, ν = F 0j, j = µj 0 = µϱ Jde o divergeni prostorové části prvního řádku tensoru elmag. pole, tedy: 1 div E = µϱ div E = ϱ ε, čímž máme uzavřenu první sérii Maxwellovýh rovni. Nyní si následovně zadefinujme takzvaný ykliký index: F [µνϱ] F µν, ϱ +F ϱµ, ν +F νϱ, µ = A ν, µϱ A µ, νϱ +A µ, ϱν A ϱ, µν +A ϱ, νµ A ν, ϱµ = 0 Výraz je tedy plně antisymetriký vzhledem ke všem indexům. Protože vztah platí pro všehny trojie indexů, můžeme si nejprve vybrat třeba µνϱ = 123: a tedy F 12, 3 +F 32, 1 +F 21, 3 = B 3, 3 +B 2, 2 +B 1, 1 div B = 0 19
µνϱ = 0jk: F 0j, k +F k0, j +F jk, 0 = 1 E j, k + 1 E k, j + 1 ɛ B l jkl t Vynásobme rovnii výrazem ɛ ijk : t ɛ jkl ɛ ijk B l = ɛ ijk j E k ɛ ijk k E j Pokud u druhého členu pravé strany prohodíme indexy jk v Levi-Civitově tensoru čímž se nám změní znaménko), získáme stejný vektorový součin jako ve členu prvním, elkem tedy po přeznačení indexů) 2 rot E. Dále je třeba si uvědomit, že ɛ jkl ɛ ijk = ɛ ljk ɛ ijk = 2δ i l. Tedy = 0 2δ i l t B l = 2ɛ ijk j E k Bi t = rot E) i rot E = B t, čímž máme Maxwellovy rovnie uzavřeny. 6.3 Poznámka ke kalibrai poteniálů Telegrafní rovnie pro poteniály odvozené z Maxwellovýh rovni a z materiálovýh vztahů j = J + σ E, D = ε E, B = µ H) a za pomoi identity rot rot = grad div ) v lineárním obeně vodivém prostředí mají tvar A µσ A t grad div A + µε ϕ ) t + µσϕ = µ J 76) ϕ + t div A = ϱ ε. 77) Druhou rovnii lze upravit přičtením dvou nulovýh výrazů na ϕ µσ ϕ t + t div A + µε ϕ t + µσϕ) = ϱ ε 78) Zde vidíme výhodnost zavedení Lorenzovy podmínky, jejíž obený tvar zní: div A + µε ϕ t + σµϕ = 0 79) Jejím aplikováním vymizí třetí členy na pravýh stranáh. Ukážeme, že Lorenzovu podmínku lze na vždy splnit, jinými slovy lze najít takové poteniály, které ji budou splňovat. Je jednoduhé si ověřit, že poteniály A a ϕ se dají změnit následujíím způsobem, aniž by to mělo vliv na fyzikální pole 4 E, B: 4 Hovoříme o kalibrační invariani Maxwellovýh rovni moderní teorie pole jako třeba teorie elektroslabýh iterakí či kvantová hromodynamika jsou postaveny na prinipu kalibrační invariane vůči určité grupě transformaí, v našem případě jde o grupu U1)). 20
A + = A + grad χ 80) ϕ + = ϕ χ t Dosad me do Lorenzovy podmínky v nevodivém prostředí: 81) div A + + εµ ϕ+ + div grad χ εµ 2 χ t t 2 = 0 82) Vidíme, že nově zavedené poteniály budou Lorenzovu podmínku splňovat, pokud pro kalibrační funki χ bude platit vlnová rovnie: χ = 0. 83) Pak budou telegrafní rovnie vlnovými nehomogenními rovniemi, a naštěstí již nebudou tak silně provázány. A µσ A t = µ J ϕ µσ ϕ t = ϱ 84) ε Podotkněme, že například pomoí Greenovy funke se dá ukázat, že rovnie pro χ je vždy řešitelná a poteniály lze pokaždé takto nakalibrovat. Zapišme nyní tyto podmínky ve tvaru čtyřvektorů: Zaved me nový čtyřpoteniál pozměněný o čtyřgradient skalární funke) vztahem: ) ϕ A +µ + =, A ϕ + = 1 ) χ t, A + χ = A µ + µ χ 85) při podmíne χ = 0. Pak tensor elmag. pole bude ze záměny derivaí) nezměněn: F +µν = A +ν, µ A +µ, ν = A ν, µ A µ, ν + µ ν χ ν µ χ = F µν Podívejme se, jak je tomu s vlnovou rovnií: A +µ = α α A +µ = α α A µ + µ χ = A µ + µ α α χ = A µ + µ χ = A µ = µj µ. Vlnová rovnie je tedy vskutku nezměněna. Pro orientai a pro ujasnění pojmů si to můžete ověřit i ve složkáh: Položme µ = j: A +j = α α A j + χ ) x j = 1 2 2 t 2 A j + χ ) x j + A j + χ ) x j Položme µ = 0: A +0 = α α A +0 = 1 2 2 = A j + χ = µjj xj t 2 ϕ χ ) + ϕ χ ) = ϕ t t t χ = ϕ = ϱ ε 21
6.4 Vlnová rovnie Zkusme si vyřešit vlnovou rovnii ve vakuu. Hledejme řešení ve tvaru harmonikýh vln A µ = 0 86) A µ = ɛ µ e ikσxσ, 87) A µ 0 je amplituda a k σ je vlnový vektor) spolu s podmínkou Dosazením naší násady získáme dvě podmínky Z vlnové rovnie plyne A µ,µ = 0 88) A µ = α α A µ = α ik α A µ ) = k α k α A µ = 0 89) Aby byl výraz nulový, musí být k α k α = 0, ale to znamená, že signál se šíří ryhlostí světla, jde o tečnu ke světelnému kuželi. Z Lorenzovy podmínky pak A µ, µ = ik µ A µ = 0 ɛ µ k µ = 0, 90) tj. 4-poteniál je ortogonální k vlnovému vektoru a speálně i polarizační vektory ɛ µ. Ve čtyřrozměrném prostoru můžeme najít ortogonální systém polarizačníh vektorů ε µ k, λ) λ = 1, 2: ε µ k, λ) = 0, εk, λ)), kde k ε = 0 transverzální polarizae) λ = 0: ε µ k, λ) = 1, 0, 0, 0) skalární polarizae) λ = 3: ε µ k, λ) = 0, k/ k ) longitudinální) Z nih jsou fyzikální polarizae splňujíí Lorenzovu podmínku pouze případy λ = 1, 2. Obené řešení vlnové rovnie spolu s Lorenzovou podmínkou můžeme pro reálný 4-poteniál A µ = A µ ) zapsat jako A µ x) = d 3 k 2 [ ak, λ)ɛ µ k, λ)e ik x + a + k, λ)ɛ µ k, λ)e ik x]. 91) λ=1 Ověřme nyní, že vlnový vektor je skutečně 4-vektor: k σ x σ musí být skalár, ale protože x σ je čtyřvektor polohy, musí být i k σ čtyřvektor. Jak souvisí k σ s klasikým vektorem k? Ve třírozměrném prostoru máme fázi vyjádřenu jako e i k r ωt). Pak srovnáním s e ikσxσ 22
získáme k 0 t = ωt, tedy k 0 = ω. A prostorové složky obou vektorů jsou shodné: k σ = ω ), k 92) kde n je jednotkový vektor ve směru šíření vlny. 6.5 Dopplerův jev 6.6 Lorenzova 4-síla Lorenzova 3-síla je dána známým vzorem Ukázali jsme, že pro obenou čtyřsílu platí F µ = dm ) dτ ; γ F k σ = ω 1, n), 93) F L = q E + v B) 94) 95) Vydáme se ale jinou estou, již známe složky tensoru F µν i čtyřryhlost, sestavíme tedy následujíí výraz a pak jej podrobně prozkoumáme: kde q je skalár, náboj zkoumané částie. Jest F 00 = 0 F µ L = qf µν u ν, 96) FL 0 = qf 0j u j = q Ej γv j = γ E v, nebot u µ = γ, v) a u 0 = γ snížením indexu se změní znaménko). ) FL i = qf i0 u 0 + F ij E u j ) = q i γ + ɛijk B k γv j = γq[e i + v B) i ]. Fyzikální význam 0-té složky: qe je elektriká síla, qe d r je přírůstek práe, časovou derivaí získáme výkon, ale γ = dt dτ, tedy F L 0 má význam výkonu elektriké síly na jednotku vlastního času. Pro obenou čtyřsílu platí η µν F µ u ν = dm0 dτ 2 ), pokud je tedy čtyřsíla kolmá k čtyřryhlosti, pak jest m 0 = konst! Pro Lorenzovu čtyřsílu platí: η µν F µ L uµ = qf µν u ν u µ = 0, nebot F µν je antisymetriký. Pro obený symetriký tensor S µν a antisymetriký A µν totiž platí S µν A µν = S νµ A νµ = S µν A µν, kde jsme jednou přeznačili indexy prohodili) a využili symetričnosti respektive antisymetričnosti tensorů. Jediná možnost, jak rovnost může být splněna je, že se jedná o identikou nulu. Nakone uved me expliitní tvar Lorenzovy čtyřsíly: ) E F µ v L = qγ, E + v B = qγ ) E v, γf L 97) 23
6.7 Hustota Lorenzovy čtyřsíly Již víme, že Lorenzova síla nemění klidovou hmotnost částie m 0 ož platí pro většinu sil). Pro odvození hustoty síly nebudeme provádět derivai podle objemu dv, nebot nejde o invariant, ale podle vlastního objemu dv 0, které spojuje vztah V 0 = γdv nebot dv 0 = dx 0 dy 0 dz 0 = γdx dy dz = γdv Tedy objemová hustota čtyřsíly bude: Φ µ df µ L dv 0 = df 0 dv 0, dγf) ) ) df 0 =, Φ γdv dv, 98) 0 kde Φ je objemová hustota klasiké Lorenzovy síly. S použitím vztahů j = ϱ v, = ϱ 0 a ϱ = γϱ 0 si tedy spočtěme dq dv 0 df 0 dv 0 = 1 dqγe v) dv 0 = 1 E j 99) Jediné, o lze rozumně derivovat podle objemu, jest náboj, a tak získáme nábojovou hustotu: Φ µ L = dq ) 1 dv 0 F µν u ν = F µν J ν = E J, Φ 100) 6.8 Zákony zahování v elektrodynamie Zadefinujme tensor energie a hybnosti T µν = 1 F µν F µσ 14 ) µ ηµν F ϱσ F ϱσ 101) 24
Referene [1] Přednáška ze speiální relativity, základní kurz fyziky na MFF UK. [2] Relativity, Speial, General and Cosmologial, W. Rindler, Oxford University Press 2001 25