Teoria mnogości, o której mówimy i teoria mnogości, w której mówimy 2010.04.05-13 Streszczenie W 1922 roku norweski logik Thoralf Skolem zwrócił uwagę na fakt, iż teoria mnogości Zermelo-Fraenkla jako teoria pierwszego rzędu posiada przeliczalny model (o ile tylko jest niesprzeczna). Fakt ten wydaje się kontrastować z możliwością wykazania w ZF istnienia zbiorów nieprzeliczalnych; zjawisko to nosi nazwę paradoksu Skolema. Aby spróbować zrozumieć taki stan rzeczy, zajmiemy się skonstruowaniem przykładu formuły pierwszego rzędu, która miałaby orzekać o istnieniu zbioru nieprzeliczalnego. Wstęp Paradoks Skolema jest dobrze opisany i omówiony w literaturze, dlatego też w niniejszej pracy zajmiemy się jedynie konstrukcją zdania języka teorii mnogości Zermelo-Fraenkla pierwszego rzędu, spełnialnego w modelach tej teorii i orzekającego o istnieniu zbioru nieprzeliczalnego. Następnie dokonamy krótkiej analizy tak otrzymanego zdania, celem zlokalizowania błędu myślowego, odpowiedzialnego za wrażenie paradoksu. Czytelnika zainteresowanego szerszą dyskusją tego zagadnienia odsyłamy zaś do [8] i [4]. Autor poczuwa się w miłym obowiązku podziękowania (anonimowym) recenzentom pierwszej wersji referatu, za trafne i rzeczowe uwagi, które umożliwiły usunięcie najbardziej rażących usterek. Definicje Językiem L nazwiemy zbiór symboli, którymi oznaczać będziemy funkcje, stałe i relacje, wraz z tzw. sygnaturą σ, czyli funkcją przyporządkowującą symbolowi jego arność (np. dla symbolu stałej c mamy σ(c) = 0, a dla symbolu relacji dwuczłonowej r σ(r) = 2). 1
L-strukturą nazwiemy układ M = (M, {f M } f L, {c M } c L, {r M } r L ), gdzie M ø to tzw.uniwersum struktury; każdemu symbolowi funkcyjnemu f L przyporządkowujemy funkcję f M : M σ(f) M zwaną intepretacją symbolu funkcyjnego f w M. Analogicznie określamy interpretacje symboli relacyjnych r L: r M M σ(r) i symboli stałych c L: c M M. Mocą struktury M nazywamy moc jej uniwersum M, natomiast mocą języka L - większą z liczb ℵ 0, L (przyjmujemy tu, że zbiór symboli zmiennych zawsze jest przeliczalny). Termem nazwiemy symbol dowolnej stałej c, zmiennej x i (i N), bądź dla symbolu f dowolnej funkcji n-arnej wyrażenie f(t 1,..., t n ), w którym t 1,...,t n są termami. W określonej strukturze M, przy określonym wartościowaniu (czyli ustaleniu znaczenia wszystkich użytych zmiennych) elementami (a 1,..., a k ) M k każdy term t posiada interpretację (ozn. t M a 1,..., a k ), będącą również przedmiotem z M: interpretacją symbolu stałej c, jest przedmiot c M, interpretacją symbolu zmiennej x i jest przedmiot a i, zaś interpretacją termu f(t 1,..., t n ) jest wartość funkcji f M dla argumentów będących interpretacjami termów t 1,...,t n (przy tym samym wartościowaniu). Formułą nazywamy wyrażenie postaci t 1 = t 2 gdzie t 1, t 2 są termami, bądź też dla dowolnego symbolu relacji n-arnej r wyrażenie r(t 1,..., t n ), w którym t 1,...,t n są termami, bądź też dla dowolnych formuł ϕ i ψ wyrażenia postaci ϕ, ϕ ψ oraz v ϕ(v) (to ostatnie jest poprawną formułą, o ile zmienna x i jest wolna 1 w ϕ, co często oznaczamy ϕ(x i )). Zbiór formuł języka L oznaczać będziemy F orm L. Zdaniem nazywamy formułę o wszystkich zmiennych związanych. Zbiór zdań języka L oznaczać będziemy Sent L. Powiemy, że formuła ϕ jest spełniona w L-strukturze M przez układ (a 1,..., a n ) M n (ozn. M = ϕ a 1,..., a n ) wtedy, gdy: ϕ jest postaci (t 1 = t 2 ), t 1, t 2 są termami, oraz t M 1 a 1,..., a n = t M 2 a 1,..., a n, ϕ jest postaci r(t 1,..., t m ), t 1,..., t m są termami, oraz (t M 1 a 1,..., a n,..., t M m a 1,..., a n ) r M, ϕ jest postaci ψ, oraz nie jest M = ψ a 1,..., a n, ϕ jest postaci ψ 1 ψ 2, oraz M = ψ 1 a 1,..., a n lub M = ψ 2 a 1,..., a n, ϕ jest postaci x i ψ(x i ), oraz dla pewnego x M jest M = ψ a 1,..., a i 1, x, a i+1,..., a n. Jest jasne, że spełnienie zdania nie zależy od wartościowania. Zdanie ϕ, które jest spełnione w strukturze M nazywamy prawdziwym w M, ozn. M = ϕ. 1 Zmienną uważamy za wolną, jeśli nie występuje pod żadnym z kwantyfikatorów. W przeciwnym razie nazywamy ją zmienną związaną. 2
Teorią będziemy nazywać dowolny zbiór zdań Σ Sent L. Modelem M teorii Σ nazywamy każdą L-strukturę w której dla każdego zdania ϕ Σ jest M = ϕ, co zapisujemy M = Σ. Jeśli teoria posiada model, to mówimy, że jest niesprzeczna. Twierdzenie Löwenheima-Skolema (dolne) Jeśli Σ Sent L jest niesprzeczną teorią języka pierwszego rzędu L, to istnieje model M = Σ, mocy M nie większej, niż moc języka L. 2 (W szczególności więc, każda teoria Σ Sent L gdzie L ℵ 0 posiadającą model nieskończony, posiada model przeliczalny). Skróty Dla wygody w zapisie formuł języków pierwszego rzędu 3 umawiamy się oznaczać zmienne wszystkimi literami alfabetu łacińskiego a, b,..., y, z; relacje dwuczłonowe będziemy często pisać w formie xry zamiast R(x, y). Dla poprawy czytelności będziemy też pomijać lub dostawiać nawiasy. Dalej wprowadzamy następujące skróty: (ϕ ψ) zamiast ( ϕ ψ), (ϕ ψ) zamiast ( ϕ ψ), (ϕ ψ) zamiast (ϕ ψ) (ψ ϕ), x ϕ(x) zamiast x ϕ(x), oraz (x y) zamiast (x = y). Teoria mnogości ZF pierwszego rzędu Przedstawimy teraz teorię mnogości Zermelo-Fraenkla pierwszego rzędu, zbudowaną nad językiem L ZF = {ε} (gdzie ε to symbol relacji dwuczłonowej). Termem może być jedynie symbol zmiennej x i (i N). Formułą może być wyrażenie postaci x i = x j, lub x i εx j (i, j N), lub dla ustalonych formuł ϕ i ψ wyrażenia ϕ, ϕ ψ, oraz x i ϕ(x i ). Powiemy, że formuła ϕ jest spełniona w L ZF -strukturze V przez układ (a 1,..., a n ) V n (ozn. V = ϕ a 1,..., a n ) wtedy, gdy: 2 Szkic dowodu tego twierdzenia znajdzie czytelnik w [3] i [6]. 3 Zdania dotyczące interpretacji tych formuł będziemy się starali zapisywać w języku polskim, o ile to możliwe unikając symboli używanych w językach o których mówimy. 3
ϕ jest postaci (x i = x j ), oraz a i = x M i a 1,..., a n = x M j a 1,..., a n = a j, ϕ jest postaci x i εx j, oraz (x M i a 1,..., a n, x M j a 1,..., a n ) ε M, ϕ jest postaci ψ, oraz nie jest M = ψ a 1,..., a n, ϕ jest postaci ψ 1 ψ 2, oraz M = ψ 1 a 1,..., a n lub M = ψ 2 a 1,..., a n, ϕ jest postaci x i ψ(x i ), oraz dla pewnego x M jest M = ψ a 1,..., a i 1, x, a i+1,..., a n. Zdefiniujemy teraz formuły pomocnicze, podpisując każdą z nich oznaczeniem jej interpretacji w standardowym modelu teorii mnogości. Będziemy pisać: Pusty(x), gdy y (yεx) (x = ø) Podzbiór(x, y), gdy z (zεx zεy) (x y) Potęgowy(x, y), gdy z (zεx Podzbiór(z, y)) (x = 2 y ) Para(p, a, b), gdy x [xεp (x = a x = b)] (p = a, b) Suma(s, x), gdy y [yεs z (zεx yεz)] (s = x) UPara(x, a, b), gdy y [yεx (y = a P ara(y, a, b))] (x = a, b = {a, {a, b}}) 4 Relacja(r), gdy x [xεr ( a b UPara(x, a, b))] (dla pewnych a i b jest r a b) Funkcja(f), gdy Relacja(f) x y z [( a b (aεf bεf UPara(a, x, y) Upara(b, x, z))) y = z] (f jest relacją jednoznaczną) wdz(x, f) gdy p y (pεf UPara(p, x, y)) (x Dom f ) 5 wzw(y, f) gdy p x (pεf UPara(p, x, y)) (y Rg f ) Wartość(f, x, y) gdy p (pεf UPara(p, x, y)) (f(x) = y) 4 Chodzi tu o parę uporządkowaną, tj. spełniającą warunek a, b = c, d wtw, gdy a = c i b = d. 5 Ze względu na sposób w jaki zdefiniowaliśmy funkcję nie jesteśmy w stanie określić jej dziedziny i przeciwdziedziny (w sensie teoriokategoryjnym). Będziemy więc traktować funkcje jak funkcje totalne i na, beztrosko oznaczając zbiór argumentów Dom oraz zbiór wartości Rg. Nie prowadzi to do nieporozumień, a jedyną funkcją o jakiej będziemy dalej mówić jest właśnie totalna surjekcja ze zbioru przeliczalnego na jego zbiór potęgowy). 4
Następnik(y, x) 6 gdy z [zεy (zεx z = x)] (y = x {x}) Nieskończony(x) 7 gdy y (yεx Pusty(y)) y (yεx z (zεx Następnik(z, y))) (ø x oraz dla dowolnego y x jest też (y {y}) x) Z pomocą tak zdefiniowanych formuł możemy wyrazić aksjomaty teorii mnogości Zermelo-Fraenka jako zdania języka L ZF : x Pusty(x) (aksjomat zbioru pustego), x y (Podzbiór(x, y) Podzbiór(y, x) x = y) (aksjomat ekstensjonalności), x y p Para(p, x, y) (aksjomat pary), x s Suma(s, x) (aksjomat sumy), x p Potęgowy(p, x) (aksjomat zbioru potęgowego), x Nieskończony(x) (aksjomat nieskończoności), x [( y yεx) y (yεx z( (zεy) (zεx)))] (aksjomat ufundowania), oraz schematy aksjomatów: x y[ϕ(x, y) a b y (yεb x (xεa ϕ(x, y)))] (aksjomaty podstawienia dla dowolnej funkcji zdaniowej ϕ(x, y)) x y z [zεy (zεx ϕ(z))] (aksjomat podzbiorów dla dowolnej funkcji zdaniowej ϕ(z)) Twierdzenie Cantora O dwóch zbiorach powiemy, że są równoliczne, wtedy i tylko wtedy, gdy istnieje między nimi bijekcja, czyli odwzorowanie wzajemnie jednoznaczne. Twierdzenie Cantora orzeka, iż żaden zbiór nie jest równoliczny ze swoim zbiorem potęgowym. Twierdzenie. (dla żadnego zbioru x nie jest prawdą, że istnieje surjekcja z x na 2 x ). x f [Funkcja(f) y (yεx wdz(y, f)) y (Podzbiór(y, x wzw(y, f)))]. Dowód. Załóżmy że tak nie jest, tj. x f [Funkcja(f) y (yεx wdz(y, f)) y (Podzbiór(y, x) wzw(y, f))] oraz niech ϕ(z, f) będzie formułą postaci a [Wartość(f, z, a) (zεa)]. 6 Nazwa jest mało adekwatna, jednak będziemy dalej używać tej konstrukcji do wyrażenia arytmetycznego następnika 7 Nie jest to oczywiście własność przysługująca każdemu zbiorowi nieskończonemu. 5
Na mocy aksjomatu podzbiorów dla funkcji zdaniowej ϕ istnieje więc zbiór y 0 = {z x : φ(z, f)} (gdzie φ(z, f) to interpretacja formuły ϕ, tj z / f(z) ), tzn. y 0 z [zεy 0 (zεx ϕ(z, f))] (nie wykluczamy wypadku gdy y 0 jest zbiorem pustym). W kilku krokach możemy stąd okazać z(zεy 0 zεx), czyli Podzbiór(y 0, x). W tezie przyjmujemy jako jeden z warunków formułę y (Podzbiór(y, x) wzw(y, f))), skąd w szczególności czyli Podzbiór(y 0, x) wzw(y 0, f)) p x 0 (pεf UPara(p, x 0, y 0 )), Podzbiór(y 0, x) x 0 Wartość(f, x 0, y 0 ). Zastanówmy się, czy zachodzi x 0 εy 0. Mamy x 0 εy 0 gdy x 0 εx a [Wartość(f, x 0, a) (x 0 εa)]. W tezie przyjęliśmy zachodzenie warunku Funkcja(f), skąd w szczególności x y z [( a b (aεf bεf UPara(a, x, y) Upara(b, x, z))) y = z] Znajdujemy stąd, że jedyną wartością a spełniającą formułę Wartość(f, x 0, a) jest y 0 ; mamy więc x 0 εy 0 gdy x 0 εx [Wartość(f, x 0, y 0 ) (x 0 εy 0 )] Zatem, wobec Wartość(f, x 0, y 0 ) otrzymujemy x 0 εy 0 gdy (x 0 εy 0 ) Sprzeczność ta kończy dowód. 6
Wskażemy teraz zbiór przeliczalny: na mocy aksjomatu nieskończoności istnieje taki zbiór X, że ø X oraz dla każdego y X jest też (y {y}) X. Niech Y oznacza rodzinę wszystkich takich zbiorów X. Przez ω oznaczmy najmniejszy z nich, tj. ω = Y. Każdemu elementowi zbioru ω możemy przyporządkować liczbę naturalną, w ten sposób, że zbiorowi pustemu ø przyporządkowujemy 0, zbiorowi {ø} - 1, {ø, {ø}} - 2,... i w ogólności interpretując zbiór pusty jako pierwszą liczbę naturalną, oraz funkcję x (x {x}) jako funkcję następnika przyporządkowujemy każdemu z elementów jego interpretację. Jest więc ω zbiorem przeliczalnym. Teraz, z twierdzenia Cantora otrzymujemy w szczególności: o [( n (Nieskończony(n) Podzbiór(o, n))) f (Funkcja(f) x (xεo wdz(x, f)) y (Podzbiór(y, o) wzw(y, f)))], skąd natychmiastowym wnioskiem jest (wobec aksjomatu zbioru potęgowego) żądana formuła: a o [( n (Nieskończony(n) Podzbiór(o, n))) f (Funkcja(f) x (xεo wdz(x, f)) y (yεa wzw(y, f)))]. Paradoks obnażony Niech V będzie przeliczalnym modelem teorii ZF. Możemy ten model rozpatrywać jako parę uporządkowaną V, R, gdzie R V V, dającą się skonstruować w standardowym (nieprzeliczalnym) modelu teorii mnogości 8. Przyjmując zatem taką interpretację, otrzymana przed chwilą formuła, po rozwinięciu definicji formuł pomocniczych orzeka (kładziemy nacisk na interpretację symbolu relacyjnego ε podmieniając go symbolem R): a[ o (( n ( y (R(y, n) x R(x, y)) y (R(y, n) z (R(z, n) x (R(x, z) (R(x, y) x = y)))) x (R(x, o) R(x, n)))) f ( x (R(x, f) ( a b y (R(y, x) (y = a x (R(x, y) (x = a x = b)))))) x y z (( a b (R(a, f) R(b, f) k (R(k, a) (k = x l(r(l, k) (l = x l = y)))) k (R(k, b) (k = x l(r(l, k) (l = x l = z)))))) y = z) y (R(y, o) p x (R(p, f) k (R(k, p) (k = y l(r(l, k) (l = y l = x)))))) y (R(y, a) p x (R(p, f) k (R(k, p) (k = x l(r(l, k) (l = y l = x))))))))] a więc o pewnej (dość zawiłej) własności relacji dwuczłonowej R, a nie, jak się z początku mogło wydawać, o kardynalności pewnego podzbioru zbioru V. Oczywiście ponieważ V jest przeliczalny, każdy jego podzbiór jest co najwyżej przeliczalny. 8 O ile takowy istnieje, tj. teoria ZF jest niesprzeczna. 7
Literatura [1] Wykłady ze wstępu do matematyki Wojciech Guzicki, Piotr Zakrzewski PWN Warszawa 2005 [2] Podstawy teorii mnogości Wojciech Guzicki, Paweł Zbierski PWN Warszawa 1978 [3] Teoria modeli Artur Piękosz, Wydawnictwo Politechniki Krakowskiej 2008 [4] Jak żyć z paradoksem Skolema? Jerzy Pogonowski Zakład Logiki Stosowanej Instytut Językoznawstwa UAM, (http://www.logic.amu.edu.pl/ images/f/f0/parskol.pdf) [5] O teorii modeli Alfred Tarski (m.in. Pisma logiczno-filozoficzne t.2: metalogika, PWN 2001) [6] Fundamentals of Model Theory William Weiss, Cherie D Mello, University of Toronto (http://at.yorku.ca/i/a/a/i/10.ps) [7] First-order Model Theory, Stanford Encyclopedia of Philosophy (http: //plato.stanford.edu/entries/modeltheory-fo/) [8] Stanford Encyclopedia of Philosophy Skolem s Paradox, (http://plato. stanford.edu/entries/paradox-skolem/) 8