Đến nội dung


nmlinh16

Đăng ký: 18-03-2018
Offline Đăng nhập: Hôm qua, 23:53
***--

Chủ đề của tôi gửi

Mọi không gian vectơ 1-chiều đều đẳng cấu, nhưng một số không gian đẳng cấu hơn những k...

06-09-2021 - 15:36

Một trong những bài học đầu tiên về đại số tuyến tính là "hai không gian vectơ $n$-chiều thì đẳng cấu". Thực ra, phát biểu đó đã ẩn đi một vấn đề không tầm thường: đẳng cấu đó không "tự nhiên" - để xây dựng nó thì ta cần chọn cơ sở cho hai không gian. (Khái niệm "tự nhiên" có thể định nghĩa chặt chẽ được bằng ngôn ngữ phạm trù, tuy nhiên trong ngữ cảnh của các không gian vectơ thì ta có thể hiểu đơn giản là "tự nhiên" = "không phụ thuộc vào cách chọn cơ sở").

 

Để cho quen thuộc, ta xét mọi thứ trên trường số thực, nhưng thật ra tất cả các suy luận dưới đây không phụ thuộc vào việc ta xét trên trường nào. Ta thường dùng chữ cái $L$ để chỉ các không gian vectơ 1-chiều, vì chúng chính là các "đường thẳng" (line).

 

Sự khác biệt căn bản giữa tập số thực $\mathbb{R}$ và một không gian vectơ 1-chiều $L$ đó là trên $L$ không có một phép nhân "tự nhiên". Lí do là vì trên $\mathbb{R}$ có một cơ sở "chính tắc" (số 1), còn trên $L$ thì không. Thật vậy, cho một đẳng cấu $\mathbb{R} \to L$ chính là cho một cơ sở (i.e. một phần tử $e \neq 0$) của $L$. Giả sử ta dùng đẳng cấu này để định nghĩa phép nhân trên $L$, nghĩa là $$(ae) \cdot (be):= ab e$$ với mọi $a,b \in \mathbb{R}$. Bây giờ ta đổi sang cơ sở khác $e'$ và viết $e' = \lambda e$, với $\lambda \in \mathbb{R}$. Thế thì theo phép nhân vừa định nghĩa ở trên, ta có $$(ae') \cdot (be') = (a\lambda e) \cdot (b\lambda e) = ab\lambda^2 e = ab\lambda e',$$ nghĩa là phép nhân này không còn là phép nhân số thực thông thường khi ta chuyển sang cơ sở mới $e'$. Hiện tượng này được diễn tả lại bằng ngôn ngữ phạm trù như sau: "Biểu đồ

Untitled.png

không giao hoán."

 

Thật ra chúng ta đã thấy hiện tượng này trong một ngữ cảnh quen thuộc hơn: vật lý. Đó chính là vấn đề đổi đơn vị. Ta xét hai đơn vị đo độ dài là ${\rm m}$ và ${\rm dm}$. Ta có $1 {\rm m} = 10 {\rm dm}$, nhưng khi đổi sang đơn vị đo diện tích thì $1 {\rm m}^2 = 100 {\rm dm}^2$. Chính xác hơn, ta không thể cứ làm phép nhân một cách đơn giản $1 {\rm m} \times 1 {\rm m} = 1 {\rm m}$, vì nếu như vậy thì khi đổi sang đơn vị ${\rm dm}$, ta sẽ có $10 {\rm dm} \times 10 {\rm dm} = 10 {\rm dm}$, không tương thích với phép nhân số thực thông thường.

 

Khi đo độ dài, thực ra chúng ta không sử dụng một con số, mà chúng ta đang sử dụng một phần tử của một không gian vectơ 1-chiều. Các đại lượng vô hướng được đo bởi các không gian vectơ 1-chiều, và việc chọn cơ sở cho các không gian này giống như việc chuẩn hoán đơn vị. Việc đổi cơ sở cũng giống như việc đổi đơn vị.

 

Phép nhân "tự nhiên" trên không gian vectơ đo độ dài được cho bởi $1 {\rm m} \times 1 {\rm m} = 1 {\rm m}^2$, và $1 {\rm m}^2$ không còn là một vô hướng để đo độ dài nữa. Điều này gợi ý rằng để xây dựng một phép nhân tự nhiên trên một không gian vectơ 1-chiều, ta cần hi sinh tính "đóng kín" của phép nhân (nghĩa là kết quả của phép nhân không còn nằm trong không gian ban đầu nữa). Đối tượng toán học cho phép làm điều này chính là tích tenxơ.

 

Cho $V$ và $W$ là hai không gian vectơ. Ta sẽ chỉ ra định nghĩa ad hoc của tích tenxơ $V \otimes W$ như sau. $V \otimes W$ là tập hợp các tổng hình thức hữu hạn dạng $$\sum_{i = 1}^n \lambda_i (v_i \otimes w_i),$$ trong đó $\lambda_1,\ldots,\lambda_n \in \mathbb{R}$, $v_1,\ldots,v_n \in V$ và $w_1,\ldots,w_n \in W$. Phép cộng và phép nhân với vô hướng trên $V \otimes W$ được thực hiện một cách hiển nhiên, và bị ràng buộc bởi điều kiện "song tuyến tính" dưới đây

$$v \otimes (w_1 + w_2) = v \otimes w_1 + v \otimes w_2,$$

$$(v_1 + v_2) \otimes w = v_1 \otimes w + v_2 \otimes w,$$

$$\lambda (v \otimes w) = (\lambda v) \otimes w = v \otimes (\lambda w)$$ với mọi $v,v_1,v_2 \in V$, $w, w_1, w_2 \in W$ và $\lambda \in \mathbb{R}$. Nếu bộ $(e_i)_{i \in I}$ là một cơ sở của $V$ và bộ $(f_j)_{j \in J}$ là một cơ sở của $W$ thì bộ $(e_i \otimes f_j)_{i \in I, j \in J}$ là một cơ sở của $V \otimes W$. Nói riêng, $\dim (V \otimes W) = \dim V \times \dim W$. Tích tenxơ của hai không gian vectơ 1-chiều lại là một không gian vectơ 1-chiều.

 

Tích tenxơ chính cách tự nhiên nhất để nhân hai phần tử của hai không gian vectơ bất kỳ. Nói "nhân" ở đây ý là một ánh xạ song tuyến tính: Cách tự nhiên nhất để  "nhân" một vectơ $v \in V$ và một vectơ $w \in W$ chính là lấy phần tử $v \otimes w \in V \otimes W$. Lí do là vì phép toán $\otimes$ có tính song tuyến tính theo nghĩa ở trên (song tuyến tính = tuyến tính theo từng biến khi cố định biến còn lại). Theo ngôn ngữ phạm trù, sự "tự nhiên nhất" này được phát biểu lại dưới dạng tính chất phổ dụng (universal property): Với mỗi ánh xạ song tuyến tính $\phi: V \times W \to U$ (với $U$ là một không gian vectơ thứ ba, tồn tại duy nhất ánh xạ tuyến tính $\psi: V \otimes W \to U$ sao cho $\psi(v \otimes w) = \phi(v,w)$ với mọi $v \in V$ và $w \in W$. Cho một ánh xạ song tuyến tính $V \times W \to U$ cũng chính là cho một ánh xạ tuyến tính $V \otimes W \to U$.

 

Chẳng hạn ta xét $F$ là không gian vectơ đo lực và $L$ là không gian vectơ đo độ dài. Ta sẽ định nghĩa kết quả của phép nhân một phần tử của $f \in F$ với một phần tử $\ell \in L$ bởi phần tử $ab(f \otimes \ell) \in F \otimes L$. Ta khẳng định rằng $F \otimes L$ chính là không gian vectơ 1-chiều để đo năng lượng. Thật vậy, nếu ta chọn cơ sở $f = 1 {\rm N}$ cho $F$ và $\ell = 1 {\rm m}$ cho $L$ và xét hai vectơ khác, $f' = af$, $\ell' = b \ell$ (với $a,b \in \mathbb{R}$), thế thì $f' \otimes \ell' = ab(f \otimes \ell)$ theo quy tắc song tuyến tính. Điều này phù hợp với việc "đổi đơn vị đo năng lượng khi các đơn vị đo lực và đo độ dài thay đổi". Cuối cùng, ta có thể lấy $f \otimes \ell = 1 {\rm N.m} = 1 {\rm J}$ làm cơ sở của $F \otimes L$, tức là làm đơn vị đo năng lượng.

 

Một cách tương tự, nếu $L$ là không gian vectơ 1-chiều để đo độ dài thì không gian vectơ đo diện tích sẽ là $L^{\otimes 2} = L \otimes L$, không gian vectơ đo thể tích sẽ là $L^{\otimes 3} = L \otimes L \otimes L \ldots$

 

Như vậy ta đã có thể nhân hai vectơ từ hai không gian vectơ 1-chiều khác nhau (i.e. nhân hai đơn vị khác nhau). Thế chia thì sao? Để làm phép chia, ta cần biết lấy "nghịch đảo" của một vectơ khác $0$ (tất nhiên, kết quả của phép lấy nghịch đảo nói chung không nằm trong không gian ban đầu). Để khái niệm "nghịch đảo" có nghĩa, trước hết ta cần một phần tử trung lập của tích tenxơ. Điều này khá đơn giản. Với mọi không gian vectơ $V$, ta có một đẳng cấu $$\mathbb{R} \otimes V \to V, \qquad \sum_{i=1}^n \lambda_i \otimes v_i \mapsto \sum_{i=1}^n \lambda_i v_i,$$ (ánh xạ ngược của nó là $v \mapsto 1 \otimes v$). Đẳng cấu này tự nhiên, vì việc xây dựng nó không cần chọn cơ sở. Tương tự, ta cũng có đẳng cấu tự nhiên $V \otimes \mathbb{R} \to V$. Như vậy tập số thực $\mathbb{R}$, tức là các vô hướng thuần túy (không mang bất kỳ đơn vị nào) chính là "phần tử trung lập" của tích tenxơ.

 

Cho $L$ là một không gian vectơ 1-chiều, nếu ta chỉ ra được một không gian vectơ $L^{\vee}$ sao cho ta có đẳng cấu tự nhiên $L \otimes L^{\vee} \simeq \mathbb{R}$ thì $L^{\vee}$ sẽ đóng vai trò như "nghịch đảo tenxơ" của $L$. Không gian $L^{\vee}$ cần tìm ở đây chính là không gian vectơ đối ngẫu của $L$, tức là không gian các ánh xạ tuyến tính $L \to \mathbb{R}$ (các phiếm hàm tuyến tính hay dạng tuyến tính trên $L$). Đây là một không gian vectơ 1-chiều (vì một dạng tuyến tính $\phi: L \to \mathbb{R}$ sẽ hoàn toàn xác định nếu ta biết giá trị của nó tại một vectơ khác $0$ của $\mathbb{R}$). Ánh xạ tuyến tính $$L \otimes L^{\vee} \to \mathbb{R}, \qquad \sum_{i=1}^n \ell_i \otimes \phi_i \mapsto \sum_{i=1}^n \phi_i(\ell_i)$$ là một toàn cấu, và vì thế là một đẳng cấu vì hai không gian trên đều có số chiều 1. Nó tự nhiên vì cách xây dựng nó không cần chọn cơ sở. Nếu $\ell \in L$ là một vectơ khác $0$, nó lập thành một cơ sở của $L$. Ta định nghĩa "nghịch đảo" của nó là dạng tuyến tính $\ell^{\vee}: L \to \mathbb{R}$ duy nhất sao cho $\ell^{\vee}(\ell) = 1$. Giả sử ta đổi cơ sở của $L$ từ $\ell$ sang $\ell' = a\ell$, $a \neq 0$. Thế thì "nghịch đảo" của $\ell'$ là dạng tuyến tính $L \to \mathbb{R}$ sao cho $\ell' = a\ell \mapsto 1$, nghĩa là $\ell \mapsto \frac{1}{a}$. Nói cách khác nó chính là dạng tuyến tính $\dfrac{\ell^{\vee}}{a}$.

 

GIả sử $L$ là không gian vectơ đo độ dài và $T$ là không gian vectơ đo thời gian. Ta định nghĩa kết quả của phép chia một phần tử $\ell \in L$ cho một phần tử $t \in T$, $t \neq 0$, bởi phần tử $\ell \otimes t^{\vee} \in L \otimes T^{\vee}$. Không gian $L \otimes T^{\vee}$ chính là không gian vectơ đo vận tốc. Thật vậy, nếu ta lấy $\ell = 1 {\rm m}$ cho $L$ và $t = 1 {\rm s}$ cho $T$ và xét hai vectơ khác, $\ell' = a\ell$, $t' = bt$ (với $a,b \in \mathbb{R}$ và $b \neq 0$) thì $$\ell' \otimes (t')^{\vee} = (a\ell) \otimes \dfrac{t^{\vee}}{b} = \dfrac{a}{b} (\ell \otimes t^{\vee}).$$ Điều này phù hợp với việc "đổi đơn vị đo vận tốc khi đơn vị đo độ dài và đơn vị đo thời gian thay đổi". Cuối cùng, ta có thể lấy $\ell \otimes t^{\vee} = 1 {\rm m}/{\rm s}$ làm đơn vị đo vận tốc.


Giới thiệu về bó

24-05-2021 - 20:32

Khái niệm  (sheaf) thể hiện một ý tưởng cơ bản: để hiểu một không gian hình học, ta có thể nghiên cứu các hàm trên không gian đó. Bó vốn có nguồn gốc từ Tô pô đại số và hình học vi phân (Leray đã xây dựng nó để chứng minh các định lý điểm bất động trong PDE). Sau này, người ta sử dụng bó một cách có hệ thống trong hình học đại số hiện đại.

 

1. "Hàm" và "điểm"

 

Trước khi đến với nội dung chính, ta bắt đầu một phiên bản baby của định lý biểu diễn Gelfand-Naimark.

 

Nếu $A$ là một vành (giao hoán và có đơn vị), ta ký hiệu $\text{Spm}(A)$ là phổ cực đại của $A$, tức là tập hợp tất cả các ideal cực đại của $A$. Trên tập hợp này có một tô-pô được gọi là tô-pô Zariski, trong đó các tập đóng là các tập hợp $$V(I):=\{\mathfrak{m} \in \text{Spm}(A): I \subseteq \mathfrak{m}\},$$ trong đó $I$ là một ideal nào đó của $A$. Thật vậy, $\varnothing = V((1))$, $\text{Spm}(A) = V((0))$, $V(I) \cup V(J) = V(IJ)$ và $\bigcap_i V(I_i) = V\left(\sum_i I_i\right)$. Tô-pô này sinh bởi các tập mở có dạng $$D(f):=\{\mathfrak{m} \in \text{Spm}(A): f \notin \mathfrak{m}\},$$ với $f \in A$, được gọi là các tập mở chính. Như vậy, ta có thể coi các phần tử của $A$ như các hàm trên không gian tô-pô $\text{Spm}(A)$. Các ideal cực đại của $A$ chính là các điểm. Việc tính giá trị của một hàm $f$ tại một điểm $\mathfrak{m}$ chính là việc tính $f \mod \mathfrak{m}$, đó là một phần tử của trường thặng dư $A / \mathfrak{m}$. Như vậy, hàm $f$ nhận giá trị trong một trường biến thiên theo từng điểm. 

Slogan: Trong hình học, điểm là một cái gì đó mà tại đó ta có thể tính giá trị của các hàm, các giá trị này nằm trong một trường nào đó.

 

 

Cho $X$ là một không gian tô-pô. Ký hiệu $\mathcal{C}(X)$ là vành các hàm liên tục $X \to \mathbb{R}$ (phép cộng và phép nhân được định nghĩa một cách hiển nhiên). Nhóm các phần tử khả nghịch của vành này là $$\mathcal{C}(X)^\ast = \{f \in \mathcal{C}(X): \forall x \in X, f(x) \neq 0\}.$$ Với mỗi điểm $x \in X$, tập hợp $\mathfrak{m}_x:=\{f \in \mathcal{C}(X): f(x) = 0\}$ là một ideal của $\mathcal{C}(X)$. Chính xác thì nó là hạch của toàn cấu $$\mathcal{C}(X) \to \mathbb{R}, \qquad f \mapsto f(x).$$ Nó là một ideal cực đại vì $\mathcal{C}(X)/\mathfrak{m}_x \simeq \mathbb{R}$ là một trường. Ta có một ánh xạ $$X \to \text{Spm}(\mathcal{C}(X)), \qquad x \mapsto m_x.$$

 

Mệnh đề. Nếu $X$ là Hausdorff và compact thì ánh xạ trên là một phép đồng phôi (trong đó tô-pô trên $\text{Spm}(\mathcal{C}(X))$ là tô-pô Zariski).

Chứng minh

Tính toàn ánh. Cho $\mathfrak{m}$ là một ideal cực đại của $\mathcal{C}(X)$. Ta chứng minh rằng tồn tại $x \in X$ sao cho $\mathfrak{m} \subseteq \mathfrak{m}_x$ (và vì thế $\mathfrak{m} = \mathfrak{m}_x$ vì chúng là các ideal cực đại). Thật vậy, nếu ngược lại thì với mọi $x \in X$, tồn tại $f_x \in \mathfrak{m}$ sao cho $f_x(x) \neq 0$. Lấy $U_x \subseteq X$ là một lân cận mở của $x$ sao cho $f_x$ nhận giá trị khác $0$ trên toàn $U_x$. Vì $X$ là compact nên tồn tại một tập con hữu hạn $S \subseteq X$ sao cho $X = \bigcup_{x \in S}U_x$. Đặt $f:=\sum_{x \in S} f_x^2 \in \mathfrak{m}$. Thế thì $f(y) > 0$ với mọi $y \in X$, do đó $f$ khả nghịch trong $\mathcal{C}(X)^\times$, suy ra $\mathfrak{m} = \mathcal{C}(X)$, mâu thuẫn.

Tính đơn ánh. Cho $x \neq y$ là hai điểm của $X$. Vì $X$ là Hausdorff và compact nên chuẩn tắc. Theo định lý Urysohn, tồn tại hàm liên tục $f: X \to \mathbb{R}$ sao cho $f(x) = 0$ và $f(y) \neq 0$, suy ra $\mathfrak{m}_x \neq \mathfrak{m}_y$.

Tính liên tục. Xét một tập mở chính $D(f)$ của $\text{Spm}(\mathcal{C}(X))$, với $f: X \to \mathbb{R}$ liên tục. Ảnh ngược của nó bởi ánh xạ $$X \to \text{Spm}(\mathcal{C}(X)), \qquad x \mapsto \mathfrak{m}_x$$ là $\{x \in X: f(x) \neq 0\}$, hiển nhiên đây là một tập mở. Các tập mở chính là một cơ sở cho tô-pô Zariski trên $\text{Spm}(\mathcal{C}(X))$ nên ánh xạ trên liên tục.

Tính đóng. Cho $Y$ là một tập con đóng của $X$. Ta sẽ chứng minh rằng $$\{\mathfrak{m}_x: x \in Y\} = V(I),$$ với $I = \bigcap_{x \in Y} \mathfrak{m}_x = \{f \in \mathcal{C}(X): f|_Y = 0\}$. Hiển nhiên ta có $\{\mathfrak{m}_x: x \in Y\} \subseteq V(I)$. Ngược lại, xét $\mathfrak{m} \in V(I)$. Ta có $\mathfrak{m} = \mathfrak{m}_x$ với $x \in X$ nào đó. Nếu $x \notin Y$ thì tồn tại $f: X \to \mathbb{R}$ liên tục sao cho $f(x) \neq 0$ và $f|_Y = 0$ (vì $X$ là chuẩn tắc, nói riêng là chính quy). Khi đó, $f \in I$ và $f \notin \mathfrak{m}_x$. Nhưng $\mathfrak{m}_x \in V(I)$ nên $I \subseteq \mathfrak{m}_x$. Tóm lại, $x \in Y$ và do đó ta có $\{\mathfrak{m}_x: x \in Y\} = V(I)$ là một tập đóng. $\square$


Các hàm tử $\text{Ext}$

06-05-2021 - 22:43

Các hàm tử $\text{Hom}$ phản biến và thuận biến của một phạm trù abel là các hàm tử khớp trái. Khi phạm trù đã cho có đủ xạ ảnh hoặc đủ nội xạ, ta có thể xây dựng các hàm tử $\text{Ext}^n$ với tư cách là dẫn xuất phải thứ $n$ của $\text{Hom}$, $n = 1,2,\ldots$. Năm 1934, Baer đã đưa ra mô tả cụ thể cho nhóm $\text{Ext}^1$ bởi các dãy khớp ngắn và phép toán trên đó (tổng Baer). Yoneda đã tổng quát hóa điều này cho các nhóm $\text{Ext}^n$ bởi các mở rộng độ dài $n$ ($n$-fold extensions).

 

Mục tiêu của các bài viết trong chủ đề này là trình bày lại các xây dựng trên và chỉ ra rằng cách xây dựng cụ thể ở trên của hàm tử $\text{Ext}^n$ trùng với cách xây dựng qua ngôn ngữ hàm tử dẫn xuất. Nội dung được lấy từ chương VII của [Barry Mitchell, Theory of Categories, 1965].

 

Ta cố định một phạm trù abel $\mathcal{A}$. Khi không có gì nhầm lẫn, ta dùng ký hiệu $\text{Hom}$ thay cho $\text{Hom}_{\mathcal{A}}$ và tương tự với $\text{Ext}^n$. Để tránh "abstract nonsense", ta hoàn toàn có thể làm việc trong một phạm trù cụ thể như phạm trù các mô-đun trên một vành. Khi đó, các chứng minh sẽ đơn giản hơn nhiều vì ta có khái niệm "phần tử".

 

 

1. Nhóm $\text{Ext}^1$ và tổng Baer

 

Cho $A$, $B$ là hai vật (của $\mathcal{A}$). Một mở rộng của $A$ bởi $B$ là một dãy khớp ngắn $\xi: 0 \to B \to X \to A \to 0$. Ta nói một mở rộng $\xi': 0 \to B \to X' \to A \to 0$ là tương đương với $\xi$ nếu tồn tại một cấu xạ $f: X' \to X$ sao cho biểu đồ

h1.png

giao hoán. Theo bổ đề 5, một cấu xạ $f$ như vậy tự động là một đẳng cấu. Lạm dụng ký hiệu, ta sẽ viết $\xi = \xi'$ nếu chúng tương đương. Ta ký hiệu bởi $\text{Ext}^1(A,B)$ lớp tất cả các mở rộng của $A$ bởi $B$ sai khác tương đương (dễ thấy "$=$" là một quan hệ tương đương giữa các mở rộng của $A$ bởi $B$). Có một vấn đề về mặt lý thuyết tập hợp rằng $\text{Ext}^1(A,B)$ có thể quá lớn (tức là một lớp thực sự thay vì là một tập hợp). Tuy nhiên chúng ta sẽ hoàn toàn lờ đi điều này. Dễ thấy nếu $\xi = \xi'$ và $\eta = \eta'$ thì $\xi \oplus \eta = \xi' \oplus \eta'$.

 

Mục tiêu của chúng ta là định nghĩa một phép toán có tính hàm tử trên $\text{Ext}^1(A,B)$ để nó trở thành một nhóm abel. Ta bắt đầu với tính hàm tử.

 

Bổ đề 1. Cho $f: A' \to A$ là một cấu xạ. Tồn tại duy nhất (sai khác tương đương) một cách nhúng biểu đồ

h2.png

vào một biểu đồ giao hoán với hai hàng khớp:

h3.png

Hàng trên của biểu đồ này là một mở rộng của $A'$ bởi $B$. Ta gọi nó là kéo lùi của $\xi$ bởi $f$ và ký hiệu nó bởi $\xi f$ (ta sẽ sớm thấy lợi thế của ký hiệu này so với ký hiệu $f^\ast \xi$).

Chứng minh

Trước hết, ta chứng minh tính duy nhất. Thật vậy, theo tính chất phổ dụng của tích theo thớ (fibered product) $X \times_A A'$, ta có một cấu xạ $X' \to X \times_A A'$, và ta dễ dàng kiểm tra rằng nó cho ta một tương đương giữa hai mở rộng $0 \to B \to X' \to A' \to 0$ và $0 \to B \to X \times_A A' \to A' \to 0$. Để chứng minh sự tồn tại, ta chỉ cần chỉ ra rằng dãy $0 \to B \to X \times_A A' \to A' \to 0$ khớp. Đây là một bài tập cơ bản của đại số đồng điều: trước hết, vì $X \to A$ là một toàn cấu nên $A$ chính là tổng hỗn tạp (amalgamated sum) của $X$ và $A'$ dọc theo $X \times_A A'$. Chi tiết xem ở The Stacks project 08N4. $\square$

 

Như vậy, mỗi cấu xạ $f: A' \to A$ cảm sinh một ánh xạ $f^\ast: \text{Ext}^1(A,B) \to \text{Ext}^1(A',B), \quad \xi \mapsto \xi f$.

 

Một cách đối ngẫu (chẳng hạn, ta có thể làm việc trong $\mathcal{A}^{\text{op}}$), nếu $g: B \to B'$ là một cấu xạ thì tồn tại duy nhất một cách nhúng biểu đồ

h4.png

vào một biểu đồ giao hoán với hai hàng khớp

h5.png

Trong trường hợp này, $X'$ là tổng hỗn tạp $X \sqcup_B B'$. Hàng dưới của biểu đồ trên là một mở rộng của $A$ bởi $B'$. Ta gọi nó là đẩy xuôi của $\xi$ bởi $g$ và ký hiệu nó bởi $g \xi$.

Ta có một ánh xạ $g_\ast: \text{Ext}^1(A,B) \to \text{Ext}^1(A,B'), \quad \xi \mapsto g\xi$.

 

 

Bổ đề 2. Cho $\xi: 0 \to B \to X \to A \to 0$ và $\xi': 0 \to B' \to X' \to A' \to 0$ là các dãy khớp ngắn. Cho một cấu xạ $\xi' \to \xi$ giữa chúng, và ký hiệu $f: A' \to A$ và $g: B' \to B$ là các cấu xạ tương ứng. Khi đó $\xi' \to \xi$ phân tích qua một mở rộng $\xi''$ của $A'$ bởi $B$ sao cho $\xi'' = g \xi' = \xi f$.

Chứng minh

Ta lấy $\xi'' = \xi f$ rồi xây dựng một cấu xạ $X' \to X \times_A A'$ bằng tính chất phổ dụng của tích theo thớ, từ đó ta có một cấu xạ $\xi' \to \xi''$ với hai đầu là $g: B' \to B$ và $1_{A'}: A' \to A'$. Do tính duy nhất nên ta có $\xi'' = g \xi'$. $\square$

 

 

Bổ đề 3. Cho $\xi: 0 \to B \to X \to A \to 0$ là một mở rộng. Cho $f: A' \to A, f': A'' \to A', g: B \to B'$ và $g': B' \to B''$ là các cấu xạ. Ta có các đẳng thức sau

(i) $1_B \xi = \xi 1_A = \xi$.

(ii) $(g'g)\xi = g'(g\xi)$ và $\xi(ff') = (\xi f)f'$.

(iii) $(g \xi) f = g(\xi f)$.

Nói cách khác, các xây dựng $f^\ast$ và $g_\ast$ có tính hàm tử và tương thích với nhau. Nói riêng, ta có một hàm tử hai biến $\text{Ext}^1(-,-): \mathcal{A}^{\text{op}} \times \mathcal{A} \to \mathbf{Sets}.$ Ngoài ra, ta có thể viết $gg' \xi, \xi ff'$ và $g\xi f$ mà không gây bất kỳ nhầm lẫn nào.

Chứng minh

(i) và (ii) là hiển nhiên. Để chứng minh (iii), ta xét các cấu xạ tự nhiên $\xi f \to \xi$ và $\xi \to g\xi$. Áp dụng Bổ đề 2, ta có thể phân tích hợp thành $\xi f \to g\xi$ qua một mở rộng $\xi'$ của $A'$ bởi $B'$ sao cho $\xi' = g(\xi f) = (g \xi)f$. $\square$

 

 

Khi $A$ là một vật, ta ký hiệu $\Delta: A \to A \oplus A$ là cấu xạ đường chéo, $\nabla: A \oplus A \to A$ là cấu xạ "cộng", và $\tau: A \oplus A \to A \oplus A$ là cấu xạ "đổi chỗ hai tọa độ".

Cho $A$ và $B$ là hai vật. Ta định nghĩa phép toán $+$ (được gọi là tổng Baer) trên tập hợp $\text{Ext}^1(A,B)$ bởi $$\xi+\xi':=\nabla (\xi \oplus \xi') \Delta$$ (tất nhiên, để vế phải có nghĩa thì $\nabla: B \oplus B \to B$ và $\Delta: A \to A \oplus A$). Cụ thể, nếu $\xi: 0 \to B \xrightarrow{i} X \to A \to 0$ và $\xi': 0 \to B \xrightarrow{i'} X' \to A \to 0$ thì $\xi + \xi'$ là mở rộng $$0 \to B \to \text{Coker}(B \xrightarrow{(i,-i')} X \times_A X') \to A \to 0.$$

 

Bổ đề 4. Các đẳng thức sau là đúng một khi một trong hai vế có nghĩa.

(i) $(g \oplus g')(\xi \oplus \xi') = g\xi \oplus g'\xi'$ và $(\xi \oplus \xi')(f \oplus f') = \xi f \oplus \xi' f'$.

(ii) $\xi \nabla = \nabla(\xi \oplus \xi)$ và $\Delta \xi = (\xi \oplus \xi) \Delta$.

(iii) $(g + g')\xi = g\xi + g'\xi$ và $\xi (f + f') = \xi f + \xi f'$.

(iv) $g(\xi + \xi') = g\xi + g\xi'$ và $(\xi + \xi')f = \xi f + \xi' f$.

Chứng minh

(i) suy ra là tính hàm tử của song tích $\oplus$. (ii) được suy ra từ Bổ đề 2 áp dụng cho cấu xạ cộng $\xi \oplus \xi \to \xi$ cũng như cấu xạ đường chéo $\xi \to \xi \oplus \xi$. Để chứng minh (iii), ta nhận xét rằng $g + g' = \nabla(g \oplus g') \Delta$, vì thế $$(g+g')\xi = \nabla(g \oplus g') \Delta \xi = \nabla(g \oplus g') (\xi \oplus \xi) \Delta = \nabla(g \xi \oplus g'\xi) \Delta = g\xi + g'\xi,$$ và tương tự cho đẳng thức $\xi (f + f') = \xi f + \xi f'$. Để chứng minh (iv), chú ý rằng $g \nabla = \nabla(g \oplus g)$, do đó $$g(\xi + \xi') = g\nabla(\xi \oplus \xi') \Delta = \nabla(g \oplus g)(\xi \oplus \xi') \Delta = \nabla(g \xi \oplus g\xi') \Delta = g\xi + g\xi',$$  và tương tự cho đẳng thức $(\xi + \xi')f = \xi f + \xi' f$. $\square$

 

 

Định lý 5. Cho $A$ và $B$ là các vật. Tập hợp $\text{Ext}^1(A,B)$ cùng với tổng Baer là một nhóm abel.

Chứng minh

Tính kết hợp. Cho $\xi,\xi'$ và $\xi''$ là các mở rộng của $A$ bởi $B$. Ta có $$(\xi + \xi') + \xi'' = \nabla(\xi \oplus \xi') \Delta + \xi'' = \nabla((\nabla(\xi \oplus \xi') \Delta) \oplus \xi'')\Delta = \nabla(\nabla \oplus 1_B)(\xi \oplus \xi' \oplus \xi'')(\Delta \oplus 1_A)\Delta.$$ Sử dụng các đẳng thức $\nabla(\nabla \oplus 1_B) = \nabla(1_B \oplus \nabla)$ và $(\Delta \oplus 1_A)\Delta = (1_A \oplus \Delta) \Delta$, ta thu được $$(\xi + \xi') + \xi''  = \nabla(1_B \oplus \nabla)(\xi \oplus \xi' \oplus \xi'')(1_A \oplus \Delta)\Delta = \nabla(\xi \oplus (\nabla(\xi' \oplus \xi'')\Delta))\Delta = \xi + (\xi' + \xi'').$$

Tính giao hoán. Cho $\xi$ và $\xi'$ là các mở rộng của $A$ bởi $B$. Các cấu xạ đổi chỗ hai tọa độ cảm sinh một cấu xạ hiển nhiên $\xi \oplus \xi' \to \xi' \oplus \xi$. Theo Bổ đề 2, ta có $\tau(\xi \oplus \xi') = (\xi' \oplus \xi) \tau$. Hiển nhiên, ta có $\nabla \tau  = \nabla$ và $\tau \Delta = \Delta$, do đó $$\xi + \xi' = \nabla(\xi \oplus \xi') \Delta = \nabla \tau(\xi \oplus \xi') \Delta = \nabla(\xi' \oplus \xi) \tau \Delta = \nabla(\xi' \oplus \xi) \Delta = \xi' + \xi.$$

Phần tử trung lập. Ta chỉ rằng rằng dãy khớp chẻ $\theta: 0 \to B \xrightarrow{i} B \oplus A \xrightarrow{p} A \to 0$ là phần tử trung lập của tổng Baer. Thật vậy, nếu $\xi: 0 \to B \xrightarrow{j} X \xrightarrow{q} A \to 0$ là một mở rộng của $A$ bởi $B$, ta có biểu đồ giao hoán với các dòng khớp:

h6.png

trong đó $\alpha$ là hợp thành của $q$ và phép chiếu lên tọa độ thứ hai $B \oplus X \to X$. Từ đó ta thấy rằng hàng giữa của biểu đồ trên là $(\theta \oplus \xi) \Delta$ và vì thế hàng dưới bằng $$\xi = \nabla(\theta \oplus \xi) \Delta = \theta + \xi.$$

Phần tử đối. Xét $\theta$ và $\xi$ như trên. Ta có biểu đồ giao hoán với hai hàng khớp

h7.png

Từ đó ta có $0 \xi = \theta$. Do đó $$\xi + (-1_B)\xi = (1_B + (-1_B))\xi = 0\xi = \theta,$$ nghĩa là $(-1_B)\xi$ là một phần tử đối của $\xi$. $\square$

 

Như vậy, $\text{Ext}^1(A,B)$ là một nhóm abel với mọi vật $A$ và $B$. Nếu $f: A' \to A$ và $g: B \to B'$ là các cấu xạ thì các ánh xạ cảm sinh $f^\ast: \text{Ext}^1(A,B) \to \text{Ext}^1(A',B)$ và $g_\ast: \text{Ext}^1(A,B) \to \text{Ext}^1(A,B')$ là các đồng cấu nhóm theo Bổ đề 4. Như vậy, ta đã xây dựng hàm tử hai biến $\text{Ext}^1(-,-): \mathcal{A}^{\text{op}} \times \mathcal{A} \to \mathbf{Ab}.$


Tại sao tìm nghiệm hữu tỉ lại khó?

25-03-2021 - 00:25

Bài 1. Giới thiệu

 

Ở bài viết này mình sẽ giới thiệu theo kiểu layman về một vấn đề của lý thuyết số hiện đại.

 

1. Dẫn nhập

 

Một câu hỏi cơ bản và lâu đời nhất của số học là làm thế nào để biết một (hệ) phương trình đa thức với hệ số nguyên (phương trình Diophantus) cho trước có nghiệm nguyên (hay hữu tỉ) hay không, và tìm nghiệm nguyên (hay hữu tỉ) như thế nào? A priori, đây là một câu hỏi rất khó và hoàn toàn có thể là không có câu trả lời. David Hilbert đã phát biểu nó thành bài toán thứ 10 trong danh sách 23 bài toán thế kỷ:


Liệu có một thuật toán mà, cho trước một phương trình Diophantus, trả lời rằng phương trình đó có nghiệm hay không?

Định lý Matiyasevich đã đưa ra câu trả lời phủ định: Không tồn tại một thuật toán phổ quát như vậy.

 

Chú ý, nếu ta không nói đến nghiệm nguyên (hay hữu tỉ), mà quan tâm đến nghiệm phức (hoặc nghiệm trong một trường đóng đại số), thì vấn đề rất đơn giản: Trong logic toán và lý thuyết mô hình, đây là tính chất khử lượng từ (QE/quatifier /elimination) của lý thuyết ACF (algebraically closed field). Tương tự đối với nghiệm thực (hoặc nghiệm trong một trường đóng thực), lý thuyết RCF (real closed field) cũng có QE. Ngoài ra ta còn có các công cụ của giải tích: thuật toán Sturm, đạo hàm...

 

Ở bài này, chúng ta tìm hiểu lí do tại sao việc tìm nghiệm hữu tỉ lại khó.

 

Tổng quát hơn, ta quan tâm đến việc tìm nghiệm trong một trường số (number field). Đây là bước chuyển từ lý thuyết số sơ cấp sang lý thuyết số đại số. Lịch sử của lý thuyết số đại số bắt nguồn từ nỗ lực chứng minh định lý lớn Fermat, rằng phương trình $$x^p - y^p = z^p$$ không có nghiệm với $p > 2$ là số nguyên tố (dễ thấy chỉ cần xét lũy thừa nguyên tố). Với $p = 2$ thì ta có thể phân tích $z^2 = (x-y)(x+y)$ và dùng suy luận về phân tích duy nhất ra thừa số nguyên tố. Với $p > 2$, ta cũng có thể phân tích như vậy, nhưng phải thông qua tập số phức, $$z^p = (x-y)(x - \zeta y)(x - \zeta^2 y)\cdots (x - \zeta^{p-1} y),$$ trong đó $\zeta = e^{\frac{2\pi i}{p}} = \cos\frac{2\pi}{p} + i\sin\frac{2\pi}{p}$ là một căn bậc $p$ phức nguyên thủy của $1$. Như vậy ta phải là việc trong một môi trường rộng hơn các số nguyên và số hữu tỉ, đó là các trường số, cụ thể ở đây là các trường số cyclotomic. Cách tiếp cận trên của Cauchy và Lamé, dù sau cùng đã thất bại, đã khai sinh ra ngành lý thuyết số đại số.

 

Một trường số là một mở rộng hữu hạn của trường số hữu tỉ $\mathbb{Q}$, tức là một trường mà là một không gian véc-tơ hữu hạn chiều trên $\mathbb{Q}$. Ví dụ, $$\mathbb{Q}(i) = \{a + bi: a,b \in \mathbb{Q}\}$$ hay $$\mathbb{Q}(\sqrt[3]{2}) = \{a + b\sqrt[3]{2} + c\sqrt[3]{4}: a,b,c \in \mathbb{Q}\}$$ là các trường số. Vai trò của các số nguyên trong $\mathbb{Q}$ được thay bởi các số nguyên đại số trong các trường số trên., cụ thể lần lượt là $$\mathbb{Z}[i] = \{a + bi: a,b \in \mathbb{Z}\}$$ và $$\mathbb{Z}[\sqrt[3]{2}] = \{a + b\sqrt[3]{2} + c\sqrt[3]{4}: a,b,c \in \mathbb{Z}\}.$$ Theo định lý phần tử nguyên thủy trong lý thuyết Galois, mọi trường số đều có dạng như trên: kết nạp một số đại số $\alpha$ cùng với các biểu thức cộng, trừ, nhân, chia có thể thực hiện được với $\alpha$ vào trường $\mathbb{Q}$ (một số đại số là nghiệm của một phương trình đa thức một biến với hệ số hữu tỉ).

 

Cản trở đầu tiên trong cách tiếp cận trên để chứng minh định lý lớn Fermat là tính chất phân tích duy nhất ra thừa số nguyên tố không còn được bảo toàn nữa. Ví dụ, trong $$\mathbb{Z}[\sqrt{-5}] = \{a + b\sqrt{-5}: a,b \in \mathbb{Z}\},$$ số 6 có hai phân tích khác nhau là $$6 = 2 \cdot 3 = (1 + \sqrt{-5})(1 - \sqrt{-5}).$$

 

 

2. Từ địa phương

 

Một cách tấn công cơ bản cho các phương trình Diophantus là thay vì giải trực tiếp (hệ) phương trình ban đầu, ta giải phương trình đồng dư tương ứng, với một modulo thích hợp. Nếu một số nguyên dương $n$ có phân tích ra thừa số nguyên tố $n = p_1^{d_1} \cdots p_r^{d_r}$, thì việc giải một phương trình đồng dư modulo $n$ tương đương với việc giải hệ gồm phương trình ban đầu theo các modulo $p_i^{d_i}$, $i=1,\ldots,r$. Đây là nội dung của định lý số dư Trung Hoa. Như vậy, ta chỉ cần đưa bài toán về giải phương trình đồng dư modulo lũy thừa của một số nguyên tố $p$. Việc làm như vậy được coi là tìm nghiệm "địa phương" của (hệ) phương trình ban đầu.

Ta trình bày lại việc này theo ngôn ngữ của lý thuyết số hiện đại.

 

Rõ ràng tìm nghiệm modulo $p^{n+1}$ thì khó hơn tìm nghiệm modulo $p^n$. Như vậy ta bắt đầu tìm nghiệm modulo $p$ trước (các số nguyên modulo $p$ tạo thành một trường, và ta có thể dùng các công cụ như đại số tuyến tính...) Sau đó ta tìm cách "nâng" nghiệm này thành modulo $p^2$, sau đó nâng thành modulo $p^3$,... Các bước nâng này có thể thực hiện theo thuật toán, điều này được đảm bảo bởi bổ đề Hensel và (phiên bản phi Ác-si-mét) của phương pháp xấp xỉ nghiệm bằng tiếp tuyến của Newton. Như vậy ta thu được một hộ nghiệm modulo $p^n$ với mọi $n$, được xem như một "nghiệm địa phương". Vấn đề là nghiệm này không nhất thiết đến từ một số nguyên hay số hữu tỉ; nó đến từ một không gian lớn hơn, được gọi là các số $p$-adic.

 

Ví dụ. Phương trình $x^2 + 1 = 0$ không có nghiệm nguyên. Tuy nhiên nó có "nghiệm địa phương" tại $p = 5$. Thật vậy, xét modulo $5$, phương trình đồng dư $x^2 + 1 \equiv 0 \pmod 5$ có nghiệm $x_1 = 2$. Giả sử ta đã tìm được nghiệm $x_n$ modulo $5^n$, tức là $x_n^2 + 1 \equiv 0 \pmod{5^n}$. Ta tìm nghiệm modulo $5^{n+1}$ ở dạng $x_{n+1} = x_n + 5^ny$, với $y$ là một số nguyên sẽ chọn sau. Ta đã có $5^n \,|\, x_n^2 + 1$ và ta muốn $5^{n+1} \,|\, (x_n + 5^n y)^2 + 1$, tức là tương đương với $$5 \,|\, 2x_n y + \frac{x_n^2 + 1}{5}.$$ Dễ thấy rằng $x_n$ không chia hết cho $5$, nên ta luôn chọn được $y$ thỏa mãn yêu cầu trên ($y$ là duy nhất modulo $5$, chẳng hạn nếu ta yêu cầu rằng $y \in \{0,1,2,3,4\}$). Dãy nghiệm $(x_n)_{n \ge 1}$ ở trên mô tả thông tin modulo $5^n$ với mọi $n$, và các thông tin này "nhất quán" với nhau, tức là $x_{n+1} \equiv x_n \pmod{5^n}$. 

 

Ý tưởng của số $p$-adic như sau: nếu một số nguyên $x$ có khai triển cơ số $p$ là $$x = a_0 + a_1p + a_2p^2 + \cdots, \qquad a_i \in \{0,1,\ldots,p-1\},$$ thì ta có thể biết $x$ khi biết các số $a_0,a_1,\ldots$, tức là biết $$x_n = a_0 + a_1p + \cdots + a_{n-1}p^{n-1}$$ với mọi $n$. $x_n$ ở đây chính là số dư của $x$ khi chia cho $p^n$. Rõ ràng ta có $x_{n+1} \equiv x_n \pmod{p^n}$ (điều kiện "nhất quán" ở trên). Tuy nhiên, cho trước một bộ số nguyên $(x_n)_{n \ge 1}$ "nhất quán" theo nghĩa như trên, ta không nhất thiết tìm được một số nguyên $x$ tương ứng với nó. Thật vậy, một điều kiện cần hiển nhiên là các số $a_n$ ở trên phải bằng $0$ kể từ một lúc nào đó. Cái chúng ta thu được ứng với một bộ nhất quán bất kỳ (không cần điều kiện $a_n = 0$ kể từ một lúc nào đó), chính là các số nguyên $p$-adic. Một số nguyên $p$-adic là một tổng hình thức $$x = a_0  + a_1p + a_2p^2 + \cdots = \sum_{n = 0}^{\infty} a_n p^n,$$ trong đó $a_i \in \{0,1,\ldots,p-1\}$ tùy ý. Chú ý rằng ta chưa hề nói gì về việc tổng vô hạn này có nghĩa (hội tụ) hay không, nó hoàn toàn hình thức. Một số nguyên $p$-adic lưu giữ thông tin modulo $p^n$ với mọi $n$, và các thông tin này nhất quán với nhau. Cụ thể, thông tin modulo $n$ thu được bằng các "chặt đuôi", tức là chỉ xét phần tổng hữu hạn (và vì thế có nghĩa, là một số nguyên thực sự, $$x_n = a_0 + a_1p + \cdots + a_{n-1} p^{n-1} \in \mathbb{Z}$$). 

 

Chúng ta sẽ làm rõ ý nghĩa của chuỗi (i.e. tổng vô hạn) ở trên. Như đã biết, số thực là khái niệm được xây dựng từ số thực bằng phương pháp hoàn toàn toàn không hề đại số: Một dãy số được gọi là cơ bản hay Cauchy nếu các số hạng của nó có thể gần nhau một cách tùy ý kể từ lúc nào đó. Tất cả các dãy số hội tụ đều là dãy cơ bản. Tuy nhiên một dãy số hữu tỉ cơ bản thì không nhất thiết hội tụ về số hữu tỉ. Ta "kết nạp" tất cả các giới hạn trên vào trường số hữu tỉ để tạo thành trường số thực $\mathbb{R}$, nơi mọi dãy cơ bản đều hội tụ. Thao tác như vậy được gọi là đầy đủ hóa. Bây giờ ta sẽ làm điều tương tự, như thay vì nói về sự hội tụ thông thường, ta sẽ đưa ra một quan niệm khác về sự hội tụ trên $\mathbb{Q}$. Một giá trị tuyệt đối trên $\mathbb{Q}$ là một hàm $|\cdot|: \mathbb{Q} \to \mathbb{R}_{\ge 0}$ thỏa mãn các tính chất sau đây.

  1. Xác định dương: $|0| = 0$ và $|x| > 0$ với mọi $x \neq 0$.

  2. Nhân tính: $|xy| = |x||y|$ với mọi $x,y$.

  3. Bất đẳng thức tam giác: $|x+y| \le |x| + |y|$ với mọi $x,y$.

Ví dụ: ta đã có hàm giá trị tuyệt đối theo nghĩa thông thường trên $\mathbb{Q}$, ta sẽ ký hiệu nó bởi $|\cdot|_\infty$. Như vậy $|x|_\infty = x$ nếu $x \ge 0$ và $|x|_\infty = -x$ nếu $x < 0$. 

Hai số hữu tỉ $x,y$ được coi là gần nhau nếu hiệu của chúng có giá trị tuyệt đối nhỏ, từ đó ta có thể nói về sự hội tụ. Trường số thực $\mathbb{R}$ là đầy đủ hóa của $\mathbb{Q}$ theo giá trị tuyệt đối $|\cdot|_\infty$. Bây giờ ta thay giá trị tuyệt đối thông thường $|\cdot|_\infty$ bởi giá trị tuyệt đối $p$-adic như sau. Mỗi số hữu tỉ $x \neq 0$ có thể viết dưới dạng $x = p^n\frac{a}{b}$, với $a,b$ là các số nguyên không chia hết cho $p$. Số nguyên $n$ là duy nhất và được ký hiệu bởi $v_p(x)$. Hàm $v_p$ đo xem số hữu tỉ $x$ "chia hết cho $p$ bao nhiêu lần". Quy ước rằng $v_p(0) = \infty$. Dễ thấy ta có các tính chất sau.

  1. $v_p(xy) = v_p(x) + v_p(y)$.

  2. $v_p(x + y) \ge \min\{v_p(x),v_p(y)\}$. Ngoài ra, nếu $v_p(x) \neq v_p(y)$ thì ta có đẳng thức.

Đặt $|x|_p = p^{-v_p(x)}$. Đây được gọi là giá trị tuyệt đối $p$-adic trên $\mathbb{Q}$. Dễ thấy nó thỏa mãn các tính chất 1 và 2 của một giá trị tuyệt đối. Đối với tính chất 3, nó thỏa mãn một bất đẳng thức còn mạnh hơn, được gọi là bất đẳng thức ultrametric: $|x+y|_p \le \max\{|x|_p, |y|_p\}$, và nếu $|x|_p \neq |y|_p$ thì ta có đẳng thức. Nói cách khác, đối với giá trị tuyệt đối $p$-adic, mọi tam giác đều cân. Một giá trị tuyệt đối như vậy được gọi là phi Ác-si-mét.

 

Theo giá trị tuyệt đối $p$-adic, hai số hữu tỉ là gần nhau nếu hiệu của chúng là một số hữu tỉ có tử số chia hết cho một lũy thừa lớn của $p$. Điều này khác biệt với quan niệm gần nhau thông thường. Ví dụ, $p^2$ thì gần $0$ hơn $p$, dãy $1, p, p^2, \ldots$ thì hội tụ về $0$, vì dãy giá trị tuyệt đối $p$-adic tương ứng là $|1|, |p|^{-1}, |p|^{-2},\ldots$ Khi đầy đủ hóa $\mathbb{Q}$ theo giá trị tuyệt đối $p$-adic, ta thu được trường $\mathbb{Q}_p$, đó là trường các số $p$-adic. Có thể chứng minh rằng một số $p$-adic khác $0$ được viết duy nhất dưới dạng $$x = \sum_{n = k}^{\infty} a_n p^n,$$ với $k$ là số nguyên tùy ý (không nhất thiết $\ge 0$), các số $a_n \in \{0,1,\ldots,p-1\}$, và $a_k \neq 0$. Sự hội tụ của tổng vô hạn ở đây là theo giá trị tuyệt đối $p$-adic. Nếu $k \ge 0$ thì ta nói $x$ là một số nguyên $p$-adic.

 

Ví dụ. Trong $\mathbb{Q}_2$, ta có $1 + 2 + 2^2 + \cdots = \sum_{n=0}^{\infty} 2^n = -1$. Thật vậy, xét tổng riêng thứ $N$, $\sum_{n = 0}^N 2^n = 2^{N+1} - 1$, khoảng cách $2$-adic giữa nó và $-1$ là $|2|^{-N-1}$, giá trị này tiến về $0$ khi $N \to \infty$.

 

Như đã nói ở trên, việc trả lời câu hỏi một phương trình đa thức cho trước có nghiệm hay không, và nếu có thì tì như thế nào, đều có thể thực hiện một các không quá khó khăn trong $\mathbb{R}$ hay trong $\mathbb{Q}_p$. Đối với các (hệ) phương trình Diophantus, việc tìm nghiệm thực và nghiệm $p$-adic được coi là việc "giải địa phương".

 

 

3. Đến toàn cục

 

Ta đã thấy rằng việc đầy đủ hóa $\mathbb{Q}$ theo các giá trị tuyệt đối khác nhau sẽ thu được các trường số thực $\mathbb{R}$, và các trường các số $p$-adic $\mathbb{Q}_p$. Ứng với $\mathbb{R}$, ta sẽ thêm một ký hiệu tưởng tượng là $\infty$, và gọi nó là "số nguyên tố tại vô cùng". $\infty$ cùng với các số nguyên tố thường thường, $2, 3, 5, 7, 11\ldots$ được gọi là các chốn (place) của $\mathbb{Q}$.

 

Định lý Ostrowski. Đó là tất cả các chốn của $\mathbb{Q}$.

 

Tổng quát hơn, đối với một trường số $k$, ta xét vành các số nguyên đại số trong $k$, ký hiệu bởi $\mathcal{O}_k$. Nó đóng vai trò như $\mathbb{Z}$ đối với $\mathbb{Q}$. Trong vành này nói chung không có phân tích duy nhất ra thừa số nguyên tố. Tuy nhiên tính chất mà chúng ta giữ được là phân tích duy nhất của iđêan ra iđêan nguyên tố (nói cách khác, $\mathcal{O}_k$ là một vành Dedekind). Về mặt lịch sử, iđêan được gọi là các số lý tưởng (ideal number). Đối với một trường số tùy ý thì ta sẽ xét các iđêan nguyên tố thay vì các số nguyên tố. Định lý Ostrowski đối với trường số $k$ có dạng như sau: Tất cả các chốn $v$ của $k$ được cho bởi.

 

1. Các chốn hữu hạn (hay chốn phi ác-si-mét), ứng với các iđêan nguyên tố $\mathfrak{p}_v$ của $\mathcal{O}_k$. Đầy đủ hóa $k_v$ tương ứng là một mở rộng hữu hạn $\mathbb{Q}_p$, với $p$ là số nguyên tố (theo nghĩa thông thường) nào đó (số nguyên tố $p$ được gọi là nằm dưới $v$). Trường $k_v$ được gọi là một trường số $p$-adic.

2. Các chốn vô hạn (hay chốn ác-si-mét), ứng với các phép nhúng thực $k \hookrightarrow \mathbb{R}$, và các cặp phép nhúng phức (không thực) liên hợp $k \hookrightarrow \mathbb{C}$. Đầy đủ hóa $k_v$ tương ứng hoặc là $\mathbb{R}$ (đối với mỗi phép nhúng thực, được gọi là một chốn thực), hoặc là $\mathbb{C}$ (đối với mỗi cặp phép nhúng phức liên hợp, được gọi là một chốn phức).

 

Các trường số $p$-adic cùng với $\mathbb{R}$ và $\mathbb{C}$ được gọi là các trường địa phương. Trường số $k$ được gọi là một trường toàn cục.

 

Tìm nghiệm trong trường địa phương là một vấn đề dễ. Câu hỏi là liệu ta có thể "dán" các "nghiệm địa phương" thành "nghiệm toàn cục" (tức là nghiệm trong trường số $k$ ban đầu hay không).

 

Cho một đa thức thuần nhất bậc hai (với nhiều biến), chẳng hạn $4x^2 + 3xy - y^2$. Rõ ràng nó luôn có nghiệm tầm thường (cho tất cả các biến bằng $0$). Ta quan tâm đến nghiệm không tầm thường của nó.

 

Định lý Hasse-Minkowski. Một đa thức bậc hai thuần nhất với hệ số hữu tỉ có nghiệm không tầm thường trong $\mathbb{Q}$ khi và chỉ khi nó có nghiệm không tầm thường trong $\mathbb{R}$ và trong tất cả các trường $\mathbb{Q}_p$, với $p$ là số nguyên tố.

 

Minkowski đã chứng minh định lý trên cho $\mathbb{Q}$, và Hasse đã tổng quát hóa nó cho trường số bất kỳ.

 

Nếu một (hệ) phương trình đa thức (với hệ số trong một trường số) thỏa mãn tính chất trên ("có nghiệm địa phương trong tất cả các chốn thì có nghiệm toàn cục"), ta nói (hệ) phương trình đó thỏa mãn nguyên lý Hasse (hay nguyên lý địa phương-toàn cục).

 

Lý do đầu tiên khiến cho việc tìm nghiệm hữu tỉ (hay trong trong một trường số) khó, đó là nguyên lý Hasse nói chung không được thỏa mãn. Đây là ví dụ rất nổi tiếng của Selmer: phương trình $3x^3 + 4y^3 + 5z^3 = 0$ có nghiệm không tầm thường trong $\mathbb{R}$ và trong tất cả các trường $\mathbb{Q}_p$, nhưng không có nghiệm không tầm thường trong $\mathbb{Q}$.

 

4. Hình học đã can thiệp vào số học như thế nào?

 

Với sự phát triển mạnh của hình học đại số hiện đại cuối thế kỷ XX, với công lớn phải kể đến thuộc về nhóm Bourbaki, đặc biệt là André Weil, Alexander Grothendieck, Pierre Deligne, Jean-Pierre Serre... các công cụ của hình học đại số đã trở nên đủ mạnh để tiếp cân các bài toán số học (chẳng hạn, đã cho phép Andrew Wiles kết thúc chứng minh của định lý lớn Fermat đã kéo dài 3 thế kỉ). Một đa tạp đại số là tập nghiệm của một hệ phương trình đa thức. Các đa tạp 1-chiều được gọi là các đường cong đại số, 2-chiều được gọi là các mặt đại số. Bài toán tìm nghiệm hữu tỉ của (hệ) phương trình Diophantus trở về bài toán tìm điểm hữu tỉ trên các đa tạp đại số. 

 

Câu hỏi tự nhiên của chúng ta là: một đa tạp cho trước có điểm hữu tỉ hay không, nếu có thì có nhiều không?

Ta bắt đầu với các đường cong. Ví dụ đơn giản nhất là tập nghiệm của một phương trình đa thức hai biến, tức là một đường cong phẳng (thật ra mọi đường cong đều tương đương song hữu tỉ/birationally equivalent với một đường cong phẳng). Ta sẽ quan tâm đến các giá trị số học (các bất biến) ảnh hưởng đến tập nghiệm hữu tỉ. Ví dụ ngây thơ nhất là bậc của đa thức. Tuy nhiên, bậc của đa thức hầu không phản ánh gì về tính chất của tập nghiệm hữu tỉ của đường cong. Một bất biến sâu sắc hơn là khái niệm giống (genus) của đường cong. Sau đây là kết quả.

 

Cho $C$ là một đường cong trơn (ta luôn làm được điều này, được gọi là giải kỳ dị, hay đơn giản hơn là chuẩn hóa đường cong) và đầy đủ (điều này tương đương với xạ ảnh) trên một trường số $k$. Gọi $g$ là giống của nó.

  1. Nếu $g = 0$ thì $C$ đẳng cấu với conic phẳng. Nếu nó có ít nhất 1 điểm hữu tỉ (đối với conic, ta có thể kiểm tra điều này bằng nguyên lý Hasse!), thì nó đẳng cấu với đường thẳng xạ ảnh $\mathbb{P}^1_k$ đây được gọi là phương pháp cát tuyến, vì thế có rất nhiều điểm hữu tỉ. Ví dụ, khi áp dụng phương pháp cát tuyến để tìm nghiệm của phương trình Pythagoras $x^2 + y^2 = z^2$, ta sẽ thu được phép chiếu nổi (stereographic projection).

  2. Nếu $g = 1$ thì $C$ được gọi là một đường cong elliptic, nó đẳng cấu với một đường cong bậc 3. Nếu nó có ít nhất 1 điểm hữu tỉ thì các điểm hữu tỉ của nó có một cấu trúc nhóm abel hữu hạn sinh (định lý Mordell-Weil). Các điểm này phân bố một cách rời rạc (chúng được đo bởi khái niệm chiều cao). Theo định lý về module hữu hạn sinh trên vành chính thì nhóm các điểm hữu tỉ phân tích thành tổng trực tiếp của một nhóm abel hữu hạn (phần xoắn) và một nhóm abel tự do (phần tự do) - nó có dạng $\mathbb{Z}^r$ - số $r$ được gọi là hạng của đường cong. Phần xoắn của nhóm này đã được hiểu khá rõ. Ví dụ khi $k = \mathbb{Q}$ thì ta có định lý Mazur (chứng minh rất sâu sắc, bản thân mình cũng chưa có thời gian kiểm tra toàn bộ, đây là một nguồn mà mình tìm được: http://www-personal..../679/index.html). Với $k$ tùy ý, ta có giả thuyết xoắn đã được chứng minh bởi Loïc Merel. Hạng $r$ vẫn còn là một bí ẩn. Việc tìm các đường cong với hạng cao rất khó, trang web này thống kê các kỉ lục về việc tìm đường cong elliptic với hạng lớn https://web.math.pmf...cMillen in 2000). Các suy luận heuristic gần đây của Bjorn Poonen và đồng nghiệp phỏng đoán rằng hạng này bị chặn trên, rằng 50% số đường cong có hạng bằng 0, 50% có hạng bằng 1 (nói riêng, hạng trung bình bằng 1/2). 

  3. Nếu $g \ge 2$ thì $C$ chỉ có một số hữu hạn điểm hữu tỉ. Đây là định lý Faltings, ban đầu được phỏng đoán bởi Mordell. Vojta và Bombieri sau này đã dùng các suy luận hình học để đơn giản hóa chứng minh gốc của Faltings. Phương pháp của Vojta gần đây đã được tổng quát hóa bởi Vesselin Dimitrov, Ziyang Gao và Philipp Habegger để đưa ra một chặn đều cho con số hữu hạn nói trên (từ đó phần nào trả lời một câu hỏi tổng quát được gọi là giả thuyết Lang). Đây là bài báo của DGH https://webusers.imj...cles/UnifML.pdf.

Đối với số chiều cao hơn, gần như ta vẫn chưa có câu trả lời hoàn chỉnh. Một lớp các đa tạp mà chúng ta đã giải quyết được là các đa tạp abel (tổng quát hóa của đường cong elliptic): chúng ta cũng có định lý Mordell-Weil cho các đa tạp abel.


Một chút giải tích hàm

02-03-2019 - 04:18

Note này viết về một số kết quả cơ bản của giải tích hàm. Hầu như không có chứng minh nào hoặc rất tóm tắt. Mình rất mong được trao đổi.

 

Đầu tiên chúng ta bắt đầu với

 

I - Định lý Baire về phạm trù.

 

Def. Trong một không gian tô-pô,

  1. một tập $G_\delta$ là giao của một họ đếm được các tập mở,
  2. một tập $G_\delta$-trù mật là giao của một họ đếm được các tập mở trù mật.

Def. Một không gian tô-pô được gọi là Baire nếu mọi tập $G_\delta$-trù mật đều trù mật.

Nói cách khác, một không gian $X$ là Baire nếu với mọi cách viết $X$ thành giao của một họ đếm được các tập đóng, ít nhất một trong các tập đó có phần trong khác rỗng. Dễ thấy không gian con mở của một không gian Baire cũng là Baire.

 

Định lý [Baire]. Không gian mê-tríc đầy đủ và không gian Hausdorff, com-pắc địa phương là các không gian Baire.

 

Def. Một tính chất được gọi là đúng hầu khắp nơi theo nghĩa Baire nếu nó đúng trên một tập $G_\delta$-trù mật.

 

Định lý. Giả sử $X$ là một không gian Baire, $(Y,d)$ là một không gian mê-tríc và $f_n: X \to Y$ $(n \in \mathbb{N})$ là một dãy hàm liên tục, hội tụ điểm về $f$. Khi đó $f$ liên tục hầu khắp nơi theo nghĩa Baire.

 

Chứng minh

Với $n, p \in \mathbb{N}$, đặt $$F_{n,p}:= \{x \in X \, | \, \forall q \geqslant p, \, d(f_p(x),f_q(x)) \leqslant 2^{-n} \}.$$ Đây là một tập đóng, hơn nữa với mỗi $n \in \mathbb{N}$, dễ thấy $$\bigcup_{p \in \mathbb{N}}F_{n,p} = X.$$

Với $U \subseteq X$ là một tập mở tùy ý, ta có $$\bigcup_{p \in \mathbb{N}}(U \cap F_{n,p}) = U,$$ hơn nữa $U$ là một không gian Baire nên tồn tại $p = p(n,U) \in \mathbb{N}$ sao sao cho $$A_{n,U} := \text{int}(U \cap F_{n,p}) \neq \varnothing.$$

Khi đó, với mỗi $n$, $$A_n := \bigcup_{U \text{ mở}} A_{n,U}$$ là tập mở trù mật. Do đó $$A = \bigcap_{n \in \mathbb{N}}A_n$$ là một $G_\delta$-trù mật. Ta dễ dàng chứng minh được $f$ là liên tục trên $A$. $\square$

 

Ví dụ. Cho $I \subset \mathbb{R}$ là một khoảng mở, $F$ là một không gian Banach và $f: I \to F$ là một hàm khả vi. Khi đó $f'$ là liên tục hầu khắp nơi theo nghĩa Baire. (chứng minh: áp dụng lý trên cho dãy hàm $(f_n)_{n \in \mathbb{N}})$ xác định bởi $f_n(x) = n(f(x+1/n) - f(x))$.

 

 

 

II - Nguyên lý bị chặn đều, định lý ánh xạ mở và định lý đồ thị đóng

 

Def [Tô-pô sinh bởi một họ nửa chuẩn]. Khi $E$ là một không gian véc-tơ thực và $p_\alpha: E \to \mathbb{R}_{\geqslant 0}$ $(\alpha \in \mathcal{A})$ là một họ các nửa chuẩn, ta có thể định nghĩa trên $E$ một tô-pô sinh bởi cơ sở là các tập có dạng $$\{y \in E \, | \, \forall \beta \in \mathcal{B},\,p_\beta(x-y) < r\}$$ trong đó $x \in E$, $r > 0$ và $\mathcal{B}$ là một tập con hữu hạn của $\mathcal{A}$. Tô-pô này khiến cho $E$ trở thành một không gian véc-tơ tô-pô.

 

Def. Một họ nửa chuẩn $(p_\alpha)_{\alpha \in \mathcal{A}}$ được gọi là tách nếu với mỗi điểm $x \in E$, từ chỗ $p_\alpha(x) = 0$ với mọi $\alpha \in \mathcal{A}$ suy ra $x = 0$.

 

Không khó để chứng minh được rằng,

  1. một dãy điểm $(x_n)_{n \in \mathbb{N}}$  trong $E$ hội tụ về một điểm $x$ theo nghĩa tô-pô khi và chỉ khi với mọi $\alpha \in \mathcal{A}$, ta có $p_\alpha(x_n - x) \to 0$,
  2. một họ nửa chuẩn là tách khi và chỉ khi tô-pô sinh bởi họ đó là Hausdorff,
  3. tô-pô sinh bởi một họ con của $(p_\alpha)_{\alpha \in \mathcal{A}}$ thì thô hơn tô-pô sinh bởi $(p_\alpha)_{\alpha \in \mathcal{A}}$,
  4. một tập con $A \subseteq E$ là bị chặn khi và chỉ khi với mọi $\alpha \in \mathcal{A}$, tồn tại $C > 0$ sao cho với mọi $x \in A$, ta có $p_\alpha(x) \leqslant C$.

Def. Một không gian tiền Fréchet là một không gian véc-tơ cùng một dãy tăng các nửa chuẩn tách.

 

Khi ta có một dãy nửa chuẩn bất kỳ, ta có thể dễ dàng thay nó bởi một dãy tăng, vì tổng của hai nửa chuẩn vẫn là một nửa chuẩn.

 

Def. Giả sử $E$ là một không gian tiền Fréchet với dãy nửa chuẩn $(p_j)_{j \in \mathbb{N}}$. Khi đó ta có thể mê-tríc hóa tô-pô tương ứng bằng cách đặt $$\forall x,y \in E, \qquad d(x,y) := \sum_{j \in \mathbb{N}} 2^{-n} \min(1, p_j(x-y)).$$

Một không gian Fréchet là một không gian tiền Fréchet đầy đủ.

 

Chẳng hạn, một họ gồm một chuẩn duy nhất là một họ tách. Vì thế các không gian định chuẩn đều là tiền Fréchet và các không gian Banach đều là Fréchet.

 

Mệnh đề. Một toán tử tuyến tính $T: (E, (p_j)_{j \in \mathbb{N}}) \to (F, (q_k)_{k \in \mathbb{N}})$ giữa hai không gian tiền Fréchet là liên tục khi và chỉ khi với mọi $k \in \mathbb{N}$, tồn tại $C > 0$ và $n \in \mathbb{N}$ sao cho với mọi $x \in E$, ta có $q_k(Tx) \leqslant Cp_j(x)$.

 

Chứng minh

"Chỉ khi". Cố định $k \in \mathbb{N}$. Vì $T$ liên tục nên tồn tại lân cận mở $U$ của $0$ sao cho $q_k(Tx) < 1$ với mọi $x \in U$. Đương nhiên $U$ chứa một tập mở trong cơ sở, nghĩa là tồn tại $j \in \mathbb{N}$ và $r > 0$ sao cho $$\{x \in E \, | \, p_j(x) < r\} \subseteq U.$$ Ta lấy $C = 2/r$ và dùng tính thuần nhất của nửa chuẩn để kết luận.

 

"Khi". Cố định $x \in E$ và gọi $V$ là một lân cận mở của $Tx$ trong $F$. Tương tự như trên, tồn tại $k \in \mathbb{N}$ và $r > 0$ sao cho $$\{x \in E \, | \, q_k(y - Tx) < r\} \subseteq V.$$ Khi đó, với mọi $x' \in E$ thỏa mãn $p_j(x - x') < r/C$, ta có $q_k(Tx - Tx') < r$, nghĩa là $Tx' \in U$. Vậy $T$ liên tục tại $x$. $\square$

 

 

Định lý [Banach-Steinhauss hay Nguyên lý bị chặn đều]. Cho $(E, (p_j)_{j \in \mathbb{N}})$ là một không gian Fréchet,  $(F, (q_k)_{k \in \mathbb{N}})$ là một không gian tiền Fréchet và $T_\alpha: E \to F$ $(\alpha \in \mathcal{A})$ là một họ các toán tử tuyến tính liên tục sao cho với mọi $x \in E$, họ $(T_\alpha x)_{\alpha \in \mathcal{A}}$ là bị chặn trong $F$. Khi đó họ $(T_\alpha)_{\alpha \in \mathcal{A}}$ là đồng liên tục, tức là $$\forall k \in \mathbb{N}, \exists C > 0, \exists j \in \mathbb{N},\forall x \in E, \forall \alpha \in \mathcal{A},q_k(T_\alpha x) \leqslant C{p_j}(x).$$

 

Hệ quả.

  1. Cho $(E, (p_j)_{j \in \mathbb{N}})$ là một không gian Fréchet,  $(F, (q_k)_{k \in \mathbb{N}})$ là một không gian tiền Fréchet và $T_n: E \to F$ $(n \in \mathbb{N})$ là một dãy các toán tử tuyến tính liên tục hội tụ điểm về $T$. Khi đó $T$ là một toán tử tuyến tính liên tục. Hơn nữa, nếu $x_n \to x$ thì $T_nx _n\to Tx$.
  2. Giả sử $G$ là một không gian Banach và $B \subseteq G$ là một tập con thỏa mãn: với mọi phiếm hàm tuyến tính liên tục $f: B \to \mathbb{R}$, $f(B)$ là bị chặn. Khi đó $B$ là bị chặn.

Chứng minh

1. Hiển nhiên theo Nguyên lý bị chặn đều và tiêu chuẩn liên tục của toán tử tuyến tính giữa hai không gian tiền Fréchet ở trên.

2. Áp dụng nguyên lý bị chặn đều cho $E = G^\ast$, $F = \mathbb{R}$ và họ toán tử $(T_b)_{b \in B}$ trong đó $T_b(f) = f(b)$, ta thấy tồn tại $C > 0$ sao cho với mọi phiếm hàm $f \in G^\ast \to \mathbb{R}$ và mọi $b \in B$, ta có $|f(b)| \leqslant C \| f \|$, từ đó dễ thấy $B$ bị chặn. $\square$

 

Định lý [Ánh xạ mở]. Mọi toán tử tuyến tính liên tục toàn ánh giữa hai không gian Fréchet đều mở.

 

Định lý [Đồ thị đóng]. Một toán tử tuyến tính giữa hai không gian Fréchet là liên tục khi và chỉ khi đồ thị của nó là đóng trong không gian tích.

 

Một bài tập vui. Cho $f$ và $f_n$ $(n \in \mathbb{N})$ là các hàm thực khả vi liên tục trên $[0,1]$. Chứng minh rằng nếu $f_n$ hội tụ đều về $f$ thì $f_n'$ hội tụ đều về $f'$.

 

 

III - Định lý Hahn - Banach

 

Định lý [Hahn - Banach dạng giải tích]. Cho $E$ là một không gian véc-tơ thực và $p: E \to \mathbb{R}_{\geqslant 0}$ là một phiếm hàm dưới cộng tính thuần nhất dương, nghĩa là

  1. $\forall x, y \in E$, $p(x+y) \leqslant p(x) + p(y)$,
  2. $\forall x \in E, \lambda \geqslant 0$, $p(\lambda x) = \lambda p(x)$.

Giả sử $F$ là một không gian con của $E$ và $f: F \to \mathbb{R}$ là một phiếm hàm tuyến tính bị chặn bởi $p$, khi đó $f$ thác triến được thành một phiến hàm tuyến tính trên $E$, bị chặn bởi $p$.

 

Hệ quả. Giả sử $E$ là một không gian định chuẩn. Khi đó,

  1. mọi phiếm hàm tuyến tính liên tục xác định trên một không gian con của $E$ đều thác triển được lên toàn $E$ thành một phiếm hàm với cùng chuẩn.
  2. với mỗi $x \in E$ đều tồn tại một phiếm hàm liên tục $f$ có chuẩn bằng $x$ sao cho $f(x) = \| x \|^2$,
  3. với mỗi $x \in E$, ta có $\|x\| = \sup\limits_{\substack{f \in E^\ast \\ \|f\| \leqslant 1}}|f(x)|$.

Chứng minh

1. Giả sử $f$ là một phiếm hàm liên tục xác định trên một không gian con $F$ của $E$. Áp dụng định lý Hahn-Bach cho $p = \| f \|_{E^\ast} \cdot \| \cdot \|_E$.

2. Xét toán tử tuyến tính $f$ xác định trên đường thẳng sinh bởi $x$ cho bởi $f(x) = \|x\|^2$.

3. Bất đẳng thức $\|x\| \geqslant \sup\limits_{\substack{f \in E^\ast \\ \|f\| \leqslant 1}}|f(x)|$ là hiển nhiên. Bất đẳng thức ngược lại suy ra từ phần trên. $\square$

 

Def. Giả sử $E$ là một không gian véc-tơ tô-pô. Một siêu phẳng affine trong $E$ là một tập con có dạng $$H = [f = \alpha] := \{x \in E \,| \, f(x) = \alpha\}$$ với $\alpha \in \mathbb{R}$ và $f$ là một phiếm hàm tuyến tính khác $0$.

 

Mệnh đề. $H$ là đóng khi và chỉ khi $f$ là liên tục.

 

Def. Một không gian véc-tơ tô-pô được gọi lồi địa phương nếu $0$ có một cơ sở lân cận gồm các tập lồi.

Rõ ràng điều kiện trên có thể thanh bởi "$0$ có một cơ sở lân cận gồm các tập lồi đối xứng", vì nếu $C$ là một tập lồi trong cơ sở lân cận này thì ta chỉ cần thay nó bởi $C \cap (-C)$.

 

Def. Cho $E$ là một không gian véc-tơ tô-pô và $C \subseteq E$ là một tập lồi khác rỗng và là một lân cận của $0$. Thang (gauge) của $C$ là ánh xạ cho bởi $$\|\cdot\|_C:E \to \mathbb{R}_{\geqslant 0}, \qquad x \mapsto \inf \{t > 0 \, | \, x/t \in C\}.$$

 

Tính chất của thang.

  1. $\|\cdot\|_C$ là thuần nhất dương.
  2. $\|\cdot\|_C$ là dưới cộng tính.
  3. Nếu $C$ mở thì $C = \{x \in E \, | \, \| x \|_C < 1 \}$.
  4. $\|\cdot\|_C$ là liên tục.

Chứng minh

Vì $C$ là lân cận của $0$ nên $\|\cdot\|_C$ được định nghĩa tốt.

1. Hiển nhiên.

2. Xét $x,y \in C$. Ta lấy $s, t > 0$ bất kỳ sao cho$x/s \in C$ và $y / t \in C$. Vì $C$ lồi nên $$\frac{x+y}{s+t} = \frac{s}{s+t}\cdot \frac{x}{s} + \frac{t}{s+t} \cdot \frac{y}{t} \in C,$$ do đó $\|x+y\|_C \leqslant s+t$. Điều này đúng với mọi $s$ và $t$ nên $\|x+y\|_C \leqslant \|x\|_C + \|y\|_C$.

3. Với $x \in C$, vì $C$ mở nên tồn tại $\varepsilon > 0$ sao cho $(1 + \varepsilon)x \in C$. Từ đó $\| x\|_C\leqslant 1/(x + \varepsilon) < 1$. Ngược lại. nếu $x \in E$ sao cho $\| x\|_C < 1$ thì tồn tại $t \in (0,1)$ sao cho $x/t \in C$. Vì $C$ lồi và chứa $0$ nên $x \in C$.

4. Vì tính dưới cộng tính nên ta chỉ cần chứng minh $\|\cdot\|_C$ là liên tục tại $0$. Thật vậy, cho $\varepsilon > 0$, khi đó tồn tại lân cận mở $V_\varepsilon$ của $0$ sao cho $V_\varepsilon \subseteq \varepsilon C$. Từ đó ta thấy, với mọi $x \in V_\varepsilon$ thì $\|x\|_C \leqslant \varepsilon$. $\square$

 

Ta có kết quả thú vị sau đây.

 

Định lý. Một không gian véc-tơ tô-pô là lồi địa phương khi và chỉ khi tô-pô của nó được sinh bởi một họ nửa chuẩn.

Chứng minh

"Chỉ khi". Giả sử $E$ là một không gian véc-tơ tô-pô lồi địa phương. Gọi $\mathcal{V}$ là cơ sở lân cận của $0$ gồm các tập lồi mở đối xứng (nếu $C$ là một tập lồi mở, ta thay nó bởi $C \cap (-C)$). Gọi$\mathcal{P}$ là tô-pô sinh bởi họ nửa chuẩn $(\|\cdot\|_C)_{C \in \mathcal{V}}$ và $\mathcal{T}$ là tô-pô ban đầu của $E$. Ta chứng minh $\mathcal{T} = \mathcal{P}$.

  • Nếu $V \in \mathcal{T}$ là lồi và đối xứng thì theo tính chất của thang, ta có $V = \{x \in E \, | \, \| x \|_V < 1 \}$, nên hiển nhiên $V \in \mathcal{P}$. Vậy $\mathcal{T} \subseteq \mathcal{P}$.
  • Xét một tập $U$ trong cơ sở của $\mathcal{P}$, nghĩa là $U = \{x \in E \,|\, \forall 1 \leqslant i \leqslant k, \|x\|_{V_i} < r\}$ (ta chỉ cần xét lân cận của $0$ do tính đối xứng của không gian véc-tơ tô-pô). Với $V_1,\ldots,V_k \in \mathcal{V}$ và $r > 0$. Khi đó $C = \bigcap_{i=1}^k rV_i \in \mathcal{T}$ là một lân cận lồi đối xứng của $0$. Dễ thấy $C \subseteq U$. Từ đây ta có $U \in \mathcal{T}$. Vậy $\mathcal{P} \subseteq \mathcal{T}$.

"Khi". Giả sử tô-pô của $E$ được sinh bởi họ nửa chuẩn $(p_\alpha)_{\alpha \in \mathcal{A}}$. Với mỗi tập hữu hạn $\mathcal{B} \subseteq \mathcal{A}$ và $r > 0$, dễ thấy tập hợp $$\{x \in E \,| \, \forall b \in \mathcal{B}, p_b(x) < r\}$$ là lồi. Chúng tạo nên một cơ sở lân cận lồi của $0$. $\square$

 

Định lý [Hahn-Banach dạng hình học]. Giả sử $A, B$ là hai tập lồi khác rỗng rời nhau của một không gian véc-tơ tô-pô $E$.

  1. Nếu $A$ mở thì tồn tại một siêu phẳng affine đóng $H = [f = \alpha]$ tách $A$ và $B$, nghĩa là $f(x) \leqslant \alpha \leqslant f(y)$ với mọi $x \in A$ và $y \in B$.
  2. Nếu $E$ lồi địa phương, $A$ compact và $B$ đóng thì tồn tại một siêu phẳng affine đóng $H = [f = \alpha]$ tách chặt $A$ và $B$, nghĩa là tồn tại $\varepsilon > 0$ sao cho $f(x) + \varepsilon \leqslant \alpha \leqslant f(y) - \varepsilon$ với mọi $x \in A$ và $y \in B$.

Chứng minh

Ta chứng minh

Bổ đề. Cho $C \subseteq E$ là một tập lồi mở và $x_0 \notin C$. Khi đó tồn tại một phiếm hàm tuyến tính liên tục $\ell: E \to \mathbb{R}$ sao cho với mọi $x \in C$, ta có $\ell(x) < \ell(x_0)$.

Chứng minh bổ đề. Ta có thể giả sử $0 \in C$. Ta biết rằng $C = \{x \in E \,|\, \| x \| < 1\}$, vì thế $\|x_0\| \geqslant 1$. Gọi $f$ là phiếm hàm tuyến tính xác định trên đường thẳng sinh bởi $x_0$ thỏa mãn $f(x_0) = 1$. Khi đó $f$ bị chặn trên bởi $\| \cdot \|_C$. Theo định lý Hahn-Banach, $f$ thác triển thành một phiếm hàm tuyến tính $\ell: E \to \mathbb{R}$ bị chặn bởi $\| \cdot \|_C$. Vì $C$ là lân cận của $0$ và ta dễ thấy với $\varepsilon > 0$ thì $ \ell(x) \geqslant \varepsilon$. Do đó $\ell$ là liên tục. Hiển nhiên ta có $\ell(x) \leqslant \|x\|_C < 1 = \ell(x_0)$ với mọi $x \in C$. $\square$

 

Trở lại định lý.

1. Ta áp dụng bổ đề trên cho $C = A - B$ và $x_0 = 0$.

2. Vì tính compact của $A$, ta có thể chọn được $n$ điểm $x_1,\ldots,x_n \in A$ và các lân cận mở $V_1,\ldots,V_n,V_1',\ldots,V_n'$ của $0$ sao cho

  • $(x_i + V_i) \cap A = \varnothing$.
  • $V_i' + V_i' \subseteq V_i$.
  • $A \subseteq \bigcup_{i=1}^n (x_i + V_i')$.

Gọi $W$ là lân cận mở của $0$ sao cho $$W + (-W) \subseteq \bigcap_{i=1}^n V_i'.$$ Khi đó $A' := A + W$ và $B' := B+W$ là hai tập lồi mở rời nhau. Ta áp dụng kết quả phần 1. cho $A'$ và $B'$. Cuối cùng, vì $W$ là lân cận của $0$ nên nó chứa tất cả các hướng, vì thế tồn tại $w_0 \in W$ sao cho $\ell(w_0) > 0$. Ta lấy $\varepsilon = \ell(w_0)$. $\square$

 

 

 

IV - Định lý Krein-Milman

 

Def. Cho $E$ là một không gian véc-tơ tô-pô và $K$ là một tập con của $E$. Một tập con khác rỗng $A \subseteq K$ được gọi là một diện của $K$ nếu nó com-pắc và nếu với mọi $x,y \in K$, từ chỗ tồn tại $\lambda \in (0,1)$ sao cho $\lambda x + (1-\lambda)y \in A$ suy ra $x,y \in A$.

Một điểm $x_0 \in K$ được gọi là một điểm cực biên nếu $\{x_0\}$ là một diện.

 

Mệnh đề. Nếu $A$ là một diện của $K$ thì mỗi diện của $A$ đều là một diện của $K$.

 

Định lý [Krein-Milman]. Giả sử $E$ là một không gian véc-tơ tô-pô lồi địa phương, Hausdorff và $K \subseteq E$ là một tập lồi com-pắc. Khi đó $K$ là bao lồi đóng của các điểm cực biến của nó.

 

Chứng minh

1. Đầu tiên ta chứng minh $K$ có ít nhất một điểm cực biên. Fact: Phần này của định lý tương đương với tiên đề chọn.

Trên tập $\mathcal{P}$ các diện của $K$, ta định nghĩa một quan hệ thứ tự: $A \leqslant B$ nếu $A \supseteq B$. Nếu $\mathcal{Q} \subseteq \mathcal{P}$ được sắp thứ tự toàn phần, ta thấy $$\bigcap_{A \in \mathcal{Q}}A$$ là một diện của $K$ (do tính chất giao hữu hạn của tập com-pắc), vì thế đây là một chặn trên cho $\mathcal{Q}$. Theo bổ đề Zorn, tồn tại một diện $M$ cực đại theo quan hệ $\leqslant$. Ta chứng minh $|M| = 1$. Thật vậy, giả sử phản chứng rằng tồn tại $x_0,x_1 \in M$ với $x_0 \neq x_1$. Theo định lý Hahn-Banach dạng hình học, tồn tại phiếm hàm tuyến tính liên tục $f: E \to \mathbb{R}$ sao cho $f(x_0) < f(x_1)$. Đặt $$N = \{x \in M \,| \, f(x) = \inf_Mf\}.$$ Thế thì $N$ là một diện của $K$ (thứ nhất, $N \neq \varnothing $ vì $M$ là com-pắc; thứ hai $N$ cũng com-pắc vì nó đóng; tính chất còn lại trong định nghĩa diện được chứng minh dễ dàng). Mặt khác $x_1 \notin N$, điều này mâu thuẫn với tính cực đại của diện $M$.

2. Gọi $\mathcal{E}$ là tập các điểm cực biên của $K$. Đương nhiên $K$ chứa bao lồi đóng của $\mathcal{E}$. Ta giả sử phản chứng rằng tồn tại điểm $x_0 \in K$ không nằm trong bao lồi đóng của $\mathcal{E}$. Theo định lý Hahn-Bach dạng hình học, tồn tại phiếm hàm tuyến tính liên tục $f: E \to \mathbb{R}$ sao cho với mọi $x \in \mathcal{E}$, ta có $f(x) < f(x_0)$. Tương tự nhiên trên, ta thấy $$A = \{x \in K \,| \, f(x) = \sup_K f\}$$ là một diện của $K$. Vì thế, nó có ít nhất một điểm cực biên $x_1$. Hiển nhiên $x_1$ cũng là một điểm cực biên của $K$ (mệnh đề trên), nghĩa là $x_1 \in \mathcal{E}$. Nhưng như vậy ta có $f(x_1) < f(x_0)$, mâu thuẫn. $\square$