Đến nội dung

Isidia

Isidia

Đăng ký: 14-05-2016
Offline Đăng nhập: 02-03-2024 - 07:01
-----

#738487 Ganh tỵ vì sự sôi nổi kế thừa nhau trong ngành Toán học ở học đường Việt Nam

Gửi bởi Isidia trong 10-04-2023 - 15:15

Bạn cần phải định rõ hoàn cảnh bài toán hơn. Ví dụ như, khi lật lên xong thì để mở tiếp hay úp lại? Có cần phải xáo lại hoàn toàn không?

Ví dụ có 10 hình tổng cộng. Trong đó có 5 cặp. Khi mở lên nếu hai hình không giống nhau thì úp lại, rồi mở tiếp.




#737398 Ganh tỵ vì sự sôi nổi kế thừa nhau trong ngành Toán học ở học đường Việt Nam

Gửi bởi Isidia trong 22-02-2023 - 21:34

Xin lỗi bạn Isidia, mình bận quá nên không lên trả lời sớm hơn được.

 

Rất tiếc khi nghe về bệnh tình của bạn, cầu mong bạn sẽ gặp may mắn.

Nesbit thấy bạn có viết blog về Toán và có vẻ như vẫn còn học Toán. Theo Nesbit thì Toán nếu học đúng cách thì không hề có hại cho bộ não mà còn có lợi. Nếu bạn mất căn bản thì cần học lại những kiến thức của lớp dưới để lấy lại căn bản trước, chứ đừng ham học những kiến thức trên cao, rất có hại. Nếu bạn còn thích học Toán (dù chỉ là sở thích chứ không phải cho sự nghiệp), thì Nesbit thật lòng khuyên bạn nên làm như vậy. 

 

 

 

Không biết bạn đọc ở đâu, nhưng phần Nesbit in đậm ở trên hoàn toàn không đúng nhé. Đọc lại thì mới thấy là Nesbit quên nên tên cái ngành học đã giới thiệu cho bạn, ngành đó gọi là Computational Linguistics, machine translation là một mảng của nó. Với kiến thức Toán năm nhất đại học thôi cũng đủ để làm nhiều thứ hay ho trong ngành này (tất nhiên ngoài ra cần phải biết lập trình). Nếu bạn muốn học thì hãy đọc sách này: https://web.stanford...~jurafsky/slp3/. Lưu ý: đọc từ đầu đến cuối, step by step, đừng vội đọc những phần mình thấy thích dựa vào tiêu đề.

 

Cảm ơn bạn nhiều nhé. Mình cũng không còn ý định tự học những cái cao siêu nữa. Trình độ và khả năng mình có hạn nên mình chỉ làm việc với những chủ đề vừa sức mà thôi.

 

Mình cũng đã tìm thấy quyển của Jurafsky. Có lẽ là một trong số những sách giáo khoa hiếm về Computational Linguistics. Mình sẽ dàng thời gian đọc từ từ. Sách dày nên có lẽ cần rất nhiều thì giờ để hoàn thành.

 

Gần đây mình mới biết là các thứ như lý thuyết độ đo không quá cần thiết cho một người muốn hiểu về statistics and probability theo hướng ứng dụng. Ngay cả các nhà thống kê học chuyên nghiệp cũng có người không hiểu mấy về độ đo. Mình cũng thở phào nhẹ nhỏm.




#737109 Combinatorics và ngôn ngữ học.

Gửi bởi Isidia trong 06-02-2023 - 18:44

Một câu hỏi khác về thống kê và xác suất (có liên quan đến xác suất không nhỉ?) là việc xác định hay ước lượng số lượng từ vựng một học sinh biết.

Chẳng ai nói tốt tiếng Anh quan tâm đếm xem mình biết bao nhiêu từ, nhưng vì sao một vài trang web hay app có thể đưa ra con số phổng chừng sau khi đưa ra các bài test đơn giản hay khó?

Chắc chắn phía sau phải có Toán thống kê trong đó.

Câu hỏi này liên quan đến câu hỏi trên vì, theo ý kiến của mình, mình nên biết học sinh ấy biết bao nhiêu từ trong đầu, vốn khó trả lời.

Rõ ràng có thể dễ dàng trả lời có bao nhiêu từ trong một corpus (cơ sở dữ liệu ngôn ngữ) của một ngôn ngữ, nhưng không dễ trả lời có bao nhiêu từ học trong đầu một học sinh.

Một cách đơn giản ước tính là tìm một cái list các từ có đánh số, liếc mắt qua xem mình có biết không. Ví dụ list đó có 1500 từ mà mình nhận biết được gần hết, vậy thì đem 1500 trừ đi số từ mình chưa biết thì ra khoảng tiên đoán.

https://ia903200.us....rds Book 1.pdf


#737107 Combinatorics và ngôn ngữ học.

Gửi bởi Isidia trong 06-02-2023 - 18:17

Tiến lên từ tổ hợp, mình đang nghĩ và suy từ về một vấn đề sau:

 

Ta định nghĩa collocation là các cụm từ mà trong đó các từ cấu thành kết hợp với nhau với tần suất cao (tức là chúng thường đi với nhau). Ví dụ danh từ feeling hay đi với động từ to have hay to harbour và giới từ for. Vậy thì giả sử cho học sinh 5 câu hỏi, ví dụ như:

 

I ---- (1) feeling ----- (2) Long.

 

Vậy thì xác suất mà học sinh ấy đoán được khoảng trống (1) và (2) là bao nhiêu?

 

Xác suất này chắc chắn có nhiều đáp án tùy theo cách hiểu và diễn giải của người tính. Chắc chắn nó phải là xác suất có điều kiện (conditional probability).

 

Đây chỉ mới là vài suy nghĩ mơ hồ của mình. Mình xem các video về Natural Language Processing và Computational Linguistics nên quan tâm đến những vấn đề đại loại vậy.




#737105 Combinatorics và ngôn ngữ học.

Gửi bởi Isidia trong 06-02-2023 - 17:06

Nếu bạn muốn biết có bao nhiêu tổ hợp cấu tạo nên một từ hay có nghĩa, thì chỉ cần tra từ điển.

Ví dụ một nguồn tổng hợp: https://github.com/dwyl/english-words

Hoặc đây http://www.math.sjsu.../dictionary.txt

Bạn có thể dùng máy tính để tổng hợp xem có bao nhiêu từ có 2 chữ, rồi so sánh với kết quả bạn tính ra để xem có bao nhiêu % từ "có nghĩa" (được từ điển ghi nhận)?

Rồi làm tương tự với $n$ chữ cái.

Wow, cám ơn bạn nhé.

 

Mình có thể thử nghiệm với một đối tượng khiêm tốn hơn. Ta có thể tính tổng số tổ hợp các cụm phụ âm (consonant clusters) (ví dụ như /pl/ trong plan (thực vật)) rồi đem so sánh với số lượng cụm phụ âm thực sự tồn tại trong tiếng Anh hiện tại. Chi tiết hơn, ta có thể phân nhóm rồi so sánh % trong mỗi nhóm cũng được.

 

Fun fact: Khi nói tới các cụm phụ âm, tiếng Ba Lan giàu hơn hẳn tiếng Anh, và thậm chí vượt mặt tiếng Nga. Đó là lý do tại sao tiếng Ba Lan là một thử thách cho người Châu Á nói thứ ngôn ngữ đơn lập (isolating morphology).




#737096 Combinatorics và ngôn ngữ học.

Gửi bởi Isidia trong 06-02-2023 - 12:10

Cảm ơn bạn Ruka,

 

Mình suy nghĩ nhiều về liên hệ giữa combinatorics và ngôn ngữ học. Ý kiến mình hiện giờ là nó không hữu dụng lắm (ở mức độ elementary (sơ cấp) như thế này), vì nó chỉ giúp ta đếm được tổng số các tổ hợp của chữ cái (grapheme), âm vị (phoneme), từ (word), etc, chứ không cho ta biết trong tổng số các tổ hợp đó, có bao nhiêu tổ hợp cấu tạo nên một từ, hay đơn giản là có ý nghĩa.

 

Tuy vậy, mình vẫn có thể làm cho vui để tự học thêm về toán tổ hợp và xác suất.

 

Bài 2: Có bao nhiêu cách để 21 phụ âm và 5 nguyên âm kết hợp nhau tạo thành một dãy chữ cái với dạng CVV (V=vowels, C=consonants)

 

Có bao nhiêu cách để chọn 1 phụ âm trong số 21 phụ âm?
- Có $^{21}C_1 = 21$ cách.
 
Có bao nhiêu cách để chọn 1 nguyên âm trong số 5 nguyên âm?
- Có $^{5}C_1 = 5$ cách.
 
Và lập lại câu hỏi trên?
- Có $^{5}C_1 = 5$ cách.
 
Tổng số tổ hợp theo dạng VCC nêu trên là $21\times 5\times 5=525$ theo nguyên tắc nhân.
 
Fun fact: Số lượng tổ hợp chữ cái kết hợp theo nguyên tắc trên có rất nhiều trong tiếng Hà Lan, nhiều hơn tiếng Anh.



#737070 Combinatorics và ngôn ngữ học.

Gửi bởi Isidia trong 04-02-2023 - 15:32

Mình ngồi tự ra bài toán thì tính thế này. Có nhiều cách ra bài toán cho câu:

 

 

Ví dụ trong một bảng chữ cái tiếng Anh có 26 ký tự, trong đó có 5 vowels (nguyên âm) và 21 consonnants (phụ âm). Vậy thì có bao nhiêu cách kết hợp giữa 5 nguyên âm và 21 phụ âm.

 

 

Như một người non nớt, mình làm như sau:

 

Nguyên âm: A, I, E, O, U ( 5 chữ cái)

Phụ âm: B, C, D, F, G, J, K, L, M, N, P, Q, S, T, V, X, Z, H, R, W, Y

 

Bài Toán đơn giản nhất là, có bao nhiêu cách để mỗi chữ cái kết hợp theo nguyên tắc, VC (Vowels and Consonants) và CV (Consonants and Vowels).

 

Thì mình tính là:

 

5V kết hợp với 21C = $21 \cdot 5=105$

21C kết hợp với 5V = $5 \cdot 21 = 105$

 

Cái này đúng không, xin hỏi mọi người.

 

Mình lỡ post cái này vào Toán hiện đại, chủ ý là muốn ai chuyên Toán biết định lý gì về combinatorics và ngôn ngữ học thì giới thiệu. Nếu các mods thấy post sai chỗ thì chuyển sang box khác phù hợp, vì mình chỉ toàn hỏi những câu căn bản. Chân thành xin lỗi!




#737069 Combinatorics và ngôn ngữ học.

Gửi bởi Isidia trong 04-02-2023 - 14:41

Trước tiên phải nói khái niệm của mình về mối quan hệ giữa combinatorics (tổ hợp) với sự kết hợp của từng chữ cái (nôm na như vậy cho dễ hiểu để khỏi phải giải thích lôi thôi) với nhau rất lờ mờ. Đại loại mình hiểu là ngành combinatorics một phần nghiên cứu về sự kết hợp giữa các phần tử với nhau trong một tập hợp, và nếu vậy liệu các chữ cái kết hợp với nhau có thể được mô tả bằng combinatorics hay không? Ví dụ trong một bảng chữ cái tiếng Anh có 26 ký tự, trong đó có 5 vowels (nguyên âm) và 21 consonnants (phụ âm). Vậy thì có bao nhiêu cách kết hợp giữa 5 nguyên âm và 21 phụ âm. Đây chỉ là bài toán đơn giản nhất mà mình nghĩ ra.

 

Nếu có ai biết thêm tài liệu hay ra đề bài dựa trên 2 lĩnh vực này thì mình xin đọc và lắng nghe. Mình phải ôn lại các kiến thức cơ bản về elementary combinatorics. Nhưng mình cảm thấy nó là một trò chơi thú vị.

 

Mình tìm được theorem (định lý) này nhưng chưa hiểu lắm, xin chia sẻ với mọi người:

 

https://encycla.com/...ization_Theorem




#737060 Ganh tỵ vì sự sôi nổi kế thừa nhau trong ngành Toán học ở học đường Việt Nam

Gửi bởi Isidia trong 03-02-2023 - 15:38

mấy anh này đã làm gì mà thành công lớn?

Thành công lớn ở đây là dựa vào sự nỗ lực của bản thân để giành học bổng và đeo đuổi ước mơ.




#737046 "Formal" và "fomalization" trong Toán nghĩa là gì?

Gửi bởi Isidia trong 02-02-2023 - 06:50

Cảm ơn bạn Linh đã đưa ra câu trả lời vừa tầm hiểu biết của mình.

 

Mình cứ tưởng sự hình thức hóa là việc biến một phát biểu bằng ngôn ngữ thường thành những ký kiệu Toán học, áp dụng các toán tử và lượng từ để khiến nó trở nên chặt chẽ và thoát khỏi sự mông lung (ambiguity) của ngôn ngữ thường.




#737045 Ganh tỵ vì sự sôi nổi kế thừa nhau trong ngành Toán học ở học đường Việt Nam

Gửi bởi Isidia trong 02-02-2023 - 06:46

Xin trích từ một cuộc nói chuyện riêng với một thành viên ở đây:

 

Toán học ngày nay đã là một ngành gây cảm hứng để các ngành khác nổ lực cải cách lại nền tảng lý luận để sánh bằng tính khách quan và chính xác của Toán. Một trong ngành ngôn ngữ học, lĩnh vực ngữ nghĩa học (semantics) đã được hình thức hóa và trở nên trừu tượng hơn hẳn các chi các trong ngôn ngữ học, nó gần như là một dạng logic Toán. Anh hiện quan tâm đến mảng này.
 

Lĩnh vực mà ta được biết theo truyền thống là ngữ pháp hay văn phạm trong ngôn ngữ học ngày nay cũng đã được hình thức hóa tới mức khó hiểu với phi chuyên gia, khiến cho Toán học, logic học và ngôn ngữ nối vòng tay lớn.

 

Tuy nhiên, liệu đằng sau những sự hình thức hóa và trừu tượng hóa đó có phải là những khái niệm và lý thuyết hữu dụng hay không, thậm chí có đúng không, thì mình không thể trả lời được chính vì sự thiếu hiểu biết về Toán học nói chung, và logic học nói riêng. Liệu các đối tượng trong ngôn ngữ học có tuân theo những quy luật (xin lỗi nếu dùng từ lấp liếm và kém rõ rành ở đây) một cách chặt chẽ như những đối tượng trong toán học hay không, mình cũng không biết. 




#737038 "Formal" và "fomalization" trong Toán nghĩa là gì?

Gửi bởi Isidia trong 01-02-2023 - 12:42

Mình nghe nhiều từ "formal" trong Toán học rất nhiều.

 

Ví dụ định nghĩa epsilon-delta của giới hạn, sự liên tục của hàm số, đạo hàm trong Giải tích cổ điển là những định nghĩa "formal".

 

Mình thấy những định nghĩa "formal" này thường là những định nghĩa khó hiểu với người không chuyên Toán. 

 

Thông thường quá trình tạo ra các định nghĩa hay khái niệm "formal" sẽ gắn liền với sự trừu tượng hóa (abstraction) trong Toán.

 

Vậy thật sự mà nói quá trình formalization là gì?

Hi vọng các bạn chuyên Toán sẽ giúp mình hiểu hơn về nó. 

 

 




#737017 Phạm Tuấn Huy được trao Clay Research Fellowship

Gửi bởi Isidia trong 31-01-2023 - 11:42

Đang bận tối tăm mặt mũi nhưng cũng gắng tranh thủ lên đăng bài này để chia sẻ với diễn đàn, đặc biệt là các bạn trẻ (có nhiều anh em khác chắc cũng đã biết tin như Nesbit cách đây ít ngày). Việt Nam có nhiều nhà Toán học rất tài năng nhưng có lẽ là công chúng ít được biết đến. Sắp tới sẽ cố gắng chia sẻ thêm những người mà mình biết.


Mình hoàn toàn đồng ý với bạn. Dù “1” người được Field nghe có vẻ ít, nhưng thử hỏi có bao nhiêu quốc gia trên thế giới chỉ có 1?

Việt Nam có rất nhiều người tài năng và ưu tú, không cứ gì phải đoạt giải lớn mới gọi là ưu tú. Thật sự mà nói, mình rất nể trọng giáo sư Nguyễn Hữu Việt Hưng. Dù chưa gặp giáo sư bao giờ nhưng giáo sư vứt bỏ phú quý để giúp đào tạo một lớp các sinh viên ưu tú để ưm mầm tài năng, công đó nặng như núi Thái Sơn vậy.


#737016 Ganh tỵ vì sự sôi nổi kế thừa nhau trong ngành Toán học ở học đường Việt Nam

Gửi bởi Isidia trong 31-01-2023 - 08:16

Nếu có điều gì có thể giúp ích cho bạn hiện tại: Nesbit cho rằng với làn sóng AI mấy năm trở lại đây thì những ai theo đuổi ngành linguistics cũng có tương lai khá sáng sủa nếu làm việc trong intersection giữa linguistics và NLP. Bạn có thể cân nhắc về hướng này. Sẽ được học thêm về Toán. Nếu đã thích Toán mà công việc không có Toán thì thật là uổng phí.

Mình xem qua profile của bạn ở trang riêng thì thấy bạn làm việc về AI. Wow!

 

Không biết bạn có biết gì về machine translation không? Như google translate, deepl, chatgpt?

 

Mình cũng muốn hiểu 3 kỹ thuật rule-based translation, statistical learning translation và neural network translation. Nhưng e không đủ trình.




#737015 Ganh tỵ vì sự sôi nổi kế thừa nhau trong ngành Toán học ở học đường Việt Nam

Gửi bởi Isidia trong 31-01-2023 - 07:58

Trong các ngành Toán ở bậc THPT và đại học, khiến mình tò mò nhất là Giải tích hàm một biến, xác suất và đặc biệt là chuỗi (series).

 

1) Giải tích hay Calculus (chứ không phải Real and Complex Analysis) muốn học cao lên phải học qua Linear Algebra cơ bản ở dạng computation

2) Xác suất muốn hiểu ở mức độ trung cấp (intermediate) đòi hỏi phải học tốt tới Calculus 3, còn cao cấp mà theo hướng lý thuyết thì phải nắm Lý thuyết độ đo (measure theory)

3) Chuỗi (bao gồm numerical series; functional series; power series; Taylor series; Trigonometric and Fourier series), vốn là một trong những ngành thúc đấy Toán học tiến bộ nhất từ thế kỷ XVII đến thế kỷ XIX ngày nay đã có thể xem là khá complete và hoàn thiện, các kết quả mới rất khó giải quyết và phải hiểu rất nhiều ngành khác mới làm được.

 

Cái này chắc cả đời mình không tự học nổi đâu! :(