Đến nội dung

Hình ảnh

Combinatorics và ngôn ngữ học.

- - - - -

  • Please log in to reply
Chủ đề này có 7 trả lời

#1
Isidia

Isidia

    Hạ sĩ

  • Thành viên
  • 74 Bài viết

Trước tiên phải nói khái niệm của mình về mối quan hệ giữa combinatorics (tổ hợp) với sự kết hợp của từng chữ cái (nôm na như vậy cho dễ hiểu để khỏi phải giải thích lôi thôi) với nhau rất lờ mờ. Đại loại mình hiểu là ngành combinatorics một phần nghiên cứu về sự kết hợp giữa các phần tử với nhau trong một tập hợp, và nếu vậy liệu các chữ cái kết hợp với nhau có thể được mô tả bằng combinatorics hay không? Ví dụ trong một bảng chữ cái tiếng Anh có 26 ký tự, trong đó có 5 vowels (nguyên âm) và 21 consonnants (phụ âm). Vậy thì có bao nhiêu cách kết hợp giữa 5 nguyên âm và 21 phụ âm. Đây chỉ là bài toán đơn giản nhất mà mình nghĩ ra.

 

Nếu có ai biết thêm tài liệu hay ra đề bài dựa trên 2 lĩnh vực này thì mình xin đọc và lắng nghe. Mình phải ôn lại các kiến thức cơ bản về elementary combinatorics. Nhưng mình cảm thấy nó là một trò chơi thú vị.

 

Mình tìm được theorem (định lý) này nhưng chưa hiểu lắm, xin chia sẻ với mọi người:

 

https://encycla.com/...ization_Theorem


There is no mathematical model that can predict your future or tell you how your life will unfold. All strength and power lies within your soul, and that's all what you need.


#2
Isidia

Isidia

    Hạ sĩ

  • Thành viên
  • 74 Bài viết

Mình ngồi tự ra bài toán thì tính thế này. Có nhiều cách ra bài toán cho câu:

 

 

Ví dụ trong một bảng chữ cái tiếng Anh có 26 ký tự, trong đó có 5 vowels (nguyên âm) và 21 consonnants (phụ âm). Vậy thì có bao nhiêu cách kết hợp giữa 5 nguyên âm và 21 phụ âm.

 

 

Như một người non nớt, mình làm như sau:

 

Nguyên âm: A, I, E, O, U ( 5 chữ cái)

Phụ âm: B, C, D, F, G, J, K, L, M, N, P, Q, S, T, V, X, Z, H, R, W, Y

 

Bài Toán đơn giản nhất là, có bao nhiêu cách để mỗi chữ cái kết hợp theo nguyên tắc, VC (Vowels and Consonants) và CV (Consonants and Vowels).

 

Thì mình tính là:

 

5V kết hợp với 21C = $21 \cdot 5=105$

21C kết hợp với 5V = $5 \cdot 21 = 105$

 

Cái này đúng không, xin hỏi mọi người.

 

Mình lỡ post cái này vào Toán hiện đại, chủ ý là muốn ai chuyên Toán biết định lý gì về combinatorics và ngôn ngữ học thì giới thiệu. Nếu các mods thấy post sai chỗ thì chuyển sang box khác phù hợp, vì mình chỉ toàn hỏi những câu căn bản. Chân thành xin lỗi!


There is no mathematical model that can predict your future or tell you how your life will unfold. All strength and power lies within your soul, and that's all what you need.


#3
Ruka

Ruka

    Trung sĩ

  • Thành viên
  • 153 Bài viết

Mình ngồi tự ra bài toán thì tính thế này. Có nhiều cách ra bài toán cho câu:

 

 

 

 

Như một người non nớt, mình làm như sau:

 

Nguyên âm: A, I, E, O, U ( 5 chữ cái)

Phụ âm: B, C, D, F, G, J, K, L, M, N, P, Q, S, T, V, X, Z, H, R, W, Y

 

Bài Toán đơn giản nhất là, có bao nhiêu cách để mỗi chữ cái kết hợp theo nguyên tắc, VC (Vowels and Consonants) và CV (Consonants and Vowels).

 

Thì mình tính là:

 

5V kết hợp với 21C = $21 \cdot 5=105$

21C kết hợp với 5V = $5 \cdot 21 = 105$

 

Cái này đúng không, xin hỏi mọi người.

 

Mình lỡ post cái này vào Toán hiện đại, chủ ý là muốn ai chuyên Toán biết định lý gì về combinatorics và ngôn ngữ học thì giới thiệu. Nếu các mods thấy post sai chỗ thì chuyển sang box khác phù hợp, vì mình chỉ toàn hỏi những câu căn bản. Chân thành xin lỗi!

 

Hành động kết hợp $2$ âm là nguyên âm và phụ âm là hành động liên tiếp nên bạn áp dụng qui tắc nhân nhé

 

Khi đó số cách kết hợp vowel sounds and consonant sounds là $5 . 21 = 105$ (cách)

 

Nếu làm theo combinatorics thì

 

Chọn $1$ vowel sound có $C_5^1$ (cách)

 

Chọn $1$ consonant sound có $C_{21}^1$ (cách)

 

Kết hợp $2$ âm lại có $ C_5^1 . C_{21}^1 = \displaystyle\binom{5}{1} . \displaystyle\binom{21}{1} = 105$ (cách)



#4
Isidia

Isidia

    Hạ sĩ

  • Thành viên
  • 74 Bài viết

Cảm ơn bạn Ruka,

 

Mình suy nghĩ nhiều về liên hệ giữa combinatorics và ngôn ngữ học. Ý kiến mình hiện giờ là nó không hữu dụng lắm (ở mức độ elementary (sơ cấp) như thế này), vì nó chỉ giúp ta đếm được tổng số các tổ hợp của chữ cái (grapheme), âm vị (phoneme), từ (word), etc, chứ không cho ta biết trong tổng số các tổ hợp đó, có bao nhiêu tổ hợp cấu tạo nên một từ, hay đơn giản là có ý nghĩa.

 

Tuy vậy, mình vẫn có thể làm cho vui để tự học thêm về toán tổ hợp và xác suất.

 

Bài 2: Có bao nhiêu cách để 21 phụ âm và 5 nguyên âm kết hợp nhau tạo thành một dãy chữ cái với dạng CVV (V=vowels, C=consonants)

 

Có bao nhiêu cách để chọn 1 phụ âm trong số 21 phụ âm?
- Có $^{21}C_1 = 21$ cách.
 
Có bao nhiêu cách để chọn 1 nguyên âm trong số 5 nguyên âm?
- Có $^{5}C_1 = 5$ cách.
 
Và lập lại câu hỏi trên?
- Có $^{5}C_1 = 5$ cách.
 
Tổng số tổ hợp theo dạng VCC nêu trên là $21\times 5\times 5=525$ theo nguyên tắc nhân.
 
Fun fact: Số lượng tổ hợp chữ cái kết hợp theo nguyên tắc trên có rất nhiều trong tiếng Hà Lan, nhiều hơn tiếng Anh.

Bài viết đã được chỉnh sửa nội dung bởi Isidia: 06-02-2023 - 17:07

There is no mathematical model that can predict your future or tell you how your life will unfold. All strength and power lies within your soul, and that's all what you need.


#5
perfectstrong

perfectstrong

    $LOVE(x)|_{x =\alpha}^\Omega=+\infty$

  • Quản lý Toán Ứng dụng
  • 4980 Bài viết

Nếu bạn muốn biết có bao nhiêu tổ hợp cấu tạo nên một từ hay có nghĩa, thì chỉ cần tra từ điển.

Ví dụ một nguồn tổng hợp: https://github.com/dwyl/english-words

Hoặc đây http://www.math.sjsu.../dictionary.txt

Bạn có thể dùng máy tính để tổng hợp xem có bao nhiêu từ có 2 chữ, rồi so sánh với kết quả bạn tính ra để xem có bao nhiêu % từ "có nghĩa" (được từ điển ghi nhận)?

Rồi làm tương tự với $n$ chữ cái.


Luôn yêu để sống, luôn sống để học toán, luôn học toán để yêu!!! :D
$$\text{LOVE}\left( x \right)|_{x = \alpha}^\Omega = + \infty $$
I'm still there everywhere.

#6
Isidia

Isidia

    Hạ sĩ

  • Thành viên
  • 74 Bài viết

Nếu bạn muốn biết có bao nhiêu tổ hợp cấu tạo nên một từ hay có nghĩa, thì chỉ cần tra từ điển.

Ví dụ một nguồn tổng hợp: https://github.com/dwyl/english-words

Hoặc đây http://www.math.sjsu.../dictionary.txt

Bạn có thể dùng máy tính để tổng hợp xem có bao nhiêu từ có 2 chữ, rồi so sánh với kết quả bạn tính ra để xem có bao nhiêu % từ "có nghĩa" (được từ điển ghi nhận)?

Rồi làm tương tự với $n$ chữ cái.

Wow, cám ơn bạn nhé.

 

Mình có thể thử nghiệm với một đối tượng khiêm tốn hơn. Ta có thể tính tổng số tổ hợp các cụm phụ âm (consonant clusters) (ví dụ như /pl/ trong plan (thực vật)) rồi đem so sánh với số lượng cụm phụ âm thực sự tồn tại trong tiếng Anh hiện tại. Chi tiết hơn, ta có thể phân nhóm rồi so sánh % trong mỗi nhóm cũng được.

 

Fun fact: Khi nói tới các cụm phụ âm, tiếng Ba Lan giàu hơn hẳn tiếng Anh, và thậm chí vượt mặt tiếng Nga. Đó là lý do tại sao tiếng Ba Lan là một thử thách cho người Châu Á nói thứ ngôn ngữ đơn lập (isolating morphology).


Bài viết đã được chỉnh sửa nội dung bởi Isidia: 06-02-2023 - 17:07

There is no mathematical model that can predict your future or tell you how your life will unfold. All strength and power lies within your soul, and that's all what you need.


#7
Isidia

Isidia

    Hạ sĩ

  • Thành viên
  • 74 Bài viết

Tiến lên từ tổ hợp, mình đang nghĩ và suy từ về một vấn đề sau:

 

Ta định nghĩa collocation là các cụm từ mà trong đó các từ cấu thành kết hợp với nhau với tần suất cao (tức là chúng thường đi với nhau). Ví dụ danh từ feeling hay đi với động từ to have hay to harbour và giới từ for. Vậy thì giả sử cho học sinh 5 câu hỏi, ví dụ như:

 

I ---- (1) feeling ----- (2) Long.

 

Vậy thì xác suất mà học sinh ấy đoán được khoảng trống (1) và (2) là bao nhiêu?

 

Xác suất này chắc chắn có nhiều đáp án tùy theo cách hiểu và diễn giải của người tính. Chắc chắn nó phải là xác suất có điều kiện (conditional probability).

 

Đây chỉ mới là vài suy nghĩ mơ hồ của mình. Mình xem các video về Natural Language Processing và Computational Linguistics nên quan tâm đến những vấn đề đại loại vậy.


There is no mathematical model that can predict your future or tell you how your life will unfold. All strength and power lies within your soul, and that's all what you need.


#8
Isidia

Isidia

    Hạ sĩ

  • Thành viên
  • 74 Bài viết
Một câu hỏi khác về thống kê và xác suất (có liên quan đến xác suất không nhỉ?) là việc xác định hay ước lượng số lượng từ vựng một học sinh biết.

Chẳng ai nói tốt tiếng Anh quan tâm đếm xem mình biết bao nhiêu từ, nhưng vì sao một vài trang web hay app có thể đưa ra con số phổng chừng sau khi đưa ra các bài test đơn giản hay khó?

Chắc chắn phía sau phải có Toán thống kê trong đó.

Câu hỏi này liên quan đến câu hỏi trên vì, theo ý kiến của mình, mình nên biết học sinh ấy biết bao nhiêu từ trong đầu, vốn khó trả lời.

Rõ ràng có thể dễ dàng trả lời có bao nhiêu từ trong một corpus (cơ sở dữ liệu ngôn ngữ) của một ngôn ngữ, nhưng không dễ trả lời có bao nhiêu từ học trong đầu một học sinh.

Một cách đơn giản ước tính là tìm một cái list các từ có đánh số, liếc mắt qua xem mình có biết không. Ví dụ list đó có 1500 từ mà mình nhận biết được gần hết, vậy thì đem 1500 trừ đi số từ mình chưa biết thì ra khoảng tiên đoán.

https://ia903200.us....rds Book 1.pdf

Bài viết đã được chỉnh sửa nội dung bởi Isidia: 06-02-2023 - 22:41

There is no mathematical model that can predict your future or tell you how your life will unfold. All strength and power lies within your soul, and that's all what you need.





1 người đang xem chủ đề

0 thành viên, 1 khách, 0 thành viên ẩn danh