Mục lục:

Làm thế nào để bạn sử dụng phân bổ Dirichlet tiềm ẩn?
Làm thế nào để bạn sử dụng phân bổ Dirichlet tiềm ẩn?

Video: Làm thế nào để bạn sử dụng phân bổ Dirichlet tiềm ẩn?

Video: Làm thế nào để bạn sử dụng phân bổ Dirichlet tiềm ẩn?
Video: Hàm Beta - Hàm Gamma - Tích phân Dirichlet và các ứng dụng | Lý thuyết 2024, Tháng mười một
Anonim

LDA là gì?

  1. Chọn tập hợp các bộ phận độc đáo của bạn.
  2. Chọn số lượng vật liệu tổng hợp bạn muốn.
  3. Chọn bao nhiêu phần bạn muốn cho mỗi hỗn hợp (mẫu từ Poisson phân bổ ).
  4. Chọn số lượng chủ đề (danh mục) bạn muốn.
  5. Chọn một số giữa không-0 và dương vô cùng và gọi nó là số alpha.

Tương tự như vậy, bạn có thể hỏi, liệu có phải máy học Latent Dirichlet Allocation không?

Phân bổ Dirichlet tiềm ẩn ( LDA ) là một mô hình xác suất chung của một kho ngữ liệu. Ý tưởng cơ bản là các tài liệu được biểu diễn dưới dạng hỗn hợp ngẫu nhiên trên ngầm các chủ đề, trong đó mỗi chủ đề được đặc tả bằng cách phân bổ các từ.

Tương tự, mô hình chủ đề LDA hoạt động như thế nào? LDA giả định các tài liệu được tạo ra từ một hỗn hợp các chủ đề. Các chủ đề đó sau đó tạo ra các từ dựa trên phân phối xác suất của chúng. Đưa ra một tập dữ liệu tài liệu, LDA kiểm tra lại và cố gắng tìm ra chủ đề nào sẽ tạo các tài liệu đó ngay từ đầu. LDA là một kỹ thuật thừa số hóa ma trận.

Về vấn đề này, làm thế nào để bạn phát âm phân bổ Dirichlet tiềm ẩn?

“Ch” có thể được phát âm giống như âm “sh” hoặc âm “k” cứng. Và phần cuối “et” có thể được phát âm theo kiểu Pháp là “lay” hoặc “let” với âm “t” cứng. Phân bổ Dirichlet tiềm ẩn lần đầu tiên được giải thích trong một bài báo nghiên cứu năm 2003, nhưng giống như hầu hết các kỹ thuật, những ý tưởng chính đã được công bố trước đó.

Phân bổ Dirichlet tiềm ẩn được giám sát hay không được giám sát?

Đúng vậy đó LDA là một không giám sát phương pháp. Tuy nhiên, nó có thể được mở rộng thành giám sát một.

Đề xuất: