混合專家模型 - 維基百科，自由的百科全書

機器學習與資料探勘

範式監督學習無監督學習線上機器學習元學習（英語：Meta-learning (computer science)）半監督學習自監督學習強化學習基於規則的機器學習（英語：Rule-based machine learning）量子機器學習
問題統計分類生成模型迴歸分析聚類分析降維密度估計（英語：density estimation）異常檢測數據清洗自動機器學習關聯規則學習語意分析結構預測（英語：Structured prediction）特徵工程表徵學習排序學習（英語：Learning to rank）語法歸納（英語：Grammar induction）本體學習（英語：Ontology learning）多模態學習（英語：Multimodal learning）
監督學習 (分類 · 回歸) 學徒學習（英語：Apprenticeship learning）決策樹學習集成學習 Bagging 提升方法隨機森林 k-NN 線性回歸樸素貝葉斯人工神經網絡邏輯斯諦迴歸感知器相關向量機（RVM）支持向量機（SVM）遷移學習微調
聚類分析 BIRCH CURE算法（英語：CURE algorithm）層次 k-平均 Fuzzy 期望最大化（EM） DBSCAN OPTICS 均值飄移（英語：Mean shift）
降維因素分析 CCA ICA LDA NMF（英語：Non-negative matrix factorization） PCA PGD（英語：Proper generalized decomposition） t-SNE（英語：t-distributed stochastic neighbor embedding） SDL
結構預測（英語：Structured prediction）圖模式貝氏網路條件隨機域隱馬爾可夫模型
異常檢測 RANSAC k-NN 局部異常因子（英語：Local outlier factor）孤立森林（英語：Isolation forest）
人工神經網絡自編碼器認知計算深度學習 DeepDream（英語：DeepDream）多層感知器 RNN LSTM GRU（英語：Gated recurrent unit） ESN（英語：Echo state network）儲備池計算（英語：reservoir computing）受限玻爾茲曼機 GAN SOM CNN U-Net Transformer Vision transformer（英語：Vision transformer）脈衝神經網絡（英語：Spiking neural network） Memtransistor（英語：Memtransistor）電化學RAM（英語：Electrochemical RAM）（ECRAM）
強化學習 Q學習 SARSA 時序差分（TD）多智能體（英語：Multi-agent reinforcement learning） Self-play（英語：Self-play (reinforcement learning technique)） RLHF
與人類學習主動學習（英語：Active learning (machine learning)）眾包 Human-in-the-loop（英語：Human-in-the-loop）
模型診斷學習曲線（英語：Learning curve (machine learning)）
數學基礎內核機器（英語：Kernel machines）偏差–方差困境（英語：Bias–variance tradeoff）計算學習理論（英語：Computational learning theory）經驗風險最小化奧卡姆學習（英語：Occam learning） PAC學習（英語：Probably approximately correct learning）統計學習 VC理論
大會與出版物 NeurIPS ICML（英語：International Conference on Machine Learning） ICLR ML（英語：Machine Learning (journal)） JMLR（英語：Journal of Machine Learning Research）
相關條目人工智能術語（英語：Glossary of artificial intelligence）機器學習研究數據集列表（英語：List of datasets for machine-learning research）機器學習概要（英語：Outline of machine learning）
閱論編

混合專家模型（英語：mixture of experts，簡稱MoE），或譯為多專家模型，是一種機器學習技術，通過門控（gating）模型將單一任務空間劃分為多個子任務，再由多個專家網絡（子模型）分別處理特定的子任務，最終得到整體的預測結果。^[1]混合專家模型與集成學習有相似之處，它們都應用多個子模型來處理問題。但它們的區別在於，混合專家模型中的每個專家都是針對不同的數據子空間進行訓練的，以適應不同類型的輸入數據。而集成學習一般而言則是使用多種模型對整個數據空間進行訓練。

層級混合專家模型 (英語：hierarchical mixtures of experts）是包含多個層級的混合專家模型。與使用單一門控模型的普通混合專家模型相比，層級混合專家模型中的門控模型呈類似決策樹的多層結構，以適應更為複雜與靈活的應用場景。^[2]

參考文獻

^ Baldacchino, Tara; Cross, Elizabeth J.; Worden, Keith; Rowson, Jennifer. Variational Bayesian mixture of experts models and sensitivity analysis for nonlinear dynamical systems. Mechanical Systems and Signal Processing. 2016, 66–67: 178–200. Bibcode:2016MSSP...66..178B. doi:10.1016/j.ymssp.2015.05.009.
^ Hauskrecht, Milos. Ensamble methods: Mixtures of experts (Presentation) (PDF). [2023-06-27]. （原始內容存檔 (PDF)於2023-04-04）.