BIRCH - 維基百科，自由的百科全書

機器學習與資料探勘

範式監督學習無監督學習線上機器學習元學習（英語：Meta-learning (computer science)）半監督學習自監督學習強化學習基於規則的機器學習（英語：Rule-based machine learning）量子機器學習
問題統計分類生成模型迴歸分析聚類分析降維密度估計（英語：density estimation）異常檢測數據清洗自動機器學習關聯規則學習語意分析結構預測（英語：Structured prediction）特徵工程表徵學習排序學習（英語：Learning to rank）語法歸納（英語：Grammar induction）本體學習（英語：Ontology learning）多模態學習
監督學習 (分類 · 回歸) 學徒學習（英語：Apprenticeship learning）決策樹學習集成學習 Bagging 提升方法隨機森林 k-NN 線性回歸樸素貝葉斯人工神經網絡邏輯斯諦迴歸感知器相關向量機（RVM）支持向量機（SVM）遷移學習微調
聚類分析 BIRCH CURE算法（英語：CURE algorithm）層次 k-平均 Fuzzy 期望最大化（EM） DBSCAN OPTICS 均值飄移（英語：Mean shift）
降維因素分析 CCA ICA LDA NMF（英語：Non-negative matrix factorization） PCA PGD（英語：Proper generalized decomposition） t-SNE（英語：t-distributed stochastic neighbor embedding） SDL
結構預測（英語：Structured prediction）圖模式貝氏網絡條件隨機域隱馬爾可夫模型
異常檢測 RANSAC k-NN 局部異常因子（英語：Local outlier factor）孤立森林（英語：Isolation forest）
人工神經網絡自編碼器認知計算深度學習 DeepDream（英語：DeepDream）多層感知器 RNN LSTM GRU（英語：Gated recurrent unit） ESN（英語：Echo state network）儲備池計算（英語：reservoir computing）受限玻爾茲曼機 GAN SOM CNN U-Net Transformer Vision transformer（英語：Vision transformer）脈衝神經網絡（英語：Spiking neural network） Memtransistor（英語：Memtransistor）電化學RAM（英語：Electrochemical RAM）（ECRAM）
強化學習 Q學習 SARSA 時序差分（TD）多智能體（英語：Multi-agent reinforcement learning） Self-play（英語：Self-play (reinforcement learning technique)） RLHF
與人類學習主動學習（英語：Active learning (machine learning)）眾包 Human-in-the-loop（英語：Human-in-the-loop）
模型診斷學習曲線（英語：Learning curve (machine learning)）
數學基礎內核機器（英語：Kernel machines）偏差–方差困境（英語：Bias–variance tradeoff）計算學習理論（英語：Computational learning theory）經驗風險最小化奧卡姆學習（英語：Occam learning） PAC學習（英語：Probably approximately correct learning）統計學習 VC理論
大會與出版物 NeurIPS ICML（英語：International Conference on Machine Learning） ICLR ML（英語：Machine Learning (journal)） JMLR（英語：Journal of Machine Learning Research）
相關條目人工智能術語（英語：Glossary of artificial intelligence）機器學習研究數據集列表（英語：List of datasets for machine-learning research）機器學習概要（英語：Outline of machine learning）
閱論編

BIRCH（英文全稱：balanced iterative reducing and clustering using hierarchies，中文：利用層次方法的平衡迭代規約和聚類）^[1]是一個非監督式分層聚類算法，於1996年由 Tian Zhang 提出。算法的優勢在於能夠利用有限的內存資源完成對大數據集的高質量的聚類。^[2]該算法通過構建聚類特徵樹（Clustering Feature Tree，簡稱CF Tree），在接下來的聚類過程中，直接對聚類特徵進行聚類，而無需對原始數據集進行聚類。^[3]因此在多數情況下只需要掃描一次數據庫即可進行聚類，IO成本與數據集尺寸呈線性關係。^[4]