n元語法

n元語法（英語：n-gram）指文本中連續出現的n個語詞。n元語法模型是基於(n-1)階馬爾可夫鏈的一種概率語言模型，通過n個語詞出現的概率來推斷語句的結構。^[1]^[2]這一模型被廣泛應用於概率論、通信理論、計算語言學（如基於統計的自然語言處理）、計算生物學（如序列分析）、數據壓縮等領域。

當n分別為1、2、3時，又分別稱為一元語法（unigram）、二元語法（bigram）與三元語法（trigram）。^[2]

示例

不同領域中的n元語法示例
領域	單位	示例	一元語法	二元語法	三元語法
馬爾可夫鏈階數			0	1	2
蛋白質測序	氨基酸	… Cys-Gly-Leu-Ser-Trp …	…, Cys, Gly, Leu, Ser, Trp, …	…, Cys-Gly, Gly-Leu, Leu-Ser, Ser-Trp, …	…, Cys-Gly-Leu, Gly-Leu-Ser, Leu-Ser-Trp, …
DNA測序	鹼基對	…AGCTTCGA…	…, A, G, C, T, T, C, G, A, …	…, AG, GC, CT, TT, TC, CG, GA, …	…, AGC, GCT, CTT, TTC, TCG, CGA, …
計算語言學	字符	…to_be_or_not_to_be…	…, t, o, _, b, e, _, o, r, _, n, o, t, _, t, o, _, b, e, …	…, to, o_, _b, be, e_, _o, or, r_, _n, no, ot, t_, _t, to, o_, _b, be, …	…, to_, o_b, _be, be_, e_o, _or, or_, r_n, _no, not, ot_, t_t, _to, to_, o_b, _be, …
計算語言學	單詞	… to be or not to be …	…, to, be, or, not, to, be, …	…, to be, be or, or not, not to, to be, …	…, to be or, be or not, or not to, not to be, …

參考文獻

^ 存档副本. [2016-10-16]. （原始內容存檔於2016-12-25）.
^ ^2.0 ^2.1 n元語法（資訊與通信術語辭典）. 國家教育研究院. [2016-10-16]. （原始內容存檔於2019-02-17）.

這是一篇語言學小作品。您可以透過編輯或修訂擴充其內容。

[1] 存档副本. [2016-10-16]. （原始內容存檔於2016-12-25）.

[naer-2] 2.0 ^2.1 n元語法（資訊與通信術語辭典）. 國家教育研究院. [2016-10-16]. （原始內容存檔於2019-02-17）.

[1]

[2]

閱論編自然語言處理
一般術語	語料庫口語語料庫停用詞詞袋完全人工智能（英語：AI-complete） n元語法（雙字母組、三元語法（英語：Trigrams））
文本挖掘	文本分割詞性標註（英語：Part-of-speech tagging）拆句處理（英語：Shallow parsing）複合詞處理（英語：Compound term processing）搭配提取（英語：Collocation extraction）詞幹提取詞形還原命名實體識別指代文本情感分析概念挖掘（英語：Concept mining）語法分析詞義消歧術語提取（英語：Terminology extraction）真實大小寫處理（英語：Truecasing）
自動摘要（英語：Automatic summarization）	多文檔摘要（英語：Multi-document summarization）句子抽取（英語：Sentence extraction）文本簡化（英語：Text simplification）
分佈語義（英語：Distributional semantics）模型	潛在語義學 Seq2Seq模型 Word2vec 語言模型大型語言模型基礎模型 LLaMA ChatGPT GPT-4 文心一言詞嵌入
機器翻譯	電腦輔助翻譯基於實例（英語：Example-based machine translation）基於規則（英語：Rule-based machine translation）
自動識別與數據採集	語音識別語音合成光學字符識別自然語言生成提示工程
主題模型	彈珠分佈（英語：Pachinko allocation）隱含狄利克雷分佈潛在語義索引
計算機輔助審查（英語：Computer-assisted reviewing）	自動作文評分（英語：Automated essay scoring）語料庫檢索工具（英語：Concordancer）文法檢查器（英語：Grammar checker）預測文本（英語：Predictive text）拼寫檢查語法猜測（英語：Syntax guessing）
自然語言用戶界面（英語：Natural language user interface）	自動在線助手聊天機械人文字冒險遊戲問答系統