建議此條目或章節與文本挖掘合并。(討論) |
建議将此條目或章節併入文本挖掘。(討論) |
此條目需要擴充。 (2008年6月11日) 请協助改善这篇條目,更進一步的信息可能會在討論頁或扩充请求中找到。请在擴充條目後將此模板移除。 |
此條目没有列出任何参考或来源。 (2008年6月11日) 維基百科所有的內容都應該可供查證。请协助補充可靠来源以改善这篇条目。无法查证的內容可能會因為異議提出而被移除。 |
文字探勘,也被稱為文本挖掘、文字採礦、智慧型文字分析、文字資料探勘或文字知識發現,一般而言,指的是從非結構化的文字中,萃取出有用的重要資訊或知識。文字探勘是一個剛起步的學科領域,它是透過資訊擷取、資料探勘、機械學習、統計學、電腦語言學來達成。大部分的資訊(超過80%)都是以文字儲存,因此,文字探勘被認為是有高度的潛在商業價值。