資料探勘

Data Mining

從大數據中發掘 patterns 的過程

詳細解釋

資料探勘(Data Mining)是從大量數據中發現模式、關聯和知識的過程,結合統計學、機器學習和數據庫技術。

與相關領域的關係:

  • 機器學習 (ML):資料探勘使用ML算法,但更強調發現可解釋的模式
  • 統計學:提供理論基礎和假設檢驗
  • 數據庫:高效的數據存儲和查詢
  • 資料科學:資料探勘是數據科學的核心組成部分

主要任務:

  • 分類:預測離散類別(如客戶流失預測)
  • 回歸:預測連續值(如銷售額預測)
  • 聚類:發現數據中的自然分組(聚類 (Spectral Clustering)
  • 關聯規則:發現項目的共現模式(如購物籃分析)
  • 異常檢測:識別異常或離群值
  • 序列模式:發現時間序列中的模式

經典算法:

應用領域:

  • 零售:顧客細分、購物籃分析、推薦系統
  • 金融:信用評分、詐騙檢測、風險管理
  • 醫療:疾病預測、藥物相互作用
  • 電信:客戶流失預測、網絡優化
  • 製造:預測性維護、質量控制

流程(CRISP-DM):

  1. 業務理解 → 2. 數據理解 → 3. 數據準備 → 4. 建模 → 5. 評估 → 6. 部署

資料探勘是將原始數據轉化為可執行洞察的關鍵技術。

探索更多AI詞彙

查看所有分類,繼續學習AI知識