大數據

Big Data

規模、速度、多樣性超傳統工具能處理的資料集合

詳細解釋

大數據(Big Data)指傳統數據處理軟體無法有效處理的海量、高速或多樣化的數據集,通常用「5V」特徵來描述。

5V特徵:

  • Volume(大量):TB到PB級別的數據規模
  • Velocity(高速):數據產生和處理速度快
  • Variety(多樣):結構化、半結構化和非結構化數據
  • Veracity(真實性):數據質量和可信度參差不齊
  • Value(價值):從數據中提取有用信息的潛力

技術架構:

  • 存儲:HDFS、雲端運算存儲、NoSQL數據庫
  • 處理:Apache Hadoop、Apache Spark、資料管線
  • 分析:分散式計算、流處理、批次處理
  • 視覺化:大規模數據圖表和儀表板

應用場景:

  • 電子商務:用戶行為分析和推薦系統
  • 智慧城市:交通流量優化和能源管理
  • 醫療健康:疾病預測和藥物發現
  • 金融服務:風險評估和欺詐檢測

大數據技術使機器學習 (ML)能夠處理更大規模的數據,提升模型準確性。

探索更多AI詞彙

查看所有分類,繼續學習AI知識