Hugging Face Datasets (資料集庫)

Hugging Face Datasets

Hugging Face 的 Python 庫,以 Apache Arrow 載入與處理 自然語言處理 (NLP)、視覺與語音資料集,與 PyTorch (Torch Compile)/TensorFlow 整合。

詳細解釋

Hugging Face Datasets 是 Hugging Face 生態的資料集庫,可從 Hub 或本地載入數千個資料集,以 load_dataset() 一行載入,底層用 Apache Arrow 做零拷貝與省記憶體。支援預處理、分詞、與 PyTorch (Torch Compile)/TensorFlow 的 DataLoader 整合。常用於 自然語言處理 (NLP)電腦視覺 與語音任務的訓練與評估。與 Hugging FacePyTorch (Torch Compile)自然語言處理 (NLP) 相關。

探索更多AI詞彙

查看所有分類,繼續學習AI知識