人機協作
Human-AI Collaboration
人類與AI共同完成任務的模式
三星 (與 AI)
Samsung (AI)
在 AI 領域提供手機端 NPU(Exynos)、Bixby、[[mobile-ai]] 與半導體(HBM、代工),與 [[qualcomm]]、[[nvidia]] 有生態重疊。
大型語言模型 (大語言模型 / 大模型)
Large Language Model (LLM) (LLM / Large Language Model)
在大量文本數據上訓練、能理解和生成自然語言的AI模型
大數據
Big Data
規模、速度、多樣性超傳統工具能處理的資料集合
內容樞紐頁(Pillar Page)
Pillar Page
負責總覽一整個主題、並串起多篇延伸文章的核心頁面,是主題集群的中心節點。
分類
Classification
預測離散類別
反向連結(Backlink)
Backlink
從其他網站指向你網站的超連結,像是別人投給你的「信任票」,是搜尋引擎評估權威度的重要指標。
引用
Citations
AI回答時標註資料來源
文生圖 (文字生圖 / Text-to-Image)
Text-to-Image (T2I)
通過文字描述生成圖像的AI技術
文件系統
File System
組織和管理電腦檔案的系統
主題集群(Topic Cluster)
Topic Cluster
圍繞同一核心主題規劃多篇延伸文章與互相連結的內容結構,讓網站在單一主題上展現完整深度。
可靠性
Reliability
系統穩定運行不故障的程度
生成式AI
Generative AI
能創造文字、圖像、音訊等新內容的AI技術
全自動模式 (Autopilot)
Autopilot (autopilot / full automation)
AI 或系統在極少或無人為介入下自主完成整段流程的運作模式
自然語言處理 (NLP)
Natural Language Processing (NLP)
讓電腦理解與生成人類語言的技術
行內編輯
Inline Edit
Cmd+K 等行內 AI 編輯模式
低代碼
Low-code
以最少編程開發應用
吞吐量
Throughput
單位時間內處理的請求數
技術 SEO(Technical SEO)
Technical SEO
專注在網站速度、結構、安全性與可抓取性等「地基」,確保搜尋引擎看得到也看得懂網站內容的 SEO 面向。
技術奇點 (Singularity)
Singularity (technological singularity)
AI 超越人類智能後技術進步不可預測、不可控的假想時刻
技術樂觀主義 (Technological Optimism)
Technological Optimism (technological optimism)
相信技術進步能解決人類重大問題的立場,與謹慎或悲觀論相對
延遲
Latency
從請求到獲得回應的時間
爬蟲(Crawler / Spider)
Crawler (Web Crawler / Spider)
自動在網頁之間爬行並蒐集資料的程式,是搜尋引擎了解網站的第一步。
封閉式商用模型 (Proprietary Models)
Proprietary Models (proprietary models)
僅透過 API 或授權使用、不開源權重的商業模型
英特爾 (與 AI/ML)
Intel (AI & ML)
提供 CPU、Gaudi 加速器、OpenVINO 與 oneAPI 等 AI 推論與訓練的硬體與軟體生態。
計算機 (Calculator)
Calculator
用於數值或公式運算的工具,含站內收益/回本計算機與 [[llm]] 的計算器工具。
負載均衡
Load Balancing
將請求或流量分散到多台伺服器或 [[inference]] 實例,以提升可用性與吞吐,常見於 [[kubernetes]] 與 [[mlops]] 服務。
差異對照檢視
Diff View
程式碼變更前後對照檢視
特斯拉 (與 AI/自駕)
Tesla (AI & Autopilot)
以 FSD、Dojo 與車載 [[computer-vision]] 聞名的自駕與 AI 應用者,大量使用 [[neural-network]] 與 [[nvidia]]/自研硬體。
狹義AI
Narrow AI
專注單一任務的AI
索引(Search Index)
Search Index
搜尋引擎用來快速查找網頁的巨大資料庫,像是為整個網路建立的目錄卡片系統。
訓練 (模型訓練)
Training (Model Training)
用數據調整模型參數的過程
訓練集
Training Set
用於訓練模型的數據子集
高通 (與 AI)
Qualcomm (AI)
提供手機與邊緣 AI 晶片(Snapdragon、AI Engine)與 Qualcomm AI Stack,主打 [[mobile-ai]] 與 [[inference]] 部署。
副駕駛
Copilot
輔助人類的AI協作介面與產品形態
終端機 AI
Terminal AI
終端機指令的 AI 輔助
聊天機器人 (對話機器人 / Chatbot)
Chatbot (Chat Bot)
能與人類進行自然對話的AI程式
最大token數
Max Tokens
限制生成長度的參數
最小可行產品
Minimum Viable Product (MVP)
以最簡單形式驗證核心商業假設的產品版本
提示詞 (Prompt / 咒語)
Prompt (AI Prompt)
給AI語言模型的輸入指令,引導模型生成期望輸出
測試集
Test Set
用於最終評估的未參與訓練數據
無代碼開發
No-Code Development
無需編寫程式碼即可構建應用的開發方式
無代碼AI
No-code AI
無需編程建AI應用
華為 (與 AI/ML)
Huawei (AI & ML)
提供 Ascend NPU、MindSpore 框架、華為雲 AI 與盤古大模型等 AI 硬體、軟體與雲端服務。
虛擬助手
Virtual Assistant
能以對話方式協助用戶的AI程式
虛擬實境 (VR)
Virtual Reality (VR)
以頭戴裝置與沉浸式畫面營造 3D 虛擬環境的技術,常結合 [[computer-vision]]、手勢與 [[multimodal-ai]] 做互動與生成內容。
雲端運算
Cloud Computing
透過網路使用遠端運算資源
意識 / 感知 (Sentience)
Sentience (sentience)
是否具備主觀感受與知覺的哲學與科學爭議,常用於討論 AI 是否「有感覺」
感覺編程 (氛圍編程 / Vibe Coding)
Vibe Coding (vibe coding / intuition-driven coding)
以自然語言與 AI 溝通、依賴感覺與直覺的快速開發模式,由 Andrej Karpathy 於 2025 年初提出
搜尋生成體驗 (SGE / AI Overviews)
Search Generative Experience (SGE / AI Overviews)
Google 等搜尋引擎在結果頁以 AI 生成摘要與回答的新形態,如 AI Overviews
搜尋意圖(Search Intent)
Search Intent
使用者在輸入關鍵字背後真正想解決的問題或達成的目的,比關鍵字本身更重要。
毀滅論者 (Doomer)
Doomer (AI doomer)
擔心 AI 對人類存亡或社會造成重大威脅、主張嚴謹監管與減速的立場
準確率
Accuracy
預測正確的樣本比例
詮釋資料
Metadata
描述數據屬性的資料
資料科學
Data Science
結合統計、程式與領域知識從數據中提取洞察的學科
資料標註
Data Labeling
為數據添加標籤的過程
電腦視覺
Computer Vision
讓機器看見並理解影像的AI技術
圖形處理單元 (GPU / 圖形處理器)
GPU (Graphics Processing Unit)
專用於並行運算的硬體,AI訓練與推論的關鍵
圖靈測試
Turing Test
判斷機器是否具有人類智慧的傳統測試方法
對話式AI
Conversational AI
以對話方式互動的AI
演算法
Algorithm
解決特定問題的一系列步驟或指令
算力富豪 (Compute-rich)
Compute-rich (compute-rich)
形容擁有極多算力資源的實體(如大型科技公司),主導大模型訓練與基礎設施
精實創業
Lean Startup
以快速實驗和迭代驗證商業假設的創業方法論
網站地圖(Sitemap)
XML Sitemap
列出網站重要頁面的清單檔案,主動告訴搜尋引擎「哪些頁面值得優先來看」。
語音助手
Voice Assistant
以語音互動的AI助手
影子 AI (Shadow AI)
Shadow AI (shadow AI)
員工未經公司授權私下使用的 AI 工具與服務,帶來合規與資安風險
數據隱私 (Data Privacy)
Data Privacy (data privacy)
個人與敏感數據的收集、使用與保護規範
模型架構
Model Architecture
[[neural-network]] 或 ML 模型的層級結構、連接方式與模組設計,如 [[transformer]]、[[cnn]]、ResNet 等。
模型訓練
Model Training
以資料與損失函數透過 [[backpropagation]]、[[gradient-descent]] 等更新參數,使模型擬合目標的過程;含 [[distributed-training]]、[[mixed-precision-training]] 等。
線性迴歸
Linear Regression
以特徵的線性組合預測連續目標的 [[machine-learning]] 方法,常用最小二乘或 [[gradient-descent]] 求解。
機器人理財顧問 (Robo-Advisor)
Robo-Advisor (robo-advisor)
以演算法與 AI 提供自動化投資建議與資產配置的數位理財服務
機器學習 (ML)
Machine Learning (ML)
讓電腦從數據中自動學習模式,而無需明確編程
護城河 (Moat)
Moat (competitive moat)
AI 公司難以被複製的競爭優勢,如數據、算力、品牌、生態
驗證集
Validation Set
用於調參與早停的數據子集
Adobe Firefly
Adobe Firefly
Adobe 的商業安全 AI 繪圖
AI (人工智能)
Artificial Intelligence (AI)
讓機器展現需要人類智慧才能完成的能力的技術
AI 素養
AI Literacy
理解與善用 AI 的基本能力
AI 精神病 (AI Psychosis)
AI Psychosis (AI psychosis)
非正式術語,描述人類對 AI 產生過度情感依賴或幻覺連結的現象
AI訂閱
AI Subscription
按月付費使用AI服務
AI培訓
AI Training
教授AI使用與開發的培訓
AI新創
AI Startup
以AI為核心的初創公司
AI寫作
AI Writing
使用AI進行內容創作和文案撰寫
AI導師
AI Tutor
AI教學助手
AI翻譯
AI Translation
使用AI進行高質量多語言翻譯
AIGC
AI Generated Content
由AI生成的內容
Amazon Mechanical Turk (MTurk / 眾包標註)
Amazon Mechanical Turk (MTurk)
Amazon 的眾包平台,將標註與微任務發給全球工作者,常用於 [[data-labeling]] 與 AI 訓練資料。
Anthropic
Anthropic
開發Claude的AI安全公司
Anthropic API (Claude API)
Anthropic API
Anthropic 提供的 API,讓開發者呼叫 Claude 系列 [[llm]] 進行對話、補全與工具使用。
Appen (資料標註與 AI 訓練資料)
Appen
提供資料標註、蒐集與評估的 AI 訓練資料服務商,支援多模態與多語言。
Apple (蘋果與 AI)
Apple (AI & ML)
蘋果在 AI 上的產品與技術:Siri、Apple Intelligence、晶片與隱私優先的端側推理。
AWS (亞馬遜雲端運算服務)
Amazon Web Services (AWS)
亞馬遜提供的雲端平台,涵蓋運算、儲存、[[mlops]] 與 AI 服務,[[sagemaker]] 為其 ML 核心。
BigQuery (Google 雲端資料倉儲)
Google BigQuery
Google Cloud 的無伺服器資料倉儲與分析平台,支援 SQL、Spark、內建 ML 與即時分析。
Bolt.new
Bolt.new
瀏覽器內的 Full-stack Web 生成工具
Canva Magic Studio
Canva Magic Studio
Canva 的 AI 工具組
ChatGPT
ChatGPT
OpenAI 推出的對話式 AI 助手,全球最普及的 [[llm]] 應用產品
Claude 3 (Opus / Sonnet / Haiku)
Claude 3
Anthropic 於 2024 年推出的多模態 [[llm]] 家族,含 Opus、Sonnet、Haiku 三檔,支援長上下文與視覺輸入。
Codeium
Codeium
Cursor 的主要競爭對手,提供強大免費層級
Colab
Google Colab
免費雲端Jupyter與GPU
Copilot Chat
Copilot Chat
與程式碼庫進行對話的 GitHub Copilot 介面
CPU (中央處理器)
CPU (Central Processing Unit)
中央處理器,電腦的主要計算元件
Cursor
Cursor
目前最紅的 AI 原生程式碼編輯器
DALL-E
DALL-E
OpenAI的文生圖AI模型
DeepL Write
DeepL Write
AI 寫作修正工具
e/acc (有效加速主義 / Effective Accelerationism)
Effective Accelerationism (e/acc)
主張全力推動科技(尤其 AI)發展、較不強調風險控制的科技哲學派別
ElevenLabs
ElevenLabs
語音合成與克隆的標竿
Fireflies.ai
Fireflies.ai
會議自動摘要助手
Fotor
Fotor
多功能線上相片編輯 AI
Gamma.app
Gamma.app
AI 生成簡報 (PPT)
GCP (Google 雲端平台)
Google Cloud Platform (GCP)
Google 的公有雲平台,提供 [[vertex-ai]]、[[bigquery]]、運算與儲存等 AI/ML 與資料服務。
Gemini
Gemini
Google開發的多模態LLM系列
Git (版本控制)
Git
分散式版本控制系統,追蹤程式碼與設定變更,為 [[mlops]] 與協作開發的基礎。
GitHub Copilot (副駕駛 / 程式碼補全)
GitHub Copilot (Copilot)
GitHub 與 OpenAI 推出的 AI 程式碼補全與生成服務,整合於 IDE,為 [[copilot]] 形態代表產品
Google (與 AI/ML)
Google (AI & ML)
提供 [[gcp]]、[[vertex-ai]]、[[bigquery]]、Gemini、[[transformer]] 論文與 TensorFlow 等 AI 生態。
GPT-4o
GPT-4o
OpenAI 的旗艦多模態模型
GPT-4o-mini
GPT-4o-mini
高性價比的輕量化多模態模型
GPT-4V (GPT-4 Vision / 視覺多模態)
GPT-4V (GPT-4 Vision)
OpenAI 的 [[gpt]]-4 視覺版,可接受影像輸入並與文字一起理解與生成,為多模態 [[llm]]。
GPU 短缺 (GPU Shortage)
GPU Shortage (GPU shortage)
AI 訓練與推理需求導致 GPU 供不應求、價格高漲的現象
Grafana (監控與可觀測性)
Grafana
開源儀表板與可觀測性平台,串接 [[prometheus]] 等資料源,用於 [[mlops]] 與基礎設施監控。
Grammarly AI
Grammarly AI
語法檢查的 AI 進化版
Helm (Kubernetes 套件管理)
Helm
[[kubernetes]] 的套件管理工具,以 Chart 打包與安裝應用,支援版本、升級與回滾。
Hugging Face Datasets (資料集庫)
Hugging Face Datasets
[[hugging-face]] 的 Python 庫,以 Apache Arrow 載入與處理 [[nlp]]、視覺與語音資料集,與 [[pytorch]]/TensorFlow 整合。
Hugging Face Hub
Hugging Face Hub
AI 界的 GitHub
Jupyter
Jupyter
互動式筆記本開發環境
Kaggle
Kaggle
數據科學競賽與學習平台
Label Studio (開源資料標註)
Label Studio
開源 [[data-labeling]] 工具,支援多模態標註、主動學習與 [[llm]] 微調資料,可自架或雲端。
Lovable
Lovable
快速生成完整 Web 應用的 AI 工程師
Make(工作流自動化平台)
Make (Workflow Automation Platform)
以視覺化拖拉方式串接不同服務與 API 的自動化平台,適合 No-code 使用者建立工作流。
Microsoft Azure (微軟雲端)
Microsoft Azure
微軟的雲端平台,提供 [[azure-ml]]、OpenAI 整合、認知服務與 [[kubernetes]] 等 AI/ML 能力。
Midjourney
Midjourney
藝術感最強的封閉源生圖工具
No-code(零程式碼開發)
No-code Development
讓非工程師透過圖形化介面與組件拖拉,建立網站、應用程式與自動化流程的開發方式。
NotebookLM
NotebookLM
Google 基於文檔的 AI 研究工具
Notion AI
Notion AI
Notion 筆記軟體內建 AI 助理
NVIDIA (與 AI 硬體/軟體)
NVIDIA
提供 [[gpu]](如 A100、H100)、CUDA、cuDNN 與 AI 軟體棧,為 [[distributed-training]] 與 [[inference]] 的主流硬體與生態。
OpenAI
OpenAI
開發GPT與ChatGPT的AI公司
OpenAI Moderation API
OpenAI Moderation
OpenAI 提供的內容審核 API,對文字進行有害類別標記(仇恨、暴力、性等),常用於 [[llm]] 輸入輸出過濾與合規。
Otter.ai
Otter.ai
會議紀錄與逐字稿 AI
Perplexity AI
Perplexity AI
以即時搜尋與引用為核心的 AI 問答服務
Remove.bg
Remove.bg
自動去背工具
Replit Ghostwriter
Replit Ghostwriter
Replit 在線 IDE 的 AI 編程助手
Scale AI (標註與數據平台)
Scale AI
提供 [[data-labeling]]、合成數據與評估服務的數據平台,客戶涵蓋自駕、國防與 [[llm]] 訓練,與 [[label-studio]]、Appen 同屬標註生態。
Scikit-learn
Scikit-learn
Python機器學習標準庫
Search API (搜尋 API)
Search API
泛指提供搜尋能力的 API,如 Google Custom Search、Bing、Elasticsearch;[[llm]] 應用常以 RAG 結合搜尋 API 取得即時資料。
SEM(搜尋引擎行銷)
Search Engine Marketing (SEM)
透過付費廣告在搜尋結果中取得曝光的行銷作法,與自然排序的 SEO 互補而非互斥。
SEO(搜尋引擎優化)
Search Engine Optimization (SEO)
透過技術與內容策略,讓網站在搜尋結果中獲得更高自然排序,帶來免費流量。
Spaces
Hugging Face Spaces
Hugging Face 的 Demo 託管平台
Stack Overflow AI
Stack Overflow AI
技術問答的 AI 整合
Suno v4
Suno v4
目前最流行的 AI 詞曲創作工具
Trae
Trae
ByteDance 推出的 AI 程式碼編輯器
Udio
Udio
高品質 AI 音樂生成
v0.dev
v0.dev
Vercel 推出的 UI 程式碼生成工具
Whisper
Whisper
OpenAI 開源的多語言語音識別模型
Windsurf
Windsurf
Codeium 推出的下一代 AI Flow 編輯器
二元交叉熵
Binary Cross-Entropy
二分類常用的損失函數
人在迴路
Human-in-the-loop
關鍵決策由人類審核的人機協作模式
人機互動學
HAI (Human-AI Interaction)
研究如何與 AI 更自然地協作
人臉辨識
Face Recognition
識別或驗證人臉身份的技術
上下文工程 (Context Engineering)
Context Engineering (context engineering)
2025 年興起的術語:在 AI 開發中,管理上下文(記憶、工具、數據源)的能力比單純寫程式更重要
上下文長度
Context Length
模型可接受的最大token數
上下文填充
Context Stuffing
將大量資訊塞入 prompt 的技巧
上下文感知補全
Context-aware Completion
依專案上下文提供智慧補全
下詞預測
Next-token Prediction
預測序列中下一個token的訓練目標
大型多模態模型
LMM (Large Multimodal Models)
原生支援多模態的大模型
子智能體
Sub-agent
被主Agent調用的子Agent
小型語言模型
SLM
Small Language Models,如Phi、Gemma
工作流自動化
Workflow Automation
具備推理能力的自動化
工作記憶
Working Memory
短期/對話內記憶
工具使用
Tool Use
LLM調用外部工具的能力
不平衡數據
Imbalanced Data
類別分布不均的訓練數據
元數據過濾
Metadata Filtering
依元數據篩選檢索
公平性
Fairness
AI系統對不同群體無歧視的品質
分詞
Tokenization
將文本切分為模型可處理的token單位
切片
Chunk
RAG中切分後的文本片段
反應式 vs 主動式 AI
Reactive vs Proactive AI
被動回應 vs 主動出擊的 AI
天氣預報
Weather Forecasting
用AI預測天氣
少樣本學習
Few-shot Learning
僅用少量範例讓模型學會新任務
幻覺率
Hallucination Rate
模型產生虛構或錯誤信息的比例
文本分類
Text Classification
將文本標註為預定義類別
文本摘要
Text Summarization
將長文本濃縮為簡短摘要
文本編碼器
Text Encoder
將文本轉為向量的編碼器
文件智慧 (Document Intelligence)
Document Intelligence (document intelligence)
以 AI 讀取、解析、分類與擷取文件內容的技術與服務
文字轉語音 (TTS)
Text-to-Speech (TTS)
將文字轉為自然語音
文字轉影片
T2V (Text-to-Video)
由文字描述生成影片
欠擬合 (擬合不足)
Underfitting
模型過於簡單無法捕捉數據規律
世界模型
World Model
對環境與因果規律的內部表徵,用於預測下一狀態或生成軌跡,常見於 [[reinforcement-learning]]、視訊生成與規劃。
主權AI
Sovereign AI
國家級AI能力
代碼文件索引化
Documentation Indexing
將程式碼與文件建為可檢索索引
半監督式學習
Semi-supervised Learning
結合少量標記與大量未標記數據的學習方法
去重處理 (Dedup) (Near Dedup)
Deduplication (Near Dedup)
移除訓練集重複
召回率
Recall
實際正例中被正確預測的比例
可解釋性
Explainability
理解AI決策依據的能力
可擴展性
Scalability
系統隨負載增長而擴充的能力
可靈 Kling
Kling
中國領先的影片生成 AI
平均絕對誤差
MAE
預測與真實差絕對值的平均
本地 AI
Local AI
離線在本機運行的 AI
正規化
Normalization
將數據縮放至特定範圍的預處理
生成式問答
Generative QA
自由生成答案的問答
生物醫療 AI (BioAI)
BioAI (biological / healthcare AI)
應用於生物學、醫藥研發與醫療照護的 AI 技術統稱
目標函數
Objective Function
優化問題中要最大化或最小化的函數
交叉熵
Cross-Entropy
分類任務的標準損失
交叉驗證
Cross-validation
輪流將數據分為訓練與驗證集的評估方法
任務拆解
Task Decomposition
將大任務拆為子任務
任務型對話
Task-oriented Dialogue
完成特定任務的對話系統
光學字元辨識 (OCR)
OCR (Optical Character Recognition)
從影像中辨識與擷取文字的技術
全能多模態模型
Omni-model
原生支援圖/影/音的多模態模型
合成媒體
Synthetic Media
AI 生成的圖像、影片、語音
合成數據
Synthetic Data
由AI或模擬生成的訓練數據
多模態
Multimodal
能同時處理文字、圖像、音訊等多種輸入的模型
多模態 AI
Multimodal AI
同時處理多種輸入模態(文字、影像、語音等)的模型與應用,如 [[gpt-4v]]、[[clip]]、語音助理與視覺問答。
多模態LLM
Multimodal LLM
能處理圖文等多種輸入的LLM
收斂
Convergence
訓練過程中損失趨於穩定的狀態
早停法
Early Stopping
驗證集表現不再提升時停止訓練
有害內容過濾
Harmful Content Filtering
過濾有害輸出
池化
Pooling
縮小特徵圖尺寸的取樣層
自主系統 (Autonomous Systems)
Autonomous Systems (autonomous systems)
在極少人為介入下能持續感知、決策並執行動作的系統
自主智能體
Autonomous Agent
能自主完成任務的Agent
自主會計
Autonomous Accounting
AI 全自動處理財務審核
自我修正
Self-Correction
發現錯誤並修正
自動駕駛
Autonomous Driving
無需人類駕駛的車輛自主導航技術
自動擴展
Auto-scaling
依負載自動擴縮
自然語言生成
NLG
讓機器產生人類語言的技術
自然語言理解
NLU
讓機器理解人類語言意圖與語義的技術
行動端 AI
Mobile AI
在手機、平板與邊緣裝置上執行的 [[inference]] 與輕量 [[machine-learning]],常搭配模型壓縮與 [[onnx]] 部署。
串流輸出
Streaming
逐token返回生成結果
冷啟動
Cold Start
服務初次載入時的延遲問題
冷啟動問題
Cold Start Problem
推薦或推論服務的冷啟動
利用率
Utilization
資源被有效使用的比例,如 [[gpu]] 利用率(算力或記憶體使用率),用於 [[profiler]] 與 [[roofline-model]] 效能分析。
均方誤差
MSE
預測與真實值差平方的平均
形變動畫
Morphing
兩圖像間的平滑過渡
批次大小
Batch Size
每次梯度更新使用的樣本數量
批次推論
Batch Inference
一次處理多個請求
技術奇點
Technological Singularity
AI超越人類的假想時刻
改寫
Paraphrasing
保持原意換句話說
束搜尋
Beam Search
保留多個候選序列的解碼策略
每秒Token數
TPS
Token per second,推論速度
決策樹
Decision Tree
以樹狀結構做分類或迴歸的模型
系統提示詞
System Prompt
設定LLM全局行為與角色的隱藏指令
車聯網
V2X
Vehicle-to-Everything
防護欄
Guardrails
防止AI輸出違規內容的過濾機制
事件串流 (Event Streaming)
Event Streaming
以事件為單位持續發布、訂閱與處理的即時資料架構,常以 [[kafka]]、[[apache-flink]] 實作。
供應鏈優化
Supply Chain Optimization
用AI優化供應鏈決策
協作智能體
Collaborative Agents
協作完成任務的Agent
卷積
Convolution
用濾波器在輸入上滑動提取特徵的運算
卸載 (Offloading)
Offloading
將 [[gpu]] 記憶體不足的張量或狀態暫存到 CPU/磁碟,以換取更大模型或 batch,常用於 [[llm]] 訓練與 [[inference]]。
命名實體識別
NER
識別文本中人名、地名等實體的NLP任務
垂直領域 AI
Vertical AI
專注單一領域的 AI(如醫療、法律)
垂直領域大模型
Vertical LLMs
專注單一產業的 LLM
奇異值分解 (SVD)
Singular Value Decomposition (SVD)
將矩陣分解為 U Σ V^T,用於降維、推薦、壓縮與 [[llm]] 的 LoRA 等低秩近似,為線性代數與 [[machine-learning]] 的基礎工具。
抽取式問答
Extractive QA
從文本片段抽取答案
法律科技AI
Legal Tech AI
法律領域的AI應用
版本控制
Version Control
追蹤程式碼與模型變更的工具與實踐
版權盾
Copyright Shield
AI侵權訴訟的賠償承諾
物理 AI
Physical AI
AI 與機器人、IoT 深度結合
狀態管理
State Management
管理Agent或應用的狀態
知識截止日期
Knowledge Cutoff
模型訓練數據的時間邊界
空間智慧 (Spatial Intelligence)
Spatial Intelligence (spatial intelligence)
理解與推理空間關係、幾何、導航與 3D 結構的 AI 能力
金融科技 AI (FinTech AI)
FinTech AI (financial technology AI)
應用於金融服務的 AI,含風控、理財、合規與文件處理
長上下文
Long Context
支持超長輸入的LLM能力
長期記憶
LTM
持久化儲存的記憶
非監督式學習
Unsupervised Learning
從未標記數據中發現模式的學習方法
思考型模型
Thinking Models
具內部推理過程的模型(如 OpenAI o1)
思考過程顯示
Thinking Process
展現模型中間推理的顯示(如 o1)
思維鏈 (CoT / Few Shot CoT)
Chain-of-Thought (CoT / Few Shot CoT)
引導LLM逐步推理的提示技巧
持續整合部署
CI/CD
自動化測試與部署的實踐
指令模型
Instruct Model
經過對齊可對話的模型
指令遵循
Instruction Following
按人類指令執行的能力
流程自動化
RPA
用軟體機器人自動化重複性流程
科學AI
AI for Science
AI4S,科學研究中的AI
計算機模擬實驗
In silico
電腦模擬代替實體實驗
負面提示詞
Negative Prompt
指定生成時不要出現的內容
負責任AI
Responsible AI
負責任地開發與部署AI
迭代優化
Iterative Refinement
多次迭代改進輸出
重複懲罰
Repetition Penalty
降低重複輸出的取樣參數
風格遷移
Style Transfer
將一張圖的風格套用到另一張的技術
個人識別資訊去識別化
PII Stripping
移除PII以符合法規
個性化行銷
Personalized Marketing
依個人偏好定製行銷內容
個性化醫療 (Personalized Medicine)
Personalized Medicine (precision medicine)
依個人基因、病史與數據提供量身訂製的診療與用藥建議
原型經濟
Prototype Economy
快速產出原型、迭代驗證的商業模式
效能剖析器
Profiler
量測程式或模型在 CPU/[[gpu]] 上的執行時間、記憶體與瓶頸的工具,[[pytorch]]、TensorFlow 等框架皆內建 profiler。
時間序列
Time Series
按時間排列的數據
特殊應用積體電路
ASIC
專用硬體晶片
特徵工程
Feature Engineering
從原始數據構造有意義特徵的過程
特徵選擇
Feature Selection
選取最有預測力的特徵子集
神經處理單元
NPU
專為神經網絡運算設計的處理器
神經網絡 (類神經網路)
Neural Network (NN)
模仿人腦神經元連接方式的計算模型
訓練週期
Epoch
模型遍歷完整訓練集一次的單位
訓練數據
Training Data
用於教導AI模型學習模式的數據集
記憶 (Memory Optimization) (Memory Wall)
Memory (Memory Optimization) (Memory Wall)
Agent儲存與調用歷史的機制
記憶檢索
Memory Retrieval
從記憶中找回相關資訊
退出權
Right to Opt-out
創作者要求作品不用於訓練
高斯分布
Gaussian Distribution
正態分布
高精地圖
HD Maps
高精度地圖
偏見
Bias
AI因數據或設計不公而產生的歧視結果
偏見緩解
Bias Mitigation
減少模型偏見
停止序列
Stop Sequences
遇此序列即停止生成
停用詞
Stopwords
預處理時通常移除的常見無實義詞
動作空間
Action Space
RL中可選動作的集合
動態捕捉
Motion Capture
擷取人體或物體在空間中的運動軌跡(關節、姿態),常用於動畫、遊戲、[[computer-vision]] 與具身 AI 的動作資料。
動態提示詞
Dynamic Prompting
依情境動態生成 prompt
問責
Accountability
AI決策責任歸屬
問答系統
Question Answering
根據上下文回答問題的NLP任務
基礎模型
Foundation Model
可泛化到多任務的大型預訓練模型
基礎模型
Base Model
未經指令對齊的預訓練模型
專家系統
Expert System
模仿人類專家決策的規則型AI系統
專案層級上下文
Project Context
專案層級的上下文理解
張量處理單元 (TPU / 張量處理器)
TPU (Tensor Processing Unit)
Google專為深度學習設計的運算硬體
強AI
Strong AI
具人類級通用智能
情感分析
Sentiment Analysis
分析文本中情感傾向的NLP任務
情感計算
Affective Computing
識別與模擬情感
情境式學習
In-context Learning
LLM從提示中的範例學習任務的能力
排名演算法(Ranking Algorithm)
Ranking Algorithm
在龐大索引資料中決定「哪一頁該排在前面」的一整套計算規則與模型。
採樣步數
Steps
擴散去噪的迭代次數
推理 (模型推理) (Inference Optimization) (Variational Inference)
Inference (Model Inference) (Inference Optimization) (Variational Inference)
使用訓練好的AI模型對新數據進行預測的過程
推論延遲
Inference Latency
從請求到回應的時間
推薦系統
Recommendation System
根據用戶偏好推薦內容的AI系統
啟發法
Heuristics
以經驗為基礎的近似解題策略
教育科技 AI
EdTech AI
AI 輔助教學與個人化學習
深度偽造
Deepfake
利用AI製作的逼真虛假圖像或影片
深度學習 (深度神經網絡)
Deep Learning (DL)
使用多層神經網絡從數據中學習複雜模式的機器學習方法
混合精度訓練
Mixed Precision Training
以 FP16/BF16 為主、FP32 為輔的 [[neural-network]] 訓練方式,搭配 loss scaling 以兼顧速度與數值穩定;與 [[mixed-precision]] 同義。
混淆矩陣
Confusion Matrix
展示分類預測與真實標籤對應的表格
產出物註冊表
Artifact Registry
管理模型與資料版本
異常檢測
Anomaly Detection
識別偏離正常的樣本
視頻生成
Video Generation
由文字或圖像生成影片
視覺問答
VQA
根據圖像回答問題
視覺語言模型
VLM
結合視覺與語言的模型
視覺語言模型
VLM (Vision-Language Model)
可理解圖像並產出文字的模型
規劃與執行
Plan-and-Execute
先規劃再執行的模式
貪婪解碼
Greedy Decoding
每步選機率最高token的解碼方式
透明度
Transparency
AI決策過程可追溯
通用人工智慧
Artificial General Intelligence
具備與人類相當的全面認知能力的AI
通用領域 AI
Horizontal AI
跨領域通用的 AI 平台
通用AI
General AI
能處理各類任務的假想AI
連續批次 (Continuous Batching)
Continuous Batching
[[llm]] [[inference]] 優化:每步解碼後可替換已完成序列為新請求,提高 GPU 利用率與吞吐。
閉源LLM
Closed-source LLM
僅API可用的專有LLM
單元測試自動生成
Unit Test Generation
由 AI 自動生成單元測試
嵌入維度
Embedding Dimension
嵌入向量的大小
嵌入模型
Embedding Model
將文本或圖像轉為向量的模型
提示詞市集
Prompt Marketplace
販售預製提示詞
提示詞鏈接
Prompt Chaining
將任務拆解為多步 prompt
散熱節流
Thermal Throttling
過熱時降頻
智能體人格設定
Agent Persona
Agent 的角色、風格與行為設定
智能體化 AI
Agentic AI
具備自主決策能力的 AI 系統,2025-2026 核心趨勢
智能體即服務
AaaS (Agent-as-a-Service)
以服務形式提供 AI 智能體能力
智能體瀏覽
Agentic Browsing
AI 代替人類操作瀏覽器,如點擊、填表
智慧城市
Smart City
運用AI與IoT優化城市運作
欺詐檢測
Fraud Detection
識別異常或詐騙行為的AI應用
湧現行為 (Emergent Behavior)
Emergent Behavior (emergent behavior)
模型規模達一定門檻後突然出現、未經明確程式設計的能力或行為
無伺服器
Serverless
無需管理伺服器的按需執行模式
無伺服器 AI
Serverless AI
按需擴展的 AI 推論服務
無伺服器GPU
Serverless GPU
按需GPU運算
無條件基本收入
UBI (Universal Basic Income)
政府發給全體公民的定期現金
硬體基礎設施 (Hardware Infrastructure)
Hardware Infrastructure
支撐 AI 訓練與推理的運算與網路設施,含 [[gpu]]、[[gpu-cluster]]、[[infiniband]] 與雲端實例。
程式碼生成 (代碼生成 / Code Generation)
Code Generation (AI Coding)
AI自動生成、補全和優化程式碼
程式碼重構 AI
Refactoring AI
AI 輔助的程式碼重構
結構化輸出
Structured Outputs
強制 LLM 輸出 JSON 等格式
虛擬試穿
Virtual Try-on
AI模擬服飾穿在身上的效果
詞袋模型
Bag of Words
忽略詞序只計詞頻的文本表示方法
超個性化
Hyper-personalization
極精細的個人化
超級智能
Superintelligence
超越人類的通用智能
超參數
Hyperparameter
訓練前需人為設定的模型配置參數
超解析度優化
Upscaling
提升圖像或影片解析度
量化版模型
Quantized Model
如 GGUF/EXL2 的壓縮格式
開放域問答
Open-domain QA
不限領域的問答
開放權重
Open-weight
公開權重但不一定開源授權
開源LLM
Open-source LLM
可自由使用與修改的LLM
集成學習
Ensemble Learning
結合多個模型預測以提升整體表現的方法
馮紐曼架構
Von Neumann Architecture
程式與資料共用記憶體、依序執行的計算機架構,為多數 CPU 的基礎;與 [[von-neumann-bottleneck]] 及類神經形態計算相對。
馮紐曼瓶頸
Von Neumann Bottleneck
[[von-neumann-architecture]] 下 CPU 與記憶體間頻寬與延遲限制,使運算常受記憶體存取所限;[[gpu]] 與 [[roofline-model]] 分析與此相關。
黑盒
Black Box
決策過程不透明、難以解釋的模型
微服務
Microservices
將應用拆為獨立可部署的小服務
微型機器學習
TinyML
在極小裝置上運行ML
意圖檢測
Intent Detection
識別用戶語句背後意圖的NLU任務
感知器
Perceptron
最簡單的神經網絡單元,線性二分類器
損失函數 (Loss Scaling)
Loss Function (Loss Scaling)
衡量模型預測與真實值差異的指標
溫度
Temperature
控制LLM輸出隨機性的取樣參數
裝置端生成式 AI
On-device GenAI
在手機等裝置本地運行生成式 AI
裝置端推論
On-device Inference
在本地裝置上推論
解碼器
Decoder
從內部表示生成輸出的網路部分
資料並行 (Data Parallel)
Data Parallelism (DP)
[[distributed-training]] 方式:每張 GPU 持有一份完整模型副本,各自處理不同資料分片,再同步梯度。
資料探勘
Data Mining
從大數據中發掘 patterns 的過程
資料預處理
Data Preprocessing
訓練前清洗與轉換原始數據的步驟
資料管線
Data Pipeline
數據從採集到模型輸入的處理流程
資料增強
Data Augmentation
透過變換擴充訓練數據的方法
資訊抽取
Information Extraction
從文本中結構化抽取實體與關係
資訊檢索
Information Retrieval (IR)
從大量數據中找出相關資訊的技術
路徑規劃
Path Planning
找尋從起點到終點的路徑
過擬合 (過度擬合 / 過適)
Overfitting
模型過度擬合訓練數據而喪失泛化能力
零樣本學習
Zero-shot Learning
模型在未見過該類別範例下進行預測
預訓練模型
Pretrained Model
在大規模數據上預先訓練的模型
預測
Forecasting
預測未來數值或趨勢
預測分析
Predictive Analytics
用歷史數據預測未來結果的分析方法
預測性維護
Predictive Maintenance
預測設備故障以提前維護
圖生圖
Image-to-Image
基於現有圖像生成或修改新圖像的AI技術
圖像修復
Image Inpainting
填補圖像缺失區域
圖像理解
Image Understanding
理解圖像內容與語義
圖像超解析
Image Super-resolution
提升圖像解析度
圖像擴展
Image Outpainting
延伸圖像邊界
圖說生成
Image Captioning
為圖像自動生成描述
對話系統
Dialogue System
多輪對話的AI系統
演算法公平性
Algorithmic Fairness
演算法對不同群體公平
演算法交易
Algorithmic Trading
用程式自動執行交易的金融應用
監督式學習
Supervised Learning
使用標記數據訓練模型的有監督學習方法
端到端學習
End-to-End Learning
從輸入到輸出一體化學習
精準農業
Precision Agriculture
用感測與AI優化農作決策
精準醫療
Precision Medicine
個人化醫療
精確率
Precision
預測為正例中實際為正的比例
綠色AI
Green AI
低碳永續的AI運算
維度縮減
Dimensionality Reduction
降低特徵維度保留關鍵資訊
網路安全
Cybersecurity
用AI檢測與防禦網路威脅
聚類 (Spectral Clustering)
Clustering (Spectral Clustering)
將樣本分組
認知負荷轉移
Cognitive Load Shifting
將人類的思考成本轉交給 AI
認知運算
Cognitive Computing
模擬人類認知的運算系統
語言建模
Language Modeling
預測序列中下一個詞的任務
語音合成
Voice Synthesis
將文字轉換為自然語音的AI技術
語音合成
Speech Synthesis
將文字轉為語音的技術
語音辨識 (ASR / 自動語音辨識)
Speech Recognition (ASR / Automatic Speech Recognition)
將語音轉為文字的技術
語音轉文字 (STT)
Speech-to-Text (STT)
將語音轉為文字
語料庫
Corpus
用於訓練或評估的文本數據集合
語義搜索
Semantic Search
依意圖而非關鍵字匹配的搜索方式
遠程操作
Teleoperation
遙控操作機器人
影像分類
Image Classification
將整張影像判定為單一類別的視覺任務
影像修復
Image Restoration
修復損壞或低質影像
數位孿生
Digital Twin
實體系統的數位副本
數據卡片
Data Cards
描述數據集的文件
數據抓取
Data Scraping
從網路批量收集訓練數據
數據策展
Data Curating
高品質數據的篩選與清洗
標準化
Standardization
將數據轉為零均值單位方差
模式識別
Pattern Recognition
識別數據中規律的領域
模型中心
Model Hub
共享與下載預訓練模型
模型主權
Model Sovereignty
國家對AI模型的控制
模型卡 (Huggingface Model Cards)
Model Card (Huggingface Model Cards)
記錄模型能力與限制的說明文件
模型卡片
Model Cards
說明模型用途與限制
模型即服務
MaaS
以API形式提供模型
模型快取
Model Caching
快取已載入的模型
模型投毒 (Model Poisoning)
Model Poisoning (model poisoning)
透過竄改模型參數或訓練流程使模型產生惡意行為的攻擊
模型服務
Model Serving
將模型部署為可調用API的過程
模型軍備競賽
Model Wars
大廠競相推出更強 LLM
模型A/B測試
A/B Testing for Models
比較不同模型版本
歐幾里得距離
Euclidean Distance
L2距離
線上學習
Online Learning
模型依序接收樣本或資料流並即時更新參數的 [[machine-learning]] 設定,與批量訓練相對;常見於串流與即時系統。
編排器
Orchestrator
協調多Agent或服務
編碼器
Encoder
將輸入轉為內部表示的網路部分
複合式 AI 系統
Compound AI Systems
由多個模型與工具組合而成
適應性學習
Adaptive Learning
根據學習者表現自動調整內容難度和路徑的教育技術
遷移學習
Transfer Learning
將已學知識應用到新任務的學習方法
閱讀理解
Reading Comprehension
基於給定文本回答問題
餘弦相似度
Cosine Similarity
衡量兩向量夾角的相似度指標
學習率
Learning Rate
梯度下降時每步更新參數的步長
學習率排程
Learning Rate Scheduler
動態調整學習率
學習率調度
Learning Rate Schedule
訓練過程中調整學習率的方法
機器人手術
Robotic Surgery
以機械臂與術中影像輔助執刀的手術系統,可結合 [[computer-vision]]、導航與 AI 輔助決策,如達文西系統。
機器翻譯
Machine Translation
自動將文本從一語言翻譯為另一語言
激活函數
Activation Function
為神經元引入非線性的函數
隨機性
Stochasticity
具不確定性的隨機過程
隨機森林 (Balanced Random Forest)
Random Forest (Balanced Random Forest)
多棵決策樹投票的集成學習方法
頻率懲罰
Frequency Penalty
依出現頻率懲罰的取樣參數
擬人化偏見
Anthropomorphism
過度賦予AI人類特質
檢查點保存
Checkpointing
訓練中保存模型快照
檢索
Retrieval
從資料庫中找出相關文件的步驟
環境感知力
Contextual Awareness
AI 理解當下情境與環境的能力
避障
Obstacle Avoidance
避開障礙物的導航
錨定
Grounding
將AI輸出錨定於可信來源
隱私保護
Privacy-preserving
保護數據隱私的技術
點雲
Point Cloud
3D空間的點集合表示
點積
Dot Product
向量的內積
醫療影像診斷
Medical Imaging Diagnostics
AI輔助醫療影像
離群值
Outlier
與多數數據顯著不同的樣本
穩健性
Robustness
模型面對干擾或異常輸入仍保持正確的能力
邊緣檢測
Edge Detection
找出影像中物體邊界的技術
邊緣AI
Edge AI
在裝置端而非雲端運行的AI推論
邊緣TPU
Edge TPU
Google邊緣推論晶片
關鍵幀
Keyframe
動畫或影片的關鍵時刻
觸覺回饋
Haptic Feedback
力與觸感回饋
權重衰減
Weight Decay
L2正則化防止過擬合
變革適應力
Change Fitness
個人與組織適應 AI 變革的能力
觀察空間
Observation Space
RL中環境狀態的表示
Activeloop (AI 資料庫平台)
Activeloop (Database for AI)
專為 AI/LLM 設計的資料儲存與串流平台,提供向量搜尋與資料版本控制。
Agentic UI
Agentic UI
為 AI 設計的動態介面
AI 自動調錯
Debug with AI
由 AI 協助診斷與修復錯誤
AI 治理框架 (Governance Framework)
AI Governance Framework (governance framework)
規範 AI 開發、部署與問責的制度與流程架構
AI 清晰度
AI Clarity
AI 輸出的清晰度與可信度
AI 對齊 (人工智慧對齊)
AI Alignment
使 AI 系統的目標與人類意圖、價值觀一致的研究與工程領域。
AI Wrapper
AI Wrapper
僅在 LLM API 外包一層的軟體
AI市集
AI Marketplace
交易AI模型與服務的平台
AI合理使用
Fair Use in AI
AI訓練的合理使用辯論
AI安全
AI Safety
確保AI系統安全可控
AI沙箱化
Sandboxing AI
隔離環境運行AI
AI治理
AI Governance
AI開發與使用的政策框架
AI法案
AI Act
歐盟AI監管法規
AI倫理
AI Ethics
AI開發與使用的倫理原則與規範
AI接案
AI Freelancing
利用AI技能為客戶提供服務並獲取報酬
AI數位商品
AI Digital Products
使用AI創作並銷售的數位產品
AI諮詢
AI Consulting
提供AI導入與策略諮詢
AI聯盟營銷
AI Affiliate Marketing
推廣AI工具賺取佣金的營銷模式
Aider
Aider
終端機內的 AI 結對編程工具
AIOps
AIOps
用AI運維IT系統
Amazon Q Developer
Amazon Q Developer
AWS 推出的開發者 AI 助手
Anysphere
Anysphere
Cursor 背後的團隊名稱
Apache Airflow (工作流調度)
Apache Airflow
以 Python 定義、排程與監控工作流的開源平台,常用於資料與 ML 管線。
Apache Kafka (事件串流平台)
Apache Kafka
分散式事件串流平台,以主題與分割儲存與訂閱訊息流,為 [[event-streaming]] 與 [[apache-flink]] 常用資料源。
API (應用程式介面)
Application Programming Interface (API)
軟體之間溝通的介面協定
Argo CD (GitOps 持續交付)
Argo CD
以 Git 為單一事實來源的宣告式 Kubernetes 持續交付工具,自動同步叢集與版本庫狀態。
Auto-GPT
Auto-GPT
2023 年開源的自主 AI 代理實驗項目,能依目標自主拆解任務並執行
Automatic1111
Automatic1111
最經典的 SD WebUI
AWQ (激活感知權重量化)
AWQ (Activation-Aware Weight Quantization)
依激活重要性保留部分權重、其餘壓成 4 bit 的 LLM 量化方法,與 GPTQ 並列常用
Azure ML
Azure Machine Learning
微軟的ML開發平台
BERTScore (語義相似度評估)
BERTScore
以 [[bert]] 等模型的 [[embedding]] 計算候選與參考文本語義相似度的自動評估指標,優於 BLEU/ROUGE。
C2PA
C2PA
數位內容來源與真實性標準
Chroma
Chroma
輕量級開源向量資料庫
ChromaDB
ChromaDB
輕量開源向量資料庫
Claude
Claude
Anthropic開發的AI助手,以安全性和有用性著稱
Cloudflare Workers AI
Cloudflare Workers AI
在邊緣端運行 AI
Cohere
Cohere
專注 B2B 與 RAG 的 AI 公司
Comet ML
Comet
實驗管理與可視化
Command R+
Command R+
Cohere 為企業 RAG 優化的模型
Composer 模式
Composer Mode
跨檔案程式碼生成模式
Consensus
Consensus
搜尋科學論文的 AI
Continue.dev
Continue.dev
VS Code 內的開源 AI 擴充插件
CUDA
CUDA
NVIDIA的GPU並行運算平台與編程模型
CUDA核心
CUDA Cores
NVIDIA GPU的並行運算單元
Dagster (資料與 ML 編排)
Dagster
以「資產」為核心的資料與 [[machine-learning]] 管線編排平台,強調資料血緣與本地開發體驗。
DBSCAN (密度聚類)
DBSCAN (Density-Based Clustering)
依密度聚類的無監督演算法,不需預設簇數,可找出任意形狀簇並標記離群點。
DeepInfra
DeepInfra
高性價比開源模型推論 API
DeepSeek
DeepSeek
來自中國的高性價比強大模型
DeepSeek-Coder
DeepSeek-Coder
專門優化程式碼的模型
Diffusers Library
Diffusers
繪圖模型的標準庫
Docker
Docker
容器化部署的標準工具
DVC
DVC
數據版本控制工具
E-E-A-T(經驗、專業、權威、信任)
E-E-A-T (Experience, Expertise, Authoritativeness, Trustworthiness)
Google 用來評估內容與網站品質的四個面向:有沒有真實經驗、專業深度、領域權威與整體可信度。
Elicit
Elicit
AI 研究助理
Elo等級分
Elo Rating
模型對戰強弱排名
F1分數
F1 Score
精確率與召回率的調和平均
Falcon
Falcon
TII 推出的早期強大開源模型
FastAPI
FastAPI
部署 AI API 的首選框架
Fireworks.ai
Fireworks.ai
高速 AI 推論服務
FLOPS
Floating Point Operations Per Second
每秒浮點運算次數,衡量計算性能的指標
Flowise
Flowise
視覺化 AI 工作流拖動工具
Flux.1
Flux.1
目前最強大的開源文生圖模型(Black Forest Labs)
Fooocus
Fooocus
簡單好用的 SD 介面
FP32 (單精度浮點 / Float32)
FP32 (Single Precision / Float32)
32 位元單精度浮點數格式,為深度學習預設權重與計算精度,較 [[quantization]] 省記憶體但較慢。
Function Calling API
Function Calling
讓LLM調用外部函數
Gemma 2
Gemma 2
Google 推出的輕量級開放模型
GGML (llama.cpp 張量庫)
GGML
llama.cpp 使用的 C 張量庫,支援多種 [[quantization]] 與 GGUF 格式,供 [[llm]] 在 CPU/邊緣高效推理。
GGUF
GGUF
Ollama 等軟體通用的模型格式
GPT (生成式預訓練變換器)
Generative Pre-trained Transformer (GPT)
OpenAI開發的生成式預訓練Transformer模型系列
GPTQ (訓練後四比特權重量化)
GPTQ (GPT Quantization)
針對生成式預訓練模型的訓練後量化方法,將權重壓至 4 bit 並以 Hessian 近似最小化誤差
GPU 叢集 (GPU Cluster)
GPU Cluster
多張 [[gpu]] 組成的運算叢集,用於 [[distributed-training]] 與大規模 [[llm]] 訓練與推理。
GPU記憶體
GPU Memory
GPU的VRAM容量
Grad-CAM (梯度加權類別活化圖)
Grad-CAM (Gradient-weighted Class Activation Mapping)
以最後卷積層梯度加權產生熱力圖,視覺化 [[cnn]] 預測時關注的影像區域,用於可解釋性。
Gradio
Gradio
快速建ML介面的框架
Granite
Granite
IBM 推出的企業級模型
Great Expectations (GX / 資料品質驗證)
Great Expectations (GX)
開源資料驗證框架,以「Expectation」宣告式規則檢查資料品質,常用於 [[mlops]] 與 [[airflow]] 管線。
Grepile
Grepile
理解深層程式碼邏輯的搜尋工具
Grok
Grok
xAI 推出的具有即時資訊的模型
Groq
Groq
極速LLM推理雲端服務
HeyGen
HeyGen
AI 影片數位人與口型對齊
HPA (水平 Pod 自動擴展)
HPA (Horizontal Pod Autoscaler)
[[kubernetes]] 依 CPU、記憶體或自訂指標自動增減 Pod 副本數的控制器,用於 [[inference]] 與 [[mlops]] 擴展。
Hugging Face
Hugging Face
最大的開源AI模型與工具平台
InfiniBand (高速叢集網路)
InfiniBand
用於 [[gpu-cluster]] 與 HPC 的高速低延遲網路技術,可達 400Gb/s,降低 [[communication-overhead]]。
Istio (服務網格)
Istio
[[kubernetes]] 的服務網格,提供流量管理、可觀測性、安全與金絲雀/藍綠部署,常用於 [[mlops]] 推理服務。
Jan.ai
Jan.ai
開源的本機 AI 助手介面
Jasper
Jasper
早期企業行銷文案 AI
Julius AI
Julius AI
數據分析與視覺化專家
K均值聚類
K-Means
將數據聚為K群的無監督方法
K近鄰
K-NN
依最近K個鄰居投票的分類方法
Kaiber
Kaiber
AI音樂視頻生成
Keras
Keras
高階神經網絡API,常與TensorFlow搭配
Krea.ai
Krea.ai
實時畫布生成
Kubeflow (K8s 上的 ML 工作流)
Kubeflow
在 [[kubernetes]] 上建置與執行 [[machine-learning]] 管線的開源平台,含訓練、調參、服務與 [[mlops]] 組件。
Lambda Labs
Lambda Labs
專門提供 AI 訓練 GPU 的雲端
LangFlow
LangFlow
視覺化 LangChain 工作流
Lasso (L1 正則化迴歸)
Lasso (L1 Regularized Regression)
加入 L1 懲罰的線性迴歸,係數可壓縮為 0,具特徵選擇效果;與 [[regularization]]、Ridge 同屬正則化方法。
Leonardo.ai
Leonardo.ai
整合多種繪圖功能的平台
LightGBM (輕量梯度提升)
LightGBM
Microsoft 的梯度提升決策樹框架,採 GOSS 與 EFB 加速,支援分散式與 [[gpu]],常與 [[xgboost]]、[[random-forest]] 並列。
LiteLLM
LiteLLM
將各種 API 轉為 OpenAI 格式的橋樑
LLaMA
LLaMA
Meta開發的開源大型語言模型系列
Llama 3.1
Llama 3.1
Meta 的旗艦開源模型系列
LM Studio
LM Studio
本地LLM試用與推理工具
LMSYS Chatbot Arena
LMSYS Chatbot Arena
盲測大模型排行榜
Logits
Logits
未歸一化的機率值
LRM (大型推理模型 / Large Reasoning Models)
Large Reasoning Models (LRM)
具備深層邏輯推理能力的模型,如 OpenAI o1 系列,強調推理而非僅語言模式
Luma Dream Machine
Luma Dream Machine
高品質影片生成工具
Magnific AI
Magnific AI
極致的圖片放大與細節增強
MCP (模型上下文協議 / Model Context Protocol)
Model Context Protocol (MCP)
Anthropic 推出的開放協議,讓 AI 代理能標準化連接各種工具與數據源
MCP 協議
MCP (Model Context Protocol)
讓 AI 連接外部工具與資料的協議
METEOR (機器翻譯評估指標)
METEOR
機器翻譯與 [[nlp]] 的評估指標,結合精確度、召回與對齊(含同義與詞形),常與 [[bleu]]、[[rouge]] 並用。
MIDI生成
MIDI Generation
生成MIDI音樂
Mistral
Mistral
Mistral AI開發的開源高效LLM
Mixtral 8x22B
Mixtral 8x22B
高效率的 MoE 開源模型
Modal
Modal
Serverless GPU運算平台
N元語法
N-gram
連續N個詞或字的序列
Neptune
Neptune
ML實驗追蹤工具
o1-mini
o1-mini
推理專用的輕量模型
o1-preview
o1-preview
OpenAI 具備推理能力的模型(Strawberry)
Ollama
Ollama
本地運行LLM的簡單工具
ONNX
ONNX
開放的模型交換格式標準
Open WebUI
Open WebUI
最受歡迎的 Ollama 網頁介面
OpenAI API
OpenAI API
訪問GPT等頂級語言模型的API服務
OpenAI相容API
OpenAI-compatible API
與OpenAI格式相容的介面
Output Parsers
Output Parsers
將 LLM 輸出轉為 JSON 等格式的工具
PandasAI
PandasAI
用自然語言操作 DataFrame
Phi-3.5
Phi-3.5
Microsoft 推出的頂級 SLM
Pi
Pi
Inflection AI 推出的感性對話 AI
Pika
Pika
AI視頻生成工具
Pinecone
Pinecone
託管向量資料庫服務
Prefect (工作流編排)
Prefect
Python 原生的工作流編排與排程平台,支援動態 DAG、重試、觀測與雲端託管,常與 [[airflow]]、[[dagster]] 並列用於 [[mlops]] 管線。
Prodigy (主動式標註)
Prodigy
Explosion 出品的 [[data-labeling]] 與主動學習工具,可接 [[nlp]] 模型做 in-the-loop 標註與迭代,常與 spaCy 搭配。
Prometheus (監控系統)
Prometheus
開源指標監控與告警系統,以拉取方式蒐集時序指標,常與 [[grafana]]、[[kubernetes]] 搭配用於 [[mlops]] 與推理服務監控。
Python
Python
AI開發最主流的程式語言
PyTorch Lightning (訓練框架)
PyTorch Lightning
建於 [[pytorch]] 上的高階訓練框架,以 Trainer 與 LightningModule 減少樣板程式碼,支援多 [[gpu]]、混合精度與 [[mlops]] 整合。
Qwen 2.5
Qwen 2.5
阿里巴巴的高性能開源系列
ReLU (線性整流單元)
ReLU (Rectified Linear Unit)
最常用的神經網絡激活函數
Replicate
Replicate
託管開源模型的平台
RMSprop
RMSprop
依梯度平方的指數移動平均做 per-parameter 縮放的自適應 [[gradient-descent]] 優化器,為 [[adam]] 的前身之一。
Robot.txt for AI
Robot.txt for AI
防止 AI 抓取網站的規則
robots.txt
robots.txt
放在網站根目錄、用來告訴搜尋引擎爬蟲哪些路徑可以抓、哪些應該避免的規則檔案。
RunPod
RunPod
GPU雲端租賃服務
Runway
Runway
AI視頻與圖像創作平台
SaaS
Software as a Service
通過網路提供軟體服務的商業模式
SafeTensor
SafeTensor
更安全、更快的權重存儲格式
SageMaker (Sagemaker Ground Truth) (Amazon Sagemaker Ground Truth)
Amazon SageMaker (Sagemaker Ground Truth) (Amazon Sagemaker Ground Truth)
AWS的ML託管服務
Seq2Seq
Sequence to Sequence
序列到序列模型,輸入輸出皆為序列的架構
Sigmoid
Sigmoid
將輸入壓縮到 0-1 範圍的 S 型激活函數
SMOTE (合成少數過採樣)
SMOTE
對少數類在特徵空間中做 k 近鄰插值以合成新樣本,緩解類別不平衡的過採樣方法,常用於 [[machine-learning]] 分類。
Snowflake (雲端資料倉儲)
Snowflake
雲端原生資料倉儲,支援 SQL、資料分享與 [[mlops]] 整合,常作為 [[machine-learning]] 特徵與訓練資料的來源與落地。
Soda Core (資料品質)
Soda Core
開源資料品質與測試框架,以 YAML 或 SodaCL 定義檢查( freshness、唯一性、分布等),與 [[great-expectations]] 同屬 data quality 生態。
Softmax
Softmax
將向量轉為機率分布的歸一化函數
Sora
Sora
OpenAI的視頻生成模型
Sourcegraph Cody
Sourcegraph Cody
專注於理解大型代碼庫的 AI
Stability AI
Stability AI
開發Stable Diffusion的AI公司
Stable Diffusion
Stable Diffusion
開源可本地運行的圖像生成模型
Stable LM
Stable LM
Stability AI 的語言模型
Streamlit
Streamlit
快速將Python腳本轉換為Web應用的開源框架
Supermaven
Supermaven
以超長 Context Window (1M+) 聞名的程式碼助手
Swish
Swish
Google 提出的自門控平滑激活函數
Synthesia
Synthesia
生成專業解說影片
T5
Text-to-Text Transfer Transformer
Google 的文本到文本統一框架 Transformer
Tabnine
Tabnine
早期 AI 程式碼補全工具
Tanh
Tanh
將輸入壓縮到 -1 到 1 的雙曲正切激活函數
TensorRT-LLM (NVIDIA LLM 推論加速)
TensorRT-LLM (TensorRT-LLM)
NVIDIA 開源的 [[llm]] 推論加速庫,在 NVIDIA GPU 上優化延遲與吞吐,支援多節點與量化
TF-IDF
TF-IDF
詞頻-逆向文件頻率的文本特徵權重方法
TFLOPS
TFLOPS
每秒兆次浮點運算
Together AI
Together AI
開源模型推理平台
Token (詞元 / 標記)
Token (Text Token)
語言模型處理文本時使用的最小單位
Token 消耗
Token Burn
大量消耗 Token 的操作
Token計費
Token-Based Pricing
AI語言模型按處理的token數量收費的模式
Token預算管理
Token Budgeting
管理上下文token使用
Topaz Photo AI
Topaz Photo AI
專業圖片修復軟體
Transformers
Transformers
Hugging Face的NLP模型庫
Unstructured.io
Unstructured.io
處理各種格式的數據工具
Vast.ai
Vast.ai
租借個人 GPU 的去中心化市場
Vertex AI
Vertex AI
Google Cloud的ML平台
Void
Void
開源版的 Cursor 替代品
VRAM
Video RAM
GPU專用記憶體,影響可載入的模型大小
Weights & Biases
W&B
ML實驗追蹤平台
Xavier 初始化
Xavier Initialization
依層的輸入與輸出維度設定權重方差,使前向與反向時訊號方差維持穩定,常用於 [[neural-network]] 與 [[he-initialization]] 對比。
人工超智能
ASI (Artificial Superintelligence)
超越人類智能的 AI
上下文窗口 (語境窗口)
Context Window
語言模型能同時處理的最大token數量
上下文緩存
Context Caching
快取長文本以降低成本
中央極限定理 (CLT)
Central Limit Theorem (CLT)
樣本平均的分布隨樣本數增大趨近常態,不論母體分布為何,為統計推論與 [[machine-learning]] 評估的基礎。
互連頻寬
Interconnect Bandwidth
裝置間通訊速率
反向傳播 (倒傳遞)
Backpropagation
訓練神經網絡時計算梯度的核心算法
反思機制
Reflection Mechanism
生成後自我檢查
幻覺 (AI幻覺 / 模型幻覺)
Hallucination (AI Hallucination)
AI生成虛假或無根據資訊的現象
支持向量機
SVM
基於最大間隔的經典分類算法
主成分分析
PCA
用於降維的線性變換方法
主動學習
Active Learning
模型主動選擇最有價值樣本請人類標記的學習策略
去除限制的模型
Uncensored Model
移除內容審查的微調模型
去噪
Denoising
從噪聲還原信號
可塑性
Plasticity
神經網路持續適應新資料、學習新任務的能力;與災難性遺忘相對,持續學習與 [[online-learning]] 常需平衡可塑性與穩定性。
可解釋性AI
Explainable AI
讓人類理解AI決策過程的技術
平坦最小值 (Flat Minima)
Flat Minima
損失曲面中曲率較小、參數微擾對損失影響小的區域,實務上常與較佳泛化相關。
本體感受
Proprioception
感知自身身體位置
正則化
Regularization
泛指防止模型過擬合的約束技術
生存風險
X-risk
人類存續的威脅
目標對齊
Goal Alignment
Agent 目標與人類期望一致
交叉編碼器
Cross-Encoder
查詢與文檔聯合編碼
全域最小值
Global Minimum
函數的整體最小值
多代理
Multi-agent
多個AI代理協作完成任務
多智能體系統
MAS
多Agent協作系統
多智能體編排
MAO
協調多專業Agent
多跳推理
Multi-hop Reasoning
需多步推論才能得出答案
多頭注意力
Multi-head Attention
並行多組注意力以捕捉不同關係
自回歸解碼
Autoregressive Decoding
逐token生成的解碼方式
自注意力機制
Self-Attention
讓序列中每個位置關注其餘位置的注意力機制
自相關
Autocorrelation
序列與自身滯後版本的相關性
自監督學習
Self-supervised Learning
從數據本身構造監督信號無需人工標記的學習方法
自編碼器
Autoencoder
學習數據壓縮與重建的神經網絡
自癒式防火牆
Self-Healing Firewall
AI 自動偵測並修復漏洞
位置編碼
Positional Encoding
為Transformer注入序列位置資訊
序列到序列
Seq2Seq
輸入與輸出皆為序列的模型架構
批次正規化 (Batch Norm / BN)
Batch Normalization (Batch Norm / BN)
對每層輸入正規化以穩定訓練的技術
折扣因子
Discount Factor
未來獎勵的折現係數
沒有免費午餐定理 (NFL)
No Free Lunch Theorem (NFL)
在對所有可能問題平均後,任何兩種優化或學習演算法期望表現相同;意即不存在通用最優演算法,需依問題選擇。
事實查核
Fact Checking
自動驗證資訊真實性的AI技術
具身智能
Embodied AI
具物理身體的AI
卷積神經網絡 (CNN)
Convolutional Neural Network (CNN)
專門處理圖像數據的神經網絡架構
委派信任度
Delegation Trust
對 Agent 委派任務的可信度評估
注意力機制 (注意力)
Attention Mechanism (Self-Attention)
讓模型專注於輸入重要部分的機制
物體檢測
Object Detection
在影像中定位並辨識物體類別的技術
知識圖 RAG
Knowledge Graph RAG
結合知識圖與 RAG 的檢索增強
知識圖譜
Knowledge Graph
以圖結構組織實體與關係的知識庫
知識蒸餾
Knowledge Distillation
將大模型知識轉移到小模型
表示學習
Representation Learning
自動學習數據表示
金絲雀部署
Canary Deployment
漸進式流量切換
長短期記憶網絡
LSTM
解決長期依賴問題的循環神經網絡架構
長程推理
Long-term Reasoning
跨多步驟的連貫推理
門控循環單元
GRU
LSTM的簡化版,少參數的序列建模架構
前饋網絡
FFN
Transformer中的兩層全連接子模組
姿態估計
Pose Estimation
估計人體或物體關節位置的技術
後驗機率
Posterior Probability
觀測到數據後的機率
思維骨架
Skeleton-of-Thought
先骨架再填充
指令微調
Instruction Tuning
用指令-回應對微調模型以遵循人類指令
查詢擴展
Query Expansion
擴展查詢以提升檢索
紅隊測試
Red Teaming
模擬攻擊以發現AI系統弱點
計算受限
Compute-bound
受運算能力限制
計算智能
Computational Intelligence
仿生與軟計算方法總稱
重排序
Re-ranking
檢索後的二次精準篩選
重疊窗口
Overlapping Windows
切片時重叠的切分方式
時間一致性
Temporal Consistency
影片幀間的連貫性
校準 (機率校準 / Calibration)
Calibration (Probability Calibration)
讓分類器輸出的機率與真實發生頻率一致,使「預測 0.8」約對應 80% 實際為正。
氣隙 AI
Air-gapped AI
物理隔離環境下的 AI
特徵存儲
Feature Store
集中管理特徵的儲存
特徵值與特徵向量
Eigenvalues / Eigenvectors
線性變換的不變方向與縮放
特徵歸因
Feature Attribution
各特徵對預測的貢獻
矩陣分解
Matrix Factorization
將矩陣分解為低秩因子
破解提示詞
Jailbreak Prompt
繞過安全限制的提示
破獄
Jailbreaking
繞過AI安全限制獲取違規輸出的手法
記憶體受限
Memory-bound
受記憶體頻寬限制
記憶體頻寬
Memory Bandwidth
記憶體與處理器間的數據傳輸速率
馬可夫鏈
Markov Chain
下一狀態只依賴當前狀態的隨機過程
偏差-方差權衡
Bias-Variance Tradeoff
模型複雜度與泛化能力的取捨
剪枝
Pruning
移除模型中冗餘參數以壓縮模型
動量
Momentum
利用歷史梯度的加速項
動態目標設定
Dynamic Goal Setting
AI 可依情境調整目標
區域最小值
Local Minimum
鄰域內的最小值
參數量
Model Parameters
神經網絡中可學習的權重數量,衡量模型大小
基因演算法
Genetic Algorithm
模擬進化過程的優化算法
密度鏈
Chain-of-Density
CoD,摘要的密度優化
專家混合模型
Mixture of Experts
多專家子網絡的架構
強化學習
Reinforcement Learning
透過試錯與獎勵機制學習最佳決策的方法
採樣器
Sampler
擴散模型中的去噪採樣
探索與利用
Exploration vs. Exploitation
嘗試新事物與利用已知的取捨
推理標記
Reasoning Tokens
模型思考時內部消耗的 Token
推論時擴展
Inference-time Scaling
在回答時花更多時間思考以提高品質
梅爾頻譜
Mel Spectrogram
人耳感知的頻譜表示
梯度下降 (梯度遞減)
Gradient Descent (SGD)
透過梯度逐步調整參數以最小化損失的優化方法
梯度消失 (Vanishing Gradient)
Gradient Vanishing (Vanishing Gradient)
深層網絡梯度趨近於零
梯度提升
Gradient Boosting
迭代添加模型以修正殘差的集成方法
梯度裁剪
Gradient Clipping
限制梯度大小防止爆炸
梯度檢查點 (Gradient Checkpointing)
Gradient Checkpointing (Activation Checkpointing)
前向時只存部分激活為檢查點,反向時再重算其餘激活,以時間換取 [[backpropagation]] 記憶體,可訓練更大模型。
梯度爆炸 (Exploding Gradient)
Gradient Explosion (Exploding Gradient)
深層網絡梯度急劇增大
深偽檢測
Deepfake Detection
識別AI生成的深偽內容
混合搜索
Hybrid Search
向量與關鍵字檢索結合
符號人工智慧
Symbolic AI
以符號推理與知識表示為核心的傳統AI範式
蛋白質結構預測
Protein Folding Prediction
如AlphaFold
規劃演算法
Planning Algorithms
拆解步驟的規劃能力
軟計算
Soft Computing
涵蓋模糊邏輯、神經網路、演化計算等容忍不確定性與近似解的計算範式,與傳統硬計算(精確、離散)相對。
軟體機器人
Soft Robotics
軟體材料的機器人
逐位置前饋網路
Position-wise Feed-Forward
Transformer中每位置獨立的前饋層
通訊開銷 (Communication Overhead)
Communication Overhead
[[distributed-training]] 中節點間同步梯度或參數所耗時間與頻寬,為擴展時的主要瓶頸之一。
連結主義
Connectionism
以神經網絡相互連接為核心的AI範式
單樣本學習
One-shot Learning
僅用單一範例學習新類別
嵌入向量 (嵌入 / 詞嵌入 / 向量嵌入) (Embedding Lookup)
Embedding (Word Embedding) (Embedding Lookup)
將離散數據(如文字)轉換為連續向量表示
循環神經網絡 (RNN)
Recurrent Neural Network (RNN)
處理序列數據的神經網絡,有記憶能力
提示工程
Prompt Engineering
設計和優化AI提示詞的專業技能
提示洩漏
Prompt Leaking
系統提示被輸出暴露
提示詞注入
Prompt Injection
透過惡意輸入操控AI輸出的攻擊
提示詞消毒
Prompt Sanitization
防止注入的輸入清理
提示詞壓縮
Prompt Compression
壓縮 prompt 以節省 token
提示微調
Prompt Tuning
只訓練軟提示
插幀
Frame Interpolation
在幀間插入過渡幀
握手協議
Handshake Protocol
Agent 間建立信任與能力協商的協議
智能體工作流
Agentic Workflow
AI循環思考與行動的多步驟任務執行模式
智能體生命週期管理
Agent Lifecycle Management
Agent 從開發到退役的完整管理
智能體推理
Agentic Reasoning
Agent的推理能力
智能體對接
A2A (Agent-to-Agent)
AI 之間互相發單、協作的通訊模式
殘差連接
Residual Connection
跳過連接以緩解梯度消失
殘差網絡
ResNet
透過殘差連接訓練極深網絡的架構
無限上下文
Infinite Context
透過 RAG 或長緩存實現的虛擬無限長度
稀疏架構
Sparse Architectures
每次只激活部分參數的架構
稀疏檢索
Sparse Retrieval
如BM25的關鍵字檢索
超長上下文窗口
Extended Context Window
2M+ tokens 的長上下文
量化 (模型量化) (Quantization Aware Training)
Quantization (Model Quantization) (Quantization Aware Training)
將模型權重降低精度以減少記憶體與加速推論
僅解碼器
Decoder-only
如GPT般只含解碼器的模型
僅編碼器
Encoder-only
如BERT般只含編碼器的模型
微調 (模型微調)
Fine-tuning (Fine Tuning / Model Fine-tuning)
在預訓練模型基礎上,使用特定數據進一步訓練以適應特定任務
概念漂移
Concept Drift
數據分布隨時間變化
溫度縮放
Temperature Scaling
調整softmax溫度的校準方法
稠密 vs 稀疏模型
Dense vs Sparse Models
全參數 vs 部分激活的架構對比
稠密模型
Dense Model
所有參數都參與每次運算的神經網絡模型
稠密檢索
Dense Retrieval
用嵌入向量的檢索
經驗回放
Experience Replay
重複利用過往經驗的訓練
群體智慧
Swarm Intelligence
仿螞蟻、蜂群等群體行為的分散式優化與決策方法,如 PSO、ACO,用於組合優化與 [[reinforcement-learning]] 的探索策略。
群體機器人學
Swarm Robotics
多機器人協作系統
腦機介面
Brain-Computer Interface
BCI,大腦與電腦連接
跨模態嵌入
Cross-modal Embeddings
將不同模態對齊到同一向量空間
路由
Router
決定將請求發給大模型或小模型的組件
運動學
Kinematics
物體運動的幾何描述
零樣本思維鏈
Zero-shot CoT
不給範例即引導模型逐步推理
零樣本語音合成
Zero-shot TTS
無需目標聲音樣本即可克隆
預訓練目標
Pre-training Objective
預訓練階段的優化目標
實體分割
Instance Segmentation
區分同類別不同個體的分割任務
實體連結
Entity Linking
將文本中的實體對應到知識庫
對抗樣本
Adversarial Examples
讓人眼難辨但使AI出錯的輸入
對齊
Alignment
確保AI目標與人類價值觀一致的議題
監督微調
SFT
用標記數據微調模型
算子融合
Operator Fusion
將多個小算子(如 ReLU、BN、Conv)合併成單一 kernel,減少 [[gpu]] 記憶體存取與 kernel 啟動開銷,以加速 [[inference]] 與訓練。
管線並行
Pipeline Parallelism
將模型按層切分到多裝置,以微批次填滿管線、隱藏氣泡,為 [[model-parallel]] 的一種,常用於大 [[llm]]。
精準醫療 AI
Precision Medicine AI
依基因與病歷個人化醫療的 AI
維度災難
Curse of Dimensionality
高維空間的數據稀疏問題
網路韌性 AI
Cyber Resilience AI
AI 強化資安防禦與恢復
蒙地卡羅方法
Monte Carlo Method
透過隨機採樣近似計算
語義分割
Semantic Segmentation
為影像每個像素標註類別
語義切片
Semantic Chunking
依語義邊界切分文本的RAG預處理
語義緩存
Semantic Cache
依語義相似度緩存,節省重複問題費用
遞歸任務分配
Recursive Tasking
遞歸式拆解任務
遞歸字元分割
Recursive Character Splitter
遞歸切分文本
遞歸摘要
Recursive Summarization
多層級遞歸式摘要長文
價值函數
Value Function
估計狀態或動作的期望回報
價值對齊
Value Alignment
使AI目標與人類一致
層正規化
Layer Normalization
對層內特徵正規化的技術
影片 RAG
Video RAG
對影片內容進行檢索增強
影片生影片
Video-to-Video
由參考影片生成新影片
數據血緣
Data Lineage
追蹤訓練數據來源與演變的紀錄
數據稀缺
Data Scarcity
高品質訓練數據供不應求
樂透券假說
Lottery Ticket Hypothesis
主張隨機初始化網路中存在子網路(「中獎券」),單獨訓練可達原網路表現,與 [[pruning]] 與稀疏化相關。
標籤平滑
Label Smoothing
軟化硬標籤以減輕過擬合的技術
模仿學習 (Imitation Learning)
Imitation Learning (IL)
從專家示範(狀態-動作對)學習策略的 [[reinforcement-learning]] 範式,含行為克隆與 DAgger、IRL 等。
模型坍塌
Model Collapse
AI數據訓練導致性能退化
模型並行
Model Parallelism
將單一模型切分到多張 [[gpu]] 或節點上,以單層或層內分割降低單機記憶體需求;常與 [[distributed-training]] 並用。
模型量化
Model Quantization
壓縮模型權重精度
模型漂移
Model Drift
模型表現隨時間退化
模型漂移監控
Model Drift Monitoring
持續監測模型效能衰減
模型擴展
Model Scaling
增大模型規模以提升表現
潛在空間
Latent Space
壓縮後的抽象表示空間
潛在擴散
Latent Diffusion
在潛在空間的擴散
熱身
Warmup
訓練初期漸進提高學習率的技巧
熵
Entropy
衡量不確定性或資訊量的指標
編排治理
Orchestration Governance
對多 Agent 編排的監督與合規
編碼器-解碼器
Encoder-Decoder
將輸入編碼後解碼輸出的序列到序列架構
遮罩語言模型
MLM
預測被遮罩位置的預訓練任務
噪聲調度
Noise Schedule
擴散過程的噪聲安排
機製可解釋性
Mechanistic Interpretability
透過分析 [[transformer]] 等模型內部計算(注意力、神經元、電路)理解其行為與表徵,偏重因果與可重現詮釋。
機器學習運維
MLOps
將ML模型從開發到部署的運維實踐
積分梯度 (Integrated Gradients)
Integrated Gradients
依輸入對輸出的梯度沿基準路徑積分,得到每個特徵的歸因分數,為可解釋 AI 的歸因方法之一;與 [[grad-cam]] 同屬解釋性技術。
遺忘曲線(AI)
NIAH (Needle in a Haystack)
測試模型在長文中的關鍵信息檢索能力
隨機失活
Dropout
訓練時隨機丟棄神經元以減少過擬合
隨機梯度下降
SGD
每批樣本更新參數的梯度下降變體
頻率派統計 (Frequentist Statistics)
Frequentist Statistics
將機率視為長期頻率、參數視為固定未知的統計學派,以 p 值、信賴區間與假設檢定為主要工具。
檢索增強生成 (RAG)
Retrieval-Augmented Generation (RAG)
結合外部知識檢索和語言生成的AI技術
聯邦學習
Federated Learning
多方協作訓練而不共享原始數據的隱私保護方法
聲音克隆
Voice Cloning
複製特定人的聲音
聲碼器
Vocoder
將特徵轉為音訊的模型
隱寫術
Steganography
隱藏資訊於載體
隱藏狀態
Hidden States
神經網絡中間層的表示
擴散模型 (擴散生成模型)
Diffusion Model
通過逐步去除噪聲來生成數據的生成式模型
藍綠部署
Blue-Green Deployment
雙環境切換部署
雙編碼器
Bi-Encoder
查詢與文檔分別編碼
類神經感測器
Neuromorphic Sensor
仿生物視覺的 event-based 感測器,以非同步事件流輸出亮度變化,利於低延遲、低功耗的 [[computer-vision]] 與邊緣 AI。
競爭智能體
Competitive Agents
對抗或競爭的Agent
權重剪枝
Weight Pruning
移除冗餘權重
邏輯鏈
Chain-of-Logic
比思維鏈更嚴謹的推導
驗證鏈
Chain-of-Verification
CoVe,生成後驗證
Adam優化器
Adam Optimizer
結合動量與自適應學習率的常用優化器
AdamW
AdamW
帶權重衰減的Adam優化器
ADASYN (自適應合成採樣)
ADASYN (Adaptive Synthetic Sampling)
針對不平衡資料的過採樣方法,依少數類樣本難度自適應生成合成樣本。
AI水印
Watermarking
在AI生成內容中嵌入可辨識標記
AI代理
AI Agent
能自主完成多步驟任務的智能系統
Annoy
Annoy
Approximate Nearest Neighbors Oh Yeah
Apache Flink (即時流處理)
Apache Flink
針對無界與有界資料流進行有狀態計算的分散式框架,保證 exactly-once 與低延遲。
API整合服務
API Integration Services
為企業將AI功能整合到現有系統的服務
Apriori 演算法 (關聯規則挖掘)
Apriori Algorithm
用於頻繁項集挖掘與關聯規則學習的經典無監督演算法,常見於購物籃分析。
Argilla
Argilla
數據標註與模型回饋平台
AUC-ROC
AUC-ROC
分類模型排序能力的曲線下面積
AutoGPT
AutoGPT
早期自主AI代理開源項目
BabyAGI
BabyAGI
簡約的自主 Agent 專案
BERT (雙向編碼器表示)
BERT (Bidirectional Encoder Representations from Transformers)
Google開發的雙向Transformer編碼器,用於理解文本
BLEU分數
BLEU Score
評估機器翻譯質量的自動指標
BM25
BM25
經典的排序算法
Braintrust
Braintrust
AI 評估與監控平台
Cerebras
Cerebras
挑戰速度極限的 AI 晶片商
CFG尺度
CFG Scale
分類器自由引導強度
CLIP
CLIP
對齊圖像與文本的對比學習模型
ComfyUI
ComfyUI
基於節點的 Stable Diffusion 進階介面
ControlNet
ControlNet
控制擴散模型生成的架構
CrewAI
CrewAI
多代理協作開發框架
Decoding
Decoding
LLM產生輸出的階段
DINO (自監督視覺 Transformer)
DINO (Self-Distillation with No Labels)
Meta 提出的自監督 [[vision-transformer]] 訓練方法,無標籤自蒸餾,可學到語義分割與物體邊界。
Dolphin
Dolphin
經過「去審查」處理的微調模型系列
EasyEnsemble (簡易集成)
EasyEnsemble
對多數類重複隨機欠採樣產生多個平衡子集,再訓練集成分類器,用於不平衡分類。
FAISS
FAISS
Facebook AI Similarity Search
FP16
FP16
16位元浮點數,常用於訓練與推論
FPGA
FPGA
現場可程式邏輯
GELU
Gaussian Error Linear Unit
Transformer常用的激活函數
GPU虛擬化
GPU Virtualization
虛擬分割GPU資源
GSM8K
GSM8K
數學推理評估基準
Haystack
Haystack
強大的 RAG 框架
He 初始化 (Kaiming 初始化)
He Initialization (Kaiming Initialization)
針對 [[relu]] 設計的權重初始化,方差為 √(2/n_in),使深層網路前向與反向時激活與梯度方差穩定。
Huber損失
Huber Loss
結合MSE與MAE的魯棒損失
HumanEval
HumanEval
程式碼生成評估基準
INT8
INT8
8位元整數,用於模型量化
InvokeAI
InvokeAI
專業級開源繪圖介面
IP-Adapter
IP-Adapter
用參考圖控制生成的適配器
Jamba
Jamba
AI21 結合 Transformer 與 Mamba 的架構
Kubernetes
Kubernetes
容器編排與管理平台
L1正規化
L1 Regularization
Lasso,促進稀疏解
L2正規化
L2 Regularization
Ridge,權重衰減
LangChain
LangChain
構建LLM應用的開源框架
LangGraph
LangGraph
LangChain 推出的 Agent 編排框架
LangServe
LangServe
將 LangChain 轉為 API
LangSmith
LangSmith
LangChain 的偵錯與評估平台
LayerNorm
Layer Normalization
對層內特徵正規化
Llama.cpp
Llama.cpp
Meta Llama模型的C++高效推理實現
LlamaIndex
LlamaIndex
專為RAG設計的數據框架
MCMC (馬可夫鏈蒙地卡羅)
MCMC (Markov Chain Monte Carlo)
以馬可夫鏈產生樣本以近似複雜機率分佈或積分的抽樣方法,常用於貝氏推論與 [[generative-model]]。
Medusa (推論加速)
Medusa
為 [[llm]] 設計的推論加速方法:以多頭解碼一次產出多個候選 token,再以驗證頭篩選,可減少 [[inference]] 步數。
Milvus
Milvus
企業級大規模向量資料庫
MMLU
MMLU
綜合知識評估基準
MT-Bench
MT-Bench
對話能力評測
NVIDIA NIM
NVIDIA NIM
預打包的推論微服務
NVLink
NVLink
NVIDIA高速GPU互連
P-Tuning
P-Tuning
可學習提示的微調方法
Perplexity 指標
Perplexity (metric)
衡量語言模型預測不確定性的評估指標
pgvector
pgvector
PostgreSQL的向量擴展
Prefill
Prefill
LLM處理輸入的階段
Pydantic AI
Pydantic AI
基於 Pydantic 的 Agent 框架
PyTorch (Torch Compile)
PyTorch (Torch Compile)
Facebook開發的開源深度學習框架
Q學習
Q-Learning
經典的無模型強化學習算法
Qdrant
Qdrant
高性能向量資料庫
Ray
Ray
分散式運算與ML訓練框架
ReAct
ReAct
結合推理與行動的Agent框架
Roofline 模型
Roofline Model
以算力與記憶體頻寬為上限評估運算效能的分析模型,可判斷 [[gpu]] 或 kernel 是算力受限還是頻寬受限。
ROUGE分數
ROUGE Score
評估文本摘要質量的指標
Semantic Kernel
Semantic Kernel
Microsoft 的 AI 開發框架
SiLU
SiLU
Swish激活函數的別稱
SimCLR (對比式自監督學習)
SimCLR
以同一影像的不同 augmentation 為正樣本、其餘為負樣本的 [[contrastive-learning]] 框架,無需標籤即可學到視覺表徵;[[clip]] 前身之一。
SkyPilot
SkyPilot
跨雲端 AI 任務調度
Tensor核心
Tensor Cores
專為矩陣運算的GPU單元
TensorFlow
TensorFlow
Google開發的深度學習框架,生產環境首選
TensorRT
TensorRT
NVIDIA深度學習推論優化器
TGI
Text Generation Inference
Hugging Face的LLM推理服務
Top-K取樣
Top-K Sampling
只從機率最高的K個token中取樣的策略
Top-P取樣
Top-P Sampling
依累積機率閾值篩選token的取樣策略
TOPS
TOPS
每秒兆次運算
TorchScript
TorchScript
PyTorch的序列化與優化格式
Transformer架構 (變換器 / 注意力模型) (Switch Transformer)
Transformer Architecture (Switch Transformer)
使用注意力機制處理序列數據的革命性神經網絡架構
Triton推理伺服器
Triton Inference Server
開源推論服務
U-Net
U-Net
編解碼對稱的醫學影像架構
U-Net擴散
U-Net Diffusion
擴散模型中的U-Net骨幹
Vision Transformer
ViT
將Transformer用於圖像的架構
vLLM
vLLM
高效LLM推理與服務開源框架
Weaviate
Weaviate
支援關鍵字與向量混合搜索
Word2Vec
Word2Vec
將詞映射為向量的早期嵌入模型
XGBoost
XGBoost
高效梯度提升的實作框架
YOLO
You Only Look Once
實時物件偵測架構
3D高斯潑濺
3D Gaussian Splatting
高效的3D重建與渲染
一致性模型
Consistency Model
單步生成的擴散變體
人類回饋強化學習
RLHF
利用人類偏好數據訓練LLM的對齊方法
三元組損失
Triplet Loss
對比學習的常見損失
上下文壓縮
Contextual Compression
依查詢壓縮檢索結果
工具性收斂
Instrumental Convergence
AI追求子目標的傾向
元學習
Meta-learning
學習如何學習的更高層學習方法
內存運算
In-Memory Computing
在記憶體中計算
分組查詢注意力
GQA
Grouped-Query Attention,減少KV頭數
分散式訓練
Distributed Training
跨多機多卡訓練
分數匹配
Score Matching
學習分數函數的生成方法
文本反轉
Textual Inversion
訓練特定概念的嵌入
父子文檔檢索
Parent-Child Retrieval
檢索父子結構文檔
可微編程
Differentiable Programming
整個計算圖可求導的編程
平穩過程
Stationary Process
統計性質不隨時間變化的隨機過程
生成化學
Generative Chemistry
AI生成分子結構
生成對抗網絡 (GAN)
Generative Adversarial Network (GAN)
通過生成器與判別器對抗訓練來生成數據
交叉注意力
Cross-Attention
查詢來自不同序列的注意力
同態加密
Homomorphic Encryption
加密狀態下運算
向量資料庫
Vector Database
存儲和檢索高維向量嵌入的專用資料庫
因果遮罩
Causal Mask
防止注意力看到未來token的遮罩
在線策略學習
On-policy Learning
從當前策略產生的數據學習
多查詢注意力
MQA
Multi-Query Attention,共享單一KV頭
多實例GPU
MIG
Multi-Instance GPU,A100等分片
多樣本破解
Many-shot Jailbreaking
用大量範例繞過安全限制
好奇心驅動學習
Curiosity-driven Learning
以好奇心為內在獎勵
安全多方計算
SMPC
Secure Multi-party Computation
自回歸視覺模型
Auto-regressive Vision
以自回歸方式生成圖像
似然函數
Likelihood Function
參數的機率給定觀測
低秩適配 (LoRA)
LoRA (Low-Rank Adaptation)
高效微調大型模型只更新少量參數的技術
均方根歸一化
RMSNorm
Root Mean Square Layer Normalization
投機執行
Speculative Execution
推論加速技術
投機採樣
Speculative Decoding
用小模型預測、大模型驗證以加速生成
貝氏推論
Bayesian Inference
依貝葉斯定理更新後驗機率
貝葉斯網路
Bayesian Network
以圖表示變數間機率依賴的模型
貝葉斯優化
Bayesian Optimization
用機率模型高效搜尋超參數的方法
貝爾曼方程
Bellman Equation
動態規劃與RL的核心等式
協變量偏移
Covariate Shift
訓練與測試時輸入分布不一致
注意力即一切
Attention Is All You Need
提出Transformer的經典論文
狀態空間模型
SSM
State Space Models
近端策略優化
PPO
Proximal Policy Optimization
非凸優化
Non-convex Optimization
目標函數非凸的優化問題
非自回歸解碼
Non-autoregressive Decoding
可並行生成多token
前置緩存
Prefix Caching
緩存 prompt 前段的 KV
前綴微調
Prefix Tuning
學習可訓練前綴向量
思維圖
Graph of Thoughts
GoT,圖結構推理
思維樹
Tree of Thoughts
探索多種推理路徑的進階提示技巧
流匹配
Flow Matching
基於流的生成模型
流水線並行
Pipeline Parallelism
按層切分模型的並行
流形
Manifold
高維中的低維結構
流形假設
Manifold Hypothesis
高維數據實際分布在低維流形上
約束優化
Constraint Optimization
在約束條件下優化目標
音訊擴散
Audio Diffusion
將擴散模型用於音訊生成
差分隱私
Differential Privacy
數學上保護個別數據的隱私
時序差分學習
TD Learning
Temporal Difference,增量式價值估計
核函數技巧
Kernel Trick
在高維空間計算而不顯式映射
海森矩陣
Hessian Matrix
多變數函數的二階偏導矩陣
神經架構搜索
NAS (Neural Architecture Search)
自動搜尋最佳網絡架構
神經解碼
Neural Decoding
從神經活動解讀意圖
神經輻射場
NeRF
Neural Radiance Fields,3D場景表示
脈動陣列
Systolic Array
TPU核心的矩陣運算架構
訓練後量化
PTQ
Post-Training Quantization
逆強化學習
IRL
從專家行為推斷獎勵函數
逆運動學
IK
從末端推關節角度
馬可夫決策過程
MDP
Markov Decision Process,RL的數學框架
高效參數微調
PEFT
只更新少量參數的微調方法總稱
高頻寬記憶體
HBM
HBM3/HBM3e,GPU高速記憶體
張量並行
Tensor Parallelism
在張量維度上切分
從小到大檢索
Small-to-Large Retrieval
先檢小片段再擴大到更大範圍
旋轉位置嵌入
RoPE
Rotary Positional Embedding,旋轉式位置編碼
混合專家模型 (MoE)
Mixture of Experts (MoE)
只激活部分參數來處理輸入的大型模型架構
混合運算
Hybrid Computing
量子運算 + AI + 超算的結合
混合精度
Mixed Precision
FP16與FP32混合訓練
視覺里程計
Visual Odometry
由視覺估計運動
通用近似定理
Universal Approximation Theorem
神經網絡可近似任意連續函數
最大邊際相關性
MMR
Maximum Marginal Relevance,平衡相關與多樣性
欺騙性對齊
Deceptive Alignment
假裝對齊實則不然
無分類器引導
Classifier-free Guidance
無需分類器的條件引導
無標記模型
Token-free Models
直接處理位元組的模型
稀疏注意力
Sparse Attention
只關注部分位置的注意力
稀疏MoE
Sparse MoE
每次只用部分專家的MoE
策略梯度
Policy Gradient
直接優化策略的強化學習方法
超級對齊
Superalignment
對齊超人類AI
量子 AI
Quantum AI
量子運算與 AI 的結合
量化感知訓練
QAT
Quantization Aware Training
雅可比矩陣
Jacobian Matrix
多變數函數的一階偏導矩陣
滑窗注意力
Sliding Window Attention
限定局部窗口的注意力
解耦表示
Disentangled Representation
因子的獨立表示
路由
Routing
MoE中分配輸入給專家
運算最優
Compute Optimal
給定算力下的最優配置
圖神經網絡
GNN
處理圖結構數據的神經網絡
對比學習
Contrastive Learning
拉近相似樣本、推遠不相似樣本的學習
對抗性攻擊
Adversarial Attack
刻意製造使模型出錯的輸入
對抗魯棒性
Adversarial Robustness
抵禦對抗攻擊的能力
對數似然
Log-Likelihood
模型擬合數據的對數機率
演員-評論家
Actor-Critic
結合策略與價值函數的RL架構
蒸餾感知訓練
Distillation-aware Training
訓練時即考慮後續蒸餾
蒙地卡羅樹搜尋
MCTS
透過隨機模擬的樹搜尋方法
語言處理單元
LPU (Language Processing Unit)
專為 LLM 設計的專用晶片
價值漂移
Value Drift
模型價值觀隨時間偏離
數據投毒
Data Poisoning
在訓練數據中植入惡意樣本
數據並行
Data Parallelism
將不同批次分配到多GPU並行訓練
模型反演
Model Inversion
從模型推斷訓練數據
模型並行
Model Parallelism
將大模型切分到多裝置訓練
模型蒸餾
Model Distillation
用大模型知識訓練小模型的技術
模擬轉現實
Sim-to-Real
將模擬訓練遷移到現實
線性注意力
Linear Attention
計算複雜度線性的注意力
線性偏置注意力
ALiBi
Attention with Linear Biases,無需位置嵌入
適配器
Adapter
插入式任務適配模組
鞍點
Saddle Point
某些方向上升、某些下降的臨界點
憲法AI
Constitutional AI
以原則約束模型行為的對齊方法
機器去學習
Machine Unlearning
刪除模型中的特定記憶
隨機捨入
Stochastic Rounding
低精度訓練的捨入方式
環形注意力
Ring Attention
分散式長序列注意力
擴展定律
Scaling Laws
模型表現隨規模的規律
歸納偏好
Inductive Bias
演算法對某種解釋的偏好
離線策略學習
Off-policy Learning
從與當前策略不同的數據學習
類神經形態晶片
Neuromorphic Chip
模擬大腦的晶片
變分自編碼器 (VAE)
VAE (Variational Autoencoder)
結合生成與壓縮的機率自編碼器架構
邏輯量子位元
Logical Qubits
經錯誤校正的量子位元
BF16
Bfloat16
腦浮點16位格式
BitNet
BitNet
極低位元LLM,可在CPU上運行
BitNet 1.58b
BitNet 1.58b
1 位元量化模型技術
Blackwell 架構
Blackwell Architecture
NVIDIA 下一代 GPU 架構
Chinchilla定律
Chinchilla Laws
數據與參數的優化比例
DDIM
Denoising Diffusion Implicit Model
確定性採樣的擴散
DDPM
Denoising Diffusion Probabilistic Model
去噪擴散機率模型
DeepSpeed
DeepSpeed
微軟的分散式訓練框架
DPO
Direct Preference Optimization
直接優化偏好無需獎勵模型
Flash Attention
Flash Attention
加速注意力計算的記憶體高效實現
FP8
FP8
8位浮點格式
FSDP
Fully Sharded Data Parallel
全分片數據並行
GraphRAG
GraphRAG
結合圖資料庫與RAG的進階檢索方法
HBM3e
HBM3e
高頻寬記憶體第三代增強版
HNSW
HNSW
層級導航小世界近似最近鄰
HyDE
HyDE
用假設性文件嵌入提升檢索的RAG技巧
IA3
Infused Adapter by Inhibiting and Amplifying
輕量微調方法
INT4
INT4
4位整數量化
KL散度
Kullback-Leibler Divergence
衡量兩機率分布差異的指標
KV快取
KV Cache
快取注意力Key/Value以加速LLM生成
LIME
LIME
局部可解釋模型
Mamba
Mamba
狀態空間模型,長文本架構
Megatron
Megatron-LM
NVIDIA的大規模訓練框架
ORPO
ORPO
單階段偏好優化
P-jailbreaking
P-jailbreaking
透過偽裝繞過安全限制
Post-Norm
Post-Normalization
注意力後做正規化
Pre-Norm
Pre-Normalization
注意力前做正規化
QAT / PTQ
QAT & PTQ
量化感知訓練與後訓練量化
QLoRA
QLoRA
量化LoRA降低顯存需求
RLAIF
RLAIF
用AI回饋替代人類的強化學習對齊
Self-RAG
Self-RAG
自我檢查式檢索增強
SHAP
SHAP
特徵歸因方法
SwiGLU
SwiGLU
結合Swish與GLU的高效激活架構
Swin Transformer
Swin Transformer
分層視覺Transformer架構
Triton
Triton
GPU核函數開發語言與編譯器
Zero-1-to-3
Zero-1-to-3
單圖轉3D的技術
ZeRO優化器
ZeRO
消除優化器狀態冗餘