瀏覽全部詞彙

157 個詞彙 · 高級

3D高斯潑濺

3D Gaussian Splatting

4

高效的3D重建與渲染

模型架構查看詳情

一致性模型

Consistency Model

4

單步生成的擴散變體

模型架構查看詳情

人類回饋強化學習

RLHF

4

利用人類偏好數據訓練LLM的對齊方法

模型架構查看詳情

三元組損失

Triplet Loss

4

對比學習的常見損失

訓練與優化查看詳情

上下文壓縮

Contextual Compression

4

依查詢壓縮檢索結果

產業術語查看詳情

工具性收斂

Instrumental Convergence

4

AI追求子目標的傾向

倫理與安全查看詳情

元學習

Meta-learning

4

學習如何學習的更高層學習方法

模型架構查看詳情

內存運算

In-Memory Computing

4

在記憶體中計算

硬體與部署查看詳情

分組查詢注意力

GQA

4

Grouped-Query Attention,減少KV頭數

模型架構查看詳情

分散式訓練

Distributed Training

4

跨多機多卡訓練

硬體與部署查看詳情

分數匹配

Score Matching

4

學習分數函數的生成方法

模型架構查看詳情

文本反轉

Textual Inversion

4

訓練特定概念的嵌入

模型架構查看詳情

父子文檔檢索

Parent-Child Retrieval

4

檢索父子結構文檔

產業術語查看詳情

可微編程

Differentiable Programming

4

整個計算圖可求導的編程

模型架構查看詳情

平穩過程

Stationary Process

4

統計性質不隨時間變化的隨機過程

基礎概念查看詳情

生成化學

Generative Chemistry

4

AI生成分子結構

應用場景查看詳情

生成對抗網絡 (GAN)

Generative Adversarial Network (GAN)

4

通過生成器與判別器對抗訓練來生成數據

模型架構查看詳情

交叉注意力

Cross-Attention

4

查詢來自不同序列的注意力

模型架構查看詳情

同態加密

Homomorphic Encryption

4

加密狀態下運算

倫理與安全查看詳情

向量資料庫

Vector Database

4

存儲和檢索高維向量嵌入的專用資料庫

技術工具查看詳情

因果遮罩

Causal Mask

4

防止注意力看到未來token的遮罩

模型架構查看詳情

在線策略學習

On-policy Learning

4

從當前策略產生的數據學習

模型架構查看詳情

多查詢注意力

MQA

4

Multi-Query Attention,共享單一KV頭

模型架構查看詳情

多實例GPU

MIG

4

Multi-Instance GPU,A100等分片

硬體與部署查看詳情

多樣本破解

Many-shot Jailbreaking

4

用大量範例繞過安全限制

倫理與安全查看詳情

好奇心驅動學習

Curiosity-driven Learning

4

以好奇心為內在獎勵

模型架構查看詳情

安全多方計算

SMPC

4

Secure Multi-party Computation

倫理與安全查看詳情

自回歸視覺模型

Auto-regressive Vision

4

以自回歸方式生成圖像

模型架構查看詳情

似然函數

Likelihood Function

4

參數的機率給定觀測

訓練與優化查看詳情

低秩適配 (LoRA)

LoRA (Low-Rank Adaptation)

4

高效微調大型模型只更新少量參數的技術

模型架構查看詳情

均方根歸一化

RMSNorm

4

Root Mean Square Layer Normalization

模型架構查看詳情

投機執行

Speculative Execution

4

推論加速技術

硬體與部署查看詳情

投機採樣

Speculative Decoding

4

用小模型預測、大模型驗證以加速生成

硬體與部署查看詳情

貝氏推論

Bayesian Inference

4

依貝葉斯定理更新後驗機率

基礎概念查看詳情

貝葉斯網路

Bayesian Network

4

以圖表示變數間機率依賴的模型

模型架構查看詳情

貝葉斯優化

Bayesian Optimization

4

用機率模型高效搜尋超參數的方法

訓練與優化查看詳情

貝爾曼方程

Bellman Equation

4

動態規劃與RL的核心等式

模型架構查看詳情

協變量偏移

Covariate Shift

4

訓練與測試時輸入分布不一致

訓練與優化查看詳情

注意力即一切

Attention Is All You Need

4

提出Transformer的經典論文

模型架構查看詳情

狀態空間模型

SSM

4

State Space Models

模型架構查看詳情

近端策略優化

PPO

4

Proximal Policy Optimization

模型架構查看詳情

非凸優化

Non-convex Optimization

4

目標函數非凸的優化問題

訓練與優化查看詳情

非自回歸解碼

Non-autoregressive Decoding

4

可並行生成多token

模型架構查看詳情

前置緩存

Prefix Caching

4

緩存 prompt 前段的 KV

硬體與部署查看詳情

前綴微調

Prefix Tuning

4

學習可訓練前綴向量

模型架構查看詳情

思維圖

Graph of Thoughts

4

GoT,圖結構推理

模型架構查看詳情

思維樹

Tree of Thoughts

4

探索多種推理路徑的進階提示技巧

模型架構查看詳情

流匹配

Flow Matching

4

基於流的生成模型

模型架構查看詳情

流水線並行

Pipeline Parallelism

4

按層切分模型的並行

硬體與部署查看詳情

流形

Manifold

4

高維中的低維結構

模型架構查看詳情

流形假設

Manifold Hypothesis

4

高維數據實際分布在低維流形上

基礎概念查看詳情

約束優化

Constraint Optimization

4

在約束條件下優化目標

訓練與優化查看詳情

音訊擴散

Audio Diffusion

4

將擴散模型用於音訊生成

模型架構查看詳情

差分隱私

Differential Privacy

4

數學上保護個別數據的隱私

倫理與安全查看詳情

時序差分學習

TD Learning

4

Temporal Difference,增量式價值估計

模型架構查看詳情

核函數技巧

Kernel Trick

4

在高維空間計算而不顯式映射

模型架構查看詳情

海森矩陣

Hessian Matrix

4

多變數函數的二階偏導矩陣

基礎概念查看詳情

神經架構搜索

NAS (Neural Architecture Search)

4

自動搜尋最佳網絡架構

模型架構查看詳情

神經解碼

Neural Decoding

4

從神經活動解讀意圖

應用場景查看詳情

神經輻射場

NeRF

4

Neural Radiance Fields,3D場景表示

模型架構查看詳情

脈動陣列

Systolic Array

4

TPU核心的矩陣運算架構

硬體與部署查看詳情

訓練後量化

PTQ

4

Post-Training Quantization

訓練與優化查看詳情

逆強化學習

IRL

4

從專家行為推斷獎勵函數

模型架構查看詳情

逆運動學

IK

4

從末端推關節角度

應用場景查看詳情

馬可夫決策過程

MDP

4

Markov Decision Process,RL的數學框架

模型架構查看詳情

高效參數微調

PEFT

4

只更新少量參數的微調方法總稱

模型架構查看詳情

高頻寬記憶體

HBM

4

HBM3/HBM3e,GPU高速記憶體

硬體與部署查看詳情

張量並行

Tensor Parallelism

4

在張量維度上切分

硬體與部署查看詳情

從小到大檢索

Small-to-Large Retrieval

4

先檢小片段再擴大到更大範圍

產業術語查看詳情

旋轉位置嵌入

RoPE

4

Rotary Positional Embedding,旋轉式位置編碼

模型架構查看詳情

混合專家模型 (MoE)

Mixture of Experts (MoE)

4

只激活部分參數來處理輸入的大型模型架構

模型架構查看詳情

混合運算

Hybrid Computing

4

量子運算 + AI + 超算的結合

硬體與部署查看詳情

混合精度

Mixed Precision

4

FP16與FP32混合訓練

訓練與優化查看詳情

視覺里程計

Visual Odometry

4

由視覺估計運動

應用場景查看詳情

通用近似定理

Universal Approximation Theorem

4

神經網絡可近似任意連續函數

基礎概念查看詳情

最大邊際相關性

MMR

4

Maximum Marginal Relevance,平衡相關與多樣性

產業術語查看詳情

欺騙性對齊

Deceptive Alignment

4

假裝對齊實則不然

倫理與安全查看詳情

無分類器引導

Classifier-free Guidance

4

無需分類器的條件引導

模型架構查看詳情

無標記模型

Token-free Models

4

直接處理位元組的模型

模型架構查看詳情

稀疏注意力

Sparse Attention

4

只關注部分位置的注意力

模型架構查看詳情

稀疏MoE

Sparse MoE

4

每次只用部分專家的MoE

模型架構查看詳情

策略梯度

Policy Gradient

4

直接優化策略的強化學習方法

模型架構查看詳情

超級對齊

Superalignment

4

對齊超人類AI

倫理與安全查看詳情

量子 AI

Quantum AI

4

量子運算與 AI 的結合

硬體與部署查看詳情

量化感知訓練

QAT

4

Quantization Aware Training

訓練與優化查看詳情

雅可比矩陣

Jacobian Matrix

4

多變數函數的一階偏導矩陣

基礎概念查看詳情

滑窗注意力

Sliding Window Attention

4

限定局部窗口的注意力

模型架構查看詳情

解耦表示

Disentangled Representation

4

因子的獨立表示

模型架構查看詳情

路由

Routing

4

MoE中分配輸入給專家

模型架構查看詳情

運算最優

Compute Optimal

4

給定算力下的最優配置

訓練與優化查看詳情

圖神經網絡

GNN

4

處理圖結構數據的神經網絡

模型架構查看詳情

對比學習

Contrastive Learning

4

拉近相似樣本、推遠不相似樣本的學習

模型架構查看詳情

對抗性攻擊

Adversarial Attack

4

刻意製造使模型出錯的輸入

倫理與安全查看詳情

對抗魯棒性

Adversarial Robustness

4

抵禦對抗攻擊的能力

倫理與安全查看詳情

對數似然

Log-Likelihood

4

模型擬合數據的對數機率

訓練與優化查看詳情

演員-評論家

Actor-Critic

4

結合策略與價值函數的RL架構

模型架構查看詳情

蒸餾感知訓練

Distillation-aware Training

4

訓練時即考慮後續蒸餾

訓練與優化查看詳情

蒙地卡羅樹搜尋

MCTS

4

透過隨機模擬的樹搜尋方法

模型架構查看詳情

語言處理單元

LPU (Language Processing Unit)

4

專為 LLM 設計的專用晶片

硬體與部署查看詳情

價值漂移

Value Drift

4

模型價值觀隨時間偏離

倫理與安全查看詳情

數據投毒

Data Poisoning

4

在訓練數據中植入惡意樣本

倫理與安全查看詳情

數據並行

Data Parallelism

4

將不同批次分配到多GPU並行訓練

硬體與部署查看詳情

模型反演

Model Inversion

4

從模型推斷訓練數據

倫理與安全查看詳情

模型並行

Model Parallelism

4

將大模型切分到多裝置訓練

硬體與部署查看詳情

模型蒸餾

Model Distillation

4

用大模型知識訓練小模型的技術

產業術語查看詳情

模擬轉現實

Sim-to-Real

4

將模擬訓練遷移到現實

應用場景查看詳情

線性注意力

Linear Attention

4

計算複雜度線性的注意力

模型架構查看詳情

線性偏置注意力

ALiBi

4

Attention with Linear Biases,無需位置嵌入

模型架構查看詳情

適配器

Adapter

4

插入式任務適配模組

模型架構查看詳情

鞍點

Saddle Point

4

某些方向上升、某些下降的臨界點

訓練與優化查看詳情

憲法AI

Constitutional AI

4

以原則約束模型行為的對齊方法

倫理與安全查看詳情

機器去學習

Machine Unlearning

4

刪除模型中的特定記憶

倫理與安全查看詳情

隨機捨入

Stochastic Rounding

4

低精度訓練的捨入方式

硬體與部署查看詳情

環形注意力

Ring Attention

4

分散式長序列注意力

模型架構查看詳情

擴展定律

Scaling Laws

4

模型表現隨規模的規律

訓練與優化查看詳情

歸納偏好

Inductive Bias

4

演算法對某種解釋的偏好

基礎概念查看詳情

離線策略學習

Off-policy Learning

4

從與當前策略不同的數據學習

模型架構查看詳情

類神經形態晶片

Neuromorphic Chip

4

模擬大腦的晶片

硬體與部署查看詳情

變分自編碼器 (VAE)

VAE (Variational Autoencoder)

4

結合生成與壓縮的機率自編碼器架構

模型架構查看詳情

邏輯量子位元

Logical Qubits

4

經錯誤校正的量子位元

硬體與部署查看詳情

BF16

Bfloat16

4

腦浮點16位格式

硬體與部署查看詳情

BitNet

BitNet

4

極低位元LLM,可在CPU上運行

模型架構查看詳情

BitNet 1.58b

BitNet 1.58b

4

1 位元量化模型技術

模型架構查看詳情

Blackwell 架構

Blackwell Architecture

4

NVIDIA 下一代 GPU 架構

硬體與部署查看詳情

Chinchilla定律

Chinchilla Laws

4

數據與參數的優化比例

訓練與優化查看詳情

DDIM

Denoising Diffusion Implicit Model

4

確定性採樣的擴散

模型架構查看詳情

DDPM

Denoising Diffusion Probabilistic Model

4

去噪擴散機率模型

模型架構查看詳情

DeepSpeed

DeepSpeed

4

微軟的分散式訓練框架

技術工具查看詳情

DPO

Direct Preference Optimization

4

直接優化偏好無需獎勵模型

模型架構查看詳情

Flash Attention

Flash Attention

4

加速注意力計算的記憶體高效實現

硬體與部署查看詳情

FP8

FP8

4

8位浮點格式

硬體與部署查看詳情

FSDP

Fully Sharded Data Parallel

4

全分片數據並行

硬體與部署查看詳情

GraphRAG

GraphRAG

4

結合圖資料庫與RAG的進階檢索方法

產業術語查看詳情

HBM3e

HBM3e

4

高頻寬記憶體第三代增強版

硬體與部署查看詳情

HNSW

HNSW

4

層級導航小世界近似最近鄰

技術工具查看詳情

HyDE

HyDE

4

用假設性文件嵌入提升檢索的RAG技巧

產業術語查看詳情

IA3

Infused Adapter by Inhibiting and Amplifying

4

輕量微調方法

模型架構查看詳情

INT4

INT4

4

4位整數量化

硬體與部署查看詳情

KL散度

Kullback-Leibler Divergence

4

衡量兩機率分布差異的指標

訓練與優化查看詳情

KV快取

KV Cache

4

快取注意力Key/Value以加速LLM生成

硬體與部署查看詳情

LIME

LIME

4

局部可解釋模型

倫理與安全查看詳情

Mamba

Mamba

4

狀態空間模型,長文本架構

模型架構查看詳情

Megatron

Megatron-LM

4

NVIDIA的大規模訓練框架

技術工具查看詳情

ORPO

ORPO

4

單階段偏好優化

模型架構查看詳情

P-jailbreaking

P-jailbreaking

4

透過偽裝繞過安全限制

倫理與安全查看詳情

Post-Norm

Post-Normalization

4

注意力後做正規化

模型架構查看詳情

Pre-Norm

Pre-Normalization

4

注意力前做正規化

模型架構查看詳情

QAT / PTQ

QAT & PTQ

4

量化感知訓練與後訓練量化

訓練與優化查看詳情

QLoRA

QLoRA

4

量化LoRA降低顯存需求

模型架構查看詳情

RLAIF

RLAIF

4

用AI回饋替代人類的強化學習對齊

模型架構查看詳情

Self-RAG

Self-RAG

4

自我檢查式檢索增強

產業術語查看詳情

SHAP

SHAP

4

特徵歸因方法

倫理與安全查看詳情

SwiGLU

SwiGLU

4

結合Swish與GLU的高效激活架構

模型架構查看詳情

Swin Transformer

Swin Transformer

4

分層視覺Transformer架構

模型架構查看詳情

Triton

Triton

4

GPU核函數開發語言與編譯器

技術工具查看詳情

Zero-1-to-3

Zero-1-to-3

4

單圖轉3D的技術

模型架構查看詳情

ZeRO優化器

ZeRO

4

消除優化器狀態冗餘

硬體與部署查看詳情