Command Palette
Search for a command to run...
百科
我们编汇了数百条相关词条,帮助您理解「人工智能」
DQ-LoRe 框架利用「双重查询 (DQ) 和低秩近似重排 (LoRe)」自动选择上下文学习示例。
对比学习是一种通过使用相互对比样本的原理来学习数据类之间常见的属性以及将数据类与另一个数据类区分开的属性来增强视觉任务性能的技术。
通过解决传统 LSTM 的局限性并结合指数门控、矩阵存储器和可并行架构等新颖组件,xLSTM 为 LLM 开辟了新的可能性。
点云是空间中点的数据集,可以表示三维形状或对象,通常由三维扫描仪获取。
指代图像分割 (Referring Image Segmentation,简称 RIS,又叫指代分割) 旨在对自然语言表达所指代的目标对象进行分割。然而,以前的方法依赖于一个强有力的假设,即一个句子必须描述图像中的一个目 […]
多重草案模型(英语:Multiple drafts model),是一种基于认知主义的物理主义意识理论,由丹尼尔•丹尼特提出。该理论以讯息处理的角度来看待心灵 。丹尼特在 1991 年出版的《意识的解释》(Conscio […]
KAN: Kolmogorov-Arnold Networks 论文提出了一种有前景的多层感知器 (MLP) 的替代方案,称为 Kolmogorov-Arnold Networks (KAN) 。 KAN 名字的由来,是 […]
Kolmogorov-Arnold 表示定理使得对复杂的动力系统进行分析变得更加简单
行动模型学习包含人工智能领域内的复杂过程,其中模型的开发本质上是为了预测代理在环境中的动作的影响。
真阳性率 (True Positive Rate,简称 TPR) 是统计学、机器学习和医学诊断中用于评估二元分类模型性能的衡量标准。它表示被模型正确识别或分类为阳性的实际阳性病例的比例。 TPR 也称为灵敏度、召回率或命 […]
故障词元 (Glitch Token) 是指在大语言模型中,本应协助模型流畅运行的词元导致了异常输出。华中科技大学、南洋理工大学等高校联合组成的研究团队在其于 2024 年发表的一项研究「Glitch Tokens i […]
多模态大语言模型将自然语言处理 (NLP) 的功能与图像、音频或视频等其他模态相结合。
与其他使用专家混合的 LLM 升级方法相比,DUS 不需要进行复杂的更改即可有效地训练和推理。
在深度学习领域中,Grokking 现象指的是神经网络在训练过程中的一种现象,即在训练误差衰减很长时间后仍能实现良好的泛化。
深度学习中的 Scaling Law 指的是感兴趣的功能性属性(通常是测试损失或微调任务的某些性能指标)与体系结构或优化过程的属性之间的关系(如模型大小、宽度或训练计算)。
涌现 (Emergence) 在人工智能领域指的是一种现象,即通过简单的个体或规则相互作用而产生复杂的集体行为或结构。在人工智能中,这种 Emergence 可以指模型学习到的高级特征或行为,这些特征或行为不是直接由设计 […]
可解释人工智能 (XAI,全称为 Explainable AI) 是一组流程和方法,允许人类用户理解和信任机器学习算法创建的结果和输出。
条件计算 (Conditional computation) 是一种减少总计算量的技术,它只会在需要时才会进行计算。
统计分类 (Statistical Classification) 是一种监督学习方法,用于将新观测数据分到已知类别中的某一个类别。
变分自编码器 (Variational Autoencoder,VAE) 是由 Diederik P. Kingma 和 Max Welling 提出的一种人工神经网络结构,属于概率图模式和变分贝叶斯方法。
掩码语言建模 (MLM) 是一种在自然语言处理 (NLP) 任务中广泛使用的深度学习技术,特别是在 Transformer 模型(如 BERT 、 GPT-2 和 RoBERTa)的训练中。
知识工程 (Knowledge Engineering) 是人工智能(AI)的一个分支,它开发规则并应用于数据,以模仿对特定主题具有专业知识的人的思维过程。
Inception Score (IS) 是一种客观性能指标,用于评估由生成对抗网络 (GAN) 生成的生成图像或合成图像的质量。
模糊逻辑 (Fuzzy Logic) 是一种变量处理方法,允许通过同一变量处理多个可能的真值。模糊逻辑试图通过开放的、不精确的数据谱和启发式方法来解决问题,从而获得一系列准确的结论。
DQ-LoRe 框架利用「双重查询 (DQ) 和低秩近似重排 (LoRe)」自动选择上下文学习示例。
对比学习是一种通过使用相互对比样本的原理来学习数据类之间常见的属性以及将数据类与另一个数据类区分开的属性来增强视觉任务性能的技术。
通过解决传统 LSTM 的局限性并结合指数门控、矩阵存储器和可并行架构等新颖组件,xLSTM 为 LLM 开辟了新的可能性。
点云是空间中点的数据集,可以表示三维形状或对象,通常由三维扫描仪获取。
指代图像分割 (Referring Image Segmentation,简称 RIS,又叫指代分割) 旨在对自然语言表达所指代的目标对象进行分割。然而,以前的方法依赖于一个强有力的假设,即一个句子必须描述图像中的一个目 […]
多重草案模型(英语:Multiple drafts model),是一种基于认知主义的物理主义意识理论,由丹尼尔•丹尼特提出。该理论以讯息处理的角度来看待心灵 。丹尼特在 1991 年出版的《意识的解释》(Conscio […]
KAN: Kolmogorov-Arnold Networks 论文提出了一种有前景的多层感知器 (MLP) 的替代方案,称为 Kolmogorov-Arnold Networks (KAN) 。 KAN 名字的由来,是 […]
Kolmogorov-Arnold 表示定理使得对复杂的动力系统进行分析变得更加简单
行动模型学习包含人工智能领域内的复杂过程,其中模型的开发本质上是为了预测代理在环境中的动作的影响。
真阳性率 (True Positive Rate,简称 TPR) 是统计学、机器学习和医学诊断中用于评估二元分类模型性能的衡量标准。它表示被模型正确识别或分类为阳性的实际阳性病例的比例。 TPR 也称为灵敏度、召回率或命 […]
故障词元 (Glitch Token) 是指在大语言模型中,本应协助模型流畅运行的词元导致了异常输出。华中科技大学、南洋理工大学等高校联合组成的研究团队在其于 2024 年发表的一项研究「Glitch Tokens i […]
多模态大语言模型将自然语言处理 (NLP) 的功能与图像、音频或视频等其他模态相结合。
与其他使用专家混合的 LLM 升级方法相比,DUS 不需要进行复杂的更改即可有效地训练和推理。
在深度学习领域中,Grokking 现象指的是神经网络在训练过程中的一种现象,即在训练误差衰减很长时间后仍能实现良好的泛化。
深度学习中的 Scaling Law 指的是感兴趣的功能性属性(通常是测试损失或微调任务的某些性能指标)与体系结构或优化过程的属性之间的关系(如模型大小、宽度或训练计算)。
涌现 (Emergence) 在人工智能领域指的是一种现象,即通过简单的个体或规则相互作用而产生复杂的集体行为或结构。在人工智能中,这种 Emergence 可以指模型学习到的高级特征或行为,这些特征或行为不是直接由设计 […]
可解释人工智能 (XAI,全称为 Explainable AI) 是一组流程和方法,允许人类用户理解和信任机器学习算法创建的结果和输出。
条件计算 (Conditional computation) 是一种减少总计算量的技术,它只会在需要时才会进行计算。
统计分类 (Statistical Classification) 是一种监督学习方法,用于将新观测数据分到已知类别中的某一个类别。
变分自编码器 (Variational Autoencoder,VAE) 是由 Diederik P. Kingma 和 Max Welling 提出的一种人工神经网络结构,属于概率图模式和变分贝叶斯方法。
掩码语言建模 (MLM) 是一种在自然语言处理 (NLP) 任务中广泛使用的深度学习技术,特别是在 Transformer 模型(如 BERT 、 GPT-2 和 RoBERTa)的训练中。
知识工程 (Knowledge Engineering) 是人工智能(AI)的一个分支,它开发规则并应用于数据,以模仿对特定主题具有专业知识的人的思维过程。
Inception Score (IS) 是一种客观性能指标,用于评估由生成对抗网络 (GAN) 生成的生成图像或合成图像的质量。
模糊逻辑 (Fuzzy Logic) 是一种变量处理方法,允许通过同一变量处理多个可能的真值。模糊逻辑试图通过开放的、不精确的数据谱和启发式方法来解决问题,从而获得一系列准确的结论。