Command Palette
Search for a command to run...
百科
我们编汇了数百条相关词条,帮助您理解「人工智能」
梅尔倒谱是一种在声音处理领域广泛应用的技术,特别是在语音识别和话者识别中。
Dijkstra 算法是一种用于寻找图中单源最短路径的经典算法。
WISE 技术旨在对抗大语言模型中的幻觉现象,并提升模型的知识记忆编辑能力。
DuoAttention 通过为检索头应用全 KV 缓存,而为流式头应用轻量级、固定长度的 KV 缓存,实现了内存和计算资源的优化。
数字表亲不追求与真实物体一一对应,而是关注相似的几何和语义特质,从而以更低的成本生成实用的训练数据。
DAPE 全称为 Data-Adaptive Positional Encoding,是一种新的位置编码方法,由香港中文大学的郑传阳等人提出的,该研究团队还包括来自新加坡国立大学、诺亚实验室、香港大学和香港浸会大学的研究 […]
SparseLLM 是一种新型的全局剪枝框架,由埃默里大学和美国阿贡国家实验室的研究人员于 2024 年共同提出,相关论文成果为「SparseLLM: Towards Global Pruning of Pre-trai […]
Diff Transformer 通过计算两个独立的 softmax 注意力图,然后求其差值来得到最终的注意力分数,这种方法能够有效消除注意力噪声,促使模型更加关注于输入中最相关的部分。
UNA 全称为 Unified Alignment Framework,是由来自 Salesforce 和厦门大学的研究团队提出的一个新型对齐框架。相关论文成果为「UNA: Unifying Alignments of […]
Swarm 是由 OpenAI 于 2024 年开发的一个实验性质的多智能体框架,它旨在简化多智能体系统的构建、编排和部署工作。 Swarm 关注的重点是让智能体协作和执行变得轻量、高度可控且易于测试。 Swarm 的核 […]
Michelangelo 是由 DeepMind 的研究人员于 2024 年提出的一个用于评估大型语言模型在长文本上下文推理能力的方法。它通过一个名为 Latent Structure Queries (LSQ) 的框架 […]
停机问题 (Halting Problem) 是逻辑数学中可计算性理论的一个重要问题,由英国数学家艾伦·图灵 (Alan Turing) 在 1936 年提出。相关论文是图灵的著名论文「On Computable Num […]
当模型在训练过程中开始生成与真实数据分布相差甚远的数据时,模型的性能会急剧下降,最终导致模型输出变得毫无意义。
Hopfield 网络是一种递归神经网络,主要用于联想记忆和模式识别等问题。
奖励错误归约是指在强化学习 (RL) 中,由于奖励函数不完全符合智能体真正目标而导致的问题。
序列推荐系统是推荐系统的一种重要类型,其主要任务是根据用户的历史行为序列来预测用户的下一个行为。
R-MFDN 通过跨模态对比学习损失函数和身份驱动的对比学习损失函数来增强模型对伪造内容的敏感性。
卡雷尔谜题是一种通过指令在模拟环境中控制机器人行动的问题集合。
全前向模式 (Fully Forward Mode,FFM) 是一种用于训练光学神经网络的方法,它由清华大学戴琼海院士、方璐教授的研究团队于 2024 年提出。相关论文是「Fully forward mode train […]
忙碌海狸游戏是由数学家 Tibor Radó 在 1962 年提出的一个理论计算机科学问题。
RNN 的工作原理是通过隐藏层的状态来存储之前时间步的信息,使得网络的输出依赖于当前的输入和之前的状态。
ResNet 通过在网络中增加残差连接,有效地解决了随着网络深度增加时出现的梯度消失和梯度爆炸问题。
Adam 是一种用于一阶梯度优化的算法,特别适用于处理大规模数据和参数的优化问题。
GPT 模型的核心技术是 Transformer 架构,它通过自注意力机制有效地捕捉上下文信息。
梅尔倒谱是一种在声音处理领域广泛应用的技术,特别是在语音识别和话者识别中。
Dijkstra 算法是一种用于寻找图中单源最短路径的经典算法。
WISE 技术旨在对抗大语言模型中的幻觉现象,并提升模型的知识记忆编辑能力。
DuoAttention 通过为检索头应用全 KV 缓存,而为流式头应用轻量级、固定长度的 KV 缓存,实现了内存和计算资源的优化。
数字表亲不追求与真实物体一一对应,而是关注相似的几何和语义特质,从而以更低的成本生成实用的训练数据。
DAPE 全称为 Data-Adaptive Positional Encoding,是一种新的位置编码方法,由香港中文大学的郑传阳等人提出的,该研究团队还包括来自新加坡国立大学、诺亚实验室、香港大学和香港浸会大学的研究 […]
SparseLLM 是一种新型的全局剪枝框架,由埃默里大学和美国阿贡国家实验室的研究人员于 2024 年共同提出,相关论文成果为「SparseLLM: Towards Global Pruning of Pre-trai […]
Diff Transformer 通过计算两个独立的 softmax 注意力图,然后求其差值来得到最终的注意力分数,这种方法能够有效消除注意力噪声,促使模型更加关注于输入中最相关的部分。
UNA 全称为 Unified Alignment Framework,是由来自 Salesforce 和厦门大学的研究团队提出的一个新型对齐框架。相关论文成果为「UNA: Unifying Alignments of […]
Swarm 是由 OpenAI 于 2024 年开发的一个实验性质的多智能体框架,它旨在简化多智能体系统的构建、编排和部署工作。 Swarm 关注的重点是让智能体协作和执行变得轻量、高度可控且易于测试。 Swarm 的核 […]
Michelangelo 是由 DeepMind 的研究人员于 2024 年提出的一个用于评估大型语言模型在长文本上下文推理能力的方法。它通过一个名为 Latent Structure Queries (LSQ) 的框架 […]
停机问题 (Halting Problem) 是逻辑数学中可计算性理论的一个重要问题,由英国数学家艾伦·图灵 (Alan Turing) 在 1936 年提出。相关论文是图灵的著名论文「On Computable Num […]
当模型在训练过程中开始生成与真实数据分布相差甚远的数据时,模型的性能会急剧下降,最终导致模型输出变得毫无意义。
Hopfield 网络是一种递归神经网络,主要用于联想记忆和模式识别等问题。
奖励错误归约是指在强化学习 (RL) 中,由于奖励函数不完全符合智能体真正目标而导致的问题。
序列推荐系统是推荐系统的一种重要类型,其主要任务是根据用户的历史行为序列来预测用户的下一个行为。
R-MFDN 通过跨模态对比学习损失函数和身份驱动的对比学习损失函数来增强模型对伪造内容的敏感性。
卡雷尔谜题是一种通过指令在模拟环境中控制机器人行动的问题集合。
全前向模式 (Fully Forward Mode,FFM) 是一种用于训练光学神经网络的方法,它由清华大学戴琼海院士、方璐教授的研究团队于 2024 年提出。相关论文是「Fully forward mode train […]
忙碌海狸游戏是由数学家 Tibor Radó 在 1962 年提出的一个理论计算机科学问题。
RNN 的工作原理是通过隐藏层的状态来存储之前时间步的信息,使得网络的输出依赖于当前的输入和之前的状态。
ResNet 通过在网络中增加残差连接,有效地解决了随着网络深度增加时出现的梯度消失和梯度爆炸问题。
Adam 是一种用于一阶梯度优化的算法,特别适用于处理大规模数据和参数的优化问题。
GPT 模型的核心技术是 Transformer 架构,它通过自注意力机制有效地捕捉上下文信息。