Command Palette
Search for a command to run...
百科
我们编汇了数百条相关词条,帮助您理解「人工智能」
DPO 的核心思想是直接在人类偏好数据上进行优化,而无需训练一个单独的奖励模型或使用强化学习
无训练指导旨在解决扩散模型在条件生成领域的难题。
主要气味地图旨在模拟气味的化学结构与其嗅觉感知特性之间的联系。
分布外检测专注于识别那些在模型训练阶段未被覆盖的数据样本。
Star Attention 能够显著减少推理时间,最多可以减少 11 倍的内存需求和推理时间,同时保持 95-100% 的准确性。
UniSeg3D 能够在同一模型内实现 6 种不同的 3D 点云分割任务。
数字理解和处理能力旨在独立评估大型语言模型 (LLMs) 在数字领域的表现。
Coconut 将推理过程从传统的语言空间中解放出来,允许模型直接在连续的潜在空间中进行推理。
密度定律描述了大型语言模型 (LLMs) 的能力密度随时间呈指数级增长的趋势。
最近邻搜索是一种在数据库或数据集中查找与给定查询点距离最近的点(或点集)的算法问题。
邻居搜索指的是确定在模拟盒子中每个粒子(通常是原子)周围的邻近粒子的过程。
单点 PageRank 计算通过随机游走模型来确定节点的重要性。
强化微调结合了监督微调和强化学习,旨在优化模型生成高质量解答的能力。
NLRL 将强化学习的核心概念用自然语言的形式重新定义。
MILP-StuDio 旨在通过保留问题分块结构来生成高质量的 MILP 实例。
MILP 是一种数学优化技术,它用于在一组线性约束条件下寻找线性目标函数的最大值或最小值。
事件相机 (Event-based Camera),也称为动态视觉传感器 (DVS) 或 DAVIS (Dynamic and Active-Pixel Vision Sensor),是一种新型的视觉传感器,它与传统相机 […]
UDK-VQA 框架的核心目的是为了增强现有的大型视觉语言模型 (LVLMs),使其能够处理关于最新知识的视觉上的问题回答 (VQA) 。
SearchLVLMs 框架能够显著提升 LVLMs 在回答需要最新知识的问题上的性能。
LLMxMapReduce 框架打破了大模型的记忆限制,理论上实现了「无限长」上下文的处理能力。
AdaCache 是由 Meta 于 2024 年提出的用于加速 AI 视频生成技术,其核心在于自适应缓存机制,相关论文成果为「Adaptive Caching for Faster Video Generation w […]
卡内基梅隆大学 (CMU) 在 2024 年提出了一种全新的黑盒优化策略,这一策略通过大语言模型自动调整自然语言提示词,以优化视觉语言模型 (VLMs) 在文生图、视觉识别等多个下游任务中的表现。这种方法不仅无需触及模型 […]
DexMimicGen 能够通过少量的人类示范生成大量的机器人训练数据。
MIA-DPO (Multi-Image Augmented Direct Preference Optimization) 是一种面向大型视觉语言模型 (LVLMs) 的多图像增强的偏好对齐方法,由上海交通大学、上海人 […]
DPO 的核心思想是直接在人类偏好数据上进行优化,而无需训练一个单独的奖励模型或使用强化学习
无训练指导旨在解决扩散模型在条件生成领域的难题。
主要气味地图旨在模拟气味的化学结构与其嗅觉感知特性之间的联系。
分布外检测专注于识别那些在模型训练阶段未被覆盖的数据样本。
Star Attention 能够显著减少推理时间,最多可以减少 11 倍的内存需求和推理时间,同时保持 95-100% 的准确性。
UniSeg3D 能够在同一模型内实现 6 种不同的 3D 点云分割任务。
数字理解和处理能力旨在独立评估大型语言模型 (LLMs) 在数字领域的表现。
Coconut 将推理过程从传统的语言空间中解放出来,允许模型直接在连续的潜在空间中进行推理。
密度定律描述了大型语言模型 (LLMs) 的能力密度随时间呈指数级增长的趋势。
最近邻搜索是一种在数据库或数据集中查找与给定查询点距离最近的点(或点集)的算法问题。
邻居搜索指的是确定在模拟盒子中每个粒子(通常是原子)周围的邻近粒子的过程。
单点 PageRank 计算通过随机游走模型来确定节点的重要性。
强化微调结合了监督微调和强化学习,旨在优化模型生成高质量解答的能力。
NLRL 将强化学习的核心概念用自然语言的形式重新定义。
MILP-StuDio 旨在通过保留问题分块结构来生成高质量的 MILP 实例。
MILP 是一种数学优化技术,它用于在一组线性约束条件下寻找线性目标函数的最大值或最小值。
事件相机 (Event-based Camera),也称为动态视觉传感器 (DVS) 或 DAVIS (Dynamic and Active-Pixel Vision Sensor),是一种新型的视觉传感器,它与传统相机 […]
UDK-VQA 框架的核心目的是为了增强现有的大型视觉语言模型 (LVLMs),使其能够处理关于最新知识的视觉上的问题回答 (VQA) 。
SearchLVLMs 框架能够显著提升 LVLMs 在回答需要最新知识的问题上的性能。
LLMxMapReduce 框架打破了大模型的记忆限制,理论上实现了「无限长」上下文的处理能力。
AdaCache 是由 Meta 于 2024 年提出的用于加速 AI 视频生成技术,其核心在于自适应缓存机制,相关论文成果为「Adaptive Caching for Faster Video Generation w […]
卡内基梅隆大学 (CMU) 在 2024 年提出了一种全新的黑盒优化策略,这一策略通过大语言模型自动调整自然语言提示词,以优化视觉语言模型 (VLMs) 在文生图、视觉识别等多个下游任务中的表现。这种方法不仅无需触及模型 […]
DexMimicGen 能够通过少量的人类示范生成大量的机器人训练数据。
MIA-DPO (Multi-Image Augmented Direct Preference Optimization) 是一种面向大型视觉语言模型 (LVLMs) 的多图像增强的偏好对齐方法,由上海交通大学、上海人 […]