Command Palette
Search for a command to run...
百科
我们编汇了数百条相关词条,帮助您理解「人工智能」
RAE 凭借明显优势有望成为扩散 Transformer 训练的新默认选择。
基于 GRPO 等微调技术现有局限性,GVPO 作为一种可靠、多功能的后训练范式应运而生。
ReCA 在应用场景和系统规模上具有泛化能力,成功任务率提升了 4.3% 。
DexFlyWheel 是一个用于灵巧操作的、可扩展且自我改进的数据生成范式。
NovaFlow 能够在不同的机器人形态中处理刚性、铰接和可变形物体。
TreeSynth 在大规模数据合成方面展现出卓越鲁棒性和可扩展性。
GTA 在多个文本分类基准测试中均显著优于标准 SFT 基线和最先进的 RL 方法。
ACE 通过动态优化输入上下文使智能体能够自我改进。
Vibe-coding 的兴起,不仅改变了编程的形态,也重塑了软件开发的生态。
类比 LLM 领域的思维链概念,CoF 适用于当今的生成视频模型。
在三个对齐能力上的实验表明 TAE 的有效性,特别是真实性以极低成本超越基线 25.8% 。
彩票假说的出现,催生了一系列高效训练神经网络的方法。
TileLang 通过统一的块和线程范式以及透明的调度能力,能够满足现代 AI 系统开发所要求的强大功能和灵活性。
通过共享卷积特征将 RPN 和 Fast R-CNN 合并为一个网络,用于目标检测。
CSA 旨在构建不仅安全,而且真正有帮助的系统。
CaT 可以在测试时用于推理时提升,或在内置于 RL(CaT-RL)中以提高策略。
MCP 用于连接 AI 助手到存储数据的地方,包括内容库、业务工具和开发环境。
MetaFold 能够处理多种衣物和广泛的语言指令,高效完成各种衣物折叠任务。
ST-Raptor 在答案准确率上比九个基线模型高出最多 20% 。
SubLlME 旨在通过排名相关性预测,在无需全量评测的情况下,实现 高效、准确的模型性能评估。
BSC-Nav 从自中心轨迹和上下文线索构建 allocentric 认知地图,并动态检索与语义目标一致的空间知识。
初步实验表明,DPCL 能够分离语音并且取得较为理想的效果。
双模退火的目标是开发一个能够掌握思考模式和非思考模式两种不同响应模式的模型。
BPO 的核心原理是通过明确对比相同输入查询下思考与非思考路径的效用来学习自适应策略。
RAE 凭借明显优势有望成为扩散 Transformer 训练的新默认选择。
基于 GRPO 等微调技术现有局限性,GVPO 作为一种可靠、多功能的后训练范式应运而生。
ReCA 在应用场景和系统规模上具有泛化能力,成功任务率提升了 4.3% 。
DexFlyWheel 是一个用于灵巧操作的、可扩展且自我改进的数据生成范式。
NovaFlow 能够在不同的机器人形态中处理刚性、铰接和可变形物体。
TreeSynth 在大规模数据合成方面展现出卓越鲁棒性和可扩展性。
GTA 在多个文本分类基准测试中均显著优于标准 SFT 基线和最先进的 RL 方法。
ACE 通过动态优化输入上下文使智能体能够自我改进。
Vibe-coding 的兴起,不仅改变了编程的形态,也重塑了软件开发的生态。
类比 LLM 领域的思维链概念,CoF 适用于当今的生成视频模型。
在三个对齐能力上的实验表明 TAE 的有效性,特别是真实性以极低成本超越基线 25.8% 。
彩票假说的出现,催生了一系列高效训练神经网络的方法。
TileLang 通过统一的块和线程范式以及透明的调度能力,能够满足现代 AI 系统开发所要求的强大功能和灵活性。
通过共享卷积特征将 RPN 和 Fast R-CNN 合并为一个网络,用于目标检测。
CSA 旨在构建不仅安全,而且真正有帮助的系统。
CaT 可以在测试时用于推理时提升,或在内置于 RL(CaT-RL)中以提高策略。
MCP 用于连接 AI 助手到存储数据的地方,包括内容库、业务工具和开发环境。
MetaFold 能够处理多种衣物和广泛的语言指令,高效完成各种衣物折叠任务。
ST-Raptor 在答案准确率上比九个基线模型高出最多 20% 。
SubLlME 旨在通过排名相关性预测,在无需全量评测的情况下,实现 高效、准确的模型性能评估。
BSC-Nav 从自中心轨迹和上下文线索构建 allocentric 认知地图,并动态检索与语义目标一致的空间知识。
初步实验表明,DPCL 能够分离语音并且取得较为理想的效果。
双模退火的目标是开发一个能够掌握思考模式和非思考模式两种不同响应模式的模型。
BPO 的核心原理是通过明确对比相同输入查询下思考与非思考路径的效用来学习自适应策略。