日期

1 年前

UNA 全称为 Unified Alignment Framework，是由来自 Salesforce 和厦门大学的研究团队提出的一个新型对齐框架。相关论文成果为「UNA: Unifying Alignments of RLHF/PPO, DPO and KTO by a Generalized Implicit Reward Function」。

UNA 的核心思想是通过一个广义的隐式奖励函数来统一不同的对齐技术，包括 RLHF/PPO 、 DPO 和 KTO 。这种方法的创新之处在于，它将这些对齐技术融合为一个监督学习问题，即最小化隐式奖励和显式奖励之间的差异。

UNA 的提出是为了解决现有对齐技术的一些局限性。例如，RLHF 需要分别训练奖励模型和策略，这个过程复杂、耗时、内存密集且在训练过程中不稳定。而 DPO 虽然提出了一个最优策略和奖励之间的映射关系，简化了 RLHF 的训练过程，但它不能充分利用奖励模型，且仅限于成对偏好数据。 UNA 通过数学证明，给定经典的 RLHF 目标，最优策略可以通过一个广义的隐式奖励函数来诱导。这个新的映射关系使得 UNA 能够简化 RLHF/PPO，同时稳定、加速并减少 RL 微调过程的内存负担，并且能够适应不同类型的反馈，包括成对、二元和标量反馈。

靶向迁移式对抗攻击框架 FOA-Attack

联合对齐全局和局部特征，有效引导对抗样本朝向目标特征分布并增强可迁移性。

2 个月前

UserBench 基准

UserBench 旨在评估和促进智能体理解、交互和适应现实世界用户沟通的能力。

3 个月前

标记感知编辑 TAE

在三个对齐能力上的实验表明 TAE 的有效性，特别是真实性以极低成本超越基线 25.8% 。

3 个月前

SAC Flow

SAC Flow 在连续控制和机器人操作基准测试中达到最先进性能。

2 个月前

DexFlyWheel 数据生成框架

DexFlyWheel 是一个用于灵巧操作的、可扩展且自我改进的数据生成范式。

3 个月前

多智能体工作流程 CudaForge

CudaForge 是一个简单有效且低成本的用于 CUDA 内核生成和优化的多智能体工作流程。

2 个月前

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

HyperAI

日期

1 年前

靶向迁移式对抗攻击框架 FOA-Attack

联合对齐全局和局部特征，有效引导对抗样本朝向目标特征分布并增强可迁移性。

2 个月前

UserBench 基准

UserBench 旨在评估和促进智能体理解、交互和适应现实世界用户沟通的能力。

3 个月前

标记感知编辑 TAE

在三个对齐能力上的实验表明 TAE 的有效性，特别是真实性以极低成本超越基线 25.8% 。

3 个月前

SAC Flow

SAC Flow 在连续控制和机器人操作基准测试中达到最先进性能。

2 个月前

DexFlyWheel 数据生成框架

DexFlyWheel 是一个用于灵巧操作的、可扩展且自我改进的数据生成范式。

3 个月前

多智能体工作流程 CudaForge

CudaForge 是一个简单有效且低成本的用于 CUDA 内核生成和优化的多智能体工作流程。

2 个月前

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

用 AI 构建 AI

HyperAI Newsletters

相关百科

靶向迁移式对抗攻击框架 FOA-Attack

UserBench 基准

标记感知编辑 TAE

SAC Flow

DexFlyWheel 数据生成框架

多智能体工作流程 CudaForge

用 AI 构建 AI

HyperAI Newsletters

相关百科

靶向迁移式对抗攻击框架 FOA-Attack

UserBench 基准

标记感知编辑 TAE

SAC Flow

DexFlyWheel 数据生成框架

多智能体工作流程 CudaForge

用 AI 构建 AI

HyperAI Newsletters

相关百科

靶向迁移式对抗攻击框架 FOA-Attack

UserBench 基准

标记感知编辑 TAE

SAC Flow

DexFlyWheel 数据生成框架

多智能体工作流程 CudaForge

相关百科

靶向迁移式对抗攻击框架 FOA-Attack

UserBench 基准

标记感知编辑 TAE

SAC Flow

DexFlyWheel 数据生成框架

多智能体工作流程 CudaForge

Command Palette

UNA 对齐框架

用 AI 构建 AI

HyperAI Newsletters

Command Palette

UNA 对齐框架

相关百科

靶向迁移式对抗攻击框架 FOA-Attack

UserBench 基准

标记感知编辑 TAE

SAC Flow

DexFlyWheel 数据生成框架

多智能体工作流程 CudaForge

用 AI 构建 AI

HyperAI Newsletters

Command Palette

UNA 对齐框架

相关百科

靶向迁移式对抗攻击框架 FOA-Attack

UserBench 基准

标记感知编辑 TAE

SAC Flow

DexFlyWheel 数据生成框架

多智能体工作流程 CudaForge

用 AI 构建 AI

HyperAI Newsletters

相关百科

靶向迁移式对抗攻击框架 FOA-Attack

UserBench 基准

标记感知编辑 TAE

SAC Flow

DexFlyWheel 数据生成框架

多智能体工作流程 CudaForge

相关百科

靶向迁移式对抗攻击框架 FOA-Attack

UserBench 基准

标记感知编辑 TAE

SAC Flow

DexFlyWheel 数据生成框架

多智能体工作流程 CudaForge