HyperAI

Main

GPU

Console
Docs
Pricing

Pulse

News

Resources

Papers
Notebooks
Datasets
Wiki

Benchmarks

SOTA
LLM Models
GPU Leaderboard

Community

Events

Utility

About Terms of Service Privacy Policy
English

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

Daily updated cutting-edge AI research papers to help you keep up with the latest AI trends

Build the Future of Artificial Intelligence

About

About Us Dataset Help

Products

News Papers Notebooks Datasets Wiki

Links

© HyperAI

GitHub Discord X (formerly Twitter)

HyperAI

Main

GPU

Console
Docs
Pricing

Pulse

News

Resources

Papers
Notebooks
Datasets
Wiki

Benchmarks

SOTA
LLM Models
GPU Leaderboard

Community

Events

Utility

About Terms of Service Privacy Policy
English

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

Daily updated cutting-edge AI research papers to help you keep up with the latest AI trends

Build the Future of Artificial Intelligence

About

About Us Dataset Help

Products

News Papers Notebooks Datasets Wiki

Links

© HyperAI

GitHub Discord X (formerly Twitter)

The Devil Behind Moltbook: Anthropic Safety is Always Vanishing in Self-Evolving AI Societies

The Devil Behind Moltbook: Anthropic Safety is Always Vanishing in Self-Evolving AI Societies

Chenxu Wang, Chaozhuo Li, Songyang Liu, et al.

Towards Autonomous Mathematics Research

Towards Autonomous Mathematics Research

Tony Feng, Trieu H. Trinh, Garrett Bingham, et al.

When to Memorize and When to Stop: Gated Recurrent Memory for Long-Context Reasoning

Intelligent Question Answering

Leheng Sheng, Yongtao Zhang, Wenchang Ma, et al.

ASA: Activation Steering for Tool-Calling Domain Adaptation

Intelligent Question Answering

Youjin Wang, Run Zhou, Rong Fu, et al.

PhyCritic: Multimodal Critic Models for Physical AI

Visual Question Answering

Tianyi Xiong, Shihao Wang, Guilin Liu, et al.

GENIUS: Generative Fluid Intelligence Evaluation Suite

Ruichuan An, Sihan Yang, Ziyu Guo, et al.

Step 3.5 Flash: Open Frontier-Level Intelligence with 11B Active Parameters

Ailin Huang, Ang Li, Aobo Kong, et al.

World-VLA-Loop: Closed-Loop Learning of Video World Model and VLA Policy

Diffusion Model

Video Generation

Xiaokang Liu, Zechen Bai, Hai Ci, et al.

Towards Autonomous Mathematics Research

Retrieval-Augmented Generation

Tony Feng, Trieu H. Trinh, Garrett Bingham, et al.

Agent World Model: Infinity Synthetic Environments for Agentic Reinforcement Learning

Zhaoyang Wang, Canwen Xu, Boyi Liu, et al.

P1-VL: Bridging Visual Perception and Scientific Reasoning in Physics Olympiads

Multimodal Representation

Yun Luo, Futing Wang, Qianjia Cheng, et al.

Chain of Mindset: Reasoning with Adaptive Cognitive Modes

Tianyi Jiang, Arctanx An, Hengyi Feng, et al.

UI-Venus-1.5 Technical Report

Veuns-Team, Changlong Gao, Zhangxuan Gu, et al.

Code2World: A GUI World Model via Renderable Code Generation

Code Generation

Yuhao Zheng, Li'an Zhong, Yi Wang, et al.

OPUS: Towards Efficient and Principled Data Selection in Large Language Model Pre-training in Every Iteration

Shaobo Wang, Xuan Ouyang, Tianyi Xu, et al.

BagelVLA: Enhancing Long-Horizon Manipulation via Interleaved Vision-Language-Action Generation

Yucheng Hu, Jianke Zhang, Yuanfei Luo, et al.

THINGS-data: A multimodal collection of large-scale datasets for investigating object representations in human brain and behavior

Object Recognition

Martin N Hebert, Oliver Contier, Lina Teichmann, et al.

Accurate Predictions of Novel Biomolecular Interactions with IsoDDE

Isomorphic Labs Team

SKILLRL: Evolving Agents via Recursive Skill-Augmented Reinforcement Learning

Reinforcement Learning

Peng Xia, Jianwen Chen, Hanyang Wang, et al.

LLaDA2.1: Speeding Up Text Diffusion via Token Editing

Diffusion Model

Tiwei Bie, Maosong Cao, Xiang Cao, et al.

Alleviating Sparse Rewards by Modeling Step-Wise and Long-Term Sampling Effects in Flow-Based GRPO

Diffusion Model

Image Generation

Yunze Tong, Mushui Liu, Canyu Zhao, et al.

Recurrent-Depth VLA: Implicit Test-Time Compute Scaling of Vision-Language-Action Models via Latent Iterative Reasoning

Yalcin Tur, Jalal Naghiyev, Haoquan Fang, et al.

QuantaAlpha: An Evolutionary Framework for LLM-Driven Alpha Mining

Jun Han, Shuo Zhang, Wei Li, et al.

Modality Gap-Driven Subspace Alignment Training Paradigm For Multimodal Large Language Models

Multimodal Representation

Xiaomin Yu, Yi Xin, Wenjie Zhang, et al.

MOVA: Towards Scalable and Synchronized Video-Audio Generation

Video Generation

SII-OpenMOSS Team, Donghua Yu, Mingshu Chen, et al.

MemoryLLM: Plug-n-Play Interpretable Feed-Forward Memory for Transformers

Ajay Jaiswal, Lauren Hannah, Han-Byul Kim, et al.

DreamDojo: A Generalist Robot World Model from Large-Scale Human Videos

Video Understanding

Shenyuan Gao, William Liang, Kaiyuan Zheng, et al.

F-GRPO: Don't Let Your Policy Learn the Obvious and Forget the Rare

Reinforcement Learning

Daniil Plyusov, Alexey Gorbatovski, Boris Shaposhnikov, et al.

MSign: An Optimizer Preventing Training Instability in Large Language Models via Stable Rank Restoration

Lianhai Ren, Yucheng Ding, Xiao Liu, et al.

AudioSAE: Towards Understanding of Audio-Processing Models with Sparse AutoEncoders

Audio and Speech Processing

Georgii Aparin, Tasnima Sadekova, Alexey Rukhovich, et al.

On the Entropy Dynamics in Reinforcement Fine-Tuning of Large Language Models

Reinforcement Learning

Shumin Wang, Yuexiang Xie, Wenhao Zhang, et al.

OdysseyArena: Benchmarking Large Language Models For Long-Horizon, Active and Inductive Interactions

Fangzhi Xu, Hang Yan, Qiushi Sun, et al.

The Devil Behind Moltbook: Anthropic Safety is Always Vanishing in Self-Evolving AI Societies

The Devil Behind Moltbook: Anthropic Safety is Always Vanishing in Self-Evolving AI Societies

Chenxu Wang, Chaozhuo Li, Songyang Liu, et al.

Towards Autonomous Mathematics Research

Towards Autonomous Mathematics Research

Tony Feng, Trieu H. Trinh, Garrett Bingham, et al.

When to Memorize and When to Stop: Gated Recurrent Memory for Long-Context Reasoning

Intelligent Question Answering

Leheng Sheng, Yongtao Zhang, Wenchang Ma, et al.

ASA: Activation Steering for Tool-Calling Domain Adaptation

Intelligent Question Answering

Youjin Wang, Run Zhou, Rong Fu, et al.

PhyCritic: Multimodal Critic Models for Physical AI

Visual Question Answering

Tianyi Xiong, Shihao Wang, Guilin Liu, et al.

GENIUS: Generative Fluid Intelligence Evaluation Suite

Ruichuan An, Sihan Yang, Ziyu Guo, et al.

Step 3.5 Flash: Open Frontier-Level Intelligence with 11B Active Parameters

Ailin Huang, Ang Li, Aobo Kong, et al.

World-VLA-Loop: Closed-Loop Learning of Video World Model and VLA Policy

Diffusion Model

Video Generation

Xiaokang Liu, Zechen Bai, Hai Ci, et al.

Towards Autonomous Mathematics Research

Retrieval-Augmented Generation

Tony Feng, Trieu H. Trinh, Garrett Bingham, et al.

Agent World Model: Infinity Synthetic Environments for Agentic Reinforcement Learning

Zhaoyang Wang, Canwen Xu, Boyi Liu, et al.

P1-VL: Bridging Visual Perception and Scientific Reasoning in Physics Olympiads

Multimodal Representation

Yun Luo, Futing Wang, Qianjia Cheng, et al.

Chain of Mindset: Reasoning with Adaptive Cognitive Modes

Tianyi Jiang, Arctanx An, Hengyi Feng, et al.

UI-Venus-1.5 Technical Report

Veuns-Team, Changlong Gao, Zhangxuan Gu, et al.

Code2World: A GUI World Model via Renderable Code Generation

Code Generation

Yuhao Zheng, Li'an Zhong, Yi Wang, et al.

OPUS: Towards Efficient and Principled Data Selection in Large Language Model Pre-training in Every Iteration

Shaobo Wang, Xuan Ouyang, Tianyi Xu, et al.

BagelVLA: Enhancing Long-Horizon Manipulation via Interleaved Vision-Language-Action Generation

Yucheng Hu, Jianke Zhang, Yuanfei Luo, et al.

THINGS-data: A multimodal collection of large-scale datasets for investigating object representations in human brain and behavior

Object Recognition

Martin N Hebert, Oliver Contier, Lina Teichmann, et al.

Accurate Predictions of Novel Biomolecular Interactions with IsoDDE

Isomorphic Labs Team

SKILLRL: Evolving Agents via Recursive Skill-Augmented Reinforcement Learning

Reinforcement Learning

Peng Xia, Jianwen Chen, Hanyang Wang, et al.

LLaDA2.1: Speeding Up Text Diffusion via Token Editing

Diffusion Model

Tiwei Bie, Maosong Cao, Xiang Cao, et al.

Alleviating Sparse Rewards by Modeling Step-Wise and Long-Term Sampling Effects in Flow-Based GRPO

Diffusion Model

Image Generation

Yunze Tong, Mushui Liu, Canyu Zhao, et al.

Recurrent-Depth VLA: Implicit Test-Time Compute Scaling of Vision-Language-Action Models via Latent Iterative Reasoning

Yalcin Tur, Jalal Naghiyev, Haoquan Fang, et al.

QuantaAlpha: An Evolutionary Framework for LLM-Driven Alpha Mining

Jun Han, Shuo Zhang, Wei Li, et al.

Modality Gap-Driven Subspace Alignment Training Paradigm For Multimodal Large Language Models

Multimodal Representation

Xiaomin Yu, Yi Xin, Wenjie Zhang, et al.

MOVA: Towards Scalable and Synchronized Video-Audio Generation

Video Generation

SII-OpenMOSS Team, Donghua Yu, Mingshu Chen, et al.

MemoryLLM: Plug-n-Play Interpretable Feed-Forward Memory for Transformers

Ajay Jaiswal, Lauren Hannah, Han-Byul Kim, et al.

DreamDojo: A Generalist Robot World Model from Large-Scale Human Videos

Video Understanding

Shenyuan Gao, William Liang, Kaiyuan Zheng, et al.

F-GRPO: Don't Let Your Policy Learn the Obvious and Forget the Rare

Reinforcement Learning

Daniil Plyusov, Alexey Gorbatovski, Boris Shaposhnikov, et al.

MSign: An Optimizer Preventing Training Instability in Large Language Models via Stable Rank Restoration

Lianhai Ren, Yucheng Ding, Xiao Liu, et al.

AudioSAE: Towards Understanding of Audio-Processing Models with Sparse AutoEncoders

Audio and Speech Processing

Georgii Aparin, Tasnima Sadekova, Alexey Rukhovich, et al.

On the Entropy Dynamics in Reinforcement Fine-Tuning of Large Language Models

Reinforcement Learning

Shumin Wang, Yuexiang Xie, Wenhao Zhang, et al.

OdysseyArena: Benchmarking Large Language Models For Long-Horizon, Active and Inductive Interactions

Fangzhi Xu, Hang Yan, Qiushi Sun, et al.

When to Memorize and When to Stop: Gated Recurrent Memory for Long-Context Reasoning

ASA: Activation Steering for Tool-Calling Domain Adaptation

PhyCritic: Multimodal Critic Models for Physical AI

GENIUS: Generative Fluid Intelligence Evaluation Suite

Step 3.5 Flash: Open Frontier-Level Intelligence with 11B Active Parameters

World-VLA-Loop: Closed-Loop Learning of Video World Model and VLA Policy

Towards Autonomous Mathematics Research

Agent World Model: Infinity Synthetic Environments for Agentic Reinforcement Learning

P1-VL: Bridging Visual Perception and Scientific Reasoning in Physics Olympiads

Chain of Mindset: Reasoning with Adaptive Cognitive Modes

UI-Venus-1.5 Technical Report

Code2World: A GUI World Model via Renderable Code Generation

OPUS: Towards Efficient and Principled Data Selection in Large Language Model Pre-training in Every Iteration

BagelVLA: Enhancing Long-Horizon Manipulation via Interleaved Vision-Language-Action Generation

THINGS-data: A multimodal collection of large-scale datasets for investigating object representations in human brain and behavior

Accurate Predictions of Novel Biomolecular Interactions with IsoDDE

SKILLRL: Evolving Agents via Recursive Skill-Augmented Reinforcement Learning

LLaDA2.1: Speeding Up Text Diffusion via Token Editing

Alleviating Sparse Rewards by Modeling Step-Wise and Long-Term Sampling Effects in Flow-Based GRPO

Recurrent-Depth VLA: Implicit Test-Time Compute Scaling of Vision-Language-Action Models via Latent Iterative Reasoning

QuantaAlpha: An Evolutionary Framework for LLM-Driven Alpha Mining

Modality Gap-Driven Subspace Alignment Training Paradigm For Multimodal Large Language Models

MOVA: Towards Scalable and Synchronized Video-Audio Generation

MemoryLLM: Plug-n-Play Interpretable Feed-Forward Memory for Transformers

DreamDojo: A Generalist Robot World Model from Large-Scale Human Videos

F-GRPO: Don't Let Your Policy Learn the Obvious and Forget the Rare

MSign: An Optimizer Preventing Training Instability in Large Language Models via Stable Rank Restoration

AudioSAE: Towards Understanding of Audio-Processing Models with Sparse AutoEncoders

On the Entropy Dynamics in Reinforcement Fine-Tuning of Large Language Models

OdysseyArena: Benchmarking Large Language Models For Long-Horizon, Active and Inductive Interactions

When to Memorize and When to Stop: Gated Recurrent Memory for Long-Context Reasoning

ASA: Activation Steering for Tool-Calling Domain Adaptation

PhyCritic: Multimodal Critic Models for Physical AI

GENIUS: Generative Fluid Intelligence Evaluation Suite

Step 3.5 Flash: Open Frontier-Level Intelligence with 11B Active Parameters

World-VLA-Loop: Closed-Loop Learning of Video World Model and VLA Policy

Towards Autonomous Mathematics Research

Agent World Model: Infinity Synthetic Environments for Agentic Reinforcement Learning

P1-VL: Bridging Visual Perception and Scientific Reasoning in Physics Olympiads

Chain of Mindset: Reasoning with Adaptive Cognitive Modes

UI-Venus-1.5 Technical Report

Code2World: A GUI World Model via Renderable Code Generation

OPUS: Towards Efficient and Principled Data Selection in Large Language Model Pre-training in Every Iteration

BagelVLA: Enhancing Long-Horizon Manipulation via Interleaved Vision-Language-Action Generation

THINGS-data: A multimodal collection of large-scale datasets for investigating object representations in human brain and behavior

Accurate Predictions of Novel Biomolecular Interactions with IsoDDE

SKILLRL: Evolving Agents via Recursive Skill-Augmented Reinforcement Learning

LLaDA2.1: Speeding Up Text Diffusion via Token Editing

Alleviating Sparse Rewards by Modeling Step-Wise and Long-Term Sampling Effects in Flow-Based GRPO

Recurrent-Depth VLA: Implicit Test-Time Compute Scaling of Vision-Language-Action Models via Latent Iterative Reasoning

QuantaAlpha: An Evolutionary Framework for LLM-Driven Alpha Mining

Modality Gap-Driven Subspace Alignment Training Paradigm For Multimodal Large Language Models

MOVA: Towards Scalable and Synchronized Video-Audio Generation

MemoryLLM: Plug-n-Play Interpretable Feed-Forward Memory for Transformers

DreamDojo: A Generalist Robot World Model from Large-Scale Human Videos

F-GRPO: Don't Let Your Policy Learn the Obvious and Forget the Rare

MSign: An Optimizer Preventing Training Instability in Large Language Models via Stable Rank Restoration

AudioSAE: Towards Understanding of Audio-Processing Models with Sparse AutoEncoders

On the Entropy Dynamics in Reinforcement Fine-Tuning of Large Language Models

OdysseyArena: Benchmarking Large Language Models For Long-Horizon, Active and Inductive Interactions