HyperAI

Main

GPU

Console
Docs
Pricing

Pulse

News

Resources

Papers
Notebooks
Datasets
Wiki

Benchmarks

SOTA
LLM Models
GPU Leaderboard

Community

Events

Utility

About Terms of Service Privacy Policy
English

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

Daily updated cutting-edge AI research papers to help you keep up with the latest AI trends

Build the Future of Artificial Intelligence

About

About Us Dataset Help

Products

News Papers Notebooks Datasets Wiki

Links

© HyperAI

GitHub Discord X (formerly Twitter)

HyperAI

Main

GPU

Console
Docs
Pricing

Pulse

News

Resources

Papers
Notebooks
Datasets
Wiki

Benchmarks

SOTA
LLM Models
GPU Leaderboard

Community

Events

Utility

About Terms of Service Privacy Policy
English

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

Daily updated cutting-edge AI research papers to help you keep up with the latest AI trends

Build the Future of Artificial Intelligence

About

About Us Dataset Help

Products

News Papers Notebooks Datasets Wiki

Links

© HyperAI

GitHub Discord X (formerly Twitter)

Listwise Policy Optimization: Group-based RLVR as Target-Projection on the LLM Response Simplex

Listwise Policy Optimization: Group-based RLVR as Target-Projection on the LLM Response Simplex

Reinforcement Learning

Yun Qu, Qi Wang, Yixiu Mao, et al.

Flow-OPD: On-Policy Distillation for Flow Matching Models

Flow-OPD: On-Policy Distillation for Flow Matching Models

Diffusion Model

Zhen Fang, Wenxuan Huang, Yu Zeng, et al.

MACE-Dance: Motion-Appearance Cascaded Experts for Music-Driven Dance Video Generation

Diffusion Model

Video Generation

Kaixing Yang, Jiashu Zhu, Xulong Tang, et al.

Rethinking Reasoning-Intensive Retrieval: Evaluating and Advancing Retrievers in Agentic Search Systems

Retrieval-Augmented Generation

Yilun Zhao, Jinbiao Wei, Tingyu Song, et al.

When to Trust Imagination: Adaptive Action Execution for World Action Models

Rui Wang, Yue Zhang, Jiehong Lin, et al.

RaguTeam at SemEval-2026 Task 8: Meno and Friends in a Judge-Orchestrated LLM Ensemble for Faithful Multi-Turn Response Generation

Intelligent Question Answering

Text Generation

Ivan Bondarenko, Roman Derunets, Oleg Sedukhin, et al.

MiA-Signature: Approximating Global Activation for Long-Context Understanding

Retrieval-Augmented Generation

Yuqing Li, Jiangnan Li, Mo Yu, et al.

Continuous Latent Diffusion Language Model

Hongcan Guo, Qinyu Zhao, Yian Zhao, et al.

Skill1: Unified Evolution of Skill-Augmented Agents via Reinforcement Learning

Reinforcement Learning

Yaorui Shi, Yuxin Chen, Zhengxi Lu, et al.

Beyond Semantic Similarity: Rethinking Retrieval for Agentic Search via Direct Corpus Interaction

Retrieval-Augmented Generation

Zhuofeng Li, Haoxiang Zhang, Cong Wei, et al.

MathNet: A GLOBAL MULTIMODAL BENCHMARK FOR MATHEMATICAL REASONING AND RETRIEVAL

Retrieval-Augmented Generation

Shaden Alshammari, Kevin Wen, Abrar Zainal, et al.

D-OPSD: On-Policy Self-Distillation for Continuously Tuning Step-Distilled Diffusion Models

Diffusion Model

Supervised Fine-Tuning

Dongyang Jiang, Xin Jin, Dongyang Liu, et al.

ZAYA1-8B Technical Report

Supervised Fine-Tuning

Robert Washbourne, Rishi Iyer, Tomas Figliolia, et al.

PhysForge: Generating Physics-Grounded 3D Assets for Interactive Virtual World

Diffusion Model

Yunhan Yang, Chunshi Wang, Junliang Ye, et al.

HERMES++: Toward a Unified Driving World Model for 3D Scene Understanding and Generation

Autonomous Driving

Xin Zhou, Dingkang Liang, Xiwu Chen, et al.

OpenSearch-VL: An Open Recipe for Frontier Multimodal Search Agents

Retrieval-Augmented Generation

Shuang Chen, Kaituo Feng, Hangting Chen, et al.

RLDX-1 Technical Report

3D Machine Vision

Dongyoung Kim, Huiwon Jang, Myungkyu Koo, et al.

Stream-T1: Test-Time Scaling for Streaming Video Generation

Diffusion Model

Video Generation

Yijing Tu, Shaojin Wu, Mengqi Huang, et al.

Stream-R1: Reliability-Perplexity Aware Reward Distillation for Streaming Video Generation

Video Generation

Bin Wu, Mengqi Huang, Shaojin Wu, et al.

Uni-OPD: Unifying On-Policy Distillation with a Dual-Perspective Recipe

Retrieval-Augmented Generation

Wenjin Hou, Shangpin Peng, Weinong Wang, et al.

AGENTIC-IMODELS: Evolving agentic interpretability tools via autoresearch

Chandan Singh, Yan Shuo Tan, Weijia Xu, et al.

HEAVYSKILL: Heavy Thinking as the Inner Skill in Agentic Harness

Jianing Wang, Linsen Guo, Zhengyu Chen, et al.

WindowsWorld: A Process-Centric Benchmark of Autonomous GUI Agents in Professional Cross-Application Environments

Jinchao Li, Yunxin Li, Chenrui Zhao, et al.

Hallucinations Undermine Trust; Metacognition is a Way Forward

Intelligent Question Answering

Gal Yona, Mor Geva, Yossi Matias

X2SAM: Any Segmentation in Images and Videos

Image Segmentation

Hao Wang, Limeng Qiao, Chi Zhang, et al.

OpenSeeker-v2: Pushing the Limits of Search Agents with Informative and High-Difficulty Trajectories

Yuwen Du, Rui Ye, Shuo Tang, et al.

PRISM: Pre-alignment via Black-box On-policy Distillation for Multimodal Reinforcement Learning

Supervised Fine-Tuning

Sudong Wang, Weiquan Huang, Xiaomin Yu, et al.

ARIS: Autonomous Research via Adversarial Multi-Agent Collaboration

Ruofeng Yang, Yongcan Li, Shuai Li

ProgramBench: Can Language Models Rebuild Programs From Scratch?

Code Generation

John Yang, Kilian Lieret, Jeffrey Ma, et al.

Efficient Accelerated Graph Edit Distance Computation on GPU

Face Recognition

Adel Dabah, Andreas Herten

LLM-based uncertainty assessment of social media situational signals for crisis reporting

Text Generation

Timothy Douglas, Roben Delos Reyes, Asanobu Kitamoto

Canonical LST: A Protocol-Native Liquid Staking Solution for Tezos

Mathias Bourgoin, Arthur Breitman, Pierrick Couderc, et al.

Listwise Policy Optimization: Group-based RLVR as Target-Projection on the LLM Response Simplex

Listwise Policy Optimization: Group-based RLVR as Target-Projection on the LLM Response Simplex

Reinforcement Learning

Yun Qu, Qi Wang, Yixiu Mao, et al.

Flow-OPD: On-Policy Distillation for Flow Matching Models

Flow-OPD: On-Policy Distillation for Flow Matching Models

Diffusion Model

Zhen Fang, Wenxuan Huang, Yu Zeng, et al.

MACE-Dance: Motion-Appearance Cascaded Experts for Music-Driven Dance Video Generation

Diffusion Model

Video Generation

Kaixing Yang, Jiashu Zhu, Xulong Tang, et al.

Rethinking Reasoning-Intensive Retrieval: Evaluating and Advancing Retrievers in Agentic Search Systems

Retrieval-Augmented Generation

Yilun Zhao, Jinbiao Wei, Tingyu Song, et al.

When to Trust Imagination: Adaptive Action Execution for World Action Models

Rui Wang, Yue Zhang, Jiehong Lin, et al.

RaguTeam at SemEval-2026 Task 8: Meno and Friends in a Judge-Orchestrated LLM Ensemble for Faithful Multi-Turn Response Generation

Intelligent Question Answering

Text Generation

Ivan Bondarenko, Roman Derunets, Oleg Sedukhin, et al.

MiA-Signature: Approximating Global Activation for Long-Context Understanding

Retrieval-Augmented Generation

Yuqing Li, Jiangnan Li, Mo Yu, et al.

Continuous Latent Diffusion Language Model

Hongcan Guo, Qinyu Zhao, Yian Zhao, et al.

Skill1: Unified Evolution of Skill-Augmented Agents via Reinforcement Learning

Reinforcement Learning

Yaorui Shi, Yuxin Chen, Zhengxi Lu, et al.

Beyond Semantic Similarity: Rethinking Retrieval for Agentic Search via Direct Corpus Interaction

Retrieval-Augmented Generation

Zhuofeng Li, Haoxiang Zhang, Cong Wei, et al.

MathNet: A GLOBAL MULTIMODAL BENCHMARK FOR MATHEMATICAL REASONING AND RETRIEVAL

Retrieval-Augmented Generation

Shaden Alshammari, Kevin Wen, Abrar Zainal, et al.

D-OPSD: On-Policy Self-Distillation for Continuously Tuning Step-Distilled Diffusion Models

Diffusion Model

Supervised Fine-Tuning

Dongyang Jiang, Xin Jin, Dongyang Liu, et al.

ZAYA1-8B Technical Report

Supervised Fine-Tuning

Robert Washbourne, Rishi Iyer, Tomas Figliolia, et al.

PhysForge: Generating Physics-Grounded 3D Assets for Interactive Virtual World

Diffusion Model

Yunhan Yang, Chunshi Wang, Junliang Ye, et al.

HERMES++: Toward a Unified Driving World Model for 3D Scene Understanding and Generation

Autonomous Driving

Xin Zhou, Dingkang Liang, Xiwu Chen, et al.

OpenSearch-VL: An Open Recipe for Frontier Multimodal Search Agents

Retrieval-Augmented Generation

Shuang Chen, Kaituo Feng, Hangting Chen, et al.

RLDX-1 Technical Report

3D Machine Vision

Dongyoung Kim, Huiwon Jang, Myungkyu Koo, et al.

Stream-T1: Test-Time Scaling for Streaming Video Generation

Diffusion Model

Video Generation

Yijing Tu, Shaojin Wu, Mengqi Huang, et al.

Stream-R1: Reliability-Perplexity Aware Reward Distillation for Streaming Video Generation

Video Generation

Bin Wu, Mengqi Huang, Shaojin Wu, et al.

Uni-OPD: Unifying On-Policy Distillation with a Dual-Perspective Recipe

Retrieval-Augmented Generation

Wenjin Hou, Shangpin Peng, Weinong Wang, et al.

AGENTIC-IMODELS: Evolving agentic interpretability tools via autoresearch

Chandan Singh, Yan Shuo Tan, Weijia Xu, et al.

HEAVYSKILL: Heavy Thinking as the Inner Skill in Agentic Harness

Jianing Wang, Linsen Guo, Zhengyu Chen, et al.

WindowsWorld: A Process-Centric Benchmark of Autonomous GUI Agents in Professional Cross-Application Environments

Jinchao Li, Yunxin Li, Chenrui Zhao, et al.

Hallucinations Undermine Trust; Metacognition is a Way Forward

Intelligent Question Answering

Gal Yona, Mor Geva, Yossi Matias

X2SAM: Any Segmentation in Images and Videos

Image Segmentation

Hao Wang, Limeng Qiao, Chi Zhang, et al.

OpenSeeker-v2: Pushing the Limits of Search Agents with Informative and High-Difficulty Trajectories

Yuwen Du, Rui Ye, Shuo Tang, et al.

PRISM: Pre-alignment via Black-box On-policy Distillation for Multimodal Reinforcement Learning

Supervised Fine-Tuning

Sudong Wang, Weiquan Huang, Xiaomin Yu, et al.

ARIS: Autonomous Research via Adversarial Multi-Agent Collaboration

Ruofeng Yang, Yongcan Li, Shuai Li

ProgramBench: Can Language Models Rebuild Programs From Scratch?

Code Generation

John Yang, Kilian Lieret, Jeffrey Ma, et al.

Efficient Accelerated Graph Edit Distance Computation on GPU

Face Recognition

Adel Dabah, Andreas Herten

LLM-based uncertainty assessment of social media situational signals for crisis reporting

Text Generation

Timothy Douglas, Roben Delos Reyes, Asanobu Kitamoto

Canonical LST: A Protocol-Native Liquid Staking Solution for Tezos

Mathias Bourgoin, Arthur Breitman, Pierrick Couderc, et al.

MACE-Dance: Motion-Appearance Cascaded Experts for Music-Driven Dance Video Generation

Rethinking Reasoning-Intensive Retrieval: Evaluating and Advancing Retrievers in Agentic Search Systems

When to Trust Imagination: Adaptive Action Execution for World Action Models

RaguTeam at SemEval-2026 Task 8: Meno and Friends in a Judge-Orchestrated LLM Ensemble for Faithful Multi-Turn Response Generation

MiA-Signature: Approximating Global Activation for Long-Context Understanding

Continuous Latent Diffusion Language Model

Skill1: Unified Evolution of Skill-Augmented Agents via Reinforcement Learning

Beyond Semantic Similarity: Rethinking Retrieval for Agentic Search via Direct Corpus Interaction

MathNet: A GLOBAL MULTIMODAL BENCHMARK FOR MATHEMATICAL REASONING AND RETRIEVAL

D-OPSD: On-Policy Self-Distillation for Continuously Tuning Step-Distilled Diffusion Models

ZAYA1-8B Technical Report

PhysForge: Generating Physics-Grounded 3D Assets for Interactive Virtual World

HERMES++: Toward a Unified Driving World Model for 3D Scene Understanding and Generation

OpenSearch-VL: An Open Recipe for Frontier Multimodal Search Agents

RLDX-1 Technical Report

Stream-T1: Test-Time Scaling for Streaming Video Generation

Stream-R1: Reliability-Perplexity Aware Reward Distillation for Streaming Video Generation

Uni-OPD: Unifying On-Policy Distillation with a Dual-Perspective Recipe

AGENTIC-IMODELS: Evolving agentic interpretability tools via autoresearch

HEAVYSKILL: Heavy Thinking as the Inner Skill in Agentic Harness

WindowsWorld: A Process-Centric Benchmark of Autonomous GUI Agents in Professional Cross-Application Environments

Hallucinations Undermine Trust; Metacognition is a Way Forward

X2SAM: Any Segmentation in Images and Videos

OpenSeeker-v2: Pushing the Limits of Search Agents with Informative and High-Difficulty Trajectories

PRISM: Pre-alignment via Black-box On-policy Distillation for Multimodal Reinforcement Learning

ARIS: Autonomous Research via Adversarial Multi-Agent Collaboration

ProgramBench: Can Language Models Rebuild Programs From Scratch?

Efficient Accelerated Graph Edit Distance Computation on GPU

LLM-based uncertainty assessment of social media situational signals for crisis reporting

Canonical LST: A Protocol-Native Liquid Staking Solution for Tezos

MACE-Dance: Motion-Appearance Cascaded Experts for Music-Driven Dance Video Generation

Rethinking Reasoning-Intensive Retrieval: Evaluating and Advancing Retrievers in Agentic Search Systems

When to Trust Imagination: Adaptive Action Execution for World Action Models

RaguTeam at SemEval-2026 Task 8: Meno and Friends in a Judge-Orchestrated LLM Ensemble for Faithful Multi-Turn Response Generation

MiA-Signature: Approximating Global Activation for Long-Context Understanding

Continuous Latent Diffusion Language Model

Skill1: Unified Evolution of Skill-Augmented Agents via Reinforcement Learning

Beyond Semantic Similarity: Rethinking Retrieval for Agentic Search via Direct Corpus Interaction

MathNet: A GLOBAL MULTIMODAL BENCHMARK FOR MATHEMATICAL REASONING AND RETRIEVAL

D-OPSD: On-Policy Self-Distillation for Continuously Tuning Step-Distilled Diffusion Models

ZAYA1-8B Technical Report

PhysForge: Generating Physics-Grounded 3D Assets for Interactive Virtual World

HERMES++: Toward a Unified Driving World Model for 3D Scene Understanding and Generation

OpenSearch-VL: An Open Recipe for Frontier Multimodal Search Agents

RLDX-1 Technical Report

Stream-T1: Test-Time Scaling for Streaming Video Generation

Stream-R1: Reliability-Perplexity Aware Reward Distillation for Streaming Video Generation

Uni-OPD: Unifying On-Policy Distillation with a Dual-Perspective Recipe

AGENTIC-IMODELS: Evolving agentic interpretability tools via autoresearch

HEAVYSKILL: Heavy Thinking as the Inner Skill in Agentic Harness

WindowsWorld: A Process-Centric Benchmark of Autonomous GUI Agents in Professional Cross-Application Environments

Hallucinations Undermine Trust; Metacognition is a Way Forward

X2SAM: Any Segmentation in Images and Videos

OpenSeeker-v2: Pushing the Limits of Search Agents with Informative and High-Difficulty Trajectories

PRISM: Pre-alignment via Black-box On-policy Distillation for Multimodal Reinforcement Learning

ARIS: Autonomous Research via Adversarial Multi-Agent Collaboration

ProgramBench: Can Language Models Rebuild Programs From Scratch?

Efficient Accelerated Graph Edit Distance Computation on GPU

LLM-based uncertainty assessment of social media situational signals for crisis reporting

Canonical LST: A Protocol-Native Liquid Staking Solution for Tezos