HyperAI

Main

GPU

Console
Docs
Pricing

Pulse

News

Resources

Papers
Notebooks
Datasets
Wiki

Benchmarks

SOTA
LLM Models
GPU Leaderboard

Community

Events

Utility

About Terms of Service Privacy Policy
English

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

Daily updated cutting-edge AI research papers to help you keep up with the latest AI trends

Build the Future of Artificial Intelligence

About

About Us Dataset Help

Products

News Papers Notebooks Datasets Wiki

Links

© HyperAI

GitHub Discord X (formerly Twitter)

HyperAI

Main

GPU

Console
Docs
Pricing

Pulse

News

Resources

Papers
Notebooks
Datasets
Wiki

Benchmarks

SOTA
LLM Models
GPU Leaderboard

Community

Events

Utility

About Terms of Service Privacy Policy
English

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

Daily updated cutting-edge AI research papers to help you keep up with the latest AI trends

Build the Future of Artificial Intelligence

About

About Us Dataset Help

Products

News Papers Notebooks Datasets Wiki

Links

© HyperAI

GitHub Discord X (formerly Twitter)

AgentVista: Evaluating Multimodal Agents in Ultra-Challenging Realistic Visual Scenarios

AgentVista: Evaluating Multimodal Agents in Ultra-Challenging Realistic Visual Scenarios

Zhaochen Su, Jincheng Gao, Hangyu Guo, et al.

DARE: Aligning LLM Agents with the R Statistical Ecosystem via Distribution-Aware Retrieval

DARE: Aligning LLM Agents with the R Statistical Ecosystem via Distribution-Aware Retrieval

Retrieval-Augmented Generation

Code Generation

Maojun Sun, Yue Wu, Yifei Xie, et al.

SkillNet: Create, Evaluate, and Connect AI Skills

Yuan Liang, Ruobin Zhong, Haoming Xu, et al.

MOOSE-Star: Unlocking Tractable Training for Scientific Discovery by Breaking the Complexity Barrier

Zonglin Yang, Lidong Bing

SURvHTE-Bench: A Benchmark for Heterogeneous Treatment Effect Estimation in Survival Analysis

Shahrriar Noroozizadeh, Xiaobin Shen, Jeremy C. Weiss, et al.

PanoWan: Lifting Diffusion Video Generation Models to 360° with Latitude/Longitude-aware Mechanisms

Diffusion Model

Yifei Xia, Shuchen Weng, Siqi Yang, et al.

ArtHOI: Articulated Human-Object Interaction Synthesis by 4D Reconstruction from Video Priors

Video Generation

Zihao Huang, Tianqi Liu, Zhaoxi Chen, et al.

Proact-VL: A Proactive VideoLLM for Real-Time AI Companions

Video Understanding

Weicai Yan, Yuhong Dai, Qi Ran, et al.

T2S-Bench & Structure-of-Thought: Benchmarking and Prompting Comprehensive Text-to-Structure Reasoning

Document Understanding

Qinsi Wang, Hancheng Ye, Jinhee Kim, et al.

Heterogeneous Agent Collaborative Reinforcement Learning

Reinforcement Learning

Zhixia Zhang, Zixuan Huang, Xin Xia, et al.

Helios: Real Real-Time Long Video Generation Model

Video Generation

Shenghai Yuan, Yuanyang Yin, Zongjian Li, et al.

Valet: A Standardized Testbed of Traditional Imperfect-Information Card Games

Mark Goadrich, Achille Morenville, Éric Piette

Speculative Speculative Decoding

Text Generation

Tanishq Kumar, Tri Dao, Avner May

Using Learning Progressions to Guide AI Feedback for Science Learning

Xin Xia, Nejla Yuruk, Yun Wang, et al.

HoMMI: Learning Whole-Body Mobile Manipulation from Human Demonstrations

Embodied Intelligence

Xiaomeng Xu, Jisang Park, Han Zhang, et al.

Density-Guided Response Optimization: Community-Grounded Alignment via Implicit Acceptance Signals

Preference Modeling

Patrick Gerard, Svitlana Volkova

Gravity Falls: A Comparative Analysis of Domain-Generation Algorithm (DGA) Detection Methods for Mobile Device Spearphishing

Adam Dorian Wong, John D. Hastings

From Entropy to Epiplexity: Rethinking Information for Computationally Bounded Intelligence

Marc Finzi, Shikai Qiu, Yiding Jiang, et al.

The Design Space of Tri-Modal Masked Diffusion Models

Diffusion Model

Louis Bethune, Victor Turrisi, Bruno Kacper Mlodozeniec, et al.

CHIMERA: Compact Synthetic Data for Generalizable LLM Reasoning

Xinyu Zhu, Yihao Feng, Yanchao Sun, et al.

RubricBench: Aligning Model-Generated Rubrics with Human Standards

Qiyuan Zhang, Junyi Zhou, Yufei Wang, et al.

MMR-Life: Piecing Together Real-life Scenes for Multimodal Multi-image Reasoning

Jiachun Li, Shaoping Huang, Zhuoran Jin, et al.

OpenAutoNLU: Open Source AutoML Library for NLU

Natural Language Processing

Grigory Arshinov, Aleksandr Boriskin, Sergey Senichev, et al.

OmniLottie: Generating Vector Animations via Parameterized Lottie Tokens

Video Generation

Yiying Yang, Wei Cheng, Sijin Chen, et al.

From Scale to Speed: Adaptive Test-Time Scaling for Image Editing

Image Generation

Xiangyan Qu, Zhenlong Yuan, Jing Tang, et al.

Multi-agent cooperation through in-context co-player inference

Reinforcement Learning

Marissa A. Weis, Maciej Wołczyk, Rajai Nasser, et al.

ACTIONENGINE: From Reactive to Programmatic GUI Agents via State Machine Memory

Hongbin Zhong, Fazole Faisalal, Luis França, et al.

CiteAudit: You Cited It, But Did You Read It? A Benchmark for Verifying Scientific References in the LLM Era

Retrieval-Augmented Generation

Zhengqing Yuan, Kaiwen Shi, Zheyuan Zhang, et al.

Mode Seeking meets Mean Seeking for Fast Long Video Generation

Video Generation

Diffusion Model

Shengqu Cai, Weili Nie, Chao Liu, et al.

CUDA Agent: Large-Scale Agentic RL for High-Performance CUDA Kernel Generation

Code Generation

Weinan Dai, Hanlin Wu, Qiying Yu, et al.

Recovered in Translation: Efficient Pipeline for Automated Translation of Benchmarks and Datasets

Hanna Yukhymenko, Anton Alexandrov, Martin Vechev

Enhancing Spatial Understanding in Image Generation via Reward Modeling

Image Generation

Zhenyu Tang, Chaoran Feng, Yufan Deng, et al.

AgentVista: Evaluating Multimodal Agents in Ultra-Challenging Realistic Visual Scenarios

AgentVista: Evaluating Multimodal Agents in Ultra-Challenging Realistic Visual Scenarios

Zhaochen Su, Jincheng Gao, Hangyu Guo, et al.

DARE: Aligning LLM Agents with the R Statistical Ecosystem via Distribution-Aware Retrieval

DARE: Aligning LLM Agents with the R Statistical Ecosystem via Distribution-Aware Retrieval

Retrieval-Augmented Generation

Code Generation

Maojun Sun, Yue Wu, Yifei Xie, et al.

SkillNet: Create, Evaluate, and Connect AI Skills

Yuan Liang, Ruobin Zhong, Haoming Xu, et al.

MOOSE-Star: Unlocking Tractable Training for Scientific Discovery by Breaking the Complexity Barrier

Zonglin Yang, Lidong Bing

SURvHTE-Bench: A Benchmark for Heterogeneous Treatment Effect Estimation in Survival Analysis

Shahrriar Noroozizadeh, Xiaobin Shen, Jeremy C. Weiss, et al.

PanoWan: Lifting Diffusion Video Generation Models to 360° with Latitude/Longitude-aware Mechanisms

Diffusion Model

Yifei Xia, Shuchen Weng, Siqi Yang, et al.

ArtHOI: Articulated Human-Object Interaction Synthesis by 4D Reconstruction from Video Priors

Video Generation

Zihao Huang, Tianqi Liu, Zhaoxi Chen, et al.

Proact-VL: A Proactive VideoLLM for Real-Time AI Companions

Video Understanding

Weicai Yan, Yuhong Dai, Qi Ran, et al.

T2S-Bench & Structure-of-Thought: Benchmarking and Prompting Comprehensive Text-to-Structure Reasoning

Document Understanding

Qinsi Wang, Hancheng Ye, Jinhee Kim, et al.

Heterogeneous Agent Collaborative Reinforcement Learning

Reinforcement Learning

Zhixia Zhang, Zixuan Huang, Xin Xia, et al.

Helios: Real Real-Time Long Video Generation Model

Video Generation

Shenghai Yuan, Yuanyang Yin, Zongjian Li, et al.

Valet: A Standardized Testbed of Traditional Imperfect-Information Card Games

Mark Goadrich, Achille Morenville, Éric Piette

Speculative Speculative Decoding

Text Generation

Tanishq Kumar, Tri Dao, Avner May

Using Learning Progressions to Guide AI Feedback for Science Learning

Xin Xia, Nejla Yuruk, Yun Wang, et al.

HoMMI: Learning Whole-Body Mobile Manipulation from Human Demonstrations

Embodied Intelligence

Xiaomeng Xu, Jisang Park, Han Zhang, et al.

Density-Guided Response Optimization: Community-Grounded Alignment via Implicit Acceptance Signals

Preference Modeling

Patrick Gerard, Svitlana Volkova

Gravity Falls: A Comparative Analysis of Domain-Generation Algorithm (DGA) Detection Methods for Mobile Device Spearphishing

Adam Dorian Wong, John D. Hastings

From Entropy to Epiplexity: Rethinking Information for Computationally Bounded Intelligence

Marc Finzi, Shikai Qiu, Yiding Jiang, et al.

The Design Space of Tri-Modal Masked Diffusion Models

Diffusion Model

Louis Bethune, Victor Turrisi, Bruno Kacper Mlodozeniec, et al.

CHIMERA: Compact Synthetic Data for Generalizable LLM Reasoning

Xinyu Zhu, Yihao Feng, Yanchao Sun, et al.

RubricBench: Aligning Model-Generated Rubrics with Human Standards

Qiyuan Zhang, Junyi Zhou, Yufei Wang, et al.

MMR-Life: Piecing Together Real-life Scenes for Multimodal Multi-image Reasoning

Jiachun Li, Shaoping Huang, Zhuoran Jin, et al.

OpenAutoNLU: Open Source AutoML Library for NLU

Natural Language Processing

Grigory Arshinov, Aleksandr Boriskin, Sergey Senichev, et al.

OmniLottie: Generating Vector Animations via Parameterized Lottie Tokens

Video Generation

Yiying Yang, Wei Cheng, Sijin Chen, et al.

From Scale to Speed: Adaptive Test-Time Scaling for Image Editing

Image Generation

Xiangyan Qu, Zhenlong Yuan, Jing Tang, et al.

Multi-agent cooperation through in-context co-player inference

Reinforcement Learning

Marissa A. Weis, Maciej Wołczyk, Rajai Nasser, et al.

ACTIONENGINE: From Reactive to Programmatic GUI Agents via State Machine Memory

Hongbin Zhong, Fazole Faisalal, Luis França, et al.

CiteAudit: You Cited It, But Did You Read It? A Benchmark for Verifying Scientific References in the LLM Era

Retrieval-Augmented Generation

Zhengqing Yuan, Kaiwen Shi, Zheyuan Zhang, et al.

Mode Seeking meets Mean Seeking for Fast Long Video Generation

Video Generation

Diffusion Model

Shengqu Cai, Weili Nie, Chao Liu, et al.

CUDA Agent: Large-Scale Agentic RL for High-Performance CUDA Kernel Generation

Code Generation

Weinan Dai, Hanlin Wu, Qiying Yu, et al.

Recovered in Translation: Efficient Pipeline for Automated Translation of Benchmarks and Datasets

Hanna Yukhymenko, Anton Alexandrov, Martin Vechev

Enhancing Spatial Understanding in Image Generation via Reward Modeling

Image Generation

Zhenyu Tang, Chaoran Feng, Yufan Deng, et al.

SkillNet: Create, Evaluate, and Connect AI Skills

MOOSE-Star: Unlocking Tractable Training for Scientific Discovery by Breaking the Complexity Barrier

SURvHTE-Bench: A Benchmark for Heterogeneous Treatment Effect Estimation in Survival Analysis

PanoWan: Lifting Diffusion Video Generation Models to 360° with Latitude/Longitude-aware Mechanisms

ArtHOI: Articulated Human-Object Interaction Synthesis by 4D Reconstruction from Video Priors

Proact-VL: A Proactive VideoLLM for Real-Time AI Companions

T2S-Bench & Structure-of-Thought: Benchmarking and Prompting Comprehensive Text-to-Structure Reasoning

Heterogeneous Agent Collaborative Reinforcement Learning

Helios: Real Real-Time Long Video Generation Model

Valet: A Standardized Testbed of Traditional Imperfect-Information Card Games

Speculative Speculative Decoding

Using Learning Progressions to Guide AI Feedback for Science Learning

HoMMI: Learning Whole-Body Mobile Manipulation from Human Demonstrations

Density-Guided Response Optimization: Community-Grounded Alignment via Implicit Acceptance Signals

Gravity Falls: A Comparative Analysis of Domain-Generation Algorithm (DGA) Detection Methods for Mobile Device Spearphishing

From Entropy to Epiplexity: Rethinking Information for Computationally Bounded Intelligence

The Design Space of Tri-Modal Masked Diffusion Models

CHIMERA: Compact Synthetic Data for Generalizable LLM Reasoning

RubricBench: Aligning Model-Generated Rubrics with Human Standards

MMR-Life: Piecing Together Real-life Scenes for Multimodal Multi-image Reasoning

OpenAutoNLU: Open Source AutoML Library for NLU

OmniLottie: Generating Vector Animations via Parameterized Lottie Tokens

From Scale to Speed: Adaptive Test-Time Scaling for Image Editing

Multi-agent cooperation through in-context co-player inference

ACTIONENGINE: From Reactive to Programmatic GUI Agents via State Machine Memory

CiteAudit: You Cited It, But Did You Read It? A Benchmark for Verifying Scientific References in the LLM Era

Mode Seeking meets Mean Seeking for Fast Long Video Generation

CUDA Agent: Large-Scale Agentic RL for High-Performance CUDA Kernel Generation

Recovered in Translation: Efficient Pipeline for Automated Translation of Benchmarks and Datasets

Enhancing Spatial Understanding in Image Generation via Reward Modeling

SkillNet: Create, Evaluate, and Connect AI Skills

MOOSE-Star: Unlocking Tractable Training for Scientific Discovery by Breaking the Complexity Barrier

SURvHTE-Bench: A Benchmark for Heterogeneous Treatment Effect Estimation in Survival Analysis

PanoWan: Lifting Diffusion Video Generation Models to 360° with Latitude/Longitude-aware Mechanisms

ArtHOI: Articulated Human-Object Interaction Synthesis by 4D Reconstruction from Video Priors

Proact-VL: A Proactive VideoLLM for Real-Time AI Companions

T2S-Bench & Structure-of-Thought: Benchmarking and Prompting Comprehensive Text-to-Structure Reasoning

Heterogeneous Agent Collaborative Reinforcement Learning

Helios: Real Real-Time Long Video Generation Model

Valet: A Standardized Testbed of Traditional Imperfect-Information Card Games

Speculative Speculative Decoding

Using Learning Progressions to Guide AI Feedback for Science Learning

HoMMI: Learning Whole-Body Mobile Manipulation from Human Demonstrations

Density-Guided Response Optimization: Community-Grounded Alignment via Implicit Acceptance Signals

Gravity Falls: A Comparative Analysis of Domain-Generation Algorithm (DGA) Detection Methods for Mobile Device Spearphishing

From Entropy to Epiplexity: Rethinking Information for Computationally Bounded Intelligence

The Design Space of Tri-Modal Masked Diffusion Models

CHIMERA: Compact Synthetic Data for Generalizable LLM Reasoning

RubricBench: Aligning Model-Generated Rubrics with Human Standards

MMR-Life: Piecing Together Real-life Scenes for Multimodal Multi-image Reasoning

OpenAutoNLU: Open Source AutoML Library for NLU

OmniLottie: Generating Vector Animations via Parameterized Lottie Tokens

From Scale to Speed: Adaptive Test-Time Scaling for Image Editing

Multi-agent cooperation through in-context co-player inference

ACTIONENGINE: From Reactive to Programmatic GUI Agents via State Machine Memory

CiteAudit: You Cited It, But Did You Read It? A Benchmark for Verifying Scientific References in the LLM Era

Mode Seeking meets Mean Seeking for Fast Long Video Generation

CUDA Agent: Large-Scale Agentic RL for High-Performance CUDA Kernel Generation

Recovered in Translation: Efficient Pipeline for Automated Translation of Benchmarks and Datasets

Enhancing Spatial Understanding in Image Generation via Reward Modeling