HyperAI

Main

GPU

Console
Docs
Pricing

Pulse

News

Resources

Papers
Notebooks
Datasets
Wiki

Benchmarks

SOTA
LLM Models
GPU Leaderboard

Community

Events

Utility

About Terms of Service Privacy Policy
English

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

Daily updated cutting-edge AI research papers to help you keep up with the latest AI trends

Build the Future of Artificial Intelligence

About

About Us Dataset Help

Products

News Papers Notebooks Datasets Wiki

Links

© HyperAI

GitHub Discord X (formerly Twitter)

HyperAI

Main

GPU

Console
Docs
Pricing

Pulse

News

Resources

Papers
Notebooks
Datasets
Wiki

Benchmarks

SOTA
LLM Models
GPU Leaderboard

Community

Events

Utility

About Terms of Service Privacy Policy
English

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

Daily updated cutting-edge AI research papers to help you keep up with the latest AI trends

Build the Future of Artificial Intelligence

About

About Us Dataset Help

Products

News Papers Notebooks Datasets Wiki

Links

© HyperAI

GitHub Discord X (formerly Twitter)

Baichuan-M3: Modeling Clinical Inquiry for Reliable Medical Decision-Making

Baichuan-M3: Modeling Clinical Inquiry for Reliable Medical Decision-Making

Baichuan-M3 Team, Chengfeng Dou, Fan Yang, et al.

Generative Modeling via Drifting

Generative Modeling via Drifting

Diffusion Model

Image Generation

Mingyang Deng, He Li, Tianhong Li, Kaiming He

AlphaEdit: Null-Space Constrained Knowledge Editing for Language Models

Text Generation

Junfeng Fang, Houcheng Jiang, Kun Wang, et al.

Learning to Reason in 13 Parameters

Intelligent Question Answering

John X. Morris, Niloofar Mireshghallah, Mark Ibrahim, et al.

DFlash: Block Diffusion for Flash Speculative Decoding

Diffusion Model

Jian Chen, Yesheng Liang, Zhijian Liu

Context Forcing: Consistent Autoregressive Video Generation with Long Context

Video Generation

Diffusion Model

Shuo Chen, Cong Wei, Sun Sun, et al.

MemSkill: Learning and Evolving Memory Skills for Self-Evolving Agents

Haozhen Zhang, Quanyu Long, Jianzhu Bao, et al.

Length-Unbiased Sequence Policy Optimization: Revealing and Controlling Response Length Variation in RLVR

Reinforcement Learning

Fanfan Liu, Youyang Yin, Peng Shi, et al.

Spider-Sense: Intrinsic Risk Sensing for Efficient Agent Defense with Hierarchical Adaptive Screening

Zhenxiong Yu, Zhi Yang, Zhiheng Jin, et al.

CAR-bench: Evaluating the Consistency and Limit-Awareness of LLM Agents under Real-World Uncertainty

Johannes Kirmayr, Lukas Stappen, Elisabeth André

Streaming Sequence-to-Sequence Learning with Delayed Streams Modeling

Multimodal Representation

Neil Zeghidour, Eugene Kharitonov, Manu Orsini, et al.

Kiss3DGen: Repurposing Image Diffusion Models for 3D Asset Generation

Diffusion Model

Jiantao Lin, Xin Yang, Meixi Chen, et al.

Stateful Conformer with Cache-Based Inference for Streaming Automatic Speech Recognition

Audio Recognition

Vahid Noroozi, Somshubra Majumdar, Ankur Kumar, et al.

Native and Compact Structured Latents for 3D Generation

Diffusion Model

Jianfeng Xiang, Xiaoxue Chen, Sicheng Xu, et al.

Continuous Audio Language Models

Simon Rouard, Manu Orsini, Axel Roebel, et al.

Evolving Interactive Diagnostic Agents in a Virtual Clinical Environment

Pengcheng Qiu, Chaoyi Wu, Junwei Liu, et al.

WeDLM: Reconciling Diffusion Language Models with Standard Causal Attention for Fast Inference

Diffusion Model

Aiwei Liu, Minghua He, Shaoxun Zeng, et al.

TurboDiffusion: Accelerating Video Diffusion Models by 100-200 Times

Diffusion Model

Video Generation

Jintao Zhang, Kaiwen Zheng, Kai Jiang, et al.

HunyuanVideo-Foley: Multimodal Diffusion with Representation Alignment for High-Fidelity Foley Audio Generation

Video Generation

Sizhe Shan, Qiulin Li, Yutao Cui, et al.

Fara-7B: An Efficient Agentic Model for Computer Use

Ahmed Awadallah, Yash Lara, Raghav Magazine, et al.

Fun-ASR Technical Report

Audio Recognition

Keyu An, Yanni Chen, Zhigao Chen, et al.

Accelerating Scientific Research with Gemini: Case Studies and Common Techniques

David P. Woodruff, Vincent Cohen-Addad, Lalit Jain, et al.

Scaling Small Agents Through Strategy Auctions

Lisa Alazraki, William F. Shen, Yoram Bachrach, et al.

Vibe AIGC: A New Paradigm for Content Generation via Agentic Orchestration

Jiaheng Liu, Yuanxing Zhang, Shihao Li, et al.

PaperSearchQA: Learning to Search and Reason over Scientific Papers with RLVR

Retrieval-Augmented Generation

James Burgess, Jan N. Hansen, Duo Peng, et al.

EgoActor: Grounding Task Planning into Spatial-aware Egocentric Actions for Humanoid Robots via Visual-Language Models

Visual Question Answering

Yu Bai, MingMing Yu, Chaojie Li, et al.

A-RAG: Scaling Agentic Retrieval-Augmented Generation via Hierarchical Retrieval Interfaces

Retrieval-Augmented Generation

Mingxuan Du, Benfeng Xu, Chiwei Zhu, et al.

Quant VideoGen: Auto-Regressive Long Video Generation via 2-Bit KV-Cache Quantization

Video Generation

Diffusion Model

Haocheng Xi, Shuo Yang, Yilong Zhao, et al.

SoMA: A Real-to-Sim Neural Simulator for Robotic Soft-body Manipulation

Depth Estimation

Mu Huang, Hui Wang, Kerui Ren, et al.

3D-Aware Implicit Motion Control for View-Adaptive Human Video Generation

Video Generation

Zhixue Fang, Xu He, Songlin Tang, et al.

daVinci-Agency: Unlocking Long-Horizon Agency Data-Efficiently

Supervised Fine-Tuning

Mohan Jiang, Dayuan Fu, Junhao Shi, et al.

Research on World Models Is Not Merely Injecting World Knowledge into Specific Tasks

Embodied Intelligence

Bohan Zeng, Kaixin Zhu, Daili Hua, et al.

Baichuan-M3: Modeling Clinical Inquiry for Reliable Medical Decision-Making

Baichuan-M3: Modeling Clinical Inquiry for Reliable Medical Decision-Making

Baichuan-M3 Team, Chengfeng Dou, Fan Yang, et al.

Generative Modeling via Drifting

Generative Modeling via Drifting

Diffusion Model

Image Generation

Mingyang Deng, He Li, Tianhong Li, Kaiming He

AlphaEdit: Null-Space Constrained Knowledge Editing for Language Models

Text Generation

Junfeng Fang, Houcheng Jiang, Kun Wang, et al.

Learning to Reason in 13 Parameters

Intelligent Question Answering

John X. Morris, Niloofar Mireshghallah, Mark Ibrahim, et al.

DFlash: Block Diffusion for Flash Speculative Decoding

Diffusion Model

Jian Chen, Yesheng Liang, Zhijian Liu

Context Forcing: Consistent Autoregressive Video Generation with Long Context

Video Generation

Diffusion Model

Shuo Chen, Cong Wei, Sun Sun, et al.

MemSkill: Learning and Evolving Memory Skills for Self-Evolving Agents

Haozhen Zhang, Quanyu Long, Jianzhu Bao, et al.

Length-Unbiased Sequence Policy Optimization: Revealing and Controlling Response Length Variation in RLVR

Reinforcement Learning

Fanfan Liu, Youyang Yin, Peng Shi, et al.

Spider-Sense: Intrinsic Risk Sensing for Efficient Agent Defense with Hierarchical Adaptive Screening

Zhenxiong Yu, Zhi Yang, Zhiheng Jin, et al.

CAR-bench: Evaluating the Consistency and Limit-Awareness of LLM Agents under Real-World Uncertainty

Johannes Kirmayr, Lukas Stappen, Elisabeth André

Streaming Sequence-to-Sequence Learning with Delayed Streams Modeling

Multimodal Representation

Neil Zeghidour, Eugene Kharitonov, Manu Orsini, et al.

Kiss3DGen: Repurposing Image Diffusion Models for 3D Asset Generation

Diffusion Model

Jiantao Lin, Xin Yang, Meixi Chen, et al.

Stateful Conformer with Cache-Based Inference for Streaming Automatic Speech Recognition

Audio Recognition

Vahid Noroozi, Somshubra Majumdar, Ankur Kumar, et al.

Native and Compact Structured Latents for 3D Generation

Diffusion Model

Jianfeng Xiang, Xiaoxue Chen, Sicheng Xu, et al.

Continuous Audio Language Models

Simon Rouard, Manu Orsini, Axel Roebel, et al.

Evolving Interactive Diagnostic Agents in a Virtual Clinical Environment

Pengcheng Qiu, Chaoyi Wu, Junwei Liu, et al.

WeDLM: Reconciling Diffusion Language Models with Standard Causal Attention for Fast Inference

Diffusion Model

Aiwei Liu, Minghua He, Shaoxun Zeng, et al.

TurboDiffusion: Accelerating Video Diffusion Models by 100-200 Times

Diffusion Model

Video Generation

Jintao Zhang, Kaiwen Zheng, Kai Jiang, et al.

HunyuanVideo-Foley: Multimodal Diffusion with Representation Alignment for High-Fidelity Foley Audio Generation

Video Generation

Sizhe Shan, Qiulin Li, Yutao Cui, et al.

Fara-7B: An Efficient Agentic Model for Computer Use

Ahmed Awadallah, Yash Lara, Raghav Magazine, et al.

Fun-ASR Technical Report

Audio Recognition

Keyu An, Yanni Chen, Zhigao Chen, et al.

Accelerating Scientific Research with Gemini: Case Studies and Common Techniques

David P. Woodruff, Vincent Cohen-Addad, Lalit Jain, et al.

Scaling Small Agents Through Strategy Auctions

Lisa Alazraki, William F. Shen, Yoram Bachrach, et al.

Vibe AIGC: A New Paradigm for Content Generation via Agentic Orchestration

Jiaheng Liu, Yuanxing Zhang, Shihao Li, et al.

PaperSearchQA: Learning to Search and Reason over Scientific Papers with RLVR

Retrieval-Augmented Generation

James Burgess, Jan N. Hansen, Duo Peng, et al.

EgoActor: Grounding Task Planning into Spatial-aware Egocentric Actions for Humanoid Robots via Visual-Language Models

Visual Question Answering

Yu Bai, MingMing Yu, Chaojie Li, et al.

A-RAG: Scaling Agentic Retrieval-Augmented Generation via Hierarchical Retrieval Interfaces

Retrieval-Augmented Generation

Mingxuan Du, Benfeng Xu, Chiwei Zhu, et al.

Quant VideoGen: Auto-Regressive Long Video Generation via 2-Bit KV-Cache Quantization

Video Generation

Diffusion Model

Haocheng Xi, Shuo Yang, Yilong Zhao, et al.

SoMA: A Real-to-Sim Neural Simulator for Robotic Soft-body Manipulation

Depth Estimation

Mu Huang, Hui Wang, Kerui Ren, et al.

3D-Aware Implicit Motion Control for View-Adaptive Human Video Generation

Video Generation

Zhixue Fang, Xu He, Songlin Tang, et al.

daVinci-Agency: Unlocking Long-Horizon Agency Data-Efficiently

Supervised Fine-Tuning

Mohan Jiang, Dayuan Fu, Junhao Shi, et al.

Research on World Models Is Not Merely Injecting World Knowledge into Specific Tasks

Embodied Intelligence

Bohan Zeng, Kaixin Zhu, Daili Hua, et al.

AlphaEdit: Null-Space Constrained Knowledge Editing for Language Models

Learning to Reason in 13 Parameters

DFlash: Block Diffusion for Flash Speculative Decoding

Context Forcing: Consistent Autoregressive Video Generation with Long Context

MemSkill: Learning and Evolving Memory Skills for Self-Evolving Agents

Length-Unbiased Sequence Policy Optimization: Revealing and Controlling Response Length Variation in RLVR

Spider-Sense: Intrinsic Risk Sensing for Efficient Agent Defense with Hierarchical Adaptive Screening

CAR-bench: Evaluating the Consistency and Limit-Awareness of LLM Agents under Real-World Uncertainty

Streaming Sequence-to-Sequence Learning with Delayed Streams Modeling

Kiss3DGen: Repurposing Image Diffusion Models for 3D Asset Generation

Stateful Conformer with Cache-Based Inference for Streaming Automatic Speech Recognition

Native and Compact Structured Latents for 3D Generation

Continuous Audio Language Models

Evolving Interactive Diagnostic Agents in a Virtual Clinical Environment

WeDLM: Reconciling Diffusion Language Models with Standard Causal Attention for Fast Inference

TurboDiffusion: Accelerating Video Diffusion Models by 100-200 Times

HunyuanVideo-Foley: Multimodal Diffusion with Representation Alignment for High-Fidelity Foley Audio Generation

Fara-7B: An Efficient Agentic Model for Computer Use

Fun-ASR Technical Report

Accelerating Scientific Research with Gemini: Case Studies and Common Techniques

Scaling Small Agents Through Strategy Auctions

Vibe AIGC: A New Paradigm for Content Generation via Agentic Orchestration

PaperSearchQA: Learning to Search and Reason over Scientific Papers with RLVR

EgoActor: Grounding Task Planning into Spatial-aware Egocentric Actions for Humanoid Robots via Visual-Language Models

A-RAG: Scaling Agentic Retrieval-Augmented Generation via Hierarchical Retrieval Interfaces

Quant VideoGen: Auto-Regressive Long Video Generation via 2-Bit KV-Cache Quantization

SoMA: A Real-to-Sim Neural Simulator for Robotic Soft-body Manipulation

3D-Aware Implicit Motion Control for View-Adaptive Human Video Generation

daVinci-Agency: Unlocking Long-Horizon Agency Data-Efficiently

Research on World Models Is Not Merely Injecting World Knowledge into Specific Tasks

AlphaEdit: Null-Space Constrained Knowledge Editing for Language Models

Learning to Reason in 13 Parameters

DFlash: Block Diffusion for Flash Speculative Decoding

Context Forcing: Consistent Autoregressive Video Generation with Long Context

MemSkill: Learning and Evolving Memory Skills for Self-Evolving Agents

Length-Unbiased Sequence Policy Optimization: Revealing and Controlling Response Length Variation in RLVR

Spider-Sense: Intrinsic Risk Sensing for Efficient Agent Defense with Hierarchical Adaptive Screening

CAR-bench: Evaluating the Consistency and Limit-Awareness of LLM Agents under Real-World Uncertainty

Streaming Sequence-to-Sequence Learning with Delayed Streams Modeling

Kiss3DGen: Repurposing Image Diffusion Models for 3D Asset Generation

Stateful Conformer with Cache-Based Inference for Streaming Automatic Speech Recognition

Native and Compact Structured Latents for 3D Generation

Continuous Audio Language Models

Evolving Interactive Diagnostic Agents in a Virtual Clinical Environment

WeDLM: Reconciling Diffusion Language Models with Standard Causal Attention for Fast Inference

TurboDiffusion: Accelerating Video Diffusion Models by 100-200 Times

HunyuanVideo-Foley: Multimodal Diffusion with Representation Alignment for High-Fidelity Foley Audio Generation

Fara-7B: An Efficient Agentic Model for Computer Use

Fun-ASR Technical Report

Accelerating Scientific Research with Gemini: Case Studies and Common Techniques

Scaling Small Agents Through Strategy Auctions

Vibe AIGC: A New Paradigm for Content Generation via Agentic Orchestration

PaperSearchQA: Learning to Search and Reason over Scientific Papers with RLVR

EgoActor: Grounding Task Planning into Spatial-aware Egocentric Actions for Humanoid Robots via Visual-Language Models

A-RAG: Scaling Agentic Retrieval-Augmented Generation via Hierarchical Retrieval Interfaces

Quant VideoGen: Auto-Regressive Long Video Generation via 2-Bit KV-Cache Quantization

SoMA: A Real-to-Sim Neural Simulator for Robotic Soft-body Manipulation

3D-Aware Implicit Motion Control for View-Adaptive Human Video Generation

daVinci-Agency: Unlocking Long-Horizon Agency Data-Efficiently

Research on World Models Is Not Merely Injecting World Knowledge into Specific Tasks