Papers

Minseo Kim, Minjae Lee, Seunghyuk Oh, et al.

Trust the Right Teacher: Quality-Aware Self-Distillation for GUI Grounding

Jingyuan Huang, Zuming Huang, Yucheng Shi, et al.

Reinforcing Dual-Path Reasoning in Spatial Vision Language Models

Yatai Ji, An-Chieh Cheng, Yang Fu, et al.

3D Machine Vision

SAE Interventions are Unreliable: Post-Intervention Recovery of Suppressed Behavior

Mingyue Cui, Linghui Shen, Xingyi Yang

Deep Learning

Kairos: A Native World Model Stack for Physical AI

Kairos Team, Fei Wang, Shan You, et al.

Guava: An Effective and Universal Harness for Embodied Manipulation

Embodied Intelligence

Haowen Liu, Xirui Li, Shaoxiong Yao, et al.

Beyond the Current Observation: Evaluating Multimodal Large Language Models in Controllable Non-Markov Games

Shengyuan Ding, Xilin Wei, Xinyu Fang, et al.

LifeSciBench: Evaluating Language Models on Realistic, Expert-Level Tasks in the Life Sciences

Benchmarks

Amelia Liu, Andrew Ho, Anne Marie Droste, et al.

TRIAGE: Dialectical Reasoning for Explainable Risk Prediction on Irregularly Sampled Medical Time Series with LLMs

Hyeongwon Jang, Gyouk Chu, Changhun Kim, et al.

Model Training

LectūraAgents: A Multi-Agent Framework for Adaptive Personalized AI-Assisted Learning and Embodied Teaching

Jaward Sesay, Yue Yu, Siwei Dong, et al.

Embodied Intelligence

GameCraft-Bench: Can Agents Build Playable Games End-to-End in a Real Game Engine?

Code Generation

Tongxu Luo, Rongsheng Wang, Jiaxi Bi, et al.

Zone of Proximal Policy Optimization: Teacher in Prompts, Not Gradients

Reinforcement Learning

Byung-Kwan Lee, Ximing Lu, Shizhe Diao, et al.

ACE-Ego-0: Unifying Egocentric Human and Robotic Data for VLA Pretraining

Hao Li, Ganlong Zhao, Yufei Liu, et al.

Supervised Fine-Tuning

LoopCoder-v2: Only Loop Once for Efficient Test-Time Computation Scaling

Transformer

Code Generation

Jian Yang, Shawn Guo, Wei Zhang, et al.

Predicting LLM Safety Before Release by Simulating Deployment

Marcus Williams, Hannah Sheahan, Cameron Raymond, et al.

Text Generation

FastContext: Training Efficient Repository Explorer for Coding Agents

Shaoqiu Zhang, Maoquan Wang, Yuling Shi, et al.

Code Generation

VibeThinker-3B: Exploring the Frontier of Verifiable Reasoning in Small Language Models

Reasoning

Supervised Fine-Tuning

Sen Xu, Shixi Liu, Wei Wang, et al.

DreamX-World 1.0: A General-Purpose Interactive World Model

Diffusion Model

Text-to-Video

DreamX Team, Yancheng Bai, Rui Chen, et al.

Geometric Action Model for Robot Policy Learning

Multimodal Representation

Jisang Han, Seonghu Jeon, Jaewoo Jung, et al.

Data Journalist Agent: Transforming Data into Verifiable Multimodal Stories

Kevin Qinghong Lin, Batu EI, Yuhong Shi, et al.

JoyAI-VL-Interaction: Real-Time Vision-Language Interaction Intelligence

Dingyu Yao, Junhao Zhou, Chenxu Yang, et al.

Video Understanding

dots.tts Technical Report

Text-to-Speech

Deterministic Video Depth Estimation with Generative Priors

Depth Estimation

Diffusion Model

Hongfei Zhang, Harold Haodong Chen, Chenfei Liao, et al.

Galaxy Image Deconvolution for Weak Gravitational Lensing with Unrolled Plug-and-Play ADMM

Deep Learning

AI for Science

Tianao Li, Emma Alexander

AI Must Embrace Specialization via Superhuman Adaptable Intelligence

Artificial Intelligence

Judah Goldfeder, Philippe Wyder, Yann LeCun, et al.

Sycophantic Chatbots Cause Delusional Spiraling, Even in Ideal Bayesians

Kartik Chandra, Max Kleiman-Weiner, Jonathan Ragan-Kelley, et al.

Text Generation

Agents of Chaos

Natalie Shapira, Chris Wendler, Avery Yen, et al.

HarnessX: A Composable, Adaptive, and Evolvable Agent Harness Foundry

Darwin Agent Team

Orchestra-o1: Omnimodal Agent Orchestration

Fan Zhang, Vireo Zhang, Shengju Qian, et al.

From Chatbot to Digital Colleague: The Paradigm Shift Toward Persistent Autonomous AI

Yongheng Zhang, Ziang Liu, Jiaxuan Zhu, et al.

Memory is Reconstructed, Not Retrieved: Graph Memory for LLM Agents

Shuo Ji, Yibo Li, Bryan Hooi

APPO: Agentic Procedural Policy Optimization

Reinforcement Learning