Runzhe Zhan's picture

9 20 2

Runzhe Zhan

rzzhan

·

https://runzhe.me/

AI & ML interests

None yet

Recent Activity

upvoted a paper 1 day ago

Think Longer to Explore Deeper: Learn to Explore In-Context via Length-Incentivized Reinforcement Learning

upvoted a paper 4 days ago

P1-VL: Bridging Visual Perception and Scientific Reasoning in Physics Olympiads

upvoted a paper 9 days ago

Dr. Kernel: Reinforcement Learning Done Right for Triton Kernel Generations

View all activity

Organizations

None yet

upvoted a paper 1 day ago

Think Longer to Explore Deeper: Learn to Explore In-Context via Length-Incentivized Reinforcement Learning

Paper • 2602.11748 • Published 2 days ago • 25

upvoted a paper 4 days ago

P1-VL: Bridging Visual Perception and Scientific Reasoning in Physics Olympiads

Paper • 2602.09443 • Published 5 days ago • 56

upvoted a paper 9 days ago

Dr. Kernel: Reinforcement Learning Done Right for Triton Kernel Generations

Paper • 2602.05885 • Published 9 days ago • 28

upvoted a paper 18 days ago

AdaReasoner: Dynamic Tool Orchestration for Iterative Visual Reasoning

Paper • 2601.18631 • Published 19 days ago • 47

upvoted a paper about 1 month ago

DiffThinker: Towards Generative Multimodal Reasoning with Diffusion Models

Paper • 2512.24165 • Published Dec 30, 2025 • 51

upvoted 6 papers 3 months ago

VisAidMath: Benchmarking Visual-Aided Mathematical Reasoning

Paper • 2410.22995 • Published Oct 30, 2024 • 3

TiViBench: Benchmarking Think-in-Video Reasoning for Video Generative Models

Paper • 2511.13704 • Published Nov 17, 2025 • 43

P1: Mastering Physics Olympiads with Reinforcement Learning

Paper • 2511.13612 • Published Nov 17, 2025 • 134

VideoSSR: Video Self-Supervised Reinforcement Learning

Paper • 2511.06281 • Published Nov 9, 2025 • 25

Thinking with Video: Video Generation as a Promising Multimodal Reasoning Paradigm

Paper • 2511.04570 • Published Nov 6, 2025 • 216

ThinkMorph: Emergent Properties in Multimodal Interleaved Chain-of-Thought Reasoning

Paper • 2510.27492 • Published Oct 30, 2025 • 86

upvoted 7 papers 4 months ago

Are Large Reasoning Models Good Translation Evaluators? Analysis and Performance Boost

Paper • 2510.20780 • Published Oct 23, 2025 • 5

Spotlight on Token Perception for Multimodal Reinforcement Learning

Paper • 2510.09285 • Published Oct 10, 2025 • 37

MemMamba: Rethinking Memory Patterns in State Space Model

Paper • 2510.03279 • Published Sep 28, 2025 • 73

Agent Learning via Early Experience

Paper • 2510.08558 • Published Oct 9, 2025 • 273

Diversity-Incentivized Exploration for Versatile Reasoning

Paper • 2509.26209 • Published Sep 30, 2025 • 16

Native Hybrid Attention for Efficient Sequence Modeling

Paper • 2510.07019 • Published Oct 8, 2025 • 17

ExGRPO: Learning to Reason from Experience

Paper • 2510.02245 • Published Oct 2, 2025 • 80

upvoted a paper 5 months ago

Reasoning over Boundaries: Enhancing Specification Alignment via Test-time Delibration

Paper • 2509.14760 • Published Sep 18, 2025 • 53

upvoted a paper 9 months ago

The Entropy Mechanism of Reinforcement Learning for Reasoning Language Models

Paper • 2505.22617 • Published May 28, 2025 • 131