do

cocodd

AI & ML interests

None yet

Recent Activity

liked a dataset about 10 hours ago

ConvLab/kvret

liked a model about 16 hours ago

BAAI/CCI3-HQ-Classifier

liked a dataset 14 days ago

liwu/MNBVC

View all activity

Organizations

None yet

liked a dataset about 10 hours ago

ConvLab/kvret

Preview • Updated Nov 25, 2022 • 32 • 4

liked a model about 16 hours ago

BAAI/CCI3-HQ-Classifier

0.6B • Updated Oct 28, 2024 • 5.45k • 11

liked a dataset 14 days ago

liwu/MNBVC

Updated Dec 3, 2025 • 148k • 582

liked 2 Spaces 2 months ago

The Smol Training Playbook

📚

2.84k

The secrets to building world-class LLMs

Unlocking On-Policy Distillation for Any Model Family

📝

Apply on-policy distillation to any model family

liked a dataset 4 months ago

withmartian/routerbench

Updated Mar 27, 2024 • 1.32k • 22

upvoted a paper 5 months ago

Group Sequence Policy Optimization

Paper • 2507.18071 • Published Jul 24, 2025 • 316

liked a model 5 months ago

Qwen/Qwen-Image

Text-to-Image • Updated Aug 18, 2025 • 228k • • 2.34k

liked a Space 5 months ago

The Ultra-Scale Playbook

🌌

3.64k

The ultimate guide to training LLM on large GPU Clusters

liked 4 datasets 6 months ago

upvoted a paper 8 months ago

BizFinBench: A Business-Driven Real-World Financial Benchmark for Evaluating LLMs

Paper • 2505.19457 • Published May 26, 2025 • 64

liked a Space 11 months ago

FineWeb: decanting the web for the finest text data at scale

🍷

1.26k

Generate high-quality text data for LLMs using FineWeb

do