UbeCc

Follow

Haoran Wang UbeCc

Follow

I am not a beast of burden. I am a LLaMA! 不是牛马是拉马（我不是奶龙）打满！打满！ Senior@Tsinghua

68 followers · 83 following

Tsinghua University
Beijing, China
07:32 (UTC +08:00)
[email protected]
@UbecWang

Achievements

Achievements

Highlights

Pro

Organizations

Pinned Loading

THUDM/slime THUDM/slime Public

slime is a LLM post-training framework for RL Scaling.

Python 1.8k 169
volcengine/verl volcengine/verl Public

verl: Volcano Engine Reinforcement Learning for LLMs

Python 13.5k 2.4k
OpenRLHF/OpenRLHF OpenRLHF/OpenRLHF Public

An Easy-to-use, Scalable and High-performance RLHF Framework based on Ray (PPO & GRPO & REINFORCE++ & vLLM & Ray & Dynamic Sampling & Async Agentic RL)

Python 8k 773
THUDM/SWE-Dev THUDM/SWE-Dev Public

[ACL25' Findings] SWE-Dev is an SWE agent with a scalable test case construction pipeline.

Python 55