Alex Open Research Wiki

Tag: llm-post-training

11 items with this tag.

Jun 26, 2026
Exploration: Fine-Tuning With Parameter Decomposition
Jun 26, 2026
Improved Large Language Diffusion Models
Jun 26, 2026
LLM Post-Training
Jun 20, 2026
Latent Thought Flow: Efficient Latent Reasoning in Large Language Models
Jun 17, 2026
On the Generalization of SFT: A Reinforcement Learning Perspective with Reward Rectification
Jun 17, 2026
ExpRL: Exploratory RL for LLM Mid-Training
Jun 17, 2026
Reinforcement Learning Finetunes Small Subnetworks in Large Language Models
Jun 17, 2026
Reinforcement Learning on Pre-Training Data
Jun 14, 2026
Synthetic Data for any Differentiable Target
May 28, 2026
DiffusionBlocks: Block-wise Neural Network Training via Diffusion Interpretation
May 18, 2026
Learning, Fast and Slow: Towards LLMs That Adapt Continually

Created with Quartz v4.5.2 © 2026