2.2.4 拥抱强化学习,赋能AI推理