OpenRLHF

20240307-sdja0

OpenRLHF 轻量高效的工业级LLM训练和对齐框架

轻量高效的工业级LLM训练和对齐框架,OpenRLHF 支持70B模型RLHF全参数全流程训练! OpenRLHF 是什么?自ChatGPT横空出世以后,大家开始关注到以InstructGPT为代表的RLHF对齐技术,并以此为基础尝试复现ChatGPT的训…