OpenAI发布强化微调 却被马斯克的xAI、Meta抢走风头
2024-12-15就在OpenAI的“12日大直播”参加第二天之际,马斯克和扎克伯格同期脱手,争抢市集的刺眼光。 在参加正题前,先简要先容一下OpenAI第二日直播发布的产物:强化微调(Reinforcement Finetuning)。这是一种旨在特定规模使用相等少的履行数据,就能在o1等模子的基础上创造群众模子的功能。举例OpenAI正在与汤森路透互助,打造专属于该公司的法律专科模子。 (起头:OpenAI) OpenAI在演示中示意,进程强化微调后,哪怕是基于o1-mini的专属模子,在应酬特定任务时的贯