PodLM
Home
API Keys
My Podcasts
Sign In
Toggle Sidebar
OpenAI o1:开启后训练时代的强化学习新范式
Sources
北大对齐团队独家解读:OpenAI o1开启「后训练」时代强化学习新范式
Update Podcast
Podcast Editor
Preview
Podcast.json
Preview
Audio
Podcast Information
Title
Description
在本期播客中,Leo 和特邀嘉宾深入讨论 OpenAI o1 模型的发布及其对后训练阶段的影响,探讨强化学习如何改变大模型的推理能力,并讨论未来的可能性。
Topics
Remove
Remove
Remove
Add Topic
Roles
Scripts