Location
Shenzhen
Job Type
Full-time
Posted
July 03, 2026
Job Description
微信小游戏-大模型后训练工程师 深圳 分享 渴望为世界带来新意的人,早已对描绘未来的“热词”不陌生——人工智能、机器学习、数据科学等等。腾讯始终在业界前沿不断探索,积极布局,并为优秀的你提供无限广阔的舞台。我们坚信科技的不断革新,最终能带来美好的、撼动人心的改变。 岗位职责 1.负责大模型在游戏业务场景的应用落地与全链路研发,覆盖小游戏试玩内容创作(玩法/剧情/素材生成)、开发者工具提效(代码生成与理解、资源生产、自动化测试等)等方向。设计并落地基于执行反馈、自动化评测与定向修复等技术的数据生产、质量保障与优化方案,打通从场景理解、数据构造、模型微调到线上效果验证的闭环,确保大模型在游戏场景中高质量、高标准交付;
2.深度参与游戏大模型能力的专项评测与分析(如试玩内容的可玩性与质量、生成代码的正确性与可运行性、工具提效收益等),制定科学的评价指标体系。通过剖析模型在实际游戏研发与内容创作任务中的弱项,设计并落地高效的数据飞轮机制,定向进行数据补充与配方调整,实现评测发现问题-数据定向强化-效果闭环提升,持续驱动模型游戏核心能力的演进;
3.追踪与研究支撑大模型在游戏业务落地的前沿技术,关注基于执行反馈的3、强化学习(RLAIF/RLCE)、代码自验证生成、AI SWE、多模态内容生成、游戏智能体(Game Agent)等方向,能够将最新研究成果快速转化为游戏业务价值。 岗位要求 1.计算机相关专业,具备较强的动手能力;熟悉 Python ,具备扎实的系统编程功底和优秀的复杂系统 Debug 能力;
2.训练框架经验: 深入理解大模型分布式训练原理,具备 Megatron-LM、DeepSpeed 或 PyTorch FSDP 等主流框架的实际源码级开发与定制经验;
3.RL 与 RL Infra 储备: 熟悉大模型后训练与对齐技术(PPO、GRPO、DPO等),熟悉 Verl、ROLL,AReal 等强化学习...
分享岗位
方式1:复制岗位链接
方式2:分享岗位海报
手机扫描二维码分享
收藏 WXG 点击了解更多BG信息 技术 一年以上工作经验 更新于年07月01日2.深度参与游戏大模型能力的专项评测与分析(如试玩内容的可玩性与质量、生成代码的正确性与可运行性、工具提效收益等),制定科学的评价指标体系。通过剖析模型在实际游戏研发与内容创作任务中的弱项,设计并落地高效的数据飞轮机制,定向进行数据补充与配方调整,实现评测发现问题-数据定向强化-效果闭环提升,持续驱动模型游戏核心能力的演进;
3.追踪与研究支撑大模型在游戏业务落地的前沿技术,关注基于执行反馈的3、强化学习(RLAIF/RLCE)、代码自验证生成、AI SWE、多模态内容生成、游戏智能体(Game Agent)等方向,能够将最新研究成果快速转化为游戏业务价值。
2.训练框架经验: 深入理解大模型分布式训练原理,具备 Megatron-LM、DeepSpeed 或 PyTorch FSDP 等主流框架的实际源码级开发与定制经验;
3.RL 与 RL Infra 储备: 熟悉大模型后训练与对齐技术(PPO、GRPO、DPO等),熟悉 Verl、ROLL,AReal 等强化学习...