微信小游戏-大模型后训练工程师

Tencent · Shenzhen, Guangdong Province, China
Location
Shenzhen
Job Type
Full-time
Posted
July 03, 2026
Job Description

            微信小游戏-大模型后训练工程师 深圳 分享 
分享岗位
方式1:复制岗位链接
方式2:分享岗位海报
手机扫描二维码分享
 收藏 WXG 点击了解更多BG信息 技术 一年以上工作经验 更新于年07月01日 渴望为世界带来新意的人，早已对描绘未来的“热词”不陌生——人工智能、机器学习、数据科学等等。腾讯始终在业界前沿不断探索，积极布局，并为优秀的你提供无限广阔的舞台。我们坚信科技的不断革新，最终能带来美好的、撼动人心的改变。
 岗位职责 1.负责大模型在游戏业务场景的应用落地与全链路研发，覆盖小游戏试玩内容创作（玩法/剧情/素材生成）、开发者工具提效（代码生成与理解、资源生产、自动化测试等）等方向。设计并落地基于执行反馈、自动化评测与定向修复等技术的数据生产、质量保障与优化方案，打通从场景理解、数据构造、模型微调到线上效果验证的闭环，确保大模型在游戏场景中高质量、高标准交付；
2.深度参与游戏大模型能力的专项评测与分析（如试玩内容的可玩性与质量、生成代码的正确性与可运行性、工具提效收益等），制定科学的评价指标体系。通过剖析模型在实际游戏研发与内容创作任务中的弱项，设计并落地高效的数据飞轮机制，定向进行数据补充与配方调整，实现评测发现问题-数据定向强化-效果闭环提升，持续驱动模型游戏核心能力的演进；
3.追踪与研究支撑大模型在游戏业务落地的前沿技术，关注基于执行反馈的3、强化学习（RLAIF/RLCE）、代码自验证生成、AI SWE、多模态内容生成、游戏智能体（Game Agent）等方向，能够将最新研究成果快速转化为游戏业务价值。
 岗位要求 1.计算机相关专业，具备较强的动手能力；熟悉 Python ，具备扎实的系统编程功底和优秀的复杂系统 Debug 能力；
2.训练框架经验： 深入理解大模型分布式训练原理，具备 Megatron-LM、DeepSpeed 或 PyTorch FSDP 等主流框架的实际源码级开发与定制经验；
3.RL 与 RL Infra 储备： 熟悉大模型后训练与对齐技术（PPO、GRPO、DPO等），熟悉 Verl、ROLL，AReal 等强化学习...
        
Ready to Apply?

Submit your application for 微信小游戏-大模型后训练工程师 at Tencent
Apply Now