腾讯研发全新TiG框架:用AI玩王者荣耀让AI模型学会战略性思考
来源:
发布时间:2025-10-04 20:10:07
电竞资讯10月4日称 据 decoder 今天报道,腾讯研究人员最近用《王者荣耀》游戏作为训练平台,探索如何让AI在游戏中学会“战略性思考”,研究全新 TiG(Think in Games)框架,相关成果已发表于 Hugging Face 平台和 arXiv 期刊。

研究团队指出,目前的 AI 模型存在明显的功能鸿沟,以游戏为取向的 AI 能正常游玩但无法理解自己所做的决策,而语言模型虽然可以推理策略,但很难真正执行操作,为此他们研发了全新 TiG 框架,让模型在游戏中同步思考、行动。

团队选择以《王者荣耀》游戏作为训练范本,先使用匿名且标准化的赛事数据定义推上路、击杀暴君、守家等 40 种宏观行动,胜负回数均衡,AI 模型们必须要在每个定义好的场景下选择最佳策略,并解释其战略缘由。

具体来说,训练分为两个阶段,首先是在监督中学习,弄清楚这些策略的基本机制;随后通过奖励机制进行强化学习,如果行动正确能得 1 分,错误行动则得 0 分。

随后团队测试了多种语言模型,涵盖 Qwen2.5(7B、14B、32B)、Qwen3-14B 模型,并使用 DeepSeek-R1 大模型作为对照组;先从 DeepSeek-R1 提炼高质量训练数据,然后使用群体相对策略优化(GRPO)技术,比较不同策略之间的优劣。

最终经过 TiG 框架训练的模型不仅能制定行动计划,还能解释原因,例如 AI 会指出某个防御塔防守薄弱,是理想的进攻目标,但需要注意埋伏的敌人。模型训练后仍保持原有的文本理解、数学推理与问答能力。

最终测试结果如下:
对照组 DeepSeek-R1:决策准确率达 86.67%
Qwen3-14B:决策准确率达 90.91%,超越 DeepSeek-R1
Qwen2.5-32B :准确率从 66.67% 提升至 86.84%
Qwen2.5-14B:准确率从 53.25% 提升至 83.12%
相关阅读
最新录像
10月28日西甲第10轮皇家贝蒂斯vs马德里竞技全场录像
10-28
10月27日NBA常规赛开拓者快船全场录像
10-27
10月27日西甲第10轮巴列卡诺vs阿拉维斯全场录像
10-27
10月27日意甲第8轮拉齐奥vs尤文图斯全场录像
10-27
10月27日法甲第9轮里昂vs斯特拉斯堡全场录像
10-27
10月27日西甲第10轮奥萨苏纳vs塞尔塔全场录像
10-27
10月27日意甲第8轮佛罗伦萨vs博洛尼亚全场录像
10-27
10月27日英超第9轮埃弗顿vs热刺全场录像
10-27
10月27日德甲第8轮斯图加特vs美因茨全场录像
10-27
10月27日法甲第9轮昂热vs洛里昂全场录像稍后更新
10-27
最新集锦
西甲马竞20客胜贝蒂斯小西蒙尼世界波巴埃纳处子球小蜘蛛助攻
10-28
沙王冠布赖坎破门托尼建功吉达国民30巴腾
10-28
里夫斯生涯新高51分!湖人力克国王艾顿22+15威少18+6+6
10-27
杨瀚森4分20秒2分1板开拓者不敌快船小卡30+10哈登20+6+13
10-27
独行侠5人17+擒猛龙!弗拉格22分浓眉25+10巴恩斯33+11+6
10-27
森林狼力克步行者华子伤退兰德尔31+6西卡33+10+8+3断
10-27
骑士力擒雄鹿米切尔24分莫布里23+8+6字母哥空砍40+14+9
10-27
黄蜂4人20+轻取奇才三球38+13+13CJ24+6+5萨尔21+5
10-27
热火送尼克斯首败!鲍威尔29+7阿德巴约19+13布伦森37+6
10-27
西甲茹拉夫斯基绝杀巴列卡诺10阿拉维斯
10-27
热词推荐
热门TAG
-
成功
天下足球
面临
奥莫尼亚
国际赛女
话题
古尔腾
扎卡特卡斯
天公
孔波齐矿
美好
宝贝
牌价
灯笼
江苏肯帝亚
竞争
接班
列什蒂竞技
产品
快要
安提瓜GFC
高调
多心
爪萨芬斯扎瑞
沙尔哥塔罕BTC
法网直播2021
cctv5高清无插件
央视体育5套在线直播
直播跳水男双3米板决赛
nba总决赛直播在线直播
亚洲杯直播平台
欧洲杯视频
湖人魔术冲突
拉斯帕尔马斯VS阿拉维斯直播
朴茨茅斯VS利兹联直播
nba今日十佳球
独行侠vs雷霆
辽宁男篮今晚直播
山东综艺频道在线直播
五星体育直播
长春亚泰吧
直播中央一台
森林狼vs快船
cctv6在线观看
2022世界杯决赛
nba录像回放完整版
ufc直播在线
CCTV5在线直播观看高清咕噜
湖南卫视观看入口
卡利亚里VS尤文图斯直播