人工智能雷锋网·2026年6月26日

GAIR Paper 107｜高校联合腾讯发布 GameCraft-Bench：AI已能端到端开发游戏，Claude Opus 四成达到可玩水平

综合评分

重要性

新颖性

趋势性

摘要

由GAIR团队联合多所高校与腾讯共同发布的GameCraft-Bench基准测试，系统评估了大语言模型在端到端游戏开发中的实际能力。测试结果表明，以Claude Opus为代表的顶尖AI模型已能在约四成的任务中生成具备可玩性的完整游戏代码与资源，标志着人工智能在游戏自动化创作与复杂逻辑构建方面取得显著进展。

为何重要

•建立AI游戏开发能力的标准化评估体系，填补该垂直领域基准测试空白
•验证大模型在长程代码生成、资产整合与交互逻辑设计上的技术突破，有望大幅降低独立游戏开发门槛
•推动“AI+游戏”产业深度融合，加速游戏制作流程自动化，可能重塑数字内容生产模式
•明确当前顶尖闭源模型的能力边界，为后续多模态智能体（Agent）研发提供关键数据参考

AI游戏开发大语言模型基准测试自动化编程游戏AIClaude Opus腾讯智能体

阅读原文 →

读者互动

您可以登录/注册后再发表

行业观点0

先选择产业情绪

相关信号

人工智能雷锋网·1 天前

Gartner发布企业级AI Coding报告，阿里云入围挑战者象限

知名市场研究机构Gartner近日正式发布企业级AI编程工具评估报告。阿里云凭借在AI辅助编码领域的持续技术投入与实际落地成效，成功入选报告中的“挑战者”象限。该报告系统评测了多款主流AI代码生成与开发辅助工具，全面展现了当前企业级AI编程赛道的技术演进路线与市场竞争态势。

AI编程企业级AIGartner报告阿里云

评分

人工智能雷锋网·1 天前

【ICML 2026】刷新高光谱图像恢复任务SOTA!DAMP：面向高光谱影像恢复的退化感知度量提示框架

本文基于ICML 2026会议信息，介绍了名为DAMP的新型AI框架。该框架针对高光谱图像恢复任务，提出了一种退化感知度量提示机制，旨在解决复杂成像条件下的图像失真问题。研究宣称已刷新该任务SOTA，为遥感、医疗等依赖高光谱数据的领域提供了更高效的图像处理方案。

人工智能计算机视觉高光谱图像深度学习

评分

人工智能雷锋网·1 天前

ICML2026 |SEER：自动增强+替换Patch，同时搞定噪声、异常、缺失、分布偏移的新SOTA模型！

本文报道了ICML 2026上提出的一种名为SEER的新型机器学习模型。该模型通过自动数据增强与Patch替换机制，有效解决了训练数据中常见的噪声、异常值、缺失值及分布偏移等问题。作为当前在该领域的最新SOTA方案，SEER显著提升了深度学习模型在复杂真实场景下的鲁棒性与泛化能力，为高质量模型训练提供了新思路。

ICML 2026SEER模型机器学习自动数据增强

评分

人工智能雷锋网·13 小时前

重构交互底层逻辑：Rokid发布AIOS，智能眼镜行业进入“原生”时刻

本文报道了Rokid正式发布AIOS（人工智能操作系统），旨在重构智能眼镜的底层交互逻辑。该系统的推出标志着智能穿戴设备正从传统操作模式向AI原生交互全面演进，预示着智能眼镜行业将进入以大模型驱动、自然语言为核心的人机交互新阶段，为下一代可穿戴终端的技术路线与生态建设提供了关键基础设施。

RokidAIOS智能眼镜人工智能操作系统

评分

人工智能雷锋网·1 天前

豆包推出专业版，能成为你的「工作搭子」吗？

字节跳动旗下AI应用“豆包”正式推出专业版，明确将目标用户转向职场人群与生产力场景。新版本预计将深度优化大模型在长文本处理、数据分析及多步骤任务执行方面的表现，致力于成为用户的智能办公助手。此次升级反映出国内AI厂商正加速推动大模型从日常聊天向专业化、高价值工作流渗透，以拓展商业化变现渠道。

豆包AI大模型人工智能应用智能办公

评分