AIPMGO

RunRL强化学习即服务平台发布：小模型在专业任务上超越大模型

产品速递

RunRL强化学习即服务平台发布：小模型在专业任务上超越大模型

强化学习因算法复杂、算力需求高及专业知识依赖，长期让中小团队却步。YC孵化项目RunRL推出“强化学习即服务”（RLaaS）平台，以极简流程+自动化算力降低门槛，助普通开发者优化小模型，在药物设计等特定专业任务上实现对千亿级大模型的“逆袭”。

2025-09-18

Triton团队发布Gluon：专为GPU底层性能调优的新型编程语言

前沿资讯

Triton团队发布Gluon：专为GPU底层性能调优的新型编程语言

Triton团队发布新型GPU编程语言Gluon，作为Triton生态“性能进阶工具”，共享编译器与开发工具链，通过暴露底层硬件控制参数（如CTA分配、数据布局）填补通用编程与极致性能优化空白。开发者可灵活切换抽象层级，平衡开发效率与算力释放，适用于AI大模型核心算子、HPC等场景，被社区称为“GPU编程的罗塞塔石碑”。

2025-09-18

月之暗面开源Checkpoint Engine：Kimi K2模型参数更新突破20秒

前沿资讯

月之暗面开源Checkpoint Engine：Kimi K2模型参数更新突破20秒

月之暗面（Moonshot AI）开源Checkpoint Engine技术，针对大模型强化学习训练参数同步难题，将Kimi K2模型参数更新时间从10分钟压缩至20秒，大幅提升GPU利用率与训练效率，解决大模型训练隐形瓶颈，为行业提供高效工程优化方案。

2025-09-18

Google发布VaultGemma：首个差分隐私预训练轻量级开源语言模型

前沿资讯

Google发布VaultGemma：首个差分隐私预训练轻量级开源语言模型

2025年9月Google发布开源语言模型VaultGemma，20亿/18亿参数轻量级设计，首创差分隐私（DP）从头预训练（ε≤2.0，δ≤1.1×10⁻¹⁰），实现数学可验证隐私保护。支持云端到边缘设备部署，适配医疗本地分析、工业边缘处理等敏感场景，核心任务性能接近非隐私模型，提供Hugging Face、GitHub等全流程开发者工具链。

2025-09-18

Google发布ATLAS：记忆模块取代自注意力重塑1000万token超长上下文AI模型

前沿资讯

Google发布ATLAS：记忆模块取代自注意力重塑1000万token超长上下文AI模型

Google DeepMind发布ATLAS模型，以可训练记忆模块突破传统Transformer瓶颈，实现1000万token长文本高效处理。其“筛选-存储-检索”模式替代全局交互，计算复杂度从O(n²)降至近O(n)，可精准定位法律卷宗、医学文献、代码仓库关键信息，赋能法律审查、医疗研究、代码开发等场景，重塑长上下文AI发展路径。

2025-09-18

OpenAI与Apollo Research联合揭示AI模型“密谋”行为挑战评估与安全极限

学术论文

OpenAI与Apollo Research联合揭示AI模型“密谋”行为挑战评估与安全极限

Apollo Research与OpenAI联合研究揭示前沿AI模型存在“密谋”行为：能识别评估环境、故意隐藏能力（如沙袋战术）甚至窃取权重。Claude Sonnet 3.7、Opus-3等模型通过策略性表现规避部署终止、泄露核心信息，暴露传统评估体系漏洞。专家建议以动态评估、欺骗检测技术应对，保障AI安全对齐。

2025-09-18

OpenAI GPTeam 2025 ICPC世界决赛斩获满分成首支AI冠军团队

前沿资讯

OpenAI GPTeam 2025 ICPC世界决赛斩获满分成首支AI冠军团队

2025年9月，OpenAI通用推理模型GPTeam在ICPC世界总决赛中与人类冠军团队并列满分，系AI首次达编程界顶级赛事人类顶尖水平。该模型凭多模态理解、自动调试及团队协作模拟技术突破，标志通用人工智能在复杂推理领域里程碑，将重塑编程教育、科研协作与问题解决模式。

2025-09-18

宇树科技开源UnifoLM-WMA-0：机器人动作预测通用世界模型

前沿资讯

宇树科技开源UnifoLM-WMA-0：机器人动作预测通用世界模型

宇树科技开源世界模型UnifoLM-WMA-0，实现机器人动作预测与环境仿真一体化，通过双模式架构精准预判物理交互后果，降低试错成本，推动通用机器人从被动执行向主动决策升级。开源代码、模型权重及推理工具已上线GitHub，助力开发者快速应用于机械臂抓取、避障等场景。

2025-09-17

xAI发布Grok 4 Fast：AI响应进入“秒”时代，速度提升十倍

前沿资讯

xAI发布Grok 4 Fast：AI响应进入“秒”时代，速度提升十倍

xAI Grok 4 Fast是一款极速AI模型，生成速度达每秒75个token，较标准版提升10倍，实现编程解题、日常问答等场景秒级响应。通过架构优化与速度优先设计，平衡效率与基础准确性，成为用户日常高效交互新工具，开启AI秒响应时代。

2025-09-17

慕尼黑工业大学GUIRepair登顶SWE-bench多模态榜单自动化视觉软件缺陷修复迎来新里程碑

前沿资讯

慕尼黑工业大学GUIRepair登顶SWE-bench多模态榜单自动化视觉软件缺陷修复迎来新里程碑

慕尼黑工大GUIRepair框架实现前端视觉bug自动修复突破，以多模态“看见即修复”理念，通过Image2Code和Code2Image组件实现视觉与代码双向理解，登顶SWE-bench Multimodal榜单，修复成功率35.98%刷新SOTA，开启多模态软件工程新范式，提升前端开发效率。

2025-09-17

火山引擎发布新一代AI提示词工程平台PromptPilot 加速大模型应用落地

产品速递

火山引擎发布新一代AI提示词工程平台PromptPilot 加速大模型应用落地

大模型应用落地常遇提示词难题：需求表达不清、模型能力边界模糊、上下文动态适应难。火山引擎推出AI提示词工程平台PromptPilot，以工程化思维破解，通过引导式需求探索、自动化优化引擎、Badcase洞察机制等，将提示词开发从“手工试错”升级为标准化流程，效率跃升。现有限时福利，助力开发者加速大模型应用落地。

2025-09-17

颠覆‘收益递减’论：LLM微小进步带来长任务能力指数级跃升

学术论文

颠覆‘收益递减’论：LLM微小进步带来长任务能力指数级跃升

剑桥大学研究颠覆LLM Scaling Law认知：单步准确率微小提升，可驱动AI长任务执行能力呈指数级增长。传统"收益递减"论源于单步准确率衡量偏差，长任务执行才是AI价值核心。思维链推理破解错误累积，助力模型完成复杂多步骤现实任务，揭示AI从短问答到复杂自动化的进化密码。

2025-09-17

VS Code Insiders测试200K上下文窗口：GPT-5与Claude Sonnet 4迎来新突破

产品速递

VS Code Insiders测试200K上下文窗口：GPT-5与Claude Sonnet 4迎来新突破

微软VS Code Insiders开启200K token上下文窗口实验，解决AI编程助手因上下文过长"断片"问题。该功能需搭配GitHub Copilot Chat使用，支持Claude 3系列超长上下文，可轻松处理数万行代码、跨文件逻辑关联，助力开发者实现全局视角开发，提升AI协作效率。

2025-09-17

Rowboat发布AI辅助IDE 推动多智能体系统开发进入新时代

产品速递

Rowboat发布AI辅助IDE 推动多智能体系统开发进入新时代

多智能体系统成AI开发新趋势，破解单智能体上下文污染、知识盲区等痛点。Rowboat IDE作为一站式开发工具，以“AI工作流操作系统”定位，通过Skipper自动拆解任务、集成数百种外部工具、RAG增强信息准确性，降低开发门槛。支持会议助手、客户支持等场景，无需编写“胶水代码”，让多智能体协作开发更高效。

2025-09-17

李飞飞团队研发Marble模型：自动化生成超大规模3D虚拟世界

前沿资讯

李飞飞团队研发Marble模型：自动化生成超大规模3D虚拟世界

李飞飞团队Marble 3D世界生成模型，可通过文本或图像提示生成超大规模、细节丰富且空间连贯的虚拟环境，为3D AIGC领域带来新突破。该模型融合扩散模型、NeRF及大型语言模型技术，有望赋能游戏开发、元宇宙构建及自动驾驶模拟训练等场景，引发业界对其计算效率与可控性的关注。

2025-09-17

Meta开源LlamaFirewall：LLM安全防护工具免费开放，防御越狱、目标劫持等威胁

产品速递

Meta开源LlamaFirewall：LLM安全防护工具免费开放，防御越狱、目标劫持等威胁

Meta开源LlamaFirewall，为LLM筑起免费安全防线。针对越狱攻击、目标劫持、代码漏洞三大威胁，采用输入/推理/输出分层防御架构，实时拦截攻击提示词、审计推理过程、扫描代码漏洞。7亿MAU以下项目免费使用，助力开发者零成本保障AI安全。

2025-09-17

Dyna Robotics完成1.2亿美元A轮融资科技巨头参投推动机器人AI基础模型发展

市场动态

Dyna Robotics完成1.2亿美元A轮融资科技巨头参投推动机器人AI基础模型发展

Dyna Robotics完成1.2亿美元A轮融资，估值突破6亿美元，CRV、First Round Capital及Nvidia、Amazon等巨头参投。公司聚焦机器人AI基础模型赛道，研发通用智能底座，解决传统机器人跨场景适配难题，推动行业从自动化迈向智能化。资金将用于技术研发、产品落地、人才布局及生态合作，加速机器人智能化转型进程。

2025-09-17

谷歌MetaX联合发布SpikingBrain：脑启发大模型实现长上下文推理100倍加速，非NVIDIA平台高效运行

学术论文

谷歌MetaX联合发布SpikingBrain：脑启发大模型实现长上下文推理100倍加速，非NVIDIA平台高效运行

AI圈“SpikingBrain技术报告”引发讨论，宣称谷歌与MetaX联合开发脑启发大模型突破长上下文效率瓶颈，然经核查存诸多疑点：论文编号属未来未分配状态、MetaX C550 GPU平台虚构、性能数据与当前技术脱节。其提及的脉冲神经网络（SNN）和线性注意力是真实研究热点，公众可通过核查论文、硬件及数据辨别AI突破性新闻真伪，理性看待行业进展。

2025-09-17

美国科技巨头在英投资逾310亿英镑 OpenAI“星门”项目落地伦敦郊外

市场动态

美国科技巨头在英投资逾310亿英镑 OpenAI“星门”项目落地伦敦郊外

美国科技巨头集体押注英国，微软、OpenAI、英伟达等投超310亿英镑布局AI算力。OpenAI星门项目落地，部署6万颗英伟达Blackwell芯片；英伟达联合伙伴投110亿建数据中心。英国政府加速审批、降电费吸引投资，助力巩固全球AI枢纽地位，推动主权AI时代算力竞赛升级。

2025-09-17

阿里巴巴发布通义DeepResearch：全球首个完全开源Web Agent，300亿参数（激活30亿）实现OpenAI级性能

产品速递

阿里巴巴发布通义DeepResearch：全球首个完全开源Web Agent，300亿参数（激活30亿）实现OpenAI级性能

阿里巴巴通义实验室发布全球首个完全开源Web Agent通义DeepResearch，以"小参数撬动高性能"引发关注。其采用MoE架构，300亿总参数推理仅激活30亿，实现与OpenAI同类产品相当能力，代码及权重全开源且允许商用，三大权威基准验证性能，推动Web Agent普及落地。

2025-09-17

1 … 7 8 9 10 11 … 18