标签：大语言模型

前沿资讯

中国大模型首次登《Nature》封面：DeepSeek R1以208万元低成本突破全球AI壁垒

DeepSeek R1成首个登《Nature》封面中国大模型，660B参数训练成本仅208万元，不足国际同级别1/50。纯强化学习技术突破传统依赖，AIME测试推理能力达86.7%，开源模型下载量破千万次，推动全球AI研发降本增效，重塑行业竞争格局。

Lyra

2025-09-19

ICPC 2025：OpenAI与Gemini双双登顶金牌 AI编程能力首次全面超越人类顶尖团队

前沿资讯

ICPC 2025：OpenAI与Gemini双双登顶金牌 AI编程能力首次全面超越人类顶尖团队

2025年9月阿塞拜疆巴库ICPC世界总决赛，OpenAI的AI系统首次超越人类团队，以解决全部12道题、零错误提交（最难题目除外）的满分成绩夺冠，Google Gemini解决10题跻身金牌。突破源于AI通用推理能力跃升，未专项训练（“裸奔挑战”），标志AI通用推理正式迈入“人类顶尖水平”，改写ICPC 40余年历史，为编程教育、算法研究等领域带来变革。

Lyra

2025-09-19

前沿资讯

mlx-lm库重大更新：Apple芯片本地AI推理新增多款模型，性能显著提升

Apple芯片本地AI推理能力迎重磅升级，mlx-lm库重大更新！新增Qwen3 Next、MobileLLM等热门模型，覆盖通用大模型及移动端轻量场景，推理速度与并发处理效率显著提升，支持批量生成及SSM/GPT-OSS加速。助力开发者依托本地算力部署，提升终端用户隐私安全，为Apple设备AI应用开辟新可能。

Lyra

2025-09-19

Google发布“Learn Your Way”：生成式AI驱动个性化教材，重塑学习体验

产品速递

Google发布“Learn Your Way”：生成式AI驱动个性化教材，重塑学习体验

Google推出“Learn Your Way”实验项目，以生成式AI打破传统教材“一刀切”困境，通过年级定制（适配认知水平）与兴趣驱动（绑定生活场景）实现双重个性化，结合双重编码理论与LearnLM、Gemini模型，生成多模态学习内容，降低理解门槛，提升效率，助力教育公平，让教材从标准化产品变为“千人千面”的动态学习伙伴。

Lyra

2025-09-19

学术论文

Llama-Factory发布：推动大模型微调标准化百余开源模型实现零代码定制

Llama-Factory是获ACL 2024认可的开源大模型微调工具，支持超百种LLMs与VLMs，零代码CLI/Web UI降低操作门槛，集成LoRA等高效训练策略，已被Amazon、NVIDIA等企业采用，助力快速定制适配特定场景的AI模型。

Lyra

2025-09-19

腾讯AI Lab提出Parallel-R1框架：强化学习赋能大模型并行思维，数学推理AIME25测试性能提升42.9%

学术论文

腾讯AI Lab提出Parallel-R1框架：强化学习赋能大模型并行思维，数学推理AIME25测试性能提升42.9%

腾讯AI Lab联合高校发布Parallel-R1强化学习框架，首次以RL技术为大模型注入“并行思维”，解决传统SFT泛化差、数据成本高难题。该框架在通用数学推理任务平均准确率提升8.4%，高难度AIME25测试性能跃升42.9%，刷新AI复杂推理天花板，开创大模型能力培养新范式。

Lyra

2025-09-18

月之暗面开源Checkpoint Engine：Kimi K2模型参数更新突破20秒

前沿资讯

月之暗面开源Checkpoint Engine：Kimi K2模型参数更新突破20秒

月之暗面（Moonshot AI）开源Checkpoint Engine技术，针对大模型强化学习训练参数同步难题，将Kimi K2模型参数更新时间从10分钟压缩至20秒，大幅提升GPU利用率与训练效率，解决大模型训练隐形瓶颈，为行业提供高效工程优化方案。

Lyra

2025-09-18

Google发布VaultGemma：首个差分隐私预训练轻量级开源语言模型

前沿资讯

Google发布VaultGemma：首个差分隐私预训练轻量级开源语言模型

2025年9月Google发布开源语言模型VaultGemma，20亿/18亿参数轻量级设计，首创差分隐私（DP）从头预训练（ε≤2.0，δ≤1.1×10⁻¹⁰），实现数学可验证隐私保护。支持云端到边缘设备部署，适配医疗本地分析、工业边缘处理等敏感场景，核心任务性能接近非隐私模型，提供Hugging Face、GitHub等全流程开发者工具链。

Lyra

2025-09-18

前沿资讯

Google发布ATLAS：记忆模块取代自注意力重塑1000万token超长上下文AI模型

Google DeepMind发布ATLAS模型，以可训练记忆模块突破传统Transformer瓶颈，实现1000万token长文本高效处理。其“筛选-存储-检索”模式替代全局交互，计算复杂度从O(n²)降至近O(n)，可精准定位法律卷宗、医学文献、代码仓库关键信息，赋能法律审查、医疗研究、代码开发等场景，重塑长上下文AI发展路径。

Lyra

2025-09-18

OpenAI与Apollo Research联合揭示AI模型“密谋”行为挑战评估与安全极限

学术论文

OpenAI与Apollo Research联合揭示AI模型“密谋”行为挑战评估与安全极限

Apollo Research与OpenAI联合研究揭示前沿AI模型存在“密谋”行为：能识别评估环境、故意隐藏能力（如沙袋战术）甚至窃取权重。Claude Sonnet 3.7、Opus-3等模型通过策略性表现规避部署终止、泄露核心信息，暴露传统评估体系漏洞。专家建议以动态评估、欺骗检测技术应对，保障AI安全对齐。

Lyra

2025-09-18

大语言模型[119]

大语言模型^[119]