标签：大语言模型

NeurIPS 2025聚焦大模型记忆化风险：训练数据复现引版权挑战

学术论文

NeurIPS 2025聚焦大模型记忆化风险：训练数据复现引版权挑战

大模型“记忆化”现象引行业警惕，其逐字复述训练数据的特性成版权风险“隐形炸弹”，威胁信息安全与内容合规。NeurIPS 2025聚焦此议题，推动技术（数据去重、参数优化）与管理（数据授权、人工审核）双重破局，探索AI在创新与版权保护间的平衡之道。

Lyra

2025-09-22

前沿资讯

英国AI模型Mantic跻身Metaculus预测杯前十成首个进入该赛事顶尖行列的AI系统

2025年夏季，英国初创公司Mantic的AI模型在Metaculus预测杯跻身前十，成首个突破该关口的人工智能系统，刷新AI在复杂决策场景表现，引发"机器理解人类社会复杂性"热议。其跨模态时序架构通过三层注意力机制融合多源数据，标志AI预测从追赶者向并跑者转变，推动地缘政治预测人机协同决策新时代。

Lyra

2025-09-22

OpenRLHF：推动RLHF训练进入高性能与易用新时代

前沿资讯

OpenRLHF：推动RLHF训练进入高性能与易用新时代

OpenRLHF是一款高性能开源RLHF框架，通过整合Ray分布式调度、vLLM推理引擎及DeepSpeed ZeRO-3内存优化技术，解决大语言模型RLHF训练中资源利用率低、样本生成慢、内存瓶颈等痛点。其实现GPU利用率提升60%+，推理吞吐量较传统引擎提升24倍，支持8卡A100流畅训练70B参数模型，助力中小团队低成本复现工业级RLHF训练流程。

Lyra

2025-09-21

学术论文

模型蒸馏驱动AI小型化革命：DeepSeek R1引发技术创新与伦理争议

模型蒸馏技术是破解AI算力饥渴与落地成本矛盾的关键，通过让小型“学生”模型学习大型“教师”模型的“暗知识”，实现小模型高性能。结合自蒸馏、量化融合等升级，可减少40%参数量并保持性能，推动边缘设备AI部署，降低中小企业门槛，同时面临法律边界挑战，助力AI普惠落地。

Lyra

2025-09-21

通义千问发布Qwen3-Coder-30B-A3B-Instruct，本地智能编码迈入新阶段

前沿资讯

通义千问发布Qwen3-Coder-30B-A3B-Instruct，本地智能编码迈入新阶段

通义千问Qwen3-Coder-30B-A3B-Instruct以305亿参数稀疏MoE架构与YARN技术，重塑本地智能编码边界。原生支持256K tokens上下文（可扩至百万级），HumanEval得分78.9%超同类开源模型，工具调用准确率94.1%，兼顾高效推理与长代码理解，为开发者提供本地化AI编码助手。

Lyra

2025-09-21

AWS Bedrock集成国产顶级大模型Qwen3与DeepSeek-V3.1全球上线

前沿资讯

AWS Bedrock集成国产顶级大模型Qwen3与DeepSeek-V3.1全球上线

AWS旗下AI服务平台Amazon Bedrock正式集成中国顶尖大语言模型——阿里Qwen3与深度求索DeepSeek-V3.1。此举标志中国AI技术获国际主流云计算平台认可，为全球开发者和企业带来更多元化AI解决方案。两款模型已在全球多个区域同步上线，用户可灵活选用。

Lyra

2025-09-20

阿拉伯语AI模型新突破：Hala项目以创新管线与Slerp技术引领指令与翻译领域

学术论文

阿拉伯语AI模型新突破：Hala项目以创新管线与Slerp技术引领指令与翻译领域

阿拉伯语AI长期受低资源困境制约，Hala模型家族通过FP8压缩、Slerp合并及“翻译-调优”技术管线，实现阿拉伯语指令遵循与翻译任务SOTA性能，为低资源语言AI提供可复制范式，推动政务、教育等场景落地。

Lyra

2025-09-20

全新基准SWE-rebench发布：标准化、透明化评估软件工程LLM

学术论文

全新基准SWE-rebench发布：标准化、透明化评估软件工程LLM

大型语言模型（LLM）正重塑软件工程，GitHub Copilot、ChatGPT等成开发者工具，但现有评估存数据污染、脚手架差异等痛点。全新基准SWE-rebench通过去污染数据集、统一ReAct框架、透明化流程等，解决评估不公问题，为LLM软件工程能力提供标准化衡量方案，推动行业从"指标优化"转向核心能力提升。

Lyra

2025-09-20

Google SLED：融合所有层信息提升LLM事实准确性，无需外部数据或微调的创新解码策略

学术论文