大语言模型[119]
OpenAI华人明星研究员姚顺雨离职,开启AI“下半场”新篇章
OpenAI核心研究员姚顺雨离职引AI界关注。这位清华姚班校友、普林斯顿博士,以ReAct、思维树等成果成AI推理领域领军者,提出“AI下半场”理论,推动行业从技术突破转向现实价值落地。其动向或影响全球AI人才流动与技术方向。
全球大模型开源生态报告2.0发布:中美贡献超四成核心力量,AI编程工具爆发式增长
《全球大模型开源开发生态全景与趋势报告2.0》发布,蚂蚁开源联合Inclusion AI勾勒AI开源生态。数据显示,62%核心项目诞生于“GPT时刻”后,平均年龄30个月,迭代加速至2-3个月;中美开发者贡献超40%,成“双核引擎”。技术上,MoE架构突破参数瓶颈,多模态成主流,AI编程工具爆发重塑开发流程,中国以开放权重策略推动生态创新。
OpenAI与微软签署谅解备忘录 战略合作开启新篇章聚焦AI工具与安全
2025年9月,OpenAI与微软签署新阶段非约束性谅解备忘录,标志AI战略合作升级。双方合作基于超130亿美元投资,微软Azure提供算力支持,OpenAI技术赋能其产品;新协议以安全为核心原则,将深化技术研发与商业化,巩固行业领先地位,影响全球AI生态格局。
马拉维农民借AI聊天机器人Ulangizi应对气候危机,农业生产模式悄然变革
马拉维农民灾后借AI助手Ulangizi重获生机。这款基于LLaMA模型、依托WhatsApp的工具,提供病虫害诊断、种植管理及气候适应建议,助农户如Alex Maere改种土豆增收超800美元。Ulangizi推动经验种植转向科学管理,为非洲应对气候变化、农业数字化开辟新路径。
OpenAI董事长Bret Taylor:AI代理重塑客户服务,AI热潮再现互联网泡沫盛况
硅谷老兵、OpenAI前董事长Bret Taylor创立Sierra,以AI代理重塑客户服务。其AI代理具备自主性,可理解需求、访问企业系统执行复杂任务(如套餐变更),区别于传统聊天机器人。采用“按成功处理案例收费”模式,已助力企业处理70%-80%客服请求,平均耗时2分钟,大幅降本增效。
上海交大与字节跳动联合推出RhymeRL 强化学习训练速度提升2.6倍
强化学习训练中Rollout阶段效率瓶颈突出,上海交大与字节跳动联合发布RhymeRL框架,通过挖掘历史数据序列与长度分布相似性,创新HistoSpec批量验证与HistoPipe调度策略,实现端到端吞吐量2.6倍提升,且精度零损失,有效突破大模型训练效率瓶颈。
西湖大学发布AiraXiv与DeepReview:AI生成论文筛选评审前沿方案
AI生成论文激增致学术界“水文”筛查难题,西湖大学WestlakeNLP发布创新方案:AiraXiv预印本平台(首个AI生成论文专属渠道)与DeepReview AI审稿系统(模拟专家思考链)。二者协同实现AI论文分类管理、分钟级审稿,大幅提升筛选效率,破解传统审稿压力,引领AI时代学术评审新范式。
Meta Connect 2025前瞻:智能眼镜、Meta AI与Llama模型领衔创新看点
Meta Connect 2025发布两款智能眼镜:高端带屏Hypernova(800美元,与Prada合作,探索AR技术)和大众无屏Ray-Ban Meta(300美元,主打日常使用)。Meta AI月活超10亿,但Llama 4模型开发推迟;元宇宙Horizon Worlds将引入AI NPC。展现其AR/AI/元宇宙协同布局与市场分层策略。
Project Fluently发布FluentlyQwen3-4B:引入“思考模式”的通用大模型
FluentlyQwen3-4B是基于Qwen3-4B-Base微调的通用大模型,核心亮点为可切换“思考模式”,能显式展示推理步骤提升可解释性,适配数学、编码等复杂任务。上下文扩展至131K tokens,兼容SGLang/vLLM等框架,支持多量化版本低门槛部署,在教育、开发等场景表现亮眼。
脑启发式大模型SpikingBrain发布:长序列处理提速百倍 能效优化破Transformer瓶颈
中国团队研发的SpikingBrain脑启发大模型,突破LLM长上下文处理瓶颈,通过脑启发脉冲计算、线性注意力机制及动态路由MoE结构,实现百倍推理加速与97.7%能耗降低。支持4M-token超长文本分析,适配法律、医疗及边缘计算场景,依托国产MetaX硬件平台,为非Transformer架构LLM提供自主可控高效方案。