标签：大语言模型

OpenAI华人明星研究员姚顺雨离职，开启AI“下半场”新篇章

圈内热议

OpenAI华人明星研究员姚顺雨离职，开启AI“下半场”新篇章

OpenAI核心研究员姚顺雨离职引AI界关注。这位清华姚班校友、普林斯顿博士，以ReAct、思维树等成果成AI推理领域领军者，提出“AI下半场”理论，推动行业从技术突破转向现实价值落地。其动向或影响全球AI人才流动与技术方向。

Lyra

2025-09-15

全球大模型开源生态报告2.0发布：中美贡献超四成核心力量，AI编程工具爆发式增长

前沿资讯

全球大模型开源生态报告2.0发布：中美贡献超四成核心力量，AI编程工具爆发式增长

《全球大模型开源开发生态全景与趋势报告2.0》发布，蚂蚁开源联合Inclusion AI勾勒AI开源生态。数据显示，62%核心项目诞生于“GPT时刻”后，平均年龄30个月，迭代加速至2-3个月；中美开发者贡献超40%，成“双核引擎”。技术上，MoE架构突破参数瓶颈，多模态成主流，AI编程工具爆发重塑开发流程，中国以开放权重策略推动生态创新。

Lyra

2025-09-15

OpenAI与微软签署谅解备忘录战略合作开启新篇章聚焦AI工具与安全

前沿资讯

OpenAI与微软签署谅解备忘录战略合作开启新篇章聚焦AI工具与安全

2025年9月，OpenAI与微软签署新阶段非约束性谅解备忘录，标志AI战略合作升级。双方合作基于超130亿美元投资，微软Azure提供算力支持，OpenAI技术赋能其产品；新协议以安全为核心原则，将深化技术研发与商业化，巩固行业领先地位，影响全球AI生态格局。

Lyra

2025-09-15

马拉维农民借AI聊天机器人Ulangizi应对气候危机，农业生产模式悄然变革

产品速递

马拉维农民借AI聊天机器人Ulangizi应对气候危机，农业生产模式悄然变革

马拉维农民灾后借AI助手Ulangizi重获生机。这款基于LLaMA模型、依托WhatsApp的工具，提供病虫害诊断、种植管理及气候适应建议，助农户如Alex Maere改种土豆增收超800美元。Ulangizi推动经验种植转向科学管理，为非洲应对气候变化、农业数字化开辟新路径。

Lyra

2025-09-15

OpenAI董事长Bret Taylor：AI代理重塑客户服务，AI热潮再现互联网泡沫盛况

圈内热议

OpenAI董事长Bret Taylor：AI代理重塑客户服务，AI热潮再现互联网泡沫盛况

硅谷老兵、OpenAI前董事长Bret Taylor创立Sierra，以AI代理重塑客户服务。其AI代理具备自主性，可理解需求、访问企业系统执行复杂任务（如套餐变更），区别于传统聊天机器人。采用“按成功处理案例收费”模式，已助力企业处理70%-80%客服请求，平均耗时2分钟，大幅降本增效。

Lyra

2025-09-15

上海交大与字节跳动联合推出RhymeRL 强化学习训练速度提升2.6倍

学术论文

上海交大与字节跳动联合推出RhymeRL 强化学习训练速度提升2.6倍

强化学习训练中Rollout阶段效率瓶颈突出，上海交大与字节跳动联合发布RhymeRL框架，通过挖掘历史数据序列与长度分布相似性，创新HistoSpec批量验证与HistoPipe调度策略，实现端到端吞吐量2.6倍提升，且精度零损失，有效突破大模型训练效率瓶颈。

Lyra

2025-09-14

西湖大学发布AiraXiv与DeepReview：AI生成论文筛选评审前沿方案

产品速递

西湖大学发布AiraXiv与DeepReview：AI生成论文筛选评审前沿方案

AI生成论文激增致学术界“水文”筛查难题，西湖大学WestlakeNLP发布创新方案：AiraXiv预印本平台（首个AI生成论文专属渠道）与DeepReview AI审稿系统（模拟专家思考链）。二者协同实现AI论文分类管理、分钟级审稿，大幅提升筛选效率，破解传统审稿压力，引领AI时代学术评审新范式。

Lyra

2025-09-14

Meta Connect 2025前瞻：智能眼镜、Meta AI与Llama模型领衔创新看点

前沿资讯

Meta Connect 2025前瞻：智能眼镜、Meta AI与Llama模型领衔创新看点

Meta Connect 2025发布两款智能眼镜：高端带屏Hypernova（800美元，与Prada合作，探索AR技术）和大众无屏Ray-Ban Meta（300美元，主打日常使用）。Meta AI月活超10亿，但Llama 4模型开发推迟；元宇宙Horizon Worlds将引入AI NPC。展现其AR/AI/元宇宙协同布局与市场分层策略。

Lyra

2025-09-14

Project Fluently发布FluentlyQwen3-4B：引入“思考模式”的通用大模型

前沿资讯

Project Fluently发布FluentlyQwen3-4B：引入“思考模式”的通用大模型

FluentlyQwen3-4B是基于Qwen3-4B-Base微调的通用大模型，核心亮点为可切换“思考模式”，能显式展示推理步骤提升可解释性，适配数学、编码等复杂任务。上下文扩展至131K tokens，兼容SGLang/vLLM等框架，支持多量化版本低门槛部署，在教育、开发等场景表现亮眼。

Lyra

2025-09-14

学术论文

脑启发式大模型SpikingBrain发布：长序列处理提速百倍能效优化破Transformer瓶颈

中国团队研发的SpikingBrain脑启发大模型，突破LLM长上下文处理瓶颈，通过脑启发脉冲计算、线性注意力机制及动态路由MoE结构，实现百倍推理加速与97.7%能耗降低。支持4M-token超长文本分析，适配法律、医疗及边缘计算场景，依托国产MetaX硬件平台，为非Transformer架构LLM提供自主可控高效方案。

Lyra

2025-09-14

大语言模型[119]

大语言模型^[119]