前沿资讯 [137]

快速了解AI领域发生的前沿事件

Project Fluently发布FluentlyQwen3-4B:引入“思考模式”的通用大模型

FluentlyQwen3-4B是基于Qwen3-4B-Base微调的通用大模型,核心亮点为可切换“思考模式”,能显式展示推理步骤提升可解释性,适配数学、编码等复杂任务。上下文扩展至131K tokens,兼容SGLang/vLLM等框架,支持多量化版本低门槛部署,在教育、开发等场景表现亮眼。
Lyra Lyra
2025-09-14

OpenAI深化美英合作升级AI安全标准 联合红队测试聚焦代理系统与生物安全

OpenAI与美英机构深化AI安全合作,联合CAISI、AISI推动治理升级。CAISI发现ChatGPT Agent提示词注入漏洞,48小时完成模型与监控双重修复;UK AISI开展生物安全测试,构建长期防护机制。此次合作标志AI安全从企业自查迈向政企协同,为行业提供可复用测试方法论。
Lyra Lyra
2025-09-14

OpenAI发布“Grove”计划:为AI早期创业者打造创新孵化新生态

OpenAI推出Grove计划,聚焦AI创业“预想法”阶段,面向有技术背景但想法萌芽的探索者,无明确方向也可申请。该计划填补从技术到创业的从0到1空白,提供前沿模型试用、导师1对1指导、算力支持及生态资源,助力提炼可行方向,与巨头同类项目形成差异化竞争,为AI技术人才创业启动赋能。
Lyra Lyra
2025-09-13

腾讯优图开源Youtu-GraphRAG:图检索增强技术实现成本与效果双突破

GraphRAG是大模型处理复杂领域知识的核心技术,却面临成本高、推理弱、适配难痛点。腾讯优图开源Youtu-GraphRAG框架,通过Schema引导等三大技术创新,实现知识图谱构建成本降30%+、复杂推理准确率升16%+,跨领域适配成本降60%+,支持医疗多跳推理、企业知识库管理等场景,已开源助力多行业落地。
Lyra Lyra
2025-09-13

Google发布VaultGemma:10亿参数开源差分隐私大模型开启AI隐私保护新纪元

2025年9月,Google发布全球首个10亿参数开源差分隐私大模型VaultGemma,通过“DP缩放定律”突破隐私-性能权衡难题,开放完整权重(Hugging Face/Kaggle可下载),为医疗、金融等隐私敏感场景提供实用技术范式,重新定义隐私保护大模型标准。
Lyra Lyra
2025-09-13

Transformer发明者Vaswani:闭源AI阻碍创新,Essential AI力推西方版DeepSeek

Transformer之父Ashish Vaswani带领Essential AI从商业项目转向开源基础AI研究,破解行业闭源困境。对标中国DeepSeek,以MoE架构推动“高性能+低成本”模型研发,通过“交叉补贴”模式保障开源可持续,助力AI从技术垄断走向科学共享,加速实现AI普惠。
Lyra Lyra
2025-09-13

百度ERNIE-4.5-21B-A3B-Thinking登顶HuggingFace文本模型趋势榜

百度ERNIE-4.5-21B-A3B-Thinking登顶HuggingFace全球文本模型趋势榜,总榜位列第三,中国AI技术再获国际认可。该模型采用MoE架构与稀疏激活设计,210亿总参数仅激活30亿,实现轻量高性能。支持128K长上下文(约25万字)及高效工具调用,开源降低应用门槛,推动金融、医疗等复杂场景落地。
Lyra Lyra
2025-09-12

蚂蚁集团与人大联合发布业界首个原生MoE架构扩散语言模型LLaDA-MoE 即将开源

蚂蚁集团与人大联合研发业界首个原生MoE架构dLLM——LLaDA-MoE。该模型基于20TB数据训练,性能比肩主流自回归模型,推理速度有数倍优势,即将完全开源。其融合动态路由与扩散机制,在代码生成、数学推理等任务表现突出,为AI领域提供新研究方向与高效解决方案。
Lyra Lyra
2025-09-12

NVIDIA发布SATLUTION:LLM自主进化SAT求解器

布尔可满足性问题(SAT)作为NP完全问题,是芯片验证、漏洞检测等领域的技术基石。传统SAT求解器依赖专家手工优化,面临代码复杂、迭代低效瓶颈。NVIDIA推出SATLUTION框架,以LLM驱动完整代码库进化,通过AI自主迭代与分布式验证,在国际竞赛中超越人类冠军方案,多场景性能领先,开启AI重塑复杂系统开发新范式。
Lyra Lyra
2025-09-12

全球最快开源大模型K2 Think推出:推理速度突破2000 tokens/秒,刷新性能纪录

K2 Think开源大模型发布,推理速度突破2000 tokens/秒(最高2730.4),成已知最快开源大模型之一。基于通义千问Qwen 2.5-32B架构,数学推理表现优异(AIME’24得分90.83),依托六大技术创新支撑高速与精准。基于通义千问架构,已在HuggingFace等开源平台发布,助力AI技术普及。
Lyra Lyra
2025-09-11