AI[128]

拍我AI限时免费开放,零门槛体验AI视频创作轻量化新纪元

9月5日-10日,国内AI视频生成平台“拍我AI”(PixVerse中国版)启动免费开放日活动,用户可零门槛体验AI视频创作新纪元。作为首批集成谷歌Gemini 2.5 Flash Image(Nano Banana)技术的平台,其凭借低延迟特性,30秒短片数秒生成,支持文生视频(3秒)与图生视频(30秒),搭配Agent助手自动生成脚本、音效字幕,简化“上传-生成-微调”流程。模板覆盖宠物短剧、3D手办动画等多元场景,全球用户已破亿,所有视频自动添加“AI生成”水印保障合规。即刻参与,零门槛体验谷歌技术加持的轻量化创作,让灵感秒变动态画面!

微软亚洲研究院DELT范式:优化数据顺序,让大模型效能跃升无需扩容参数

大模型训练正从“参数竞赛”转向“数据效能”优化,微软亚洲研究院提出的DELT范式指出,数据顺序是决定模型性能的关键。DELT通过“评分-选择-排序”动态机制,让数据适配模型学习节奏,核心依托LQS评分(量化数据静态质量与动态适配性)和折叠排序(优化训练顺序)两大技术。实验显示,7B模型用80%数据即可达传统全量数据训练的SOTA性能,训练时间缩短23%;在金融风控、医疗诊断等领域,召回率提升4%、罕见病识别准确率提高6.7%。该范式推动AI从参数依赖转向数据智能编排,为大模型高效训练提供新路径。

OpenAI开放ChatGPT对话分支功能:一键解决多思路探索难题

ChatGPT于2024年7月推出“对话分支”功能,打破单线程对话局限,支持用户在任意对话节点创建独立分支,实现主线与多探索路径并行。该功能通过轻量化触发(消息右侧↗️图标)、结构化管理(分支命名、跨设备同步)及上下文共享,大幅提升多思路探索效率:较传统方式,代码调试步骤减少60%,多版本回答管理成本降低80%。核心应用覆盖学术(多理论框架并行验证)、开发(多方案实时调试)、创作(剧情平行推演)等场景,技术底层采用类似Git的“对话树”模型,避免上下文污染。目前移动端仅支持查看,分支功能正推动AI从工具向“思维协作伙伴”进化,竞品如Google Gemini、Anthropic Claude已跟进相关研发。

纽约州立大学石溪分校等团队开发PosterGen:AI多智能体自动化生成专业学术海报

学术海报制作常让非设计背景研究者面临耗时费力的困境,现有工具难兼顾自动化与设计质量。PosterGen作为多智能体AI工具,由纽约州立大学等团队开发,可直接将论文PDF转为专业可编辑海报。其核心通过模拟设计师流程,实现内容解析、叙事重构、空间布局及色彩版式优化,无需手动输入,单张制作时间从10小时缩短至2小时,支持PPTX二次修改。开放代码与项目主页结合设计原则编码,首次实现“全自动+专业级”平衡,被《Nature》评价为重新定义学术海报生产标准,助力研究者从排版中解放,聚焦内容打磨与学术交流。

OSWorld Verified:构建可复现CUA评测基准,破解SOTA声明乱象

计算机使用代理(CUA)作为AI驱动生产力变革的核心力量,正通过GUI操作、CLI执行及跨应用协作赋能办公自动化等场景。然而,行业长期受困于SOTA声明不可复现、评测环境差异大、数据泄露等问题,导致研究低效与信任危机。为此,AI评估机构推出OSWorld Verified公开排行榜,构建首个统一、可复现的CUA评测基准。该平台通过标准化硬件/操作系统环境、固定公开数据集及多维评分指标,解决结果不可比难题,已对GPT-4o、Claude 3等模型完成基准测试。其“四步闭环验证”机制与防作弊设计,正推动CUA行业从“自说自话”迈向透明化,为技术落地提供可信赖的能力参考,助力构建开放信任的AI生产力生态。

2025外滩大会:沪蚂蚁集团主办 全球科技领袖共探重塑创新增长

2025 Inclusion·外滩大会将于9月10-13日在上海黄浦世博园区举办,以“重塑创新增长”为主题,汇聚16位院士、图灵奖得主及550余位全球科技领袖。大会设40余场论坛,聚焦AI、具身智能、芯片等前沿领域,主论坛将探讨大模型进化、智能体应用,王坚院士现场发布接入20万物联网设备的“城市神经计算平台”。5000平米“机器人小镇”展示100余款具身智能机器人,呈现优必选、傅利叶等企业硬件突破及行业三层产业链架构,中国占全球具身智能融资38%。新加坡、香港、上海三地联动推进金融科技协同,共建监管合规数据共享链。万平米科技展设概念-转化-应用三层体验,8000支战队角逐AI赛事,8家顶级创投现场对接。AI创作主题曲《Hello Future》等科技人文融合项目同步亮相,打造思想碰撞、技术展示与产业对接的科技嘉年华。

苹果弃购Perplexity押注自研WKA引擎:2026年推AI大脑重塑Siri智能问答

苹果近期调整AI战略,放弃收购AI搜索公司Perplexity,转而全力推进自研AI搜索引擎项目WKA(World Knowledge Answers),计划2026年春季推出。WKA将作为Siri的“AI大脑”,助力其从“语音指令执行者”升级为“智能问答助手”,具备全网信息抓取、AI摘要生成及上下文理解能力,并逐步渗透至Safari浏览器、Spotlight搜索等核心场景。消息公布后,苹果股价逆势上涨3.8%,一方面因市场对其加速AI布局的信心提振,另一方面得益于谷歌确认继续支付默认搜索引擎费用(年贡献约200亿美元)。不过,WKA项目面临人才流失挑战,已有10名核心AI研究员离职。未来,苹果将凭借生态整合与隐私保护优势,与谷歌Gemini、微软Bing AI等角逐2026年AI搜索战场。

物流科技老兵创Augment,AI助手Augie获8500万美元A轮融资

物流科技创业者Harish Abbott(曾创立Deliverr并以21亿美元售予Shopify)再推新公司Augment,专注AI驱动物流自动化。公司近期完成Redpoint领投的8500万美元A轮融资(距2500万美元种子轮仅五个月),凸显资本市场对AI物流潜力的看好。核心产品AI助手Augie定位“物流人的AI同事”,可自动化报价管理、包裹追踪、货物构建等七大流程,覆盖邮件、Slack、短信等多沟通渠道,助力客户如Armstrong Transport Group降低40%发票延迟率,种子轮后客户数翻倍。依托Deliverr技术积累(曾年入超10亿、服务5000+品牌),Augment在AI物流自动化赛道(竞争涵盖Vooma等)以效率提升为核心,推动行业从繁琐事务中解放,迈向智能化高效运营新阶段。

波士顿动力Atlas再进化:单一AI模型实现机器人手脚协同

波士顿动力Atlas人形机器人实现关键技术突破,首次通过单一AI模型同时控制行走与抓取动作,实现“手脚协同”全局决策,动态环境适应性大幅提升,树立通用型机器人算法新标杆。其核心技术采用分层强化学习架构,底层处理传感器数据生成基础动作指令,高层动态调整任务优先级;创新引入动作干扰消除算法,抓取时自动补偿重心偏移,平衡控制误差降低72%;经30万组跌倒案例仿真训练,具备“小步滑移”等自主防摔策略,动作流畅度接近人类水平。相比特斯拉Optimus模块化模型、日本JAXA地形专用模型,Atlas跨场景通用控制优势显著,未来可广泛应用于高危作业、灾后救援等领域,推动机器人技术从“专用”向“通用”演进。

Coinbase AI代码生成占比达40% 目标十月突破50%

Coinbase作为加密货币交易所,其AI生成代码占比达40%,计划2024年10月提升至50%以上,显著领先金融科技行业35%的平均水平(GitHub数据)。AI代码在重复性功能模块生成速度较人工快55%,错误率降低18%,有效应对金融科技高频迭代与合规安全需求。所有AI代码需通过“三重过滤网”审查(静态分析工具初筛、动态测试模拟、人工逻辑校验),确保安全底线。金融科技因系统稳定性与监管审查双重压力领跑AI编程,未来工程师角色将从“代码生产者”转向“系统架构师”与“安全守门人”,平衡效率提升与技术债务风险。