OpenAI推迟开源模型发布,竞争压力加剧
OpenAI宣布无限期推迟备受期待的开源AI模型发布,理由是需要进行更多安全测试。CEO山姆·奥特曼于2025年7月12日宣布了这一决定,这也是今夏第二次推迟原计划成为OpenAI近年来首个开源权重模型的发布。与此同时,中国的月之暗面和DeepSeek等竞争对手正凭借强大的开源替代方案迎头赶上。
OpenAI宣布无限期推迟备受期待的开源AI模型发布,理由是需要进行更多安全测试。CEO山姆·奥特曼于2025年7月12日宣布了这一决定,这也是今夏第二次推迟原计划成为OpenAI近年来首个开源权重模型的发布。与此同时,中国的月之暗面和DeepSeek等竞争对手正凭借强大的开源替代方案迎头赶上。
来自芬兰和法国的欧洲研究人员展示了一项突破性技术:利用激光脉冲通过超细玻璃光纤进行人工智能计算,其速度比传统电子器件快数千倍。该系统于2025年6月发布,在图像识别等任务中可在不到万亿分之一秒内实现接近业界领先的表现。这一突破有望从根本上改变AI硬件架构,使系统速度更快、能效更高。
OpenAI 正式发布 ChatGPT Agent,这一重大升级为 AI 配备了虚拟计算机,使其能够自主完成复杂任务。该统一系统融合了网页浏览、深度研究和对话智能,实现了从头到尾处理工作流程。OpenAI 在实施截图引用、提示注入过滤等安全措施的同时,也承认该系统仍在持续完善,尚存在一定局限。
微软推出的先进 AI 基础模型 Aurora,能够比传统系统提前五天预测热带气旋路径,误差降低约 30%。在 2022-2023 年度全球气旋路径预测中,Aurora 超越了七大主要气象预测中心,展现出前所未有的精确度。Aurora 的预测结果正被全球各地纳入灾害救援规划,有望通过更可靠的提前...
欧洲研究人员展示了一种革命性的计算方法,利用激光脉冲通过超薄玻璃光纤进行AI计算,其速度比传统电子设备快数千倍。这项突破性成果由坦佩雷大学和玛丽-路易斯·巴斯德大学团队主导,利用光纤中的非线性光学效应,构建了极限学习机(ELM)架构,有望在提升AI处理速度的同时,大幅降低能耗。
OpenAI首席执行官萨姆·奥特曼(Sam Altman)既是人工智能进步的倡导者,也是其负责任发展呼吁的发声者。在捍卫OpenAI“为人类福祉创造通用人工智能(AGI)”使命的同时,他也坦言公司的策略已随时间发生变化。这种双重立场反映了AI专家内部更广泛的分歧,且在性别观点上存在显著差异——...
Google宣布扩展Gemini 2.5家族,正式发布Gemini 2.5 Flash和Pro,并预览推出2.5 Flash-Lite——这是迄今为止成本最低、速度最快的2.5版本。Flash-Lite是一款针对成本和速度优化的推理模型,默认关闭“思考”功能,为对延迟敏感且对模型智能要求较低的...
NVIDIA与多所高校合作发布了DiffusionRenderer,这是一套革命性的神经渲染系统,将逆向渲染与正向渲染统一于单一AI框架。该技术可分析普通RGB视频,预测场景的几何与材质等属性,实现无需昂贵设备的照片级CGI集成。这一突破有效消除了高预算制作与独立创作者之间的技术壁垒。
亚马逊云服务(AWS)正式推出 Kiro AI,这是一款革命性的规范驱动型智能开发环境,旨在弥合快速 AI 原型开发与生产级软件之间的鸿沟。Kiro 于 2025 年 7 月 14 日发布,通过将开发者的提示转化为详细的规范、设计文档和任务清单,再生成代码,为软件开发引入结构化流程。这一新工具...
2025 年 7 月 17 日,OpenAI 正式发布 ChatGPT Agent,这是一套统一的智能代理系统,融合了 Operator 的网页导航能力、deep research 的深度分析优势以及 ChatGPT 的对话智能。该强大工具让用户能够将竞品分析、会议准备、旅行规划等复杂任务交由...
谷歌推出了一项由AI驱动的电话拨打功能,可代表用户主动联系本地商家,获取价格和可用性等信息。这项结合了Gemini与Duplex技术的创新服务现已通过Google搜索面向美国所有用户开放,商家可选择退出。这标志着AI代理在现实世界中为用户执行任务迈出了重要一步,既能节省时间,也引发了关于AI身...
METR 的一项严格研究发现,经验丰富的开源开发者在使用如 Cursor Pro 搭配 Claude 3.5/3.7 Sonnet 等 AI 工具时,完成编码任务所需时间比不使用 AI 辅助时多出 19%。该随机对照试验涉及 16 名资深开发者,基于他们自有仓库的 246 个真实任务。令人意外...
Google于2025年7月15日正式发布了迄今为止最先进的文本生成图像AI模型——Imagen 4,并通过Gemini API和Google AI Studio向开发者开放。新一代模型在图像质量上取得了显著提升,尤其是在文本渲染方面,并推出了两种不同的模型变体以满足多样化的创意需求。该技术可...
2025 年 7 月 15 日,谷歌扩展了 Gemini 2.5 家族,正式推出了 Flash-Lite——该系列中成本效益最高、速度最快的模型。此次发布还标志着 Gemini 2.5 Flash 和 Pro 正式面向所有用户开放。Flash-Lite 专为高吞吐量任务设计,在 Gemini ...
谷歌推出了Gemini Robotics On-Device,这是一款可直接在机器人本地运行的先进AI模型,无需依赖互联网连接。这一突破性技术让机器人能够在有限或无网络环境下,以更高的自主性、更快的响应速度和更强的功能性完成复杂任务。基于今年3月发布的Gemini Robotics平台,全新端...
Google 正式发布了 Gemini CLI,这是一款开源 AI 智能体,将 Gemini 2.5 Pro 的强大能力直接引入开发者终端。作为一款轻量级工具,Gemini CLI 通过熟悉的命令行界面,提供代码辅助、问题解决和任务管理等功能。开发者只需个人 Google 账号即可免费使用,这...
Google 大幅增强了 Gemini Live 的应用集成功能,将其从对话式 AI 升级为面向行动的助手。用户现可在 Gemini Live 对话中无缝操作 Google 地图、日历、任务和 Keep。该功能自 2025 年 6 月下旬开始推送,正持续扩展,Google 承诺未来数月将带来更...
中国初创公司月之暗面(Moonshot AI)发布了Kimi K2,这是一款拥有1万亿参数的开源大语言模型,在关键基准测试中超越了GPT-4和Claude。该模型在编程、数学推理和自主智能等方面表现出色,代表着推动先进AI技术普及的战略举措。凭借创新的MoE架构和MuonClip优化器,Kim...
OpenTools.ai 正式发布了其全面的每日 AI 新闻聚合服务,为用户提供来自权威来源的人工智能、机器学习及新兴技术的精选动态。该平台旨在满足专业人士在快速变化的 AI 领域中保持信息同步的需求,因为每日的技术进展可能对企业战略和技术采纳产生重大影响。这项服务的推出,使其成为 2025 ...
YouTube已将Google DeepMind的Veo 2模型集成到Shorts平台,使创作者能够通过简单的文本提示生成视频片段。这一强大的新功能允许用户创作独立的视频内容,或用AI生成的视觉效果增强现有Shorts。该技术采用SynthID水印,明确标识AI生成内容,目前已在部分国家上线,...