谷歌发布Beam:革命性3D视频通信平台
谷歌正式将Project Starline升级为Google Beam,这是一款由AI驱动的3D视频通信平台,无需专用头显或眼镜即可实现逼真的面对面交流。该技术通过先进的AI体积视频模型,将普通2D视频流转换为沉浸式3D体验,保留自然的眼神交流和细微表情。谷歌已与惠普(HP)合作,计划于今年晚...
谷歌正式将Project Starline升级为Google Beam,这是一款由AI驱动的3D视频通信平台,无需专用头显或眼镜即可实现逼真的面对面交流。该技术通过先进的AI体积视频模型,将普通2D视频流转换为沉浸式3D体验,保留自然的眼神交流和细微表情。谷歌已与惠普(HP)合作,计划于今年晚...
Anthropic 于 2025 年 5 月 22 日发布了迄今为止最强大的 AI 模型 Claude Opus 4 和 Claude Sonnet 4。这两款混合推理模型在编程、任务执行和高级记忆功能方面实现了突破性进展。此次发布进一步巩固了 Anthropic 在与 OpenAI 和 Go...
Google正式在美国所有用户中推出AI模式,无需Labs报名即可广泛使用其先进的搜索能力。本次全国部署引入了用于深度研究的Deep Search功能,并集成了Project Astra的实时能力,让用户能够通过摄像头与所见内容实时互动。这一重大扩展标志着Google AI战略和主流应用的重要...
Google 推出了 Google Meet 的实时语音翻译功能,能够保留说话者的声音、语调和情感表达。这项由 Google DeepMind 的 AudioLM 技术驱动的创新功能,实现了极低延迟的自然多语种对话。该功能现已以测试版形式向 Google AI Pro 和 Ultra 订阅用户...
Google正将Project Mariner的计算机使用能力集成到Gemini API和Vertex AI中,使AI能够直接与计算机系统交互并进行控制。这一进展让AI能够自主完成复杂的网页任务,Automation Anywhere、UiPath和Browserbase等公司已在探索其潜力。...
Google已将Project Astra的先进视觉理解能力集成到Gemini Live中,使AI助手能够通过用户的智能手机摄像头和屏幕“看见”并解读世界。这一重大升级于2025年Google I/O大会上宣布,使Gemini能够在对话过程中通过分析视觉信息提供实时帮助。此前仅限付费用户使用的...
在Google I/O 2025大会上,谷歌展示了其在人工智能领域的重大进展。Gemini 2.5 Pro现已在LMArena排行榜所有类别中领先。公司还推出了Deep Think——一项用于复杂数学与编程任务的实验性增强推理模式。此外,谷歌发布了第七代TPU Ironwood,每个Pod可提...
Google正式将Project Starline升级为Google Beam,这是一款由AI驱动的3D视频通信平台,无需专用头显即可实现极为逼真的虚拟临场感。该技术通过六摄像头阵列和AI体积视频模型,将参会者以毫米级精度、60帧/秒的头部追踪渲染在3D光场显示屏上。Google与惠普(HP)...
谷歌发布了Deep Think(深度思考)实验性增强推理模式,专为Gemini 2.5 Pro设计,以应对高度复杂的数学和编程挑战。这一新功能使模型能够在回答前并行考虑多种假设,显著提升了其在高级基准测试中的表现。此外,谷歌还加强了Gemini的安全防护,抵御间接提示注入攻击,使2.5系列成为...
Anthropic 推出了 Claude 4 系列,旗舰机型 Opus 4 和 Sonnet 4 在提升 AI 能力的同时,强化了安全措施。这两款混合模型在编程和推理等复杂任务上表现卓越,其中 Claude Opus 4 首次触发了 Anthropic 的 AI 安全等级 3 协议。此次发布正...
OpenAI 正式发布了 o3-mini,这是其“o”系列中最新、最具性价比的推理模型,旨在在保持较低计算成本的同时,提供更强的推理能力。该模型在 STEM 领域表现尤为突出,在编程、数学和科学推理方面相较前代有显著提升。o3-mini 现已通过 ChatGPT 及 API 向用户开放,标志着...
谷歌已在 Gemini 应用中向所有用户开放 Gemini 2.5 Flash,并计划于 6 月初在 Google AI Studio 和 Vertex AI 上全面发布,随后不久将推出 Gemini 2.5 Pro。新版模型在推理能力、多模态处理和代码生成方面实现了重大提升,同时令 toke...
谷歌正式推出Google AI Ultra高端订阅服务,月费高达250美元,面向追求前沿AI能力的专业人士和高阶用户。该服务于2025年Google I/O大会上发布,提供对Gemini 2.5 Pro(含DeepThink模式)等谷歌最先进AI模型的访问权限,并包含Project Marin...
谷歌正式预览发布了 Gemini 2.5 Flash,为其高效、低成本的 AI 模型带来了重大升级。新版本引入了混合推理能力,使开发者能够灵活控制模型的思考过程,同时保持速度与效率。目前,Gemini 2.5 Flash 已在 Google AI Studio、Vertex AI 及 Gemi...
据彭博社记者Mark Gurman报道,苹果将在6月9日的WWDC大会上宣布,计划向第三方开发者开放其Apple Intelligence AI模型。公司正在开发一套软件开发工具包(SDK)和相关框架,初期将允许开发者访问较小的本地AI模型。这一战略举措旨在激活苹果AI生态系统,此前Apple...
Anthropic正式推出Claude 4 Opus和Sonnet 4,树立了AI编程与推理能力的新标杆。两款混合模型于2025年5月22日发布,具备扩展思考与工具调用、增强记忆系统以及前所未有的自主运行能力——Opus 4可连续自主工作长达七小时。两款模型在保持原有定价的基础上,在编程、推理...
OpenAI已于2025年5月20日将其强大的Codex AI编程代理集成至ChatGPT iOS应用,为移动用户带来先进的本地软件工程能力。该工具由codex-1驱动,这是OpenAI专为编程任务优化的o3推理模型版本,能够生成更简洁的代码,并比以往更精准地遵循指令。这一移动端扩展体现了Op...
在2025年台湾台北国际电脑展(Computex 2025)上,英伟达CEO黄仁勋发布了NVLink Fusion,这是一项突破性的计划,允许客户和合作伙伴将非英伟达处理器与英伟达GPU协同使用。这标志着英伟达从以往封闭策略向开放生态的重大转变。此前,NVLink——英伟达的高速芯片互连技术—...
继在 Google I/O 2025 上宣布后,谷歌已正式开始向美国所有用户推出搜索中的 AI 模式。该功能由定制版 Gemini 2.5 驱动,为搜索带来先进的推理能力和对话式追问。其采用“查询扇出”技术,将问题拆分为子主题并同时发起多次搜索,使用户能够更深入地探索网络内容。
Anthropic 推出了迄今为止最先进的 AI 模型——Claude Opus 4 和 Claude Sonnet 4,在编码、推理和自主工作方面树立了新标准。Claude Opus 4 展现出前所未有的持久力,能够在复杂任务中自主工作近七小时,几乎接近完整的工作日。这两款模型具备混合推理能...