谷歌推出AI模式语音对话搜索功能
谷歌为其AI模式搜索功能推出了全新的语音对话能力,使用户能够进行自然流畅的语音交互。该功能名为“Search Live”,由定制版Gemini模型驱动,具备先进的语音处理能力,目前面向参与AI模式实验的美国用户开放。这一升级基于谷歌在I/O 2025大会上公布的AI战略,标志着人机交互向更直观...
谷歌为其AI模式搜索功能推出了全新的语音对话能力,使用户能够进行自然流畅的语音交互。该功能名为“Search Live”,由定制版Gemini模型驱动,具备先进的语音处理能力,目前面向参与AI模式实验的美国用户开放。这一升级基于谷歌在I/O 2025大会上公布的AI战略,标志着人机交互向更直观...
谷歌正式向开发者(通过 Google AI Studio)和企业用户(通过 Vertex AI)发布了 Gemini 2.5 Pro,预计将于 2025 年 6 月 19 日全面开放。该模型目前在 WebDev Arena 和 LMArena 榜单均居首位,展现出卓越的编程与推理能力。谷歌还推...
据Research and Markets最新报告显示,全球媒体与娱乐领域的生成式AI市场正迎来爆发式增长,预计到2034年市场规模将从2024年的19.7亿美元增长至207亿美元,年复合增长率约为26%。当前,文本生成图像以超过30%的市场份额占据主导地位,而虚拟现实应用预计将在2029年前...
根据2025年6月18日发布的一份最新报告,全球数字营销领域的生成式AI市场预计将从2024年的24.8亿美元增长至2034年的351.2亿美元。这一惊人的年均增长率达到30%,主要受个性化需求增加、成本效益营销方案以及视频内容日益突出的推动。目前市场格局分散,前十大企业仅占据15.2%的市场...
2025年6月18日成为人工智能在多个科技领域取得重大进展的重要时刻,物联网、营销科技与边缘计算领域均有重磅消息发布。包括亚马逊和谷歌在内的科技巨头正推动对州级AI监管实施10年冻结,引发业界及共和党内部的分歧。与此同时,数字营销领域的生成式AI市场预计将从2024年的24.8亿美元增长至20...
美国总统特朗普宣布启动“星门计划”,这是一项由私营部门主导、总投资高达5000亿美元的里程碑式AI基础设施建设项目。该计划由OpenAI、甲骨文(Oracle)和软银(SoftBank)牵头,首期投资1000亿美元,旨在全美范围内建设大型数据中心,首批设施已在德克萨斯州动工。该项目预计将创造超...
谷歌推出了SynthID Detector验证门户,可识别带有SynthID技术水印的内容。在2025年Google I/O大会上宣布,该工具能够检测由谷歌AI模型生成的图片、文本、音频和视频。目前已有超过100亿条内容被水印标记,谷歌将通过候补名单系统,率先向记者、媒体专业人士和研究人员开放...
OpenAI 发布了 o3-mini,这是其推理模型家族的最新成员,旨在提升 AI 在技术领域的能力,同时保持高效。该模型在 STEM 领域(尤其是编程、数学和科学)表现卓越,提供三档可调节推理力度,以平衡准确性与速度。o3-mini 现已通过 ChatGPT 和 API 向用户开放,体现了 ...
OpenAI 正式发布了 Operator,这是一款先进的 AI 助手,能够自主完成包括订购杂货和购买门票在内的多种在线任务。Operator 首先面向美国的 ChatGPT Pro 订阅用户开放,利用自有浏览器自动浏览网站、点击按钮并填写表单,几乎无需人工干预。该系统注重用户安全,配备敏感信...
谷歌正式推出了Veo 3,这是迄今为止其最先进的AI视频生成模型,能够生成高质量1080p视频并集成音频功能。该模型在运动追踪、物理模拟和精确编辑控制方面实现了重大突破。作为OpenAI Sora的直接竞争对手,Veo 3加剧了AI视频生成市场的激烈竞争。
在 WWDC 2025 上,苹果发布了 OS 26,这是一项重大更新,在全新统一命名体系下为所有设备带来了更强大的 AI 功能。此次更新引入了全新设计的“液态玻璃”界面,以及诸如屏幕内容视觉智能、通话与消息实时翻译、未知来电筛查等 AI 驱动特性。OS 26 将于今秋正式推送,标志着苹果十余年...
AI News及其姊妹媒体近日发布了最新动态,强调人工智能与多个科技领域加速融合。报道指出,以Google DeepMind为代表的企业正引领通用人工智能(AGI)研发,推动云计算、数据中心、量子计算与安全基础设施的变革。业内专家预测,具备人类水平的通用人工智能有望在未来五年内出现,这将从根本...
OpenAI 正式发布 o3-mini,这是其推理模型系列的最新成员,旨在提升 AI 问题解决能力的同时保持成本效益。该模型在 STEM 领域(尤其是科学、数学和编程)表现出色,相较前代产品重大错误减少 39%,响应速度提升 24%。o3-mini 通过 ChatGPT 和 API 均可访问,...
OpenTools.AI 正式上线了一个全面的人工智能新闻平台,提供来自科技领域的每日精选动态。该服务汇集了来自权威渠道的最新 AI、机器学习及新兴技术进展,帮助用户把握瞬息万变的行业趋势。平台由 AI 工具研究员 Mackenzie Ferguson 编辑,旨在通过精心挑选的内容,助力用户“...
Meta正式推出基于其Movie Gen技术的强大AI视频编辑工具,目前已在Meta AI应用、Meta.AI网站以及Edits应用等多个平台上线。该工具内置50多种预设选项,用户只需轻点几下即可更换视频背景、风格、服装和灯光效果。该技术将在未来几个月扩展至Instagram,标志着好莱坞级视...
谷歌发布了 Gemini 的全新功能——代理模式(Agent Mode),用户只需描述最终目标,AI 即可自主完成复杂任务。这一实验性功能利用了 Project Mariner 的计算机使用技术,并正集成到 Gemini API 和 Vertex AI,供开发者使用。Automation An...
Google 正在扩展其旗舰 AI 模型 Gemini 2.5 Pro,使其具备“世界模型”功能,能够像人类认知一样理解、模拟并规划现实环境。这一进步基于 Gemini 已有的推理能力,包括全新的 Deep Think(深度思考)功能,使模型在作答前能够权衡多种假设。这一演变标志着 AI 系统...
英国政府正式推出Extract,一款能够在数秒内扫描数百份规划文件的AI助手,大幅提升了以往因审批流程缓慢而饱受诟病的规划许可效率。这一突破性技术将极大释放规划官员的工作时间,使其专注于决策,加快住房建设进程。该工具的推广有助于实现政府“变革计划”中的关键目标——在下届议会期间新建150万套住...
东京理科大学的研究人员开发出了一种突破性的自供能人工突触,能够以接近人类的精度区分颜色。该器件集成了染料敏化太阳能电池,自主发电,并能在可见光谱范围内以10纳米分辨率识别颜色。这项创新解决了计算机视觉领域的两大难题:实现高精度色彩检测,以及大幅降低边缘计算应用的能耗。
Google 在 Canvas 中推出了全新的强大 Create 菜单,用户可将文本转换为互动信息图、网页、测验以及播客风格的音频概览,支持 45 种语言。这一重大升级基于 NotebookLM 的成功,后者已获得数百万用户的积极反馈。新功能,尤其是音频概览,使内容互动更加多样,包括离线收听和...