Moonvalley 推出物理驱动 AI,将草图变为电影级现实
Moonvalley 正式发布了 Marey,一款创新型 AI 模型,可将草图和文本提示转化为物理精确的 1080p、24 帧/秒视频。该技术完全基于授权内容训练,为电影制作人和设计师在保持真实物理效果的同时,提供了前所未有的物体运动、镜头角度和场景构图控制。这一具备商业安全性的工具有望弥合创...
Moonvalley 正式发布了 Marey,一款创新型 AI 模型,可将草图和文本提示转化为物理精确的 1080p、24 帧/秒视频。该技术完全基于授权内容训练,为电影制作人和设计师在保持真实物理效果的同时,提供了前所未有的物体运动、镜头角度和场景构图控制。这一具备商业安全性的工具有望弥合创...
Meta推出了独立的Meta AI应用程序,采用先进的Llama 4模型,带来前所未有的个性化和自然语音交互体验。全新的虚拟助手配备全双工语音技术,实现流畅、实时的对话,无需尴尬停顿。凭借对Meta生态系统的深度整合及学习用户偏好的能力,Meta AI力争在2025年底成为全球使用最广泛的AI助手。
谷歌对其 Imagen 4 Ultra 模型进行了重大升级,目前该模型在 Artificial Analysis 备受推崇的图像生成排行榜中位列第三,仅次于 OpenAI 的 GPT-4o 和字节跳动的 Seedream 3.0。升级后的文本生成图像模型在照片级真实感、细节渲染和字体排版方面表...
微软CEO萨提亚·纳德拉宣布,GitHub Copilot的累计用户数已突破2000万,仅在过去三个月内就新增了500万用户。这款AI编程助手如今已被90%的《财富》百强企业采用,企业级用户数量较上季度增长了75%。研究显示,Copilot可将开发者生产力提升高达55%,同时显著改善工作满意度。
埃隆·马斯克的xAI公司正通过两项重要的Beta版新产品,拓展其AI服务版图:一是“Imagine”,一款可生成带同步音频的视频的文本转视频工具;二是“Valentine”,一位受虚构浪漫角色启发、具备情感智能的AI伴侣。这些产品标志着xAI从文本AI向创意与情感交互工具的战略扩展,旨在激烈竞...
总部位于新加坡的AI平台Manus推出了“广域研究”(Wide Research)功能,能够同时部署100多个AI代理并行处理复杂数据任务。与竞争对手传统的“深度研究”工具采用串行处理不同,Manus的方案通过多个通用型代理并行分工,大幅缩短研究时间,同时保证分析的全面性。该功能目前面向Pro...
IBM研究显示,自治AI智能体有望成为2025年最具影响力的技术创新,99%的企业AI开发者正在积极探索或开发智能体技术。这些智能系统将简化工作流程、推动流程优化,并实时处理日常任务,有望释放人类从事更具创造性的工作。尽管在应用过程中仍面临挑战,但企业越来越将AI智能体视为实现可衡量投资回报的...
埃隆·马斯克的xAI公司正通过两项重要新功能扩展其Grok生态系统:AI驱动的视频生成器“Imagine”和具备情感响应能力的AI陪伴者“Valentine”。这两款工具将首先以测试版形式向Grok Heavy订阅用户开放,其中Imagine可通过xAI自研的Aurora引擎根据文本提示生成视...
据多份行业报告显示,全球AI语音助手市场正经历爆发式增长,预计到2033年市场规模将达到1380亿美元,年复合增长率为15-28%。这一扩张得益于自然语言处理技术的进步、医疗、汽车及企业等领域的广泛应用,以及消费者对免手操作技术的偏好日益增强。亚马逊、谷歌和苹果等主要厂商持续主导市场,并在情感...
由 Robinhood CEO Vlad Tenev 联合创办的 Harmonic 公司推出了 Aristotle,这是一款承诺实现无幻觉数学推理的 AI 聊天机器人应用。该模型在 2025 年国际数学奥林匹克竞赛中取得金牌表现,采用 Lean 编程语言对答案进行形式化验证。Harmonic ...
Google在其搜索AI模式中引入了由迄今为止最智能的Gemini 2.5模型驱动的新教育功能。这些功能专为学习者、教育者及好奇心强的用户设计,通过高级推理和多模态能力,帮助用户探索复杂主题。此次更新包括PDF上传支持、互动学习工具以及更深入的研究能力,彻底改变了用户与教育内容的互动方式。
Yelp 正在测试创新的 AI 拼接视频功能,能够自动将用户上传的照片、视频及商家信息整合为生动的本地餐厅视觉预览。这些动态视频不仅展示用餐体验,还突出热门菜品,为用户带来比静态图片更具沉浸感的预览。该功能体现了 Yelp 通过 AI 创新不断提升本地商家发现与连接的持续努力。
Google于2025年7月29日正式向部分Workspace客户开放其先进的Veo 3 AI视频生成模型,此前该技术已于5月的Google I/O大会首次亮相。Veo 3能够生成高质量、音画同步的视频,包括对话和环境音效。此次功能首先在“快速发布”域上线,“计划发布”域将于8月陆续开放。Wo...
总部位于悉尼的Archistar公司正式与洛杉矶当局合作,推出其AI驱动的eCheck平台,加速1月毁灭性野火后的重建进程。这项技术可自动验证建筑设计是否符合当地规范,成为加州首次在灾后恢复中大规模部署人工智能。此举紧随Archistar与国际建筑规范协会(ICC)达成战略合作,将该平台定位为...
总部位于洛杉矶的 Steadfast Robotics 正在通过人工智能驱动的机器人和软件,彻底改变南加州野火灾后重建流程,将工地准备时间缩短了60%。该公司由工程师 Elena Vasquez 于2023年创立,结合自主机器设备与合规软件,并与澳大利亚公司 Archistar 合作,将 eC...
Adobe 正式发布了 Harmonize,这是一项由 Firefly 驱动的开创性 AI 功能,可在 Photoshop 中自动调整色彩、光线、阴影和视觉基调,仅需几次点击即可实现无缝照片合成。该功能最早以 Project Perfect Blend 之名在 2024 年 Adobe MAX...
OpenTools.AI于2025年7月27日发布了其每日AI新闻简报,为专业人士和爱好者提供了一份关于人工智能及新兴技术最新进展的精选合集。该简报重点关注了基因组研究中关于病毒DNA序列的最新突破,以及The Browser Company和Perplexity推出的AI驱动浏览器创新。这份...
据多方可靠消息,包括AI Unraveled播客和OpenAI首席执行官Sam Altman的最新表态,OpenAI正计划于2025年8月发布GPT-5。这一代模型将整合OpenAI多项AI技术,将传统语言处理与高级推理能力相结合。此次发布是OpenAI路线图上的重要里程碑,继GPT-4.5和...
微软于2025年7月28日为其Edge浏览器推出了Copilot模式,将传统的浏览体验转变为AI辅助之旅。这一实验性功能将搜索、聊天和导航整合为统一界面,能够理解用户在多标签页下的研究背景,并预测其下一步操作。目前,拥有Copilot访问权限的Windows和Mac用户可免费体验该功能,使微软...
Google推出了Opal,这是一款全新的实验性工具,让用户无需编写任何代码即可创建由AI驱动的迷你应用。Opal于2025年7月24日作为美国地区公测版在Google Labs上线,用户只需用自然语言描述需求,即可生成功能性应用。该平台会将描述转化为可视化工作流,串联提示词、AI模型和工具,...