日本科学家打造自供能AI视觉系统,模拟人类视觉能力
东京理科大学的研究人员开发出了一种突破性的自供能人工突触,能够以接近人类的精度在可见光谱范围内区分颜色。该设备集成了染料敏化太阳能电池,能够自发产生电力,并无需额外电路即可执行复杂的逻辑运算。这项创新解决了机器视觉系统在部署于边缘设备时通常面临的高计算资源和能耗难题。
东京理科大学的研究人员开发出了一种突破性的自供能人工突触,能够以接近人类的精度在可见光谱范围内区分颜色。该设备集成了染料敏化太阳能电池,能够自发产生电力,并无需额外电路即可执行复杂的逻辑运算。这项创新解决了机器视觉系统在部署于边缘设备时通常面临的高计算资源和能耗难题。
在I/O 2025大会上,谷歌宣布其产品与API的月度Token处理量已从去年的9.7万亿激增至480万亿,增长了50倍。Gemini应用月活跃用户突破4亿,开发者数量五倍增长至700万。这一爆发式扩张标志着谷歌所称的AI平台转型进入新阶段,数十年研究成果正转化为全球用户的实际体验。
谷歌目前每月在其产品和API中处理高达480万亿个AI令牌,较去年同期的9.7万亿增长了50倍。Gemini应用的月活跃用户已达4亿,开发者数量也增长五倍,达到700万。这一惊人的增长标志着AI应用进入了新阶段,数十年的研究正逐步转化为全球用户的实际体验。
香港大学的研究人员开发出一项突破性无人机技术,使无人机能够以高达每小时45英里的速度,在复杂环境中自主导航,模仿鸟类的自然敏捷性。SUPER系统于2025年6月7日发布,利用先进的3D激光雷达传感器和双轨迹规划技术,无需预先绘制路线或GPS即可导航。同时,节能的类脑计算突破有望将AI无人机的续...
在2025年6月9日的WWDC大会上,苹果宣布将其30亿参数的端侧基础模型向第三方开发者开放。这一重要里程碑将允许开发者把苹果AI能力——目前已应用于文本摘要和自动纠错等功能——直接集成到自家应用中。虽然这些模型的算力不及竞争对手的云端方案,但此举进一步扩展了苹果在注重隐私的框架下的AI生态系统。
谷歌正式发布 SynthID Detector 验证门户,可识别其 SynthID 技术水印的文本、图片、音频和视频内容。该工具能够精准定位包含水印的具体内容片段,帮助用户区分人类与 AI 创作的媒体。自 2023 年 SynthID 推出以来,已为超过 100 亿条内容添加水印。此次检测门户...
谷歌正式向开发者和企业发布了 Gemini 2.5 Pro,首次引入专为复杂数学与编程任务设计的实验性 Deep Think 深度推理模式。新一代模型家族在安全防护方面实现重大升级,显著提升了在工具使用过程中对间接提示注入攻击的防护能力,成为谷歌迄今为止最安全的模型家族。Project Mar...
初创公司Flowith于2025年4月引发关注,现已推出其开创性的“Infinite Agent”平台。该平台采用可视化画布界面,彻底改变了AI交互方式。系统以思维导图的形式取代传统聊天界面,将每个问题转化为分支图谱上的节点,用户可回溯、探索新路径,并将结果存储在个人或可共享的“知识花园”中。...
中国科技巨头百度宣布,将于2025年6月30日前开源其下一代文心大模型(Ernie),标志着公司战略发生重大转变。此举正值中国AI市场竞争加剧,尤其是初创公司如DeepSeek以更低成本提供与美国领先模型相媲美的性能。此外,百度还将于2025年4月1日起,免费开放其AI聊天机器人文心一言,放弃...
2025年6月,阿里巴巴在全新升级的夸克App中推出了全新的 DeepResearch(深研)模式,这是公司在AI智能体技术领域迄今为止最重要的突破。该功能将夸克从一款云存储与搜索应用,转型为一站式AI搜索工具,充分发挥了阿里巴巴强大的通义千问(Qwen)系列模型能力。这一进展巩固了阿里巴巴在...
谷歌正式推出了AI模式,这是迄今为止其最先进的AI搜索体验,目前正在美国范围内全面上线。该新搜索界面由定制版Gemini 2.0驱动,具备高级推理、多模态能力以及更强的后续提问处理能力。首席执行官桑达尔·皮查伊称此次发布为“对搜索的全面重塑”,从根本上改变了用户与谷歌旗舰产品的交互方式。
埃隆·马斯克旗下的xAI公司计划于2025年5月初发布Grok 3.5,承诺在火箭发动机和电化学等技术问题上展现前所未有的推理能力。本次升级基于今年2月发布的Grok 3,后者已在数学和编程基准测试中超越OpenAI的GPT-4o和DeepSeek等竞争对手。新模型代表xAI向AI领域领导者发...
2025年6月6日,多项重要AI进展被报道,中国AI初创公司DeepSeek成为焦点。该公司最新的模型更新加剧了与OpenAI、谷歌等西方科技巨头的竞争。这些进展凸显了全球AI格局的快速演变,低成本、开源模型正挑战着传统巨头。
东京理科大学的研究人员开发出了一种突破性的自供能人工突触,能够在可见光谱范围内以极高精度区分颜色。该器件集成了染料敏化太阳能电池,自行发电,无需额外电路即可执行复杂的逻辑运算。这项创新解决了机器视觉领域中处理视觉数据通常需要大量计算能力和能耗的重大难题。
谷歌推出了全新订阅计划 Google AI Ultra,旨在为用户提供其 AI 应用和服务的“最高级别访问权限”。该高端套餐月费为 249.99 美元,包含谷歌 Veo 3 视频生成器、新一代 Flow 视频编辑应用,以及尚未上线的强大 Gemini 2.5 Pro Deep Think 模式...
谷歌宣布计划于六月初正式发布 Gemini 2.5 Pro,此前 Gemini 2.5 Flash 预览版已取得成功。Pro 版本将引入 Deep Think,一种专为复杂数学与编程任务设计的实验性增强推理模式。谷歌还为 2.5 系列模型部署了先进的安全防护,大幅提升了对间接提示注入攻击的防御...
谷歌宣布计划将Gemini 2.5 Pro转变为一个高度复杂的“世界模型”,能够理解、模拟并在复杂环境中进行规划。这一进步将使AI能够通过建模世界的各个方面,像人类一样进行规划和想象新体验。公司还透露,Gemini 2.5 Flash现已全面开放,2.5 Pro也即将上线,两者均具备更强的安全...
Anthropic近日推出了Claude Opus 4和Claude Sonnet 4,在AI编程和推理能力方面树立了全新标准。Claude Opus 4以72.5%的SWE-bench成绩引领行业基准,而Sonnet 4则以更亲民的价格提供卓越性能。两款模型均具备混合推理能力,可在即时响应与...
亚马逊推出了Alexa Plus,这是一款基于先进生成式AI的虚拟助手,相较前代产品实现了重大升级。新系统利用生成式人工智能技术,带来更自然的对话体验、更个性化的服务,以及更强大的复杂任务处理能力。尽管在早期推广中遇到了一些挑战,Alexa Plus仍致力于重振亚马逊在由谷歌和苹果主导的激烈A...
亚马逊宣布将在北卡罗来纳州里士满县投资100亿美元,建设大型AI与云计算数据中心园区,预计将创造至少500个高技能岗位。这一于2025年6月4日公布的投资,是北卡历史上最大规模之一,将极大提振当地经济。亚马逊CEO安迪·贾西将生成式AI定位为能够彻底重塑公司几乎所有客户体验的变革性技术。