找回密码
 立即注册
搜索
查看: 26|回复: 0

辞旧迎新春节至,盘点2025年AI科技领域8大热门趋势

[复制链接]

1万

主题

0

回帖

5万

积分

管理员

积分
57275
发表于 3 天前 | 显示全部楼层 |阅读模式
亨格来自奥菲神庙

量子位|官方帐户

明天是春节假期,告别了旧的,并欢迎新的节日。让我们有不同的东西 -

我发送了“一年的前景”,并在2025年初站立,并简要介绍了AI技术领域不同领域的热门趋势。

从人类形的机器人,AI眼镜,从推理模型到AI ...从产品方面和技术方面,我们将一口气捕捉到今年的所有八种最有用的热门趋势,并享受农历新年。

这是编辑部对整个行业变化的洞察力,此前在年底和年初查看了世界各地的各种展览,论坛和圆桌会议,并参观了生产,学术界和研究领域的许多机构。

邀请您欣赏它,参与或拭目以待。

为什么这不是AI技术新年晚餐? (手动狗头)

01产品方

第1部分:人形机器人

如果我们始于马斯克在2021年第一个特斯拉AI日宣布人类机器人( Prime)的概念,回顾过去三年,该赛道逐渐流行,全球巨头已经增加了投资,而企业家团队则进入了市场。

此外,自2023年以来,随着AI大型模型技术的发展和模拟环境的改进,压纹智能为人形机器人增加了火。中国科学院的院士座齐(Yao Qizhi)也表达了他的观点,称类人生物是实现普遍压纹智慧的最合适形式。

结果是,类人形机器人爆炸并迅速从概念到真正的机器,从实验室到户外开放世界。

到目前为止,人形机器人的高潮是在CES 2025年初开始,老挝人开设了人形机器人组的热情:

14个人形机器人的“与我相同的尺寸(与我同样)”在他身后排成一列,这非常令人震惊。

在14个类人形机器人中,有6个来自中国:

一周前,在机器人和边缘计算副总裁北京,它显示,它正在建立一个平台,以帮助机器人专家,研究人员,机械工程师和测试人员更容易开发机器人解决方案。

一切都在加速。

而且潜力并不是说:麦肯锡的报告显示,到2030年,全球人形机器人市场空间可以达到12-16万亿元。

我们刚进入的2025年可能是人形机器人大规模生产的第一年:

特斯拉有望在一年内进入小规模生产的阶段,马斯克预计将在2026年实现大规模的批量生产。在中国,有731个人形机器人在本月初正式宣布了大规模生产。

第2部分:AI眼镜

在2024年中,雷·邦·梅塔(Ray-Ban Meta)运送了超过100万辆,完全点燃了全球AI眼镜轨道。

“眼镜必须是携带AI功能的最重要的载体之一”已成为行业共识。如果您不相信,您可以简单地称其为AI眼镜舞台 - 根据不完整的统计数据,在CES网站上显示了近50个AI眼镜,其中至少有14名中国玩家。

查看中国和外国媒体和KOL的报告和探索,这些已揭露的AI眼镜可以大致分为三类:

如此激烈的盛大场合吸引了整个行业的注意力,尤其是Meta作为先驱,自然会特别注意。

据了解,梅塔混合现实产品团队的核心成员最近在硅谷表示,在《一百镜像战争》中给他留下深刻印象的产品之一是AI眼镜(这也是游戏“ Oasis”中的“ Oasis”中的“ oasis”中的名称。

他解释说,他被独特的成像方法所吸引。显示技术没有通过各种镜头反射选择成像,而是将光学模块放置在框架上部,以直接投射从AI获得的信息,从AI到用户的视网膜进行成像。

这避免了彩虹图案,漏光和其他AI眼镜中的其他问题,还提高了获取信息的效率。

目前,这与所有其他AI眼镜不同。

目前有一个不足为奇的现实,也就是说,在CES结束后的一个月内,对AI眼镜的关注和讨论仍在上升。

一方面,展览的强烈影响带来了长尾效应。另一方面,来自多个品牌的AI眼镜已经开始发货,并且用户收到了评论的反馈。

在近战期间,屏幕也两天前也被爆炸一次:在世界上最大的众筹平台上,众筹的数额超过137万美元(约为99.26亿元),超额订阅为6,861%,创造了AR/AI   of AR/AI杯的最大销售纪录的创纪录。

该行业闪耀了CES,用户圈已经认识到众筹结果。原因是或其独特的自我定位:

它不是消费电子产品,而是一种时尚的技术产品。

简而言之,尽管该产品具有AI功能,但它将首先符合“一双出色的普通眼镜”的条件。

“ Great”反映在日常服装中,包括但不限于舒适的佩戴(市场上最轻的重量 +超过12个小时的电池寿命),时尚且美丽,可正确的视觉(带有免费眼镜)等,然后在此基础上,“仅在智能眼镜上开发有意义的功能。”

此外,为了不复制手机功能,重点是生产力方案;为了集成到用户的日常生活中,它为传统的交互式形式添加了戒指互动形式,而无需依靠手机,而无需在人群之间进行空旷的对话。

(我是狂喜的gif)

有趣的是,它背后的是中国第一的隐形眼镜。

它是由国内彩色学生品牌穆迪(Moody)的核心团队孵化和独立运营的。该公司的首席执行官还是穆迪的创始人兼首席执行官。另一方面,这项技术由新加坡的AI硬件集成服务提供商Gyges Labs提供,并且配备了世界上最小,最轻的近眼显示器在眼镜上的光学模块。

Ciran首席执行官,图片来源



这是一种祝福。赛道一开始,有人就领先于脱离束缚,不再受雷·潘·梅塔(Ray-Ban Meta)先前的经历的约束。

2025年,作为代表,AI眼镜行业开始在新的尖端创新中出现。专注于自己,是利用眼镜市场的透视和积累来推动AI眼镜的用户体验向前迈出一大步。

第3部分:智能驾驶

在Huang 的CES演讲的下半年中,到目前为止,已经对此进行了热门讨论。

世界上有三种类型的机器人可以制造,并且不需要绿色空间(已发达的地点),而棕色田地(未开发的地点)适应其特性完美。

这三种类型的机器人之一是自动驾驶汽车(另一种是人形机器人)。

尽管L4级自动驾驶仍在另一方面,但智能驾驶已成为汽车行业的新奢侈品标准,并且是技术平等权利的新方向。

在过去的2024年,智能驾驶通过两个端到端加速了改组,即:

基于此,L2+经验得到了不断改进,该行业已经开始朝着L3发展,逐渐拥有技术基础,支持L3的政策和保证机制。

L3可在市售,预计将在2025年成为先驱。

同时,作为L4级自动驾驶技术的核心应用程序方案,它也正在如火如荼地进行。

世界顶级领导人Waymo每周已经载有15万多名乘客。在中国, 和Pony Ma 最近一直在敲响铃铛并推出。

此外,马斯克预测,每公里的营业成本将小于1元-7*24小时,并且商业化将在全球范围内加速。

根据基于Qubit智囊团的公共数据的计算,国内市场规模将在2025年达到10.92亿元人民币。

第4部分:AI陪伴

对于许多公司而言,AI陪伴一直是部署AI应用程序的重要选择。

根据《量子位智囊团报告》的一项调查,在过去的一年中,20家国内公司总共推出了21种产品。但是报告的统计数据显示,在2024年,诸如国内AI陪伴和用户活动速度的提高之类的数据通常会下降,而后继者则很弱。

这可能与诸如市场饱和度,用户需求变化以及技术创新不足之类的因素有关。

但是,CES允许AI陪您在另一个村庄。人们发现AI已开始从在线转移到离线。

具体而言,它表现为各种AI玩具,例如NéFufu,Ropet和Ai Me。

热的

通过AI技术,他们根据环境感知。有些人有能力模拟情绪,而另一些人甚至无法与人类进行基本的浅层互动。

但是,AI玩具在受欢迎的玩具中非常受欢迎。基本原因是他们无法避免他们提供的新鲜经验和情感支持。

作为AI 的物理世界的载体,它不再专注于儿童用户的“伴侣”,而是将其扩展到年龄段的用户。

换句话说,在2025年,在线增长放缓的AI陪伴正在从虚拟应用转变为物理硬件,产品设计往往更具拟人化和情感,以满足用户对陪伴和互动的需求。

02技术方面

第5部分: -

毫无疑问,火花的重要趋势已经可以在2025技术方面看到,并且必须有一个新的范式:O1:

- 。

与1年前通常认为在技术领域的传统法律不同,它强调了训练后(后)和推理阶段( - 时间)计算投资的重要性,相应的结果是模型推理能力的显着提高。

这意味着,大型模型资源开始倾向于后和推理计算能力。

这也意味着新一轮比赛的开始。

仅在几个月内,就单独观察了这个国家,例如  O1,  QVQ,Zhipu  Glm-Zero-,Step R-Mini,Deep -R1,Kimi K1.5,Kimi K1.5, -M1-已发布。

需要注意的是,首席执行官 Sam明确向公众宣布“ O1只是推理模型的GPT-2时刻”。

看来这是真的

在推理能力方面,的O1版本(2.0 Flash)具有比所有型号快5倍的思维速度(在发布时在市场上);在O3系列的高度是O1的两倍以上,Mini已经可用。

就概括能力而言, - 不仅在语言大型模型领域有效。 O3,QVQ,-M1-等已证明它可以推广到视野。

在模型成本方面,-R1在培训水平上的创新和工程优化使推理模型的高昂成本和使用成本带到了新的低点,继续冲击硅谷。

在12月底发布的新型GPU B300将其视频记忆从192GB增加到288GB,这足以支持推理模型的机制,以显着降低潜伏期并在处理长期任务时支持更大的批次大小。

这是Lao Huang为2025年出现的所有推论模型提供的物理外国援助。

Grok AI图

第6部分:视频生成



自去年2月推出Sora模型以来,世界各地的相关技术都取得了长足的进步。

在这一轮视频生成技术进步的热潮中,两种最受欢迎​​的技术是两种技术力量。

一个是将体系结构引入扩散模型的DIT()模型,从而大大提高了图像生成的质量。

杰作是索拉。

索拉的经典作品,东京女孩

另一条主要途径仍然与深度学习和GAN(一般对手网络)密不可分,该网络将通过分析大量培训数据来学习并试图模拟现实世界的物理定律。

代表性的工作是VEO 2。

VEO 2经典,切西红柿

在这条赛道上,家庭和家鲜花比海外繁荣。初创企业和大型制造商展示了他们的能力,并共同努力促进技术发展。一些技术已经达到甚至超过Sora的水平。

这是一些玩家及其产品:

此处提到的产品被认为是几乎所有国内视频生成轨道播放器都采用“左手技术进步,右手产品的土地”路线。

因此,TOC产品用户市场反馈对技术的反向压力也可以视为视频生成技术的紧急进步甚至创新的重要因素。

第7部分:AI

传统的AI,例如从基础层访问的Codex模型,重点是单行代码完成或功能生成。

新一代的AI工具通过AI 2.0 ERA的大型型号(例如GPT-4O和3.5)实现了全栈开发功能。

尤其是具有3.5的强大编程功能,许多AI星项目已经诞生了。

例如,Bolt,v0,就像刚刚宣布完成最新1.05亿美元的B融资的那一位一样,它仅在去年中旬连接到3.5之后才实现了用户量和声誉的爆炸。

除了提高AI功能的传统技能,例如教学微调,特定于代码的微调,多任务学习和多目标损失功能,3.5的强大代码功能还来自其长上下文功能,这有助于模型评估需求和生成定制的解决方案。

在2025年,AI背后的技术具有新的探索点。

代码功能与O1和开源-R1的能力相当,该代码功能于本月20日发布。

它的AI功能可以大大提高,部分地基于训练后培训阶段的纯RL(强化学习)途径,而没有SFT(有监督的微调),但很少有带注释的数据;在编程任务中,自动测试用于评估代码质量。

简而言之,尽管AI仍然需要手动干预和优化,但颠覆性的变化已经完成:

从代码完成工具到完整的开发助理,它甚至从“低代码”拖动到使“无编码”编程从概念转变为练习。

目前,AI的基础技术显示了值得深入探索的新焦点。再加上码头模型本身的快速进步,预计将在2025年的L3智能驾驶水平上取得突破,从而产生新的开发范式。

第8部分:太空智能

斯坦福大学教授Li 首先提出了空间情报的概念,被称为“ AI教母”:

空间智能是指机器在三维空间和时间上感知,理性和行动的能力,从而帮助他们了解三维空间中事物的位置和相互作用。

遵循这个概念,Li 创立了太空情报公司世界实验室。

去年12月上旬,发布了第一个太空智能模型,该模型可以在一张图片中生成交互式3D游戏世界AI系统,从而真正打开了空间智能的窗帘,以从理论到实践。

为了进一步阐明空间智能的细节,其野心是将空间计算操纵虚拟世界的能力与个人智能达到现实世界的能力相结合。

因此,在广义空间智能背后的技术范围内,还可以涵盖具体的情报,世界模型和3D代。

其中,世界模型旨在建立对物理世界的动态模拟,支持AI系统以预测未来状态并制定行动策略。

到目前为止,该领域有两个主要的技术路线:

首先,由 Genie 2代表,通过视频生成模型学习物理定律可以预测单帧图像的连续动作序列;其次,由代表,结合了增强学习和多模式数据,以构建高精度的虚拟环境。

3D一代技术是空间智能的另一个发展方向。

以下是基于3D,3D几何形状的2D模型优化的各种技术途径,以及将2D图像直接映射到3D表征。

还有一件事

在这八个主要曲目中,有些已经准备好了,有些已经显示出它们的力量,有些甚至显示出“超车”。

无论是产品方面的“可见”,还是技术方面的“可触摸”,AI都以前所未有的速度重塑了我们的生活。

在分类和库存的过程中,不可避免地会有很多秘密和其他事情。

如果有什么丢失的东西,请原谅我,欢迎朋友指出并在评论区域进行讨论。

最后,我祝大家新年快乐,并祝大家好运。我们还将回家参加春节旅行狂欢以庆祝新年〜
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|【智道时空】 ( 京ICP备20013102号-16 )

GMT+8, 2025-5-2 22:40 , Processed in 0.067584 second(s), 19 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表