凉水书库

手机浏览器扫描二维码访问

一文搞懂世界模型:ai如何“脑补”真实世界?(第1页)

最近,AI领域里“世界模型”这个词越来越火,各大科技巨头纷纷入局,像是谷歌发布Genie 3,昆仑万维推出Matrix-Game 2.0,腾讯开源HunyuanWorld-Voyager。这世界模型到底是啥?为啥科技大厂们都对它趋之若鹜?它和我们熟悉的ChatGPT又有啥区别?别着急,接下来就用最通俗易懂的大白话,结合大家熟知的例子,带你彻底搞懂世界模型。

一、先搞懂:世界模型是啥?和普通AI模型有啥不一样?

(一)世界模型:让AI“看懂”真实世界

简单来说,世界模型是一种能让AI理解和模拟真实世界的模型。以往的AI模型,像图像识别模型只能分辨图片里有什么,语言模型只能处理文字信息。但世界模型不一样,它能把视觉、语言、动作等多种信息融合在一起,形成对世界的整体认知,还能预测未来可能发生的事。

举个例子,你看到一个小孩在玩皮球,皮球滚到桌子下面。我们人类不用看也知道,皮球还在桌子下面,不会凭空消失。这是因为我们大脑里有一个“世界模型”,能理解物体的运动规律和空间关系。而普通AI如果只看到皮球滚到桌子下这一帧画面,它很难理解皮球去了哪,因为它没有对世界的整体认知。但有了世界模型的AI,就能像人一样“脑补”出皮球在桌子下的画面,还能预测如果小孩去桌子下找皮球,会发生什么。

(二)和ChatGPT这类语言模型的区别

我们熟悉的ChatGPT属于大语言模型,主要处理文本信息。它能根据你输入的文字,生成相关的回答,比如你问它“明天天气怎么样”,它能根据数据和算法给出答案。但ChatGPT没有对真实世界的感知和理解,它不知道天气变化会对现实生活有什么影响,也无法和真实世界进行交互。

而世界模型更像是一个“智能模拟器”,它不仅能理解语言,还能理解图像、声音等信息,能在虚拟环境里模拟真实世界的物理规律和变化。比如你给世界模型输入一张房间的图片,再告诉它“把椅子搬到窗户边”,它能模拟出椅子移动后的房间画面,还能考虑到椅子移动时会不会撞到其他东西,这是ChatGPT这类语言模型做不到的。

(三)世界模型的起源:从心理学猜想开始

世界模型的概念最早源于心理学对“人脑如何表征外部现实”的猜想。1943年,苏格兰心理学家Kenneth Craik提出“脑内小尺度模型”假设,认为生物体若能在大脑里携带外部现实的简化副本,就可先“脑内试错”,再输出行动。这就好比我们在做一件事之前,会先在脑海里想一下可能的结果,再决定怎么做。

后来,经过认知科学、机器人学与强化学习的交叉演化,世界模型逐渐发展起来。2018年,“World Models”论文的发表,标志着世界模型概念正式被深度学习社区采纳。从那以后,世界模型在AI领域不断发展,成为实现通用人工智能(AGI)的重要路径之一。

二、世界模型能干啥?这些应用场景和我们息息相关

(一)游戏领域:打造“无限可能”的开放世界

在游戏里,世界模型能让游戏场景更加真实、动态,玩家的每一个动作都能实时影响游戏世界。比如,你在玩一款开放世界游戏,当你走进一片森林,以往的游戏可能是提前设定好森林里的场景和物品。但有了世界模型,森林里的树木会根据你的靠近产生光影变化,小动物会因为你的脚步声而逃窜,甚至天气也会随着时间和你的行动实时变化。

昆仑万维的Matrix-Game 2.0在这方面就表现出色。它是一款交互式世界模型,参数量仅有1.8B,能跑在单块GPU上。你只需上传一张静态图片,它就能基于该图像加载并生成一个虚拟世界。玩家可以通过方向键或WASD键控制人物在虚拟世界中的移动,且每一次人物的移动都会实时影响环境,并生成新的视频内容。像丢给它一张3A大作《荒野大镖客》的游戏画面,它能模拟出非常细腻的自然景观,河流蜿蜒流淌,还能模拟出流水的动态效果,大大增加了游戏的真实感与沉浸感。

(二)自动驾驶:提前“预判”复杂路况

自动驾驶汽车需要应对各种复杂路况,世界模型能帮助它提前“预判”可能出现的危险,做出更安全的决策。比如,当自动驾驶汽车遇到前方突然变道的车辆时,世界模型可以根据车辆的速度、距离以及周围环境信息,预测出可能的碰撞风险,并及时调整车速和行驶方向。

热门小说推荐
绝世女庄主

绝世女庄主

小说原名——《玉荷魂》。她,是万人敬仰的大蜀第一美人。她,是风姿卓绝的缙云山玉峰山庄之主。她,是继承了“帝魂之气”的上古皇帝后裔。她,是天真善良向往美好的普通邻家女孩。五代......十国的纷繁乱世中,上古神兵峥嵘现世,阴谋阳略涤荡人心。黑与白,善与恶,悲与欢,分与合。她,身处刀光剑影,唯有酣畅淋漓的快意恩仇,终能绘成血肉江湖最动人的画卷。PS.B站动画MV:www.bilibili.com/video/av51643929。【展开】【收起】...

从麻雀开始修仙

从麻雀开始修仙

西北玄天黑幽幽,仙家白面往下丢。坟头倒比馒头大,野庙无僧香火愁。遍地白面难入口,虫蚁无踪肚无油。此时方忆当年雀,他已为仙我为偷。穿越成一只麻雀,程羽不等不靠,游市井,戏人间,顺便修个仙。本书单主多穿。......

黄金台

黄金台

恶名昭著的朝廷鹰犬与战功赫赫的将军互看不顺眼,是一对铁打的死对头。岂知天有不测风云,将军战场受伤,落下双腿残疾,还被皇帝赐婚指给了死对头。 一纸赐婚诏书,互相敌视的两个人被迫成婚,住进同一屋檐下。相处日久,才发现原来这厮也不是那么一无是处/高不可攀。 古风架空,各朝制度与信口胡编的大杂烩,谢绝考据。 古代版先婚后爱,一个24k甜文。 CP:恶名昭彰的权臣攻x威名赫赫的将军受 【注意事项】宫斗水平极为低下,权谋含金量不足1%,与历史发展规律严重不符,距有思想有内涵的正剧差十万八千里。...

剑中影之十大剑客

剑中影之十大剑客

一个冷静正直的剑客。一个自强不息的傻少爷。和一个刁钻古怪的公主。他们本不是一路人。可是一件惊天劫案,让三个性情完全不同的人走到了一起,从此生死与共,祸福相依。为了追查劫案,他们又无意中卷入了江湖四大家族的明争暗斗之中。英雄翻身动乾坤,自此天下不太平。江湖中,十大剑客纷纷现身,四大家族你争我夺;朝野上,萧王一心匡扶社稷,东厂却屡屡诸杀忠臣。我师三人行,共赴江湖路。风云突变疾,剑中影重重。(注:此书原名《剑中影》,为修订版本,纯武侠风格。)。...

你再管我试试

你再管我试试

身为一个成绩好家境好长得好的学生,秦然最喜欢打游戏,励志成为一个风靡全球的职业电竞选手。 一天,他刚准备下播,突然翻到一个博主发的帖子,一张帅气男高图和配文:“扣1我转你们学校去”。 秦然跟着凑热闹,把自己学校的名字发了上去。 — 开学第一天,一直单人桌的秦然发现旁边多了一张课桌。 秦然抬起眼,问了一句:“这谁?” 后门走进来一个人,嗓音带着笑意:“我。” 秦然一愣,随后震惊:“我靠,真转过来了?” — 这人转过来就转过来吧,还什么事儿都要管他。 他上课困了想睡会儿觉,对方就轻轻拽他的校服外套:“上课睡觉容易感冒。” 他收到一封情书,还没打开就被对方按住了手:“早恋不好。” 他心情不好想抽支烟,对方就把烟从他手上抽走:“吸烟对肺不好。” 秦然:“。” — 直到某天秦然喝醉不小心把林亦琛亲了一口,亲完发现没什么感觉还想再亲,当即就被林亦琛拦下。 这人怎么那么烦,还管自己不让他亲,明明差点就亲上了。 秦然脾气一下就上来了:“你再管我试试?” 林亦琛唇角微勾:“那你来吧^_^” 阅读指南: 1.双c,1v1HE,林攻秦受,攻前期有点儿茶(bushi 2.轻轻松松的小甜饼,慢热日常 3.看到不喜欢不舒服的地方请点x,不然只会让自己更不好受。 4.祝大家看文愉快~...

我同夫君琴瑟和鸣

我同夫君琴瑟和鸣

李泠琅同江琮琴瑟和鸣,至少她自己这么觉得。 二人成婚几个月,虽不说如胶似漆,也算平淡温馨。她处处细致体贴,小意呵护,给足了作为新婚妻子该给的体面。 江琮虽身有沉疴、体虚孱弱,但生得颇为清俊,待她也温柔有礼。泠琅以为就能这么安逸地过着。 直到某个月黑风高夜,禁地之外—— 她亲眼撞见,那个平日里走两三步喘五六下的新婚丈夫,穿着夜行衣,手里提着剑,剑尖淌着血。 他立于高墙,背对着月色回首,眼中是她从未见过的凛冽杀气。 泠琅轻捂胸口,娇弱呼唤:“夫君,这是怎么回事?我好害怕……” 对面却温声道:“夫人不妨先藏好身后刀,再来说这些。” 泠琅惯用刀,刀是阿爹留给她的。阿爹曾是天下第一刀客,却死在了归隐后的第十三年。 为了调查真相,她潜入侯府,后来又阴差阳错,同病弱世子成了表面夫妻。有了这层身份,再也不用成日飞檐来,走壁去,遮掩躲藏。 真相水落石出,泠琅收刀转身,正欲离去,不料被人死死拉住手腕。 江琮眼底沉沉,面上仍笑得温雅: “同我缠斗七十六次,打伤我二十七次,轻薄我十五次,说喜欢我三次——” 他在她耳边咬牙:“夫人这就想走?” 史密斯夫妇梗 相杀相爱,一边打架一边xx的故事 两个都是演技派,女主白切疯,男主白切黑。 weibo:我亦羡秋风...