读天下精彩故事,品世间百味人生【98故事网】
98故事网-经典故事_精选文摘_当代小说在线阅读
当前位置:98故事网 > 精选文摘 >Sora问世,一石激起千层浪

精选文摘《Sora问世,一石激起千层浪》

栏目:精选文摘|日期:2024-07-30|来源:风流一代|作者:杨易臻|阅读:手机阅读

精选文摘《Sora问世,一石激起千层浪》内容如下:

穿着时尚的女性漫步在霓虹灯闪烁的东京街头“”两艘海盗船在一杯咖啡内作战“……春节假期,这几段画面精美的视频在朋友圈”霸屏“,这些视频是美国人工智能团队OpenAI新发布的视频大模型Sora创作的。

Sora,这个词来源于日语中的”天空“,意指无限的创造潜力。2022年底因发布ChatGPT一炮走红的OpenAI,又因Sora在全球内容创作领域掀起新的风暴。

博采众长,Sora”一骑绝尘“

只需要一段20至30个词汇的文本指令或一张静态图像,就可以生成一段视频,不论是写实还是动画风格、宽屏还是竖屏,皆可任意选择。虽然Sora并非首个可以通过文本生成视频的大模型,但在时长、分辨率等视频生成模型的关键指标上,相比先前的Runway、Pika等文生视频产品,Sora可谓”一骑绝尘“。”Sora的诞生,意味着AGI(人工通用智能)的实现可能从10年缩短至一两年。“360创始人周鸿祎在微博上宣布。

记者亲身体验了此前某款视频大模型的生成产品,在生成的10秒视频中,人物表情僵硬、动作不协调,视频也无法准确呈现文字描述,与Sora的演示视频相比,确实差距巨大。

”Sora的技术亮点是,让AI内容编辑和生成实现了从文本、图像到视频的本质跨越。“中国计算机学会理事、南京理工大学计算机科学与工程学院副院长肖亮认为,Sora的底层技术并不算新,但优势在于”博采众长“,是多项技术积累、共同作用的结果。Sora在技术上的”颠覆性“主要体现在三方面:一是突破当前视觉大模型”60s超长视频“生成瓶颈,以往的视频模型大多只能生成时长不超过10秒的视频,而Sora在保证视频时长的同时,还能保持人物和场景的连贯;二是呈现多角度一镜到底,逼真表现光影几何、物理关系;三是较为真实地遵循物理世界规律,比如画笔会在画布上留下水墨、人吃汉堡会留下咬痕等。

OpenAI对Sora的定位颇具野心,号称其并非仅仅是”文生视频“的工具,而是一个通用的”物理世界模拟器“——复现真实世界的重力、摩擦力等物理现象。这一定位使得Sora未来有望成为跨越各行各业的”超级工具“,可用于模拟天气变化、自动驾驶、生物行为甚至军事场景等。

对此,南京大学计算机科学与技术系长聘副教授过洁表示,实际上,早有多条技术路径瞄准”模拟物理世界“这一目标,只不过实现方式不同。Sora的技术路径可以理解为”数据驱动“——通过学习视频来理解现实世界的动态变化,并用计算机视觉技术模拟这些变化。”但从Sora的一些‘翻车视频可以看出,它在理解物理世界时会遇到困难。“过洁以游戏举例,在一款射击游戏中,玩家想要走出屋子射击”敌人“,Sora很可能会让玩家”穿墙而去“。”Sora是否知道墙是一道物理障碍?在它塑造的世界规则中,是否有这么一条规矩,规定墙是不能穿过的?这些都是未知。“

”目前Sora接受的所有训练都是人类’喂给它的,其实还是没有跳脱现阶段人类的认知范围。目前还有许多物理规律连人类都还没有掌握,人类尚未踏足的知识领域,Sora也无法理解。“过洁说。

创意工作,AI仍难以替代人类

”过往的人工智能产品,多半可以分为‘以文生文’以文生图等类型。它们大多是根据网上已有的语料来进行内容产出,对于我们的工作生活并没有带来特别大的改变。“南京大学人工智能学院院长周志华分析,大家之所以对”文生视频“的反应”有点大“,是因为通过文字输入来生成视频这种方式,更容易让大家感同身受。

本文地址:https://www.98gs.com/wenzhai/24818.html,转载请注明出处。

 1 2下页
阅读相关精选文摘标签:科普知识
本站所有故事、文摘、小说版权归原作者所有,如侵犯到您的权益,请及时联系删除,本站不负任何法律责任
© 2024 98gs.com 98故事网 All Rights Reserved 闽ICP备19003060号-2
合作 / 友链 / 建议请联系E-mail:325794@qq.com