晚上,科技公司白领琼回到家,正准备选部好剧享受美好的睡前时光,一部名叫《琼糟透了》的新剧吸引了她的目光——剧中主角 " 琼 " 从名字到造型都和 " 琼 " 一样。不仅如此,琼白天经历的一切,都被拍到了剧中,甚至还遭到了 " 恶意演绎 "。
琼迅速找到律师,准备发起控告。但她惊讶地发现,不管是电视台还是剧中饰演自己的演员,琼都无法控告他们侵权。因为,这是一部完全由 AI 创作的视频节目,并且过去依靠人工制作需要的数月工期也被 AI 缩短到几分钟。
这原本是美剧《黑镜》第六季第一集中描述的故事。但谁能想到,在该剧播出几个月后,视频大模型 Sora 的诞生让电视剧里的故事正在加速变成现实。当人们经历了 2023 年 ChatGPT 带来的震撼后,属于 AI 的 2024 年又是一番新景象。
视频大模型,开启 AI 又一春
2023 年,OpenAI 发布的 GPT-4 语言模型成为 AI 领域的焦点,被认为是人工智能领域的一项重大突破。时隔一年,2024 年 2 月 16 日凌晨,OpenAI 在其官方发布了文生视频模型 Sora。用户只需输入文本指令,Sora 就可以快速生成 60s 视频内容,同时理解和模拟真实世界,输出准确反映用户提示的视频。
OpenAI 将 Sora 定位为一款世界模拟器的视频生成模型,为未来发展理解和模拟真实世界的模型奠定基础。根据官方介绍,目前 Sora 具备生成包括多个角色、特定类型的运动、准确细节的主体和复杂场景的能力。同时,还能够创建多个镜头,模拟复杂的摄像机运镜效果,使得生成的视频更加生动。
*Sora 生成的视频截图
此外,由于 OpenAI 将扩散模型与 LLM 相结合,使得 Sora 具备了理解和模拟真实世界的能力,因此 Sora 所生成的视频中已经可以展现出空间以及空间内物体之间的真实物理关系。目前 Sora 除了文生视频功能外,还具备图生视频、视频扩展、视频拼接、视频编辑、图像生成等功能。
Sora 的发布不光是给 AI 领域的企业以及爱好者带来了震撼,还立刻盖过了谷歌公司同样在 2 月 16 日发布的人工智能模型迭代版本 Gemini 1.5 Pro 的风头。被 " 截胡 " 的心酸,恐怕只有谷歌知道。
原本谷歌 Gemini 已经很努力地绕过文字环节、直接跨越到通过视觉和声音来理解世界的阶段(尽管后来被证实是谷歌员工通过关键词提示帮助 Gemini 生成了回复),从而避开了与 GPT-4 在同纬度 " 战斗 "。但 OpenAI" 不讲武德 " 的做法,打了 Gemini 一个措手不及。
*Gemini 通过视觉和语音进行互动的演示视频截图
当然还有更憋屈的:在谷歌和推特都有从业经历的 AI 创业者 Gabor Cselle 用 Gemini 1.5 分析了 Sora 生成的樱花雪景视频。没想到 Gemini 1.5 非常中肯的给出了 " 视频的视觉效果令人赞叹,但它并非真实场景所拍 " 的结论,给人一种 " 连对手都说好 " 的反差感。不过谷歌也在 22 日发布了平均性能远超 Llama,并且声称是全球最强开源大模型 Gemma,算是勉强博回了一些面子。
除了谷歌,影视与游戏公司们最近也是如临大敌。美国旧金山早期投资人 Zak Kukoff 预测,在 5 年内,一个不到 5 人的团队将可能用文生视频模型制作出一部票房收入超过 5000 万美元的电影。
当然,也有很多积极的方面。360 公司董事长周鸿祎直接在朋友圈发长文称,"Sora 对物理世界的模拟,至少将会对机器人具身智能(通过感知和交互与环境进行实时互动的能力,惊蛰研究所注)和自动驾驶带来巨大的影响。它展现的不仅仅是一个视频制作的能力,它展现的是大模型对真实世界有了理解和模拟之后,会带来新的成果和突破。"
在由 Sora 开启的大视频模型元年,一定会有更多企业 " 弃文从视 "。是好,是糟,恐怕也只有 " 视 " 过才知道了。
AGI 版 " 权力的游戏 "
2023 年,OpenAI 内部爆发的 " 宫斗戏 ",让很多不关注人工智能领域的人都知道了,原来在日本之外,美国还有个 " 奥特曼 " —— 38 岁的 OpenAI 首席执行官萨姆 · 奥特曼 ( Sam Altman ) 。而随着 OpenAI 公司以及奥特曼本人频频在大众面前获得关注,一场全球瞩目、属于 AGI 行业的 " 权力的游戏 " 也在上演。
2015 年,奥特曼和特斯拉 CEO 马斯克等人联合创办了 OpenAI,起初它是一家由非营利董事会管理的营利性公司,并且优先考虑使命而不是财务利益。马斯克当时曾说:" 我们希望有一种类似于 Linux 版本的 AI,不受任何个人或公司的控制。"
2019 年发布的 GPT-2,就是一个开源大模型,但在这之后,OpenAI 在奥特曼的领导下走向了 " 闭源 " ——其后续发布的 GPT-3、GPT-3.5 以及 GPT-4,都是闭源模型。
马斯克作为联合创始人之一,虽然在 2018 年离开 OpenAI 董事会,但也公开表达过自己的不满,他表示 OpenAI 设立时是一家开源公司,现在变成了一个闭源、受微软控制的逐利公司。这根本不是他想要的。到了 2023 年,马斯克依然如此表示,人工智能初创公司 OpenAI 的 " 闭源 " 行为并不是可取的做法。
奥特曼曾解释称:很久之前,就已经意识到非营利性不是长久之计,仅仅依靠非营利筹集到的资金对 OpenAI 的研究来说远远不够,商业化是必然选择。
甚至为了证明 OpenAI 公司的非盈利性依旧存在,他在一场会议上表示:" 公司里没有人可以完全信任。董事会可以解雇我,我认为这很重要。" 只是,OpenAI" 宫斗戏 " 发生之后,很少有人再相信奥特曼的这一番言论了。
而更令人关注的是奥特曼还曾说过:自己理解的 AGI 所掌握的知识应该是要超过人类科学知识总和的,并且具有创造性,能够推动基础科学的发展。
奥特曼对 AI 商业化带来的安全风险以及 OpenAI 的 " 宫斗戏 ",进一步引发了全球对 AI 伦理问题的关注—— 2023 年,多个国家和组织开始制定 AI 伦理标准,以确保 AI 技术的可持续发展。这些标准强调了透明度、公平性和可解释性在 AI 系统中的重要性,为未来的 AI 发展提供了道德指引。
2023 年 12 月,欧洲议会、欧盟成员国和欧盟委员会达成协议,通过了全球首部人工智能领域的全面监管法规《人工智能法案》。
随着 Sora 的发布,AGI 的进化时间似乎被缩短了 5-10 年,这也让很多人想起了曾被授予图灵奖的 "AI 教父 " 的杰弗里 · 辛顿(Geoffrey Hinton)说过的一句话,后悔研发人工智能,担心人工智能会为世界带来严重危害。
20 多年前,斯皮尔伯格在其执导的电影《人工智能》中设置了一个基于人与人工智能(AI)的 " 道德困境 " ——当机器人具备了人类的复杂情感时,是否应该接受道德规范的约束。这其实也是在讨论,人工智能与人类社会的共存和相互关系中存在的道德困境。
有业内人士指出,在当下治理框架、管控措施都未跟上的情况下,仅靠企业恐无法提供社会所需的人工智能安全性和信任度。但对于 AGI 行业来说,奥特曼的选择或许决定了未来 AI 进化的方向。
在一篇发表于纽约科技博客《Intelligencer》的文章中,作者 Elizabeth Wei 称奥特曼是 " 伪装成好人的帝国主义者 "。美国著名创业孵化器 Y Combinator 的联合创始人保罗 · 格雷厄姆(Paul Graham)也曾给过类似的评价:" 你可以把他扔到一个充满食人族的岛屿上,五年后再回来,会发现他成为了国王。"
在《时代》的采访中,一位熟悉 OpenAI 董事会程序的人如此点评奥特曼:" 在很多方面,萨姆真是一个不错的人……他关心使命,关心其他人,关心人类。但是,如果你观察他的行为,也能清晰地看到一种使用极端方式来追求权力的模式。"
从这些评价来看,或许奥特曼只想当 " 光之国 " 的国王,而不想做 AI 的奴仆。而对于这场 AGI 版 " 权力的游戏 ",当下作为看客的用户们也将承受 " 剧终 " 的结果。
新能源汽车竞速,靠 AI 上分?
在 AI 与日常生活的结合方面,新能源汽车无疑是最贴近现实的场景之一,也是近几年最受关注的赛道之一。而智能驾驶不但是 AI 落地的具体形式,更成为车企赢得行业竞争的主要方向。但是在竞争加剧的市场环境下,车企们面临的挑战也越来越大。
2 月 18 日,有媒体报道称,高合汽车召开内部大会,宣布即日起将停工停产 6 个月。虽然随后有高合汽车内部人士及时予以否认,但这条消息仍然引发了部分网友对高合的负面猜想。
此外,华为合作的两款车型智界 S7 和问界新 M7 均先后发生延迟交付的问题,虽然华为提出了 " 提车关爱补贴计划 ",但还是有不少车主在社交平台以更新累计补贴的方式进行抱怨。
对于 2024 年中国车企的状况,小鹏汽车 CEO 何小鹏这样说道。"2024 年将是中国汽车品牌进入‘血海’竞争的第一年,一场激烈竞争中的‘厮杀’在所难免。"
春节假期刚过,比亚迪率先打响 " 价格战 ",下调旗下多款车型售价。而后五菱汽车、长安启源、哪吒汽车等多家车企纷纷跟进宣布下调售价。
其中,比亚迪正式推出了秦 PLUS 荣耀版和驱逐舰 05 荣耀版两款新车,7.98 万元起售的价格让 " 电比油低 " 的广告语格外具有吸引力;五菱星光正式发布 150 进阶版荣耀售价 9.98 万元,则让超长纯电续航插混车型售价正式进入 "9 万级 " 时代。
不少人预测 2024 会是新能源车市场最卷的一年,行业会从耐力赛彻底转向竞速赛,可谁能想到这一开年,迎接车企们的就是 " 淘汰赛 "。
此前,威马汽车的 " 消失 " 就曾带给新能源车主们新的危机感:智能座舱等功能面临的最大风险就是,一旦品牌车企破产倒闭," 降智 " 不可避免。而手机帮造车出现的延迟交付问题,也反映出其对产业链和供应链控制力与传统车企相比,仍有不小差距。
作为 AI 技术在交通领域的一项重要商业化应用,自动驾驶的落地将为人们的出行带来便利,提高交通效率,减少交通事故。然而时至今日,自动驾驶技术的普及仍面临诸多挑战,如技术安全、法律法规和社会接受度等,短期内依然难以成为主流智能汽车的核心应用技术。不过,正如周鸿祎所说,Sora 的 " 诞生 ",会对自动驾驶带来巨大的影响。
当然,2024 年开年比较难受的还有刚刚 " 上新 " 的小米汽车 SU7。雷军在去年 12 月 28 日举行的发布会上讲解小米首辆轿车 SU7 性能时曾表示:" 不要喊 9 万 9 了,不可能的!" 他进一步称," 但凡有这种表现和配置的,都得 40 万以上!所以 14 万 9 也不用再讲了,还是要尊重一下科技啊!"
然而比亚迪领跑的这一波新能源车降价,或许给正在试探潜在购车消费者心理价格上限的小米当头一棒。毕竟,与深耕汽车行业几十年的车企比 " 性价比 ",小米完全没有优势。但如果小米选择走中高端路线,一个月只卖几百辆、然后在年初即传出 " 停工 "、走高端差异化创新路线的高合,恐怕就是前 " 车 " 之鉴。
中国人信奉一句话:" 车 " 到山前必有路。市场发展推动了行业加速洗牌,经历了优胜劣汰留下来的企业和品牌,才能带动行业更快更好的发展。这么看来,新能源汽车行业的开年 " 淘汰赛 ",未必是 " 糟糕 " 的一件事。而手握 AI 技术的手机帮一旦 " 活下来 ",势必在未来要 " 上大分 "。
40 年前,詹姆斯 · 卡梅隆执导的《终结者》开辟了科幻电影的新篇章,还引发了 " 科技的发展是幸运还是灾难 " 的探讨。
如今,AI 在展现出巨大生产力的同时,也如 " 终结者 " 一般进入各行各业。并且其发展速度,已经远超人类想象。我们都不得不承认 AI 的时代是 " 正在进行时 " 了。至于它是否 " 糟糕 "?就要看你如何接受这 "AI" 了。
来源:惊蛰研究所