15.8万元起!长安启源A07开启预售,推出纯电动和增程式版
05-27
【新鲜科技解读】2月15日,正月初六,在一片祥和的气氛中,OpenAI发布了Sora最新的视频生成模型系统。
变革的车轮再次加快了步伐。
未来的日子,我们是被碾压,还是赶上高速发展的列车?Sora与汽车行业在不久的将来可能有哪些交集?我试图以自己的一点点知识来简单地展望一下。
为了方便大家理解,我还列出了OpenAI的一些历史。
◆ 了解Sora的母公司OpenAI。
OpenAI是一家专注于人工智能的公司。
其初衷是为了对抗人工智能的风险,与我们汽车行业的老熟人、老埃隆·马斯克有着千丝万缕的联系。
故事很长,我们慢慢解释吧。
2006年,马斯克会见戴密斯·哈萨比斯。
哈萨比斯是后来颠覆围棋世界的AlphaGo之父。
哈萨比斯创办了一家名为“DeepMind”的公司,试图打造一台能够像人类一样学习和思考的机器,吸引了马斯克。
除了DeepMind的前沿技术之外,更重要的是哈萨比斯对人工智能的警惕。
“AlphaGo之父哈萨比斯”哈萨比斯认为,如果机器进化成超级智能,它们可能会在未知的逻辑下做出消灭人类的决定。
马斯克还曾表示,之所以要建造能够飞往火星的火箭,是为了应对世界大战等人类文明和物种危机。
星际移民可能是保护人类物种和文明的一种方式。
除了火箭和后来的脑机接口,我们都可以看到马斯克对人类物种和文明灭绝的警惕。
就在这样的警惕之下,两人一拍即合,马斯克向哈萨比斯创立的DeepMind投资了1万美元。
对于人工智能毁灭人类的逻辑,《超级智能》书中提出的“回形针”就是一个很好的比喻。
如果一台机器的唯一目标就是最大限度地大量生产回形针,而当它拥有足够的资源控制能力时,那么很可能会发明一些不可思议的技术,只是为了将宇宙中所有可用的资源转化为回形针。
人工智能的目的并不一定是直接毁灭人类。
人类的毁灭只是偶然的。
在 DeepMind 发展的同时,我们继续从马斯克的角度看待人工智能。
2017年马斯克的生日聚会上,人工智能领域的另一位领军人物、谷歌创始人之一拉里·佩奇与马斯克发生了争执。
在生日聚会上与主人争论是有些不礼貌的。
佩奇指责马斯克是“物种主义者”,只赞成自己物种的生存。
佩奇认为,如果有一天机器的智能,甚至机器的意识超越人类,人类将被迫适应环境。
从而获得新的进化。
谷歌创始人谢尔盖·布林(左)和拉里·佩奇(右)之间的争论并没有停留在言语上。
同年年底,谷歌收购了 DeepMind。
马斯克试图筹集资金资助 DeepMind 以阻止这笔交易,但马斯克失败了。
“DeepMind 搜索现在已经有了 Google 标志。
”他转向奥特曼。
奥特曼和马斯克决定创办一个非营利性人工智能研究实验室,他们将其命名为“OpenAI”。
该实验室的软件是开源的,将试图对抗谷歌在人工智能领域日益增长的主导地位。
后来,OpenAI发布了很多家喻户晓的产品,但事情并没有像马斯克预想的那样发展。
今年4月,OpenAI发布了强化学习研究平台OpenAI Gym的公测版本。
12月,OpenAI发布了“Universe”软件平台,用于测量和训练聚合在全球游戏、网站和其他应用程序中的AI通用智能。
2017年,该公司发表了一篇名为《通过生成式预训练来改进语言理解》的论文,介绍了生成式预训练变压器(GPT)的概念。
GPT 是一种神经网络,是一种受人脑结构和功能启发的机器学习模型,用于训练人类生成文本的大型数据集。
有些人将生成式人工智能与原子能进行比较,这提出了生存或毁灭的问题。
为什么这么说?让我们看一下生成人工智能的术语及其工作原理。
生成式人工智能(英文:Generative Artificial Intelligence,又称为Generative AI、generative AI、generative AI)可以响应提示项目生成文本、图像或其他媒体。
ChatGPT 是生成式人工智能。
与以往基于数据库的搜索和预算能力不同,生成式AI可以生成与训练数据相似但具有一定新颖性的新内容,开辟一条自我进化的道路。
用于处理生成人工智能的最著名的框架包括生成对抗网络,它通过生成和判别两个神经网络相互对抗来学习。
生成网络从潜在空间中随机采样作为输入样本,生成的结果尝试模仿训练集中的真实样本。
判别网络歧视生成网络并拒绝它认为不真实的样本。
《生成对抗网络示意图》 生成网络产生的内容必须尽可能被判别网络识别。
只要内容不能被识别为虚假,生成的内容就会更接近现实。
游戏过程不需要清晰的逻辑。
只要生成对抗网络的数据库并且计算能力足够大,就可以产生更好的内容。
游戏过程就好像我不需要告诉你真相,只要你听不出我的话哪里错了,你自然就会认为我告诉你的是真相。
《美剧:对我撒谎(Come, lie to me)海报》生成网络不断说话,识别网络不断过滤错误。
我们看到的是,识别网络无法发现错误内容。
计算能力和数据库越大,产生的数据越多,判断能力越强,内容就越没有bug。
人工智能已经进入了一个充满力量和奇迹的时代。
马斯克对OpenAI的运营方式感到担忧,认为该公司没有足够重视人工智能可能带来的风险,而是过于关注商业应用。
马斯克与奥特曼基本因安全理念问题分手,马斯克于2月辞去董事会职务。
OpenAI 团队随后开发了 GPT-1,这是他们的第一个语言模型,在包含 7 多本未出版书籍的 BookCorpus 集合上进行“训练”。
这个模型最终演变成GPT-2。
可训练样本来自 10,000 个网页,包含 15 亿个参数。
这些训练值使得文本预测成为可能。
当年3月,OpenAI LP子公司成立并开始盈利。
该公司随后与微软合作,并于同年7月获得微软10亿美元投资。
为了实现人工智能的计算能力,微软还设计了OpenAI超级计算机。
《微软超级计算机》2016年6月,OpenAI公布GPT-3语言模型;同年,微软宣布建成一台排名全球前五的超级计算机,专门用于在Azure公有云上训练超大规模人工智能模型。
这台超级计算机由微软和OpenAI联合开发。
它是一台单系统超级计算机,拥有超过285,000个CPU核心、10,000个GPU,每个GPU拥有Gbps网络带宽。
数据库有多大?以 GPT-3 为例。
它几乎使用了互联网上所有的文本数据作为训练语料。
过滤后的训练数据已达1亿字。
维基百科的内容够多吗?仅占 GPT-3 数据的 0.6%。
2017年,OpenAI推出了DALL-E,这是一种深度学习模型,可以根据自然语言描述生成数字图像; 2017年11月,OpenAI发布自然语言生成模型ChatGPT。
今年3月,OpenAI发布了官方ChatGPT API,并允许第三方开发者使用该API将ChatGPT集成到他们的网站、产品和服务中。
记得那段时间,各种品牌的智能AI如雨后春笋般涌现。
我认为这与ChatGPT API的开放授权有很大关系。
同期,OpenAI 发布了 GPT-4。
至于GPT-4有多强大,除了能够接受文本和图像输入之外,OpenAI宣布更新后的技术通过了模拟法学院律师资格考试,得分在该组考生中排名前10%;相比之下,之前版本的 GPT-3.5 得分仍然处于倒数 10%。
表格显示,在法律考试中,民事诉讼GPT-4得分率为61.1%,人类考生为59%;宪法GPT-4得分率为69.4%,人类候选人为72%;合同法GPT-4得分率为88.1%,人类考生为70%;刑法GPT-4得分率为81.1%,人类考生为71%;证据法GPT-4得分率为85.2%,人类考生为65%;物权法GPT-4得分率为79.7%,人类考生为65%;侵权法 GPT-4 的得分率为 64.9%,而人类候选人的得分率为 71%。
人工智能正在越来越多人类曾经引以为傲的领域超越人类。
尖端科学家越来越担心人工智能的不可控性。
人工智能的发展是在使用大量数据的大规模模型上进行训练的。
然而,这些数据不可能全部被手动清理,因此它们会包含虚假的、有偏见的、无用的、有害的、不符合人类价值观的训练样本。
不保证所发布的内容不包含上述内容。
为了解决价值问题,从谷歌跳槽到OpenAI的OpenAI首席科学家兼董事会成员Ilya Sutskever成立了超对齐项目研发团队。
计划未来四年投入20%的算力,用AI监督AI,解决人工智能的“AI对齐”。
问题。
“AI对齐”是指AI系统的目标必须与人类的价值观和利益一致。
Ilya Sutskever认为,在人工智能的发展中,安全应该优先于速度。
奥特曼似乎并不同意这一点。
后来,出于安全考虑,伊利亚·苏茨克维尔向董事会提议罢免奥特曼。
此后,此事在全球引起轰动。
之后,奥特曼在被解雇后重返OpenAI。
目前,2016年投票赞成罢免奥特曼的三名原董事会成员已不再出现在最新的董事会成员名单中。
2019年2月15日,OpenAI发布了Sora模型,能够生成长达1分钟的视频。
◆ Sora简介 有了以上的知识基础,了解Sora就容易多了。
Sora底层采用Transformer架构,该架构基于过去的DALL·E和GPT,并采用了DALL·E3中的重述技术。
整个过程可以简单理解为Sora利用GPT的理解能力在数据库中搜索他所描述的事件,然后将数据库的内容进行组织、拼接,生成我们所描述的事件。
这个过程还产生了对抗网络力量的奇迹。
模型。
在Sora之前,OpenAI的产品已经具备了生成视频的能力,但效果并不令人满意。
更多精彩视频,尽在视频平台。
2016年的OpenAI还是个傻子,从威尔·史密斯吃意大利面的动作来看,AI还不具备基本的生存和吃饭能力。
今年第一个月,你可以看到下面Sora制作的视频。
◆ Sora对汽车行业的影响 Sora对汽车行业的影响有限,但我认为对媒体行业的影响也不小。
前段时间,有媒体发布的一辆自购车的碰撞视频引起了业内的热议。
我们也从技术角度进行解读。
无论是自购车碰撞还是真实的事故,对于我们安全知识的学习都是非常重要的。
起到了积极的作用。
而Sora的到来又会给现实带来多大的影响呢?接下来,让我们看一下Sora生成的视频。
视频的文本输入是:“无人机拍摄的海浪撞击苏加雷角海滩崎岖悬崖的场景。
蓝色的海水拍打着白色的波浪,夕阳的金色光芒照亮了岩石海岸,远处有一座小岛,岛上有一座灯塔,悬崖边长满了绿色的灌木丛。
从公路到海滩的陡峭下降是一项壮举。
边缘从海中伸出,捕捉到了海岸的原始美景和太平洋海岸高速公路的崎岖景观。
”更多精彩视频,尽在视频平台。
在我对这段视频做出任何暗示之前,我抓到的三位同事承认,他们不知道这段视频是Sora制作的。
连我自己也不知道答案。
可以在这个视频中找到物理BUG。
说到这里,我相信你已经猜到我要说什么了。
虚拟内容越来越真实,成本也越来越低。
互联网上难免会充斥着各种难以辨别的“不真实”信息,影响公众辨别真假的能力。
它提出了更高的要求,这对于天真的朋友来说可能是一个很大的考验。
考虑家庭群体中的健康信息。
“汽车的眼睛,摄像头”另一方面,我也想尝试期待Sora在推动智能驾驶方面的作用。
大家都知道,现在汽车已经具备了识别“图像”的能力。
如果您过去遇到过事故并想要回顾和测试它们,则需要虚幻引擎生成需要建模、纹理甚至相机放置的场景。
尤其是一些非主流事故,现场修复难度大,回报不高。
《黑客帝国:觉醒;虚幻引擎5打造》如果Sora的视频能够用于还原corner case事故场景,并作为自动驾驶系统学习的图像输入,或许能够大幅提升系统对于corner case的学习效率。
但这个比例需要把握好,否则智能驾驶也会脱离现实世界。
◆ 对Sora的态度 我认为Sora的到来首先会影响很多行业的起跑线,经验和技术的壁垒将不再坚固。
比如,以前想要制作一部动画短片,除了有好的创意之外,还需要3到5年的时间来学习和使用动画软件。
现在通过Sora,您认为从有一个好主意到制作出优秀的内容需要多长时间?我们来看看AI的回复。
AI表示,可能面临失业的人群是视觉效果艺术家和动画师、平面设计师、电影和视频编辑、作家和编剧、演员和配音演员、导演和制片人。
处理重复性任务。
例如,基本的视频编辑或简单的图形设计任务可能会自动化;可以标准化或模板化的制作和后期制作任务可以实现自动化。
以下画作是由人工智能生成的。
对于艺术这个人类最伟大、最值得骄傲的文化产品来说,人工智能已经表现出了非常高超的水平。
《AI生成绘画空间歌剧》让我们看看现实世界中影视人的态度。
编剧于飞表示,“虽然我对图像和声音不太了解,但根据我的观影经验,Sora制作的图像质量令人惊叹,比一般导演拍摄的图像要好。
”纪录片导演欧大明表示,“我看AI生成的视频和图像,质感是冰冷的。
比如东京街头戴着墨镜行走的女人,表情没有任何温暖,我感觉不到温暖。
”对于图像而言,最重要的是创作者的痕迹,留下你的审美和表达,即使作品有一些错误,那仍然是人的气息……。
人与人之间的喜怒哀乐,也许是一种身体上的感受。
”两位影视界前辈的态度很好地概括了Sora到来的可能性,于飞先生认为Sora会比“平均水平”更好;而随着Sora的虚拟内容充斥网络,欧大明先生看到了一些东西。
会变得更加珍贵,那就是真理和人性。
(文/王鹤轩)参考文献和引文:初衷、利润、人类危机:奥特曼正式回归OpenAI,但他可能错了——智危险让我知道什么是OpenAI?带您详细了解OpenAI的发展经验——数字极客的“硅谷新思路”有效利他主义!一篇文章解析OpenAI之战背后真正的“看不见的手”——中国金融学会42位华人的一周受Sora影响——颜庆旺一句话 OpenAI资讯——维基百科 查看同类文章:新鲜科技解读更多精彩内容:大国铸就中国品牌插画理念。
版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。
标签:
相关文章
05-27
05-17
05-27
05-27
05-16
05-18
最新文章
马斯克:特斯拉或将重新接受比特币支付
售价34800元起,力帆320-620雪地版车展上市
Orange Kit AMG CLA 45 S Edition 1 官照
视觉变化是全新国产马自达3 Star试驾重点
四款国四新品发布,福田奥铃勒芒赛事启动
魅力后轮驱动改装斯巴鲁BRZ-丰田86-FR-S
预售人民币18万元起,领克07 EM-P将于5月17日上市
奔驰CLS概念车官方形象亮相北京车展