热线电话:
400-123-4567Openai Sora 研报机械阀门隔膜阀
Sora最佳受益者方向或是AI视频内容变现渠道:建议关注稀缺AI短剧出海标的【超讯通信】
2024年2月16日,OpenAI发布最新文生视频大模型Sora,当前最高支持生成1分钟的视频。据OpenAI官网,Sora的出发点是公司教育Al理解和模拟物理世界运动并解决现实世界交互问题。
Sora 1分钟左右视频自动生成的长度天然契合短剧时长,结合AI换脸技术有望成为短剧出海必选项。此前超讯通信投资七火山Seven Volcanoes,凭借海外上线发行及取得东南亚TOP3榜单的MiniTV平台开展视频内容新载体创造探索和短视频巨头内容AI化战略服务商等战略,而此次结合Sora发布以及AI换脸、Al图像增强等新型技术有望形成强共振。
每成为海外快手AI视频内容战略合作伙伴,超讯通信已具备短剧出海的核心先决条件。超讯通信官方微信公众号发布消息,公司投资的Seven Volcanoes(七火山)作为SnackVideo(海外快手)的AI视频内容战略合作伙伴,通过前沿Al技术,实现海量内容的本地化,将为印尼用户带来精彩的短剧内容,助力SnackVideo的平台内容生态建设。
模型强大的视频生成能力推高行业天花板,产业赋能的深度和广度有望超预期拓展。
投资建议:Sora 模型推动 AI 多模态领域飞跃式发展,AI 创作等相关领域将迎来深度变革,AI 赋能范围进一步扩大,多模态相关的训练及推理应用也将进一步提升对算力基础设施的相关需求。推荐标的:金山办公科大讯飞万兴科技虹软科技神州数码中科曙光,受益标的:苏州科达当虹科技。
OpenAI 发布首个文生视频模型 Sora,效果震撼。Sora 模型可以通过文本描述生成 60 秒长视频,还可以对视频色彩风格等要素精确理解,创造出人物表情丰富、情感生动的视频内容。目前 Sora 尚未对公众全面开放,仅邀请部分测试者进行体验,但是 OpenAI CEO 在社交平台上展示了由网友提供文本描述生成的视频案例,展现了 Sora 在视频生成方面的强大能力。
Sora 三大亮点突出,实现 AIGC 领域的里程碑式进展。首先是 60 秒长视频,Sora 可以保持视频主体与背景的高度流畅性与稳定性。其次是单视频多角度镜头,Sora 在一个视频内实现多角度镜头,分镜切换符合逻辑且十分流畅。再是理解真实世界的能力机械阀门隔膜阀,Sora 对于光影反射、运动方式、镜头移动等细节处理得十分优秀,极大地提升了真实感。
Sora 的技术基础保障了强大功能的持续迭代。Sora 是一种 Diffusion模型,同时具备良好的扩展性。Sora 使用 DALL·E 3 的 Recaption 技术,使视频可以更符合文本指令,此外还具备静图生视频、原视频拓展补帧等能力。OpenAI 表示 Sora 是构建世界模型的基础,未来将向实现 AGI 继续迈进,我们认为该模型的当前表现展现出了这种潜力
【天风海外】重磅!OpenAI发布Sora 文生视频模型,能力大幅提升,内容创作工作流有望被颠覆,下一个亿级用户的互联网平台雏形已然出现!
事件:北京时间2月16日凌晨,OpenAI发布Sora文生视频大模型,Sora可以生成长达一分钟的视频,同时保持视觉质量和遵循用户的提示。Sora能够生成包含多个字符、特定类型运动以及准确的主体和背景细节的复杂场景。
1)OpenAI的Sora文生视频模型效果:远超所有此前文生视频方案,几乎实现了两个代际的提升,接近消费者/工业生产需要。60S的内容长度远超此前文生视频的10S长度,达到了短视频的爆款长度;极度稳定的长镜头乃至多镜头;丰富稳定的物理交互。
2) 我们判断OpenAI的Sora效果远超此前的Diffusion模型的根本原因在于模拟世界物理的能力:OpenAli
为Sora作为Diffusion模型能力提升的很大来自于更多的视频作为训练集以及准确深入的语言理解能力与世界构造能力。OpenAI的白皮书尚未发布,但从研究人员来看,真正研发Sora的人员仅有三人,其它均为支持性工作,我们认为OpenAI Sora能力的大幅提升可能主要来自于三方面:1、Diffusion-Transformer架构,2、可能通过UE5、Unity、Nerf等大量生成合成数据作为训练集3、大语言模型的能力提升和对世界能力的提升。
3)目前商业化进度:OpenAI尚未公开开放Sora权限,表示Sora目前仅为研究项目的开始,CEO Altman在Twitter邀请留言生成视频展示能力,并表示OpenAI已经在和安全测试机构、电影和视频创作者合作,以改进产品。
4)未来市场展望:两干亿的短视频创作市场有望率先被颠覆。我们认为生成式AI在视频创作和世界模型的大踏步进步将实现对视频/3D/游戏等下游应用场景的渗透。在短视频、创作工具、游戏等下游领域,Sora等AI原生产品有望融入工作流,增强用户体验、降低用户使用壁垒、进一步降低创作成本,并极大拓展创作者能力边界。Sora已经踏过创造出爆款内容的时长和品质,意味着一到两年的整个行业的边界即将改变。
口投资建议:我们认为在内容创作工具,OpenAI已经和其它产业出现代际差,并带动行业大幅进展,未来一年商业化预计大幅推进。建议关注计算架构 (NVDA VRT)的需求在推理端的大幅需求提升,API/大模型推理侧的马太效应进一步增强(MSFT OpenAI)、IP类公司将小说转化为短视频能力的飞跃()电商等垂直行业用户的视频广告等商拍制作流程的大幅加速(ADBE 美图 虹软焦点科技)、以及下一代互联网创作与分享的平台雏形出现!
2024/2/16,OpenAl突然发布了文生视频模型Sora,可以在用户的要求下,生成可最高长达一分钟的视频,例如摩登女子在东京街头行走、黑人男子读书等等(详细案例可参见官网视频),在长达一分钟的视频中可以同时存在远景与近景特写,且细节翔实逼真。
实今日起,Sora 会对部分视觉艺术家、设计师和电影制作人开放,以获得关于如何改进模型的反馈意见,使其对创意专业人士最有帮助。OpenAI表示将尽早分享研究进展,以便开始与 OpenAI 以外的人员合作并获得他们的反馈,同时让公众了解人工智能的发展前景。
Sora能够生成包含多个角色、特定运动类型以及主体和背景准确细节的复杂场景。该模型不仅能理解用户在提示中提出的要求,还能理解这些事物在物理世界中是如何存在的。该模型对语言有深刻理解,因此能准确解释提示,并生成能表达生动情感的引人注目的角色。Sora还能在单个生成的视频中创建多个镜头,准确地体现角色和视觉风格。
Sora 建立在过去对 DALL-E 和 GPT 模型的研究基础之上,因此,该模型能够在生成的视频中更忠实地遵循用户的文字说明。除了能够仅根据文字说明生成视频外,该模型还能根据现有的静态图像生成视频,并准确、细致地对图像内容进行动画处理。该模型还能对现有视频进行扩展或填充缺失的帧。OpenAI今日会公布更详细的技术文档,从中我们有望获得更多技术细节。
1、OpenAI发布文生视频模型Sora,Sora可以直接输出长达60秒的视频,并且包含高度细致的背景、复杂的多角度镜头,以及富有情感的多个角色。据OpenAI官网展示的Demo机械阀门隔膜阀,Sora生成的视频一致性强于此前的Runway/Pika。但Sora目前的弱点是无法理解因果关系/难以模拟物理定律。技术原理上,Sora基于Diffusion+Transformer模型,一次性生成整个视频的长度,并逐步消除噪声完成视频转换。在一致性的保障机制上,通过一次性为模型提供多帧预测的方式,Sora确保一些物体即使镜头远离也能保持不变。Sora建立在OpenAl过去对DaLLE和GPT模型的研究基础上。
4-Turbo,并且在100万token的范围内保持了相对稳定的表现。与之对比,GPT-4 Turbo的性能则明显下降,且无法处理超过128,000 token的文本。Gemini 1.5继续强化Base Model向长上下文窗口发展的趋势,前OpenAl研究员Andrej Karpathy提到AI技术栈中,上下文窗口相当于缓存的作用。
北京时间2月15日晚间到2月16日凌晨,Google与OpenAI同一天发布新模型,全面开启2024更卷的模型之争,大模型正式进入巨头之争格局。通用人工智能AGI真的要来了吗?算力需求何时见顶?数据够用吗?
数字未来刘道明:利好算力板块、利好手握数据资源的平台公司。模型能力增强后,预计相关行业落地速度大幅加快。
电子樊志远:Al大模型不断升级,AI芯片、HBM芯片、Al服务器、光模块/光芯片及交换机等相关产业链持续受益,看好产业链重点受益公司沪电股份中际旭创新易盛天孚通信通富微电生益科技兴森科技胜宏科技。
互联网传媒陆意:看好AI工具化进步下,后续具备AI应用商业化落地可能的公司,包括天下秀华策影视中文在线掌阅科技等。
计算机孟灿:看好AI产业新变化在计算机板块的机会映射,推荐关注万兴科技、美图、海康威视大华股份萤石网络。
基础化工陈屹:看好AI材料投资机会,尤其是今年业绩能兑现的公司,建议重点关注东材科技,关注圣泉集团雅克科技。
医药袁维:重点看好人工智能应用在医疗设备、药物发现、临床诊治等领域的应用;重点公司:迈瑞医疗祥生医疗润达医疗健麾信息等
【申万传媒】OpenAI发布文生视频模型Sora,AI视频向商业化大步迈进。
Sora性能:#1)视频时长现象级扩展:可达到60秒,且并非多个3-4s视频的拼接,连贯性强;
#2)更强的一致性:物体形状、场景风格保持出色,可实现多镜头切换,不再局限于单镜头视频生成;
#3)逼真程度再上一台阶:相比PIKA、Runway,Sora生成视频在人物手部动作、面部表情、动物眨眼等高难度内容上表现大幅提升。
技术:1)将视频和图像编码成潜在代码,分解成包含时间和空间信息的Patches,利于模型训练,可类比LLM中的Token;2)语言理解:使用了DALL-E 3中的重述技术,将视觉训练数据生成高精准描述性的字幕,提高语意理解能力。
OpenAI坦言Sora目前仍存在局限性,如难以准确地模拟复杂场景的物理属性,玻璃破碎;也可能无法理解因果关系的具体实例;混淆提示的空间细节,如左右等。
我们预计AI视频对视频行业(场景包括泛娱乐、广告、新闻等等)将产生巨大影响,一方面降低视频内容生产制作门槛,另一方面创意、IP的价值会更高;同时算法、算力等技术公司也有往参与分享产业链价值。此外,UGC视频的质量将进一步提升,过去UGC视频多为15s短平快的视频,有了AI视频工具助力,一分钟以上的微电影社区指日可待。
关注有一定安全边际的公司,包括有丰富IP储备的上海电影、阅文集团华策影视;有丰富应用场景的美图、易点天下焦点科技
国内有些人的思想确实比较邪恶,反正就是不愿意承认别人的强大。从去年年初开始的这波人工智能概念,难道引领的不是人家美帝?不管从硬件还是软件上,我们都落后人家很多,这是事实。当然我们也一直在追赶,现实就是人家也一直在进步,难道又想弯道超车
今后,FAKE NEWS更逼真了。我们将从后真相时代,走向无真相时代了。
【民生计算机】Sora最佳受益者方向或是AI视频内容变现渠道:建议关注稀缺AI短剧出海标的【 超讯通信 】2024年2月16日,OpenAI发布最新文生视频大模型Sora,当前最高支持生成1分钟的视频。据OpenAI官网,Sora的出发点是公司教育Al理解和模拟物理世界运动并解决现实世界交互问题。Sora 1分...机械阀门隔膜阀机械阀门隔膜阀机械阀门隔膜阀
扫一扫关注大业微信公众帐号