AI奇点说
《AI奇点说》直播栏目由WAIC Circle生态共建伙伴计划联合上海人工智能与元宇宙产业联盟等多方合作伙伴共同推出,旨在打造一档聚焦人工智能领域的深度对话类节目。每月2期90分钟的深度互动,邀请高校、顶级平台及企业精英人群,围绕AI轻松愉快地想象世界与产业的未来。
引言
近日,AI初创公司Suno推出了V3音乐生成模型,只需几秒就能生成2分钟动听的音乐,惊艳了全世界。在国内,各大卫视也纷纷推出AI特色作品,为观众带来了一场前所未有的娱乐盛宴。随着人工智能技术的飞速发展,具有高度传播性和用户黏性的泛娱乐产业首先迎来了前所未有的变革,核心驱动力来自于生成式人工智能(GenAI)的创新突破。
从文本、图片、视频再到音乐,AIGC一次次刷新着内容创造,带来了创作的无限可能。在这场创新浪潮中,本期《AI奇点说》聚焦泛娱乐产业,邀请多位专家共探AIGC创新应用,揭秘发展新“前景/钱景”。本文将为您呈现此次直播的精彩内容。
精彩观点
林云川
SMG技术中心主任
上海东方传媒技术有限公司总经理
上海市广播科学研究所所长
对于媒体机构或者专业机构而言,AI应用的准确性非常重要,要避免对公众造成误导。
马千里
无界AI联合创始人
不要吝啬在数据上花钱、花时间,用更好的模型才会有一个更好的未来。
胥正川
复旦大学管理学院副教授
上海市广播科学研究所所长
AI充斥于企业的各个环节、各个事物当中,从data driven转变为以AI为燃料是未来的发展趋势。
曾艳红
上海人工智能实验室青年研究员
央视听媒体大模型动画制作平台核心技术研究人员
在研究领域我们倾向于做一些更基础的事情去解决一些更基础、更本质的问题,以免被降维打击。
本文目录
1、面对新技术的到来,泛娱乐产业的哪些领域将会受益?
2、未来AIGC的产品应用创新在用户体验上还有哪些突破空间?
3、AIGC技术的商业潜力和市场前景如何?
4、AIGC作为新的生产能力将会带来哪些突破想象的商业模式创新?
1、面对新技术的到来,泛娱乐产业的哪些领域将会受益?
胥正川:
生成式AI的发展速度惊人,当前文生文有ChatGPT,文生图片有Midjourney,文生视频有Sora,文生音频有Suno,它们已经开始颠覆传统的内容生产方式。因此,第一个问题想问问大家:面对新技术的到来,泛娱乐产业的哪些领域将会受益?
曾艳红:
谈及AI带来的改变和赋能,大家都会讲到降本增效,但我认为这只是第一步,这也是当前我们正在探索的阶段。例如在《千秋诗颂》这个项目的合作中,原画部分对生成水平具有较高的要求,比如服饰需要符合朝代的史实等等,倘若按照传统的工作流程,就需要与美术进行反复的沟通,因此会造成制作周期较长的结果。我认为当下这个行业还处于生产力尚未被完全释放的阶段,因此我们希望能够运用AI技术提升整个生产效率。此外,AI技术还能够帮助我们完成一些以前无法实现的事情,在项目中,面对导演想要的一些新的风格的探索和创造,我们也能够利用AI技术帮他进行打造和生成。另外,根据我平时跟踪的一些学术研究,AI技术对于三维方面的游戏角色设计等也在产生一定的影响。
马千里:
我想说一个宏观层面的变化——AIGC带来的产量是巨大的,以图片为例,无界AI每天能够生成260万张图片,是其他图片网站的百倍左右,如此巨大规模的数量并不是因为公司自身有多厉害,而在于AIGC的产量天生就是巨大的。并且当它的质量达到一定水平之后,海量的高质量内容的产生会对内容产业带来巨大的影响。正如Gartner所预测,当我们打开各种内容平台,里面有10%-20%的内容会是由AI创造的,我认为也许明年就能实现。在微观层面,Suno的出现给音乐音频领域带来了一个突破,它已经可以创造出非常优美的歌曲,倘若你不知道它是由AI创作的,那么你一定会认为它是由人类创作的,它已经达到了图灵测试的水准。总的来说,AI在各个领域都进行了内容的生产制造,并且制造的数量越来越多、质量越来越高,我认为这是新时代的一个奇点。
林云川:
面对新技术的到来,我认为泛娱乐产业的所有领域都会受益。本质而言,AI作为一种工具,是赋能用户来进行使用的,它不仅能够带来生成内容的快捷度,而且还能激发用户的创造力,此外,它还能补充用户的结构化思维,帮助你完善表达的要点、健全表达的方式,与此同时也能带来更好的传播力。对我们媒体人而言,创造力和传播力是新质生产力的核心构成部分。在内容层面,对于生产出来的内容,大家不要忽略人生观和价值观的树立,当你选择什么内容来进行进一步的生成,你的选择恰恰是你的价值观和日常学习积累的体现。总之,AI只是辅助你的工具,想要真正提升能力还是要靠自己的学习力,不管是对于AI的学习还是对其他内容的学习,这样才能真正将其合理应用在泛娱乐产业的相关领域。
2、未来AIGC的产品应用创新在用户体验上还有哪些突破空间?
胥正川:
三位嘉宾的工作内容都和产品密切相关,能否谈一谈未来AIGC的产品创新在用户体验方面会有什么样的突破空间?会带给我们什么样的惊喜?大家可以进行展望或者评论。
马千里:
其实大家在做语言模型的时候,都希望比ChatGPT厉害,想要它在数学、逻辑等各方面表现水平更佳。但不难发现有些产品走出了另外一条路,比如豆包,它把NPC或者说把智能体做得非常究极。你会发现你往往会用两种态度来对待语言模型:当你用ChatGPT的时候,它犯一点错,你可能就会大发雷霆;但如果它是一个带着标签形象的智能体,比如说杨过、小龙女或者你的母亲,在跟它对话的时候,你在感情方面的包容性往往会更强,即使它犯错,只要不是特别夸张,在你眼中它依旧会保持比较可爱的形象。其实,我认为这也是中国人做产品的优势所在——可以把现有的技术运用到最大化,然后找出相应的场景来触达消费者,让消费者先买单,再慢慢地积累数据。那么有一天,它可能就变得和整体一样强,而且在这种特定的人文关怀方面可能会更强,不会像木讷的机器,而是让你感觉是在跟一个真实的人对话。以上只是一个案例,但整体而言,我认为到最后比拼的还是模型的整体能力,模型整体的通用型能力是一个基础。可能我们在商业化上可以做到局部领先,能够实现养活团队,但从长远上来看,还是要投入大量的算力,不要吝啬在数据上花钱、花时间,用更好的模型才会有一个更好的未来。
曾艳红:
我认为个性化也是一个可以突破的点,对于以前的生产模式,基本上是由专业的人来生产,再通过个性化的推荐来推荐给你,对于推荐的事物,大家可能会觉得不感兴趣。但是如果结合AIGC的技术,在它更加成熟并且普及面更广的前提下,未来的应用可能是个性化地制造给你的,甚至它可以照顾到每个人,毕竟是否好看是偏主观层面的概念,在此时,就可以由用户来决定自己想要什么样的内容,然后用AIGC的技术来帮助生产。
林云川:
起初大家会认为倘若AI应用不够有趣,用户就不会使用它,但在后期会发现,对于媒体机构或者专业机构而言,准确性是非常重要的。我们在做ToC和ToB端的AI应用时,发现ToB端有三个特点:第一个是准确性,大家可能都会尝试利用AI生成一个东西,比如让动物的照片“跑”起来,这时往往会出现前后脚不一致等逻辑混乱的情况,针对我们生产的东西,在准确性层面往往被提到了一个很高的高度,倘若生成的内容不准确,可能会对大家造成误导;第二个是伦理性,当我们用二次训练来提升大模型的准确度时,基本都是用以前的数据集或者以前的物料来进行训练,市面上现存的争论也比较多——你训练的数据是否是你自己的?是否具备它的可用性?有多少人会愿意把自己的脸或声音授权给人用呢……所以伦理上的要求是B端和C端的第二个不同;第三个是融合性,例如,对生产出来的大模型、图片和视频进行二次加工,这就涉及到两个层面:第一个是生产出来的图片或者模型,是否能够用于自己生产的技术标准,在这方面能够实现比较好的融入,这是技术标准的融合性。另外,我们在做的过程中其实也有两种选择,比如说是先文生成图,然后选择它的图,选择喜欢的风格,再让其生成视频,还是直接文生视频,然后再进行修改和调整呢?这也是我们在做产品的过程中不断探索的一个阶段。回到产品这个概念,我觉得应该是先更有趣,否则就没人使用,但用了之后想要专业地用,必须得更实用。
3、AIGC技术的商业潜力和市场前景如何?
胥正川:
我们前面谈到的AIGC的前景和未来展望,那我们首先要过渡到对于市场的解读,对于AIGC的商业前景和盈利性,我们应如何追求?各位有什么看法?
林云川:
其实我们现在在用的很多AI大模型都是试用,都是不收钱的,但倘若你要做一个垂域模型,你面向的这些用户不只要求有趣性,对准确性也有要求。一方面是要通过训练提升AI模型的能力,在此时会显示出它在商业层面的很多价值,不管针对泛娱乐行业还是其他行业。所以我认为垂域的模型叠加成为垂域的大模型,这是一个很有市场前景的方向。从有趣性到实用性,恰恰也就是它从一个给大家使用的工具,到付费使用的工具的一个转变, 这可能是它的一个垂域场景的商业应用。总的来说,AI的商业前景本质上就是简单的四个字——“降本增效”。
马千里:
在C端上会存在模型层和应用层之间的问题,很多时候你会发现做应用做了很长时间,结果模型层一个更新,就把应用层的功能给干掉了,也就意味着模型层把应用层给“吃”掉了,这可能源于在大模型时代,模型层会很“厚”,而应用层相对比较“薄”。但是在接触B端垂直行业问题的时候,其实模型层和应用层是合为一体的,很多时候B端业务都需要模型的训练层去介入。此外,还有一个问题是对于人的替代性,一方面它的确是把一些人给淘汰掉了,另一方面,AI让个体获得了很强的能力,个体可以通过组合AI形成一个又一个工作流,从而把老板以前的活给替代掉。以前你需要一个团队,现在一个人就足矣。
曾艳红:
倘若模型一下子更新迭代,就会给应用层带来巨大影响,因此在研究领域我们倾向于做一些更基础的事情去解决一些更基础、更本质的问题,以免被降维打击。当前大体上有两种方式,一种方式是大规模的训练,当然这是有限的机构才能做到的。另一种就是你只有有限的资源,这对我们新的研究而言也是一个挑战——如何更好地选一个课题,让它更有价值的同时又不会被降维打击、被历史遗忘呢?例如,在Sora出来后,我们也在反思:我们能做什么研究,是哪怕Sora出来也不会被降维打击的?
4、AIGC作为新的生产能力将会带来哪些突破想象的商业模式创新?
胥正川:
任何企业对于AI的运用是分几步走的,第一步一定是工具化,用它改善工作效率、实现降本增效,第二步是把这个工具变成定制化的工具,这种定制化未来会变得越来越多。企业的未来趋势是从data driven慢慢变成所谓的以AI为燃料,AI会充斥于企业的各个环节、各个事物中,然后推动整个公司的运作和发展。AIGC作为新的生产力会带来哪些商业模式创新?各位嘉宾有什么可以和大家分享的吗?
马千里:
有一个比较大的一个商业机会是肉眼可见的,倘若明年真的如Gartner所预测——AI生产内容会占到10%-20%,这其实意味着在信息流平台方面会有一个很大的迭代。在过去,信息流平台是以UGC为主的,UGC信息流平台有一个底层逻辑叫算法推荐,算法推荐的逻辑是从一个UGC的有限级里挑出一个你可能会喜欢、会购买的东西。然而在算法创造的时代、在AIGC时代,你不必去推荐一个别人可能喜欢的事物,而是可以直接创造一个别人可能喜欢的事物,你看到的这个内容是AI为你独自生产出来的,这种可能性会非常高,因为现在的AIGC已经通过了图灵测试,在音乐和视频领域,未来都会通过图灵测试,因此在那时,你无法分辨这是由AI创造的还是由人类创造的。图灵测试是第一个阶段的一个任务,我认为接下来还有一个阶段,叫“红药丸蓝药丸时刻”,这个时刻非常重要,倘若AI能够完全按照你的爱好生产你喜欢的东西,那就意味着你看到的都是你想看到的,你听到的都是你想听到的,在此阶段其实是完全沉迷的时刻,因此可能会迎来模式的变化,由于是基于算法推荐的,因此可能会用算法创造的逻辑进行迭代。
曾艳红:
还有一个可能是数据生成,我们生成模型并用它来生成数据,刚才讨论的内容大部分是泛娱乐领域的消费,其实在研究中以及一些创业公司的探索中,往往是用生成的数据再去训练模型,比如自动驾驶,它需要用大量的自动驾驶的视频来训练这个识别的模型,其中包含的一些潜在问题,比如突然出现猫或狗等一些障碍物,此类数据非常少。对该领域展开的研究也深入发展了很多,当前也有一些创业公司在做这一块事情,这可能是一个不太一样的视角。
林云川:
AIGC作为一个新的生产力,从周期角度来看,要把AIGC的产品给创造出来,此时就需要商业创新,比如我要创造和生产这个能力,在数据这方面肯定会有更多的需求,例如数据的标注、数据的训练等等,这其实是一个商业创新。此外, AIGC在生产内容之外,它通过视频来解构这个世界的能力以及再生成能力,其实是非常让人恐惧的。最后,由于我们比较偏向于内容的创造或者制作,或者是内容再利用,因此对于AIGC的新的商业创新是非常值得我们进一步展开探索的。
WAIC Circle生态共建伙伴计划
为进一步深化构建大会平台,促进行业对接与赋能,在2023世界人工智能大会启动会上,大会首次正式对外宣布启动“WAIC Circle生态共建伙伴计划”。大会邀请多方合作伙伴共同搭建多维平台,通过全年形式多样的活动载体,进一步激活大会资源,打造WAIC生态圈,促进人工智能领域的“共创、共建、共融、共治、共享、共赢”。
WAIC 2024已开启申报
扫码获取申请表或垂询
抢先预约2024不容错过的AI盛会
点击回顾WAIC 2023精彩
参考资料:
WAIC
举办地区:上海
开闭馆时间:09:00-18:00
举办地址:上海市浦东新区国展路1099号
展览面积:70000㎡
观众数量:300000
举办周期:1年1届
主办单位:世界人工智能大会