“十四五”时期,新发展格局为文化和旅游科技创新提供了广阔的空间和场景,新一轮科技革命和产业变革深入推进,文化和旅游科技创新集成应用、跨界协同特征进一步凸显,以云计算、物联网、人工智能、大数据等为代表的新一代信息技术为文化和旅游科技创新提供了不竭动力,正在全面提升文化和旅游运行效率和消费体验,加速推动文化和旅游发展方式变革。为助力科技全面融入文化和旅游生产和消费各环节,本届海峡两岸文博会将举办“海峡创新大会”,凭借强大的资源汲取能力,力邀海峡两岸文旅界、科技界及学者界资深专家通过主旨演讲、主题演讲、圆桌讨论等环节,共同探讨科技赋能内容生产创新、产品和业态创新、商业模式创新、治理方式创新等文旅各领域。为业界把握数字化、网络化、智能化发展带来新启示,新机遇,进而促进文化和旅游高质量发展。
以下是云从科技集团股份有限公司副总裁张立在2023数字文旅论坛的精彩致辞,由云现场整理。
大家下午好!
我是来自云从科技的张立,很感谢主办方,今天这次以主论坛的邀请作为嘉宾,跟大家分享一下云从怎么看科技和文旅产业的结合?我们有一些什么样的观点?
云从科技是一家什么样的公司?云从科技更加多的是在背后默默的提供技术支撑。我们是做视觉出身的,和很多在座的嘉宾,大家可能没有特别直接感受到云从的产品,但是当您去银行,当您去过海关、机场,当您在一个安全的城市空间里,可能您无时无刻都享受到了云从技术带来的一种服务。
云从这几年的发展,从2015年从中科院出来,到现在8年时间,我们在去年成功登陆了科创板,也是国内人工智能第一个登陆科创板的人工智能企业,也是得益于这几年国家对于人工智能产业的大力推动。
我今天的演讲主题:人机协同,开启文旅AI新时代。
为什么起这个名字?想回溯一下“人机协同”这四个字,2019年3月份,国家深改委在指导意见中,没有具体说人工智能应该和哪些产业相结合?所以在那个时候大家都在说,AI赋能百业,什么行业都可以赋能。
人工智能如何去和各行各业赋能,提出了一个方法论。分别是:第一个是数字驱动,大家现在都知道数字经济,是一个燃料,是数字引擎。第二个是人机协同,这4个字说明了人工智能不是取代人类,是服务于人类,是用设备和智能去协作于人类的生产生活,是面向人民群众能够对于幸福生活的一个追求,要去支撑这样的追求,所以提出了“人机协同”。今天大模型、ChatGPT出来之后,很多人说我要失业了,不要太担忧,技术是服务于人类的。第三个是跨界融合。当科技遇到文化,会产生什么样的化学反应?想象力有非常大的想象空间,这个想象空间,我相信今天没有人可以给它去定义这是多少千亿的规模或者是多少万亿的规模,我认为这是目前阶段都没有办法去定义这样的一个体量规模的。第四个“共创分享”,在今天人工智能时代到来的时候,通过技术去结合各行各业的所有的从业人员的智力,共创分享,能够让这件事情做得更好,能够赋能实体经济。
在2020年10月份,云从人工智能操作系统从2018年开始研发,到2020年,通过三年的研发,我们发布了云从人工智能操作系统,我们叫做“人机协同操作系统”,也叫做人机协同平台。在2023年7月24日,政治局会议开了一次会,在这次会议上,刚才说了,2019年3月份的时候,这个指导意见并没有说人工智能应该去赋能哪个行业,但是在7月24日,就是在上周,政治局会议上明确提出来,是对两个产业的赋能,非常清晰。一个是先进制造业,一个是现代服务业,非常清楚。
制造业和我们的文旅产业好像有一点距离,我们看现代服务业,我们文旅产业是不是现代服务业?一定是的,一定是现代服务业。为什么在发展了四年之后,由政治局会议上提出了这两个产业,我们看一下今年发生了什么?
在去年9月份ChatGPT3开始出来,其实业界可以看到,还没有到全国轰动的时候,但是产业界和学术界都已经有了很大的振动。到今年2月份ChatGPT出来,可以说震惊了全球的人类,也提出了很多人类未来有各种的威胁说等等。
在提出大模型时代到来的时候,它能带来什么?为什么在今年的节点上面,到了7月份我们国家提出来是对这两个产业的赋能?为什么在之前没有提出来?
可以看到制造业和现代服务业有什么样的要求?中国整个工业体系是相对完整的,整个工业基础是比较好的。当我们在看的时候,制造业的分门别类特别多,对于技术在制造业的赋能来看,研发投入非常之大,因为你每到一个制造行业,比如说我们厦门,可能有很多这样的制造业,有离散的,有连续的,光离散制造又分了很多的,有装备制造,各种机械加工的,要求都不一样。人工智能是不是可以做到一次性研发覆盖所有的制造需求?不能的。人工智能的本身体验,在AI1.0、2.0时代,体验是不好的,当你每遇到一个场景的时候,技术人都要去做研发,要做算法重新的适配、建模和试炼。
为什么现在提出来?现代服务业更多服务于人,文旅产业的核心,是由人创造的知识、文化,又服务于人类创意的产业,最终是服务于人的。服务于人之后,带来什么样的体验?刚才百度的人员一直在说沉浸式的体验,怎么加强人和环境的体验?可是在过去人工智能技术做不到这一点。
基于这一点,我们认为在今天这个大模型时代,AI2.0时代来了。当这个技术和我们的传统行业结合之后,它的共创分享在哪里,它如何去跨界,如何去把行业的和技术的知识能够在一个平台上能够共创出来,这种想象力是可以通过技术去落地的。
今天,我在前面开场讲了一下为什么云从操作系统叫做“人机协同”,并且为什么我今天站在这里受到主办方的邀请?我觉得主办方也是很有心,把主论坛定位数字和文旅的结合,今天的论坛主要和科技有关的。
这是2021年提出来的人工智能“三浪”发展阶段。现在看起来不陌生,已经一步步开始实现了。在过去发生了什么?当我们从中科院出来的时候,发现这个技术,我们是否能凭着一个单点的技术走向产业界?我们发现好像可以。所以在几年前云从被大家认知的是人脸识别,云从做了大量的人脸识别的技术,并且这些技术在国内很领先,在国际上也很领先,在全球人脸识别市场出货量云从是最大的。但是毕竟是一个单点的应用,是基于算法的应用,可是所有的单点技术都是有红利透支结束的时候。当它出现了它的盈利拐点的时候,下一步是做什么?所以就是不停的,我们说科技就是要做不停的解锁,技术的研发,才能带来技术的解锁,技术的解锁才能带来产业无限的想象力。
所以在“二浪”时代,当单点实现多点闭环的时候,可以为客户提供更多的产品和问题解决。刚才提到了,各位可能只要享受过银行的服务,一定用过云从的技术,只是不知道是云从的技术。所以在这里,我们体现出来的是,怎么把技术通过多点的系统架构变成一个个的产品和解决方案。
在2021年时候我们就提出来,什么时候可以到“三浪”?当技术平台化,软硬件解耦,强大应用生态,实现流量重构的时代就会到来。
只是没想到很快,非常快,今年这件事情发生了,在2022年,我们在科技部有一个人工智能开放平台,这个平台叫做视听交互平台,也是今天上午我们和厦门,包括文广签约的平台,落在了厦门,视听交互产业园,解决的就是如何把人和机器交互的体验技术能够落地,能够带来更多新的体验。在这里我想强调的是,在整个环境中人是不可以脱离的。也就是说我们所有的技术在落地的时候,也就是服务于人的体验和使用,解决人类的问题。
这一张图从技术角度阐述了一下,为什么AI1.0时代整个的效率和效能是做不到的?在1.0时代,每一个场景都要有一个算法,每一个场景出来,每一个问题出来,都要用算法工程师去把算法模型建起来并且做训练,大量的投入。但是到了大模型2.0时代,整个的平台化到通用性会做得非常好,在通用性非常好的情况下,在大模型暴力美学上,这是中西方文化的差异,中国学术一直也在做,只是认为那是暴力美学,为什么中国的学术界没有因为大模型而斐誉全球的时候,我相信它一定能带我去发现一个新大陆。这就是中西方文化带来的学术选择的不一样,实际上其实两边的科学家都在爬珠穆朗玛峰一样,在做不同的选择。
需要更多的大模型的技术团队去在这一块投入大量的研发,将大模型和行业相结合。中国最大的优势在于说,我们有这么多的产业可以相结合。今天我们看文旅产业,也是未来会从技术去赋能产业的同时,也带动了技术产业的提升。
可以看到技术在哪些方面提升?人工智能是在提质增效将本方面,为产业带来高效能的提升。包括生产能力的效率提升,包括知识生成的效率提升,包括新的交互方式的改变,可以把现在所有觉得做得不好的这些,包括一些智能设备,包括一些可能是IoT设备可以重新再做一遍,这就是技术带来产业的提升。
云从的大模型,是在我们人机协同操作系统里的,只是说今天我们推出的大模型载体还是我们的这个操作系统。对于产业的赋能,是逐渐在解锁的。记得最早我们当时在做人脸识别的时候,对于产业的拉动,是无限想象的。所以这也是国家在2019年提出来,一定以产业应用为目标,市场需求为导向,这才能够是技术持续发展的动力和引擎。
畅想一下在大模型时代,技术的突破是否能为我们的文旅插上更大的伊卡洛斯的翅膀?但是,你能够飞得高的同时,你那是够安全,这也是说我们在这次思考问题的时候提到的,包括这两天和很多的专家,在线下交流的时候也提到了,包括技术的伦理,技术的安全,甚至我们谈到的数字化版权等等这些,这都是未来的一些课题。但是,不管怎么说,已经阻挡不了技术对于文化产业的赋能。
云从在文旅产业做了什么?云从在文旅产业做的东西,我觉得特别没有想象力。为什么?这就是直男的科技人员看到问题,就要强化去解决那个问题。比如说我们可能和广电做了视频的解析,做了一些视频的检查等等,怎么说呢?你说有没有效率?一定有效率,一定比肉眼看更有效率。但是我觉得没有想象力。
这是我们在文旅落的吗?目前还没有。它可能是将来一个一个场景。在我来之前,给大模型给我们这个大会赋了一首诗,有一点押韵,但还是写得不够好。
海峡两岸情谊长,文化交流绽芳光。
文博盛会今开幕,共襄盛举谱华章。
闽南的南音,我也不懂,谁能够给我解释,它的历史渊源?我可以去百度查,没有问题。但是今天有了更方便的办法,我有这样一个图片分析,能够告诉我这张图片,这张艺术品的风格是什么?可以做大量的解读。可以通过一系列的视频,去解析这个视频里的各种场景,并且可以预测场景。在一个国际视觉顶会上,云从论文做到了顶会的录用,我们通过4D建模,4D是什么?4D就是时间。当你建模加上时间维度之后,会发现这是一件非常有趣的事情,将来可以做大量的预测,这种预测可以对经济进行赋能,也可以来自城市交通、城市治理,也可以来自各种可能你需要的,包括应急,包括这次的防汛,在这样大的雨,这样的情况下,是否能提前做预警,提前做仿真预测?
这里我们和文广红点在探讨工业设计。如何可以集全球之智,我们说集众智,做众创,能够让我们的设计走向全世界,全球,甚至可以快速通过3D打印等等工业化的落地形成闭环?我们也在探讨这样的可能性。
很典型的,对于做影视作品,做游戏,我们和游族网络,因为把《三体》版权买断了,所以也和游族网络做《三体》游戏大模型。
最近,我们也在和深圳日报合作,深圳市今年改革开放40周年,要写一部40周年的小说,这部小说应该来自于全深圳市民,应该来自于全深圳市民的贡献。所以我们也在做这样的公益性的活动。
这是我们提到的数字人,阮总也提到了,我们在内部不叫数字人,叫做“AI精灵”,未来我们每个人都有一个精灵。元宇宙到底是什么?元宇宙终极就是人的永生,就是你的精灵,当你出现在这个空间维度消失的时候,你会出现在另外一个空间维度。元宇宙应该是一个精灵,你现在就是一个精灵,将来也会在未来世界里成为一个精灵。
这是云从本身能力的介绍,刚才讲了这么多,云从这家公司,我们不仅来自于中科院,也是承担了很多国家人工智能相关工作的制定,包括承担了相关的人工智能平台。
我们也希望在新的技术大模型时代,AI2.0时代,大模型时代,能够和文旅的结合成就大家共同的伟大,谢谢大家!