2023年《麻省理工科技评论》“35岁以下科技创新35人”中国区发布将来到上海。本次论坛我们聚焦「Infinitas 未来无限」,我们将搭建一个展现“青年人”智慧与潜力的舞台,聚集全球创新人才和资源,让更多人见证他们不懈的探索和追求,让一点火苗点燃他们无穷的创造力。让上海与我们共同见证这片广阔无垠的舞台上,追梦者们绽放出耀眼的光芒。

以下是生数科技联合创始人兼首席技术官鲍凡在2024中国科技青年论坛暨《麻省理工科技评论》“35岁以下科技创新35人”中国区发布仪式精彩讲话,由云现场整理。
大家下午好!很高兴见到各位老师和各位嘉宾,今天在这里和大家分享一下我在生成式AI的一些创新实践。
大家都能非常明显感受到最近生成式AI对我们生活的一些冲击,去年年初从ChatGPT开始到今年年初的Sora,可以感受到生成式AI的快速发展,十年前我们用那些人工智能对话的时候,它还是一个人工智障,但现在确实我们能够实打实的感受到里面的智能,它能够写程序、写讲稿、扮演角色对话,甚至最近那种生成长时长非常逼真的视频,现在人工智能都可以做到这些事情。
我们在生成式AI上也做了相当多积累,涉及到底层理论、加速推理网络架构、大规模训练等全战略领域。2021年左右,我们就开始布局以扩散模型为代表的生成式AI,当时也做出了一系列具有国际影响力的成果。比如说扩散模型上的采样算法,当时也入选了()奖,包括后面的UBIT网络架构,它也是首个扩散模型和transformer模型架构,奠定了后面多模态的扩散模型基础。
2023年初,我们基于UBIT架构去完成了首个扩散的多模态大模型的大规模可扩展性验证,可以在一个模型里完成文生图、图生文任务。在今年的4月份,我们继续基于UBIT网络架构做了国内首个视频的大模型Vidu。
Vidu可以带给一系列的行业想象力,它相比过去的那些视频生成模型,有next level的提升,可以看到它的逼真性和动态性。未来它作为最基础的工具属性,它能够赋能饮食行业,它也可以带来一些额外的娱乐属性,提供一些新的情绪价值,甚至更广泛的话,它也有作为世界模型的潜力,因为它确实能建模各种各样的物理规律,也是通过AGVI的潜在路径。
关于什么可以称之为改变世界,我认为需要在一个宏观的层面上给人类群体带来一些正向的变化。比如说ChatGPT结合证明检查器是可以给数学家群体的工作模式带来极大变化,从靠个人能力单兵作战变成靠群体共同开发,像这种群体性的变化,我认为可以称之为改变世界。
我的工作从最基本的对影视从业者群体带来的变化,到娱乐生活、社会生产力的潜力,带来一些变化。欧几里得的《几何原本》给人类带来了纯粹理性,在改变人类生产范式()在改变人类信息的沟通模式上,互联网给信息流动带来数量级的提升。感谢各位,非常荣幸能和大家分享我自己的一些见解。