春节期间,美国人工智能团队OpenAI发布“文字生成视频”大模型Sora,特别是官方公布的长达60秒未经修改的AI视频,引发业界震撼。
近日,国内已有AI团队紧急上线相关“文字生成视频”大模型,但与国外主流AI视频模型能力相仿,均无法超越Sora的水平。专家指出,AI生成视频技术仍有门槛,国内企业想弯道超车面临不小的难度。虽然发展之路任重道远,但也充满无限可能。
国内公司加速布局
Sora出手即“王炸”,AI生成视频创业公司面临巨大压力。
事实上,国内科技公司在文生视频领域早已有布局。公开信息显示,包括字节跳动、海康威视、万兴科技、拓尔思、当虹科技等视频内容相关的科技公司都在积极布局文生视频。
今年年初,字节跳动发布了一种超高清文生视频模型MagicVideo-V2。据悉,该模型输出的视频在高清度、润滑度、连贯性、文本语义还原等方面,比目前主流的文生视频模型Gen-2、StableVideoDiffusion、Pika1.0等更出色。
此前,抖音集团CEO张楠于2月7日宣布已经辞去集团CEO,将聚焦在剪映业务上。这意味着,抖音将加强对AI生图和视频产品的布局,其中文生视频自然是重中之重。
前几日,阿里云旗下魔搭社区(Model-Scope)上线文本生成视频大模型。目前由文本特征提取、文本特征到视频隐空间扩散模型、视频隐空间到视频视觉空间这3个子网络组成,整体模型参数约17亿。
国内外差距在哪里
北京社会科学院副研究员王鹏认为,尽管国内大模型近年来取得显著进展,但与OpenAI、谷歌、英伟达等公司相比,仍存在技术差距。这些公司在深度学习、自然语言处理、计算机视觉等领域拥有更深厚的技术积累和研发实力,在AIGC领域具有更强的竞争力。
专家认为,中国的人工智能发展缺的不仅是有实力的大模型,还有与之直接相关的人才和AI“三算”,即算力、算法、算据。
在算据上,国产大模型与GPT-4存在差距。在自然语言大模型中,参数是衡量一个深度学习模型复杂度和能力的重要指标。参数多,意味着模型能够处理更多的数据,学习更多的知识。国外公司在训练数据的质量和多样性方面往往占有优势,能够获取到更丰富、跨语言、跨领域的全球数据资源。而国内企业受限于数据隐私保护政策、地域性等因素,可能在数据质量和规模上面临挑战,尽管国内数据总量庞大,但在数据处理规范、标注质量等方面需要进一步提升。
有研究人员将GPT参数规模与大脑神经元做类比,GPT-3的规模与刺猬大脑类似,GPT-4拥有100万亿个参数,基本达到人类大脑的规模。
再看国产大模型,目前百度的文心一言、华为的盘古大模型参数量在千亿规模的级别,与GPT-3相近,即使是排名靠前的阿里巴巴的M6大模型,其参数规模也仍与GPT-4相差一个数量级。
在算法创新方面,虽然中国企业有显著进步,尤其在模型架构优化、知识融合、多模态学习等方面取得了一系列重要成果,但在某些核心技术突破上,如自监督学习机制、模型并行和数据并行优化技术等方面,国外研究团队仍保持一定的领先优势。
算力,同样是AI的核心竞争要素,核心的核心是芯片。在当前的AI芯片领域竞争中,英伟达凭借其卓越的技术优势占据主导地位,推出的A100与H100GPU是数据中心领域无可争议的性能翘楚。
ChatGPT在训练阶段就采用了英伟达顶级配置的A100芯片。然而,在中美科技竞赛背景下,美国已对A100和H100向中国实施出口限制,迫使中国厂商不得不采用性能受限的阉割版A800芯片,该芯片的数据传输速率较原版降低了30%,这无疑削弱了AI集群的训练效率和整体表现。
尽管国产优秀芯片正在逐步发展,能够为大模型预训练提供一定算力支持,但与国际领先水平之间仍存在显著差距。投身人工智能行业不仅需要巨额的前期研发投入,确保企业具备雄厚的资金实力,而且必须掌握世界顶尖的研发技术能力。
“国内企业要迎头赶上,需要在技术研发、人才培养和市场洞察上下功夫,同时还要考虑到国内外市场的差异性和合规性问题。”人工智能行业天使投资人郭涛认为,国内AI企业不妨与成熟技术团队建立战略合作,共享技术资源,针对国内市场需求,进行产品和应用创新,实现弯道超车。
中国的优势与前景
从去年爆火的ChatGPT到今年的Sora,我们可以体会到当前这一波AI技术的发展势头更为迅猛,迭代速度达到了前所未有的三个月至半年为一个周期。专家认为,这是科技领域一种显著的进化现象,它正以前所未有的力量推动着社会进步的步伐。
那么,把握机遇的关键节点在哪里呢?
专家表示,对于中国来说,必须在相对不利的环境中紧紧咬住世界前沿技术,并在有可能的情况下,在人工智能的一些局部领域集中发力。同时,要不断进行具体政策的调整优化,鼓励和加速人工智能技术在中国的落地应用,让我国人口众多、市场巨大的优势再次得到充分发挥。
虽然发达国家在人工智能领域领先,但中国的人工智能发展得益于其庞大的市场、丰富的数据和政府的积极支持。
在中国,人工智能已经成为国家战略的一部分。政府、企业和学术界共同努力,推动人工智能的研究和应用。人工智能市场呈现出爆发式增长,从智能家居到无人驾驶,从金融科技到医疗健康,人工智能已经渗透到社会的各个角落。庞大的市场需求和数据资源为中国人工智能的发展提供了有力支撑。
但与此同时,中国也面临着人才短缺、技术创新能力不足、数据安全等问题。这需要在发展人工智能的同时,加强国际合作,吸取外部经验,培养自己的人才和技术创新能力。
全球人工智能的发展正处于一个关键时刻。技术、资本、人才、数据等要素正成为各国竞相争夺的重要资源。在这个过程中,各国都需要找到自己的优势和特色,构建自己的人工智能生态,实现人工智能的可持续发展。
在这个大背景下,中国有其独特的优势和机遇。庞大的市场、丰富的数据、政府的支持和人民的创造力都将成为中国人工智能发展的重要动力。通过加强国际合作,提升自我创新能力,中国有望在全球人工智能的竞赛中占据一席之地。虽然发展之路任重道远,但也充满无限可能。未来的中国大模型不仅要解决“从无到有”的问题,更要致力于“从有到优”,最终成为引领全球人工智能创新浪潮的核心驱动力之一。
在过去的一年里,我们看到的MaaS、AIAgent、多模态、开源、参数比拼、行业模型……这些关键词背后对应的是对工业世界的改变和中国产业数字化转型的加速推动,我们有理由相信,在2024年,国内大模型在技术上的突破之外,也会出现更多向下的产业兼容和产业实践案例,作为新质生产力推动产业数字化转型的航船加速前进。
本报综合报道
内容来源:亦城时报