协同推进开源大模型质量跃升

0次浏览     发布时间:2025-04-14 06:39:00    

今年以来开源大模型赛道的发展成效,标志着我国在这一领域正处于从“追随者”到“引领者”的跨越式发展阶段。

近些年,我国在开源大模型领域的技术突飞猛进,生态规模迅速扩大,涌现出诸多优秀的开源项目,在应用性能方面逐渐赶上国际前沿大模型,全球影响力凸显。例如,深度求索的DeepSeek系列大模型的技术指标位居全球前列;阿里的Qwen系列大模型全球下载量已突破2亿次,衍生模型数量超过10万个,超越Meta的Llama成为全球最大开源模型族群。

面对全球人工智能行业激烈竞争,我国企业注重采取差异化发展战略,着重提升产品的性价比。主要体现为:一是低成本高效能。DeepSeek的R1模型预训练费用只有557.6万美元,不到OpenAI GPT-4o模型的十分之一,推理成本也大幅降低。二是开源发展策略。与其他AI巨头形成鲜明对比,我国企业坚持全球开源共享技术策略,大部分开源大模型支持免费商用和衍生开发,有利于降低企业的研发成本,吸引大量技术开发者加入其产业生态。三是多模态融合发展。我国开源大模型注重支持跨模态信息整合,有助于提升开源大模型与其他领域的融合程度。目前,我国开源大模型已经深入千行百业,在制造业、电力、医疗、教育、金融等领域都有应用,为各行业的智能化转型提供了支持,展现出强大的赋能潜力。

也要看到,我国在算力、芯片、数据、安全等方面仍面临一定风险与挑战。比较突出的问题是,我国算力规模亟待提高,高性能AI芯片过度依赖进口。尽管目前我国算力规模已居全球第二位,但是开源大模型的算力需求呈指数级增长,未来的算力缺口将会制约我国开源大模型产业高速发展。数据规范化程度亟待提升,大模型安全治理机制滞后。开源大模型训练需要使用海量数据,但是在数据获取的便利性、数据来源的合法性、数据质量的可靠性、数据使用的安全性等方面仍然面临不小挑战,开源大模型在数据泄露与滥用、数据版权等方面的风险凸显。尽管《生成式人工智能服务管理暂行办法》已出台,但在实操中缺乏统一标准和具体指南,亟待建立行业安全治理机制。

推动开源大模型实现质量跃升,仍需各方加强协同,通过政策引导破解算力、芯片、数据、安全等方面难题,多措并举加快构建自主可控、安全可靠、全球领先的开源大模型产业,深化产研协同与国际合作,进而在全球竞争中占据更主动的地位。

构建自主算力体系,强化国际合作与标准制定。加大国产高性能芯片研发投入,支持国内企业技术攻关。推动“东数西算”工程与区域算力协同发展,注重在全国范围内统筹建设万卡级智能算力集群。我国应积极主导或参与国际开源大模型技术标准制定,通过全球开源社区等平台推广开源技术,共建全球AI治理联盟。

完善数据共享与交易机制,建立健全安全治理框架。鼓励建立行业数据库,通过区块链技术保障数据隐私与权属,探索建立“数据训练基地”模式,鼓励企业以贡献度换取数据使用权,促进数据要素的共享和交易。及时出台与人工智能相关的政策法规和指导细则,并制定细分领域人工智能应用安全指南,推广“算法备案”机制,建立第三方评测平台,动态监测模型风险。

推动产研融合与生态协作,推出商业化支持政策。支持企业、高校联合研发,推动大模型在更多产业落地见效,设立“揭榜挂帅”专项基金,推动高性能芯片、大模型性能优化等关键技术突破。鼓励大模型企业平衡好免费服务与增值服务之间的关系,建立良性循环的商业模式。推动地方政府开放公共场景,加速大模型落地应用。

(本文来源:经济日报 作者:中国社会科学院大学应用经济学院执行院长、教授、博士生导师倪红福)

最新文章