中宏网安徽4月11日电 合肥高新区云飞路与方兴大道交会处,有一座看似平凡却蕴含无限可能的建筑——本源量子计算机组装与测试实验室。
当你走近这座建筑,透过那扇玻璃,仿佛能窥视到一个神秘而又充满活力的微观世界。
日前,中国第三代自主超导量子计算机“本源悟空”完成全球首个十亿参数大模型微调任务,为深陷“算力焦虑”的AI产业打开了新世界的大门。
全球首个量子计算机十亿级大模型微调实验是做什么的?背后有何意义?记者进行了独家解码。
科研人员在调试安装国产自主超导量子计算机。
算力围城中的量子突围
在合肥综合性国家科学中心人工智能研究院,副研究员陈昭昀坐在电脑前,点开一组实验数据:优化后的模型在心理咨询对话数据集(CPsyCountD)上训练损失降低15%,数学推理任务(R1-Distill-SFT)的严格准确率从68%提升至82%。
数据的背后,是一块不足指甲盖大小的芯片——超导量子芯片“悟空芯”,让量子计算与大模型微调技术完美结合。
那么,什么是大模型微调技术呢?不妨拿大家熟悉的DeepSeek来打个比方。
可以把通用大模型想象成一个拥有一定知识储备的万事通,但是在面对像医疗诊断、金融风控这样高度专业的场景时,它可能就有点力不从心了。
这时候,微调就像是一场专门的特训。通过在通用大模型的基础上,用特定领域的数据对它进行进一步的训练,就像是给这个万事通在特定领域进行深度辅导,让它能够更好地适应这些专业场景。
此前,安徽医科大学联合中国科学技术大学附属第一医院和健康科技企业,在合肥发布体重管理大模型智能助手“减单”,就是借助AI技术提高减重的个性化干预质量和诊疗效率。
在这个过程中,通用大模型可能已经具备了基础的医学知识,但要想让它真正成为一名“医生”,还需要通过微调来提升其在特定疾病诊断上的准确性。
与此同时,传统的低秩微调方法就像是一个虽然努力但是有点“力不从心”的学徒。
它虽然在一定程度上提高了模型的性能,却面临着性能瓶颈和泛化能力有限的“参数膨胀”难题。这就好比是一个小房子,东西越来越多,空间就越来越拥挤,效率也就越来越低了。
而量子计算的出现,为解决这些问题提供了新的思路。
以金融风控场景为例,通用大模型需处理数亿条交易数据,参数规模动辄千亿级,训练一次能耗相当于上百户家庭全年用电量。
而量子计算凭借其叠加态和纠缠态的特性,可以同时探索海量的参数组合,从而大大提升大模型微调的训练效率。
“就像给经典模型装上了量子引擎。”本源量子副总裁窦猛汉用了个形象的比喻,这样的结合可以让两者协同发力,发挥出更强大的能力。
参数瘦身术的量子密码
传统计算机在处理海量数据时,随着模型规模的增大,所需的算力也呈指数级增长,这不仅限制了大模型的应用范围,还增加了训练成本和时间,就像一个人在黑暗中摸索,效率低下且容易迷失方向。
而量子计算机则像是一群拥有超能力的人,能够在同一时间探索无数条路径,迅速找到最优解。
为此,团队创新设计了“量子加权张量混合参数微调”方法,通过量子计算特性实现智能“微调”,可以提高训练效率,减少资源消耗。
具体来说,他们将模型权重转化为量子神经网络与张量网络混合架构。
这种混合架构的优势在于,它既能通过量子门操作提取高维非线性特征,又充分利用了张量网络在参数压缩方面的优势。
这使得模型在保持高性能的同时,大大减少了参数量,从而降低了计算复杂度和存储需求。
“这是量子计算首次‘真机实战’AI大模型任务,证明现有硬件已能初步支撑大模型微调。”陈昭昀表示。
值得一提的是,在这场量子计算与AI大模型的“跨界联姻”里,“本源悟空”量子计算机无疑扮演了关键角色,堪称“最强助攻”。
作为我国目前先进的可编程、已交付超导量子计算机,“本源悟空”展现出了强大的量子计算能力。已为全球139个国家超2300万人次提供量子算力云服务,完成35万个量子运算任务,涵盖流体动力学、金融、生物医药等多个行业领域。
“本源悟空”能够让传统计算机数年才能啃下的“硬骨头”,在极短的时间内快速完成。这种高效的计算能力,使得大模型领域微调变得更加高效。
量子计算与AI的深度融合
量子计算与大模型的结合,是当前AI领域研究的热点之一。随着量子计算技术的不断发展,未来量子计算将在AI领域发挥更加重要的作用。
当下,“量子+”的化学反应正在你我身边发生。从金融风控的参数优化,到药物研发的分子模拟,量子技术正在重构产业格局。
一方面,量子计算可以提供更强大的算力支持,加速大模型的训练和优化过程;另一方面,利用量子计算的叠加态和纠缠态特性,可以设计出更加高效的量子神经网络算法,从而提高AI模型的性能和效率。
此外,量子计算还可以用于解决一些传统AI算法难以处理的问题,如组合优化、量子机器学习等。
不过,我们也要清醒地认识到,尽管量子计算在大模型微调方面已经取得了显著的成果,但这个领域仍然像是一片充满未知的海洋,还有许多挑战等待着我们去征服。
量子计算机的硬件性能就像是一个还需要不断成长的孩子,还有待进一步提升,这样才能满足更大规模、更复杂的计算需求。
而且,量子计算与AI技术的融合就像是一场刚刚开始的恋爱,还需要深入研究和探索。如何将量子计算的特性更好地融入AI模型,如何设计出更加高效的量子神经网络算法,这些都是科学家们需要攻克的难题,就像是一座座高山等待着勇敢的攀登者。(记者 王书浒 图片来源:安徽省量子计算工程研究中心)
新闻链接
合肥量子产业“十年磨一剑”
沿着合肥高新区望江西路向西,量子大道两侧聚集着本源量子等几十家量子企业,形成全国最完整的量子产业链。
在这个过程中,合肥正以“量子+”思维重构产业格局——量子通信保障金融安全、量子计算加速药物研发、量子测量提升工业精度,一幅“量子赋能未来”的画卷正在巢湖之滨徐徐展开。
如今,这里已建成中国第一条自主超导量子计算机制造链、国内首条量子芯片生产线,并上线中国第三代自主超导量子计算机“本源悟空”。
在政策支持方面,合肥市出台《量子信息产业发展规划(2020-2030年)》,全力打造“量子科技”“量子产业”双高地。
2024年,合肥高新区发布建设世界领先科技园区行动方案,提出到2035年,该区将成为全国首个以量子产业为领先标志的世界领先科技园区,基本建成“世界量子中心”。
真正的科技进步不仅是实验室里的数据,还有普通民众都能感受到的变化。
有理由相信,在不久的将来,量子计算将给我们的生活带来更多的惊喜和便利。
不妨想象一下,未来的医疗诊断更加精准,金融服务更加高效,工业生产更加智能化。
而这一切,都离不开量子计算的强大支持。