近日,百度智能云告成点亮昆仑芯三代万卡集群,这亦然国内首个厚爱点亮的自研万卡集群。据悉,百度智能云将进一步点亮3万卡集群。这一迫害标记着百度在东说念主工智能算力领域迈出了坚实的一步开云体育,不仅为百度本身的本领发展提供了刚毅能源,也为整个中国科技界、互联网行业和AI行业带来了新的发展机遇。
万卡集群上风突显,助力算力迫害与资本优化
万卡集群的建成不仅为百度带来了刚毅的算力支捏,还鞭策了模子降本的趋势。在往时一年中,整个行业王人在悉力裁汰大模子的使用资本,而算力弥留是导致资本居高不下的热切要素之一。百度通过自研芯片和大领域集群的树立,不仅处治了本身算力供应的问题,还为整个行业提供了新的念念路和见地。
从算力上看,超大领域并行计较智力可杀青考试后果跃升,万卡集群可将千亿参数模子的考试周期大幅裁汰,知足AI原生应用快速迭代的需求。同期也能支捏更大模子与复杂任务和多模态数据,相沿Sora类应用的开导。此外,万卡集群唐突支捏多任务并发智力,通过动态资源切分,单集群可同期考试多个轻量化模子,通过通讯优化与容错机制减少算力挥霍,杀青考试资本指数级着落。
跟着国产大模子的兴起,万卡集群逐步从“单任务算力挥霍”到“集群效力最大化”过渡,通过模子优化、灵验考试率擢升、动态资源分拨等妙技,智能退换任务,将考试、微调、推理任务搀杂部署,从而擢升集群抽象应用率,裁汰单元算力资本。
百舸赋能,全处所擢升集群性能与清爽性
往时,多芯混训和激增的故障率等贫乏,成为万卡集群部署经过中的刚毅挑战。而24年9月升级的百度百舸AI异构计较平台4.0(以下简称“百舸平台”),在万卡集群的树立中证据了至关热切的作用。
领先,迫害硬件彭胀性瓶颈,如卡间互联的拓扑放肆,幸免通讯带宽成为瓶颈;同期,围绕芯片及集群功耗,基于万卡领域惯例有盘算推算功耗可达十兆瓦或更高,选定立异性散热有盘算推算,从而处治万卡集群的能效与散热问题;完善模子的漫步式考试优化,选定高效并行化任务切分计谋,考试主流开源模子的集群MFU擢升至58%;在擢升清爽性方面,提供容错与清爽性机制,幸免由于单卡故障率随领域指数高潮而酿成的万卡集群灵验性大幅着落,保险灵验考试率达到98%;终末,针对机间通讯带宽需求,树立超大领域HPN高性能收集,优化拓扑结构,从而裁汰通讯瓶颈,带宽灵验性达到90%以上。
百舸4.0构建了十万卡级别的超大领域HPN高性能收集,针对跨地域通讯中的高蔓延问题,通过优化的拓扑结构、多旅途负载平衡计谋及通讯计谋,杀青了几十公里的跨地域通讯。在通讯后果上,百舸通过先进的拥塞适度算法和集合通讯算法计谋,杀青了十足无封闭,并通过10ms级别超高精度收集监控,保险了收集的清爽性。
在多芯混训方面,百舸展现了刚毅的资源整合智力。它唐突将不同地点、不同领域的异构算力进行结伴管制,构建起多芯资源池。当业务提交使命负载时,百舸可自动进行芯片选型,依据集群剩余的芯片资源,领受性价比最高的芯片来驱动任务,从而最大化地应用集群的剩余资源,杀青高达95%的万卡多芯搀杂考试效力。
此外,在集群清爽性方面,百舸提供了全面的故障会诊妙技,唐突快速自动侦测到导致考试任务相等的节点故障。百度自研的BCCL(百度集合通讯库)唐突快速定位故障并提供自动化的容错智力,将故障复原时候从小时级裁汰到分钟级,极地面提高了集群的可靠性和可用性。
日前,花旗银行发布研报暗示开云体育,DeepSeek、百度等中国模子展现出高效和低资本上风,将有助于加快众人AI应用开导,并在众人激勉更多本领立异,鞭策2025年东说念主工智能应用的拐点。中国工程院院士、清华大学计较机系素养郑纬民也暗示,当下构开国产自主万卡系统充满挑战,但“至关热切”。