摩尔线程推首款国潮游戏显卡、服务器GPU计算卡!还有中国首个元宇宙平台MTVERSE
芯东西 | 2022-11-08 07:58:55 阅读:335
发布文章
多家头部国产GPU企业的产品,已经开始接受市场的检验。作者 | 心缘编辑 | 漠影芯东西11月3日报道,刚刚,国产GPU独角兽企业摩尔线程推出了基于其自研MUSA架构的多功能GPU芯片MT-春晓,以及国潮显卡MTT S80、面向服务器的MTT S3000加速卡。同时,摩尔线程充分展示了其软硬协同的综合实力:发布兼容适配CUDA的MUSA开发者套件,sGPU 1.0云原生技术,还打造了中国首个元宇宙平台MTVERSE及众多软硬件产品,包括基于MTT S3000打造的MCCX元计算一体机等。MTT S80将在“双11”期间在京东首发开售,近期在摩尔线程官方公众号上可查询产品购买信息。摩尔线程创始人兼CEO张建中在GPU领域深耕超过15年,曾帮助世界头部芯片设计公司英伟达开拓并构建GPU在中国大陆的完整生态体系。观察到中国GPU的发展始终与国外存在差距,张建中在2020年10月创办摩尔线程。今年3月,摩尔线程首次交卷,推出基于自研第一代MUSA架构的GPU苏堤,以及基于苏堤的桌面级显卡及数据中心级产品。(4096核心!摩尔线程推首款服务器GPU产品,还有台式机显卡)如今,仅隔7个月,摩尔线程再亮多款新品,并现场演示了40多个基于其多功能GPU的丰富应用,覆盖PC游戏、AI、数字人、数字孪生、物理仿真、8K多媒体显示、云游戏、云桌面、数字办公等场景。会后,摩尔线程CEO张建中、摩尔线程CTO张钰勃与芯东西等媒体进行深入交流。
01.第二款GPU春晓来了!
首款国潮游戏显卡支持PCIe Gen5
一开场,张建中首先宣布,摩尔线程PES完美体验系统联盟不断壮大,覆盖CPU、操作系统、OEM厂商、软件服务厂商、云服务厂商以及系统软件开发商。多款现代化办公PC系统及人工智能(AI)服务器等产品获得PES认证。自今年3月推出摩尔线程首款GPU苏堤以来,苏堤光速前进,获得品高云、首都在线、天翼云、七牛云、紫光云、青云、瑞云渲染、移动云、泽塔云、华云等一众云计算伙伴的支持。中国移动、中国电信、招商****等行业用户,均率先使用摩尔线程的首款GPU苏堤。紧接着,张建中宣布推出第二款基于其自研架构MUSA的多功能GPU——MT-春晓。MT-春晓拥有4086个MUSA核心、128个张量计算核心,在1.8GHz主频下单精度浮点算力(FP32)可达14.4TFLOPS,INT8算力达到57.6TOPS。该GPU的像素填充率、纹理填充率均达到460Pixel/s,支持PCIe Gen5、GDDR6显存,显存带宽为448GB/s,视频编解码方面支持8K、AV1、H.265、H.264和32路1080P@30fps,可支撑7680 x 4320@30Hz的8K显示输出。相较“苏堤”,“春晓”的GPU四大引擎全面升级,整体性能提升在4倍左右。其中图形渲染能力方面平均提升3倍;编码能力提升4倍,解码能力提升2倍;AI计算加速平均提升4倍,物理仿真计算性能提升2.5倍;并引入了新技术支持窄带高清,节约带宽30%以上。张建中在接受采访时说,摩尔线程首款GPU苏堤的目标是与国内计算生态系统适配,第二款GPU则不仅要满足国产化需要,还希望能成为主流的GPU产品,参与国际化竞争,并更好地提升国产软件平台的用户体验。基于MT-春晓GPU,摩尔线程打造了其第一款国潮游戏显卡MTT S80。张建中说,MTT S80是国内首款支持Windows环境、DirectX图形接口以及PCIe Gen5的显卡产品,这是一款中高端显卡,配有16GB超大显存,支持业界所有的主流游戏。全球排名前二的厂商花了超过10年的时间来开发驱动程序,摩尔线程希望用更短时间,去完成看似不可能的事情。研发设计游戏显卡难度非常大,其中最难的部分在于开发Windows驱动程序。由于计算机图形的专业性非常强,一套成熟的图形驱动程序代码量和一个操作系统的代码量相当,懂得开发Windows 驱动的人才也非常稀有。因此,所有GPU公司,都会面临在短时间内开发优秀的Windows驱动程序、完美支持DirectX不同版本的巨大挑战。经过工程师的努力,今天,摩尔线程推出MUSA DirectX 1.0,已经支持20多款PC游戏,测试用例超过100万,顶住了12小时循环压力测试。MTT S80的Windows驱动目前已经内置了MUSA DirectX Driver模块,并已完成对《暗黑破坏神3》、《英雄联盟》和《穿越火线》等数十款主流游戏的适配。“路再长,走下去必能到达。”张建中谈道,摩尔线程计划在一年之内,开发出世界一流的DirectX驱动程序,去满足用户对性能的需求。其终极目标是完成DirectX完整功能研发,让它支持当前的主流游戏及和图形工作的工作站软件。摩尔线程现场演示了用MTT S80玩《暗黑破坏神3》和《极品飞车》,整个过程都很稳定流畅。当前摩尔线程正在与Unreal和Unity等游戏引擎开发商,以及腾讯游戏、网易游戏、西山居、完美世界、360游戏等国内顶尖游戏开发商展开深度合作,以便对游戏引擎和游戏产品提供更好更快的支持,使得玩家可以获得持续更新的3A级游戏体验。通过MTSS时空超分辨率技术,MTT S80支持用低分辨率原始图像重构高分辨率成像,性能超越原生分辨率渲染。此外,摩尔线程还发布了PES控制中心,允许用户管理、监控图形显卡的运行状态,可在游戏内实时显示帧率、GPU负载等信息,并可以设置分辨率、颜色、实现游戏中“一键截图”等。对游戏性能进行优化,通常需要围绕硬件、计算、访存、调度和系统等几个维度来开展,离不开研发资源和时间的投入。通过驱动软件的优化,性能可以得到大幅提升,但这需要大量时间和资源的投入,还需要和广泛的游戏开发者进行深度合作。张建中说,GPU的软件生态打造,是比产品研发还要挑战的事情,是一项长期的事业。
02.面向服务器的MTT S3000:训推一体 兼容CUDA
传统GPU叫图像处理器,最早主攻图形渲染,负责“成像”,是游戏、设计领域的主力;后来GPU在并行计算方面的“天赋”被挖掘,开始拓展边界,逐步发展成加速AI及高性能计算的一大主流算力底座。随着全社会对算力的需求持续暴涨,GPU的长期市场空间相当可观。今日发布的MT-春晓GPU,便是一款多功能计算平台,集成了视频编解码、AI训练及推理、物理仿真与科学计算等丰富的引擎。除了游戏显卡外,摩尔线程也基于MT-春晓打造了面向服务器的计算平台MTT S3000,亮点是同时兼顾AI训练和推理。这是目前GPU行业中首款支持PCIe 5.0标准的产品,可为AI推理和训练、云游戏、云渲染、视频云、数字孪生、数字内容创作等提供算力支持。面向服务器的MTT S3000包含了4096个MUSA流处理核心及128个专用张量计算核心,晶体管规模达到220亿,GPU核心频率为1.9GHz,显存位宽256bit,搭配32GB GDDR6显存。MTT S3000支持FP32、FP16、INT8等多种计算精度,其中FP32算力可达15.2TFLOPS,支持DirectX、OpenGL、Vulkan、OpenCL等主流图形和计算接口,兼容CUDA,同时支持动态弹性切分的虚拟化技术和SR-IOV隔离。摩尔线程致力于实现从算法模型到AI应用的端到端全流程覆盖,可帮助AI开发者实现从算法到应用的高效部署。AI训练方面,MTT S3000提供有庞大的预训练模型库,并支持TensorFlow、PyTorch、百度飞桨等主流AI框架,并实现了对Transformer、CNN、RNN等数十类AI模型的优化。AI推理方面,MTT S3000覆盖多种主流AI模型,并与CUDA兼容适配,可实现算法应用无缝迁移,支持已经开发好的CUDA代码。以医疗应用为例,MTT S3000的FP32高精度推理可以支持医疗领域MONAI推理框架。MTT S3000内置了AI推理引擎Tensor X,AI应用性能相比“苏堤”可平均提升4倍。OpenMMLab、潞晨科技、百度飞桨、计图、智源研究院都是MUSA AI战略合作伙伴。在GPU生态中,软件是举足轻重的存在,开发门槛很高。而要让好的软件与应用得以在GPU上发挥作用,不仅需要工程师的努力,还需广大用户和游戏爱好者的支持。为此,摩尔线程打造了MUSA软件栈,从下往上包含四大引擎的驱动程序、MUSA开发套件和应用领域开发套件,为开发者提供了多种强大的编程开发工具。其中,应用层面开发套件有各种库来满足不同行业的应用。无论是初学者还是有经验的开发者,都能使用地得心应手。MUSA与CUDA兼容适配,通过自动化工具,可以很方便地将同一段CUDA应用代码移植到MUSA上,在开发上也照顾了现有的用户习惯。从现场演示来看,MUSA上的运行结果与CUDA平台基本上完全一致。总的来说,摩尔线程今日发布的MUSA软件系列涵盖平台软件、计算加速软件,以及云计算及应用软件,并打造了开发者网站来为开发者提供全方位的技术与资源支持。云是GPU的一大应用场景。张建中说,据不完全统计,去年云端数据中心新增算力中,有90%都来自GPU。其中,容器化和虚拟化技术对于提升GPU资源利用率非常重要。为此,摩尔线程发布一系列基于摩尔线程创新性MT Mesh 2.0的GPU云原生方案。MT Mesh 2.0可根据云端中心应用负载,自动化分配GPU计算和显存资源,实现GPU算力弹性伸缩。其云原生sGPU 1.0技术可原生支持Kubernetes生态,支持GPU弹性切分调度、容器共享与安全隔离以及自动化运维,并能通过使用GPU安卓容器透传技术和渲染编码一体化技术,加速安卓云手机解决方案,减少应用延迟,增加并发路数。现场,摩尔线程进行了云桌面实机演示,通过虚拟化技术,将单个物理GPU切分成多个虚拟GPU,能够同时运行不同类型的云桌面应用,从而满足对算力资源更灵活多样化的需求。爱特云翔、百度智能云等都是摩尔线程的云桌面合作伙伴。摩尔线程还宣布将与腾讯先锋一起打造基于MUSA架构的云游戏解决方案ACX,并与蔚领时代、硅基大陆合作云游戏解决方案。
03.打造中国首个元宇宙平台元计算一体机开箱即用
元宇宙是以图形和AI计算为核心基石的集成式应用,物理引擎、渲染引擎和AI技术的发展很大程度上决定了元宇宙的应用演进步伐。张建中告诉芯东西,摩尔线程将下一代互联网视作主战场,长期研发方向是提供元宇宙计算的核心技术。元宇宙有3个关键要素:场景、内容、人,摩尔线程便围绕此打造了核心软硬件技术。今天,摩尔线程推出了中国首个元宇宙平台MTVERSE,并宣布关于面向“场景”的物理仿真引擎AlphaCore、面向“内容”的AI内容创作平台MT马良、面向“人”的DIGITALME数字人平台的一系列升级。MTVERSE元宇宙平台以摩尔线程MUSA GPU集群为算力基础,为用户提供计算基础架构及服务,包括大数据、AI训练与推理、图形渲染和物理仿真三大平台,提供从硬件集群、软件基础架构到SDK工具链的全栈式解决方案。上层的SDK工具链包含智能重建、智能理解、智能交互/仿真等工具,方便开发者调用数字人、文献理解、语音识别、视觉识别、自然语义理解、对话交互、物理仿真、AIGC内容生成等功能,缩短开发周期。同时,摩尔线程独立设计研发的多平台GPU物理仿真引擎AlphaCore升级至2.0版本。其中CatalystFX可做到实时高精度烟火仿真效果,Flood Dynamics能实现逼真的流体模拟仿真,Storm System可进行天气与云层模拟,Vera Fiber支持多物理场交互。摩尔线程宣布和多家合作伙伴一起打造元宇宙超写实场景的制作。当前摩尔线程正与光线云合作打造云原生渲染引擎RaysEngine全场景应用,可支撑超大城市数字孪生渲染、AlphaCore物理仿真深度整合、DIGITALME数字人渲染与AI驱动、8K超高清图形渲染等。张建中也感谢了摩尔线程的数字孪生合作伙伴。面向近年爆火的AI应用AIGC智能内容创作,摩尔线程在MTT S3000上研发生成了其第一个AI内容创作平台“MT马良”,支持中英文图文生成、图像超分、简笔画创作、视频生成等。摩尔线程与云南艺术学院合作,共建设计学院AI艺术创作实验室,开设MT-马良课程培养设计专业人才,制作出更好的AI内容生成作品。现场还展示了云南艺术学院用“马良”创作的艺术作品。摩尔线程DIGITALME数字人解决方案也全新升级,构建了完整的数字人生产线:MT-女娲能基于原始图片进行人脸风格编辑、3D人脸重建,并可以添加人物资产;MT-画皮可通过单路摄像头捕捉,支持数字人表情驱动;MT-随影可通过单路摄像头进行准确的动作捕捉;MT-随答是数字人对话系统,适用于智能客服、AI助手、智能座舱等场景。基于此,摩尔线程研发其第一个数字人MUSA。张建中现场与MUSA进行了流畅的问答对话。最后,摩尔线程宣布推出MCCX元宇宙一体机,通过软硬件一体化交付,为用户提供开箱即用、可满足不同场景需求的元计算算力。
04.结语:国产GPU正奋起直追,未来可期
作为智算中心建设的关键算力基础设施,GPU能够为物理世界数字化和数字世界物理化实现提供多元有效算力支撑。而要实现兼顾高刷新率、高分辨率的图形图像显示功能,在设计难度上非常有挑战性,涉及几何、像素、光照、纹理映射等大量复杂功能的设计,技术、生态壁垒森严。当前国产GPU性能和生态建设仍与国际先进水平存在差距,这是客观事实,但我们也无需妄自菲薄,自主创新不是一步登天的事,至少有一批国产GPU已经在起步的路上。前方是需求庞大的广阔市场,侧方是美国政府的围追堵截,在复杂外界环境的重压之下,无论从产业前景还是国家安全的角度来看,国产GPU的发展只会更加坚决。近两年来,包括摩尔线程在内的多家头部国产GPU企业已经陆续拿出硬件产品,并开始接受市场的检验。实力雄厚如英伟达,也曾在教育用户、培育生态的路上跋涉多年,实现全面可替代的路途依然艰辛遥远,奋起直追的国产GPU们,需被给予更多的包容与试炼的机会。
*博客内容为网友个人发布,仅代表博主个人观点,如有侵权请联系工作人员删除。