热点资讯
丝袜美腿qvod 中国工程院院士郑纬民:捏续优化数据存储结构
发布日期:2024-09-07 12:18 点击次数:175
郑纬民
◎记者 宋薇萍丝袜美腿qvod
近日,在2024 Inclusion·外滩大会上,中国工程院院士、清华大学计较机科学与技巧系西宾郑纬民汲取上海证券报记者专访默示,东谈主工智能将对经济发展和东谈主民生流水平提升发达着越来越大的作用。东谈主工智能发展离不开三个因素,分裂是数据、算法、算力。算力扩容,除加强基础纪律诞生外,还应该千方百计扩大存储。建议东谈主工智能企业通过不休优化数据存储结构应答算力挑战。
郑纬民觉得,大模子需要大算力,也需要大存储,但相应会导致大资本,“大模子人命周期的每一个才调齐与存储系统相干。散布式技巧又存在于大模子人命周期的每一环,建议优化里面存储结构,向存储要算力”。
阿朱 勾引郑纬民分析称,比如在数据得到阶段,大模子检察需要网罗海量多模态小文献,任一模态的数据集包含多达数亿至数百亿小文献,对文献系统元数据管束建议挑战。在数据处理阶段,陆续、随即的小样本读取等海量数据处理也对底层大数据处理框架建议挑战。模子检察阶段,检察点文献读写对存储系统读写建议挑战。在模子推理阶段,模子参数和中间遵循KVCache对内存系统容量和传输速率建议挑战,中间遵循KVCache每每要占据更多存储空间。
“何如花更少的资金诞生更雄伟的基础纪律,得志更大的阛阓需求?东谈主工智能企业不要一味追求硬件扩容,应在软件优化上寻求处置决策。”郑纬民说。
他建议,大模子企业在推理经过中,应试虑为历史中间遵循KVCache特意诞生高容量、高宽带的存储系统,保留中间遵循,以便叠加诓骗,检朴算力。“以大模子赞助读论文场景为例,当不同用户对统一篇论文进行发问,唯有能将分享的可复用的部分保存下来屡次复用,就不错大幅缩小算力支出。”郑纬民说。
海量资讯、精确解读,尽在新浪财经APP牵扯裁剪:江钰涵 丝袜美腿qvod