收藏文章 楼主

【期刊精选】面向数据共享的模型训练服务系统

版块:IT/互联网   类型:普通   作者:小羊羔links   查看:260   回复:0   获赞:0   时间:2022-09-15 23:08:45

2022

 · 

September



面向数据共享的模型训练服务系统


作者简介


魏 宏 原 女,硕 士 研 究 生,主 要 研 究 方 向 高 性 能 计 算 。
华 蓓 女,博 士,教 授,主 要 研 究 方 向 高 性 能 计 算。
林 飞 男,硕 士 研 究 生,主 要 研 究 方 向 高 性 能 计 算。










01

论文简介


《面向数据共享的模型训练服务系统》一文发表于《》期刊2022年第2期。

数据驱动的人工智能应用需要大数据支持,然而现实中因隐私保护等原因,数据往往互不流通,而以孤岛形式存在。如何实现数据安全可用是当前亟待解决的问题。设计和实现了面向数据共享的模型训练服务系统,通过向用户提供数据功能服务接口而非数据本身,实现数据可用不可见。重点针对资源受限的数据共享平台,设计了高效的资源分配和作业调度方法,特别是通过自动资源缩放来应对多变的工作负载,达到优化用户体验和提高资源利用的目的。实验表明,相较于常规的作业调度方法,本系统在各种工作负载下都具有响应服务请求快、作业完成时间短的优点。



 2022 · September




02

主要内容



一、相关工作

本文提出面向数据共享的模型训练服务系统,允许机构 企业利用自有数据集和自有计算资源,向用户提供模型训练服务(当然机构可以向用户收费,但这不在本文讨论的范围内)。用户只需指定需要的数据集并上传自定义的模型结构(本系统主要考虑深度学习模型),系统可自动完成模型训练作业,并向用户返回训练好的模型,真正实现“数据可用不可见”。提供数据的功能性服务接口而非数据本身,对于消除数据孤岛、促进数据安全流通具有极为积极的作用。

二、实验设置

测试平台是由3台服务器组成的小型集群,服务器之间通过万兆以太网连接。一台服务器同时承担主控节点、工作节点和存储服务器的功能,配置IntelXeon Gold 6230处理器,运行Ubuntu 16.04操作系统,配有4块NVIDIA RTX2080Ti GPU卡。另外两台服务器作为工作节点,配置Intel Xeon E5-2699 v4处理器,运行CentOS 7操作系统,每台服务器配有4块NVIDIA Tesla P100 GPU卡。所有服务器部署Docker引擎,版本为1.15.3。

选取深度学习中常见的5种图像分类模型作为要训练的模型,深度学习框架为TensorFlow,数据集为TensorFlow Datasets中的dogs_and_cats和tf_flowers。预先测得这些模型在一块GPU上完成一轮(epoch)训练的用时在1~2 min。为模拟一轮训练用时较长(10 min以上)的作业,在AlexNet模型的基础上增加了数量不等的卷积层。


三、结论

本文设计与实现了基于数据共享平台的模型训练服务系统,通过在自有数据集上为用户提供模型训练服务实现数据可用不可见。系统的核心是以最小化请求响应时间和最大化资源效用为目标的一组资源分配和资源缩放策略,兼顾了用户体验和平台收益两方面因素。通过利用不同负载特性和不同作业到达密度的作业集在小型集群上进行的实验表明,与常规作业调度方法相比,本系统在服务请求时间和作业完成时间方面都有上佳的表现。可以预见,数据共享平台及模型训练服务系统的广泛应用,将极大地促进数据的安全流通和使用。



 2022 ·September



   

 




扫描上方二维码即可获取全文

期刊介绍




2022年7月,国内首本兼备网络安全和数据治理双领域的学术性期刊《》(刊号 CN10-1863/TP 正式创刊出版。该刊由中国电子主管,华北计算机系统工程研究所主办,清华大学-中国电子数据治理工程联合研究院和中国电子数字办协办。该刊聚焦网络空间安全和数据治理前沿领域最新科研动态,密切关注政产学研用各环节在网络强国和数字中国建设过程中跨学科学术成果,坚持技术与应用、产品与研发、产业与市场相结合,服务国家网络空间安全和数据治理工程建设。
《》由中国电子首席科学家、中国工程院院士方滨兴担任主编,中国电子第六研究所所长张尼和清华大学公共管理学院教授、长江学者特聘教授、清华中国电子数据治理工程研究院院长孟庆国担任副主编,数十名院士和知名专家组成专家编辑委员会。该期刊将主动开展理论研究,聚焦学术生态资源,拓展网络安全和数据治理领域基础研究,打造一流学术成果交流展示窗口;充分发挥学界专家力量,组织高水平学术会议,组织出版学术专著;坚持理论与实践相结合,服务国家网络空间安全和数据治理工程建设。
稿方式请点击下方“ ”。






小羊羔锚文本外链网站长https://seo-links.cn 
回复列表
默认   热门   正序   倒序

回复:【期刊精选】面向数据共享的模型训练服务系统

Powered by 小羊羔外链网 8.3.12

©2015 - 2024 小羊羔外链网

免费发软文外链 鄂ICP备16014738号-6

您的IP:3.19.31.73,2024-04-26 13:18:24,Processed in 0.05465 second(s).

支持原创软件,抵制盗版,共创美好明天!
头像

用户名:

粉丝数:

签名:

资料 关注 好友 消息