学术论文

      基于最小费用最大流的大规模资源调度方法

      Large-Scale Resource Scheduling Based on Minimum Cost Maximum Flow

      摘要:
      并行作业是大规模资源调度的研究热点.已有的研究工作通常采用队列进行资源调度建模,仅能满足局部最优解且只能适应调度目标固定不变的场景,灵活性不够.提出了一种基于最小费用最大流的大规模资源调度建模方法,将任务的资源需求和物理资源供给问题转换成最小费用最大流图的构造和求解问题.首先,选择公平性、优先级和放置约束这3种典型度量作为切入点,从资源视角映射为图的构造问题,通过改变图的结构,使其具备适应性调整能力;其次,针对图的求解时间复杂度高的问题,实现了一种增量式优化算法;最后,实验对比公平性、优先级和放置约束这3种资源调度典型系统,验证了该方法可通过按需配置,支持多种调度目标,具备灵活性.并通过实验仿真,验证了万级规模下,基于图的资源调度延迟比基于未优化图算法的资源调度延迟最多降低90%.
      Abstract:
      Concurrent job execution is a hot topic in large-scale resource scheduling research.Existing efforts employ queueing model with local optimal solution to schedule co-located tasks,thus can only fit specific requirement.Hence,how to design a single scheduler to meet diverse requirements is challenging.This paper introduces Sirius,a new framework for resource scheduling based on minimum cost maximum flow network.This new approach makes it easy to express scheduling requirements,including fairness,priority and placement constraint,on a unified way as a typical graph construction and solution problem.Meanwhile,an incremental algorithm is implemented to speed up the flow network solver,significantly reducing its runtime by 90 percent.
      作者: 陈晓旭 [1] 吴恒 [2] 吴悦文 [1] 陆志刚 [3] 张文博 [2]
      作者单位: 中国科学院软件研究所软件工程技术研究开发中心,北京 100190;计算机科学国家重点实验室(中国科学院软件研究所),北京 100190;中国科学院大学,北京 100049 中国科学院软件研究所软件工程技术研究开发中心,北京,100190 计算机科学国家重点实验室(中国科学院软件研究所),北京 100190;中国科学院大学,北京 100049
      刊 名: 软件学报 ISTICEIPKU
      Journal: Journal of Software
      年,卷(期): 2017, 28(3)
      分类号: TP316
      在线出版日期: 2017年4月11日
      基金项目: 国家重点研发计划,国家自然科学基金,国家科技支撑计划(2015BAH55F02)National Key Research and Development Plan,National Natural Science Foundation of China,National Key Technology Research and Development Program of the Ministry of Science and Technology China