您所在的位置: 需求库 技术需求 一种hadoop集群的自动部署的技术需求

一种hadoop集群的自动部署的技术需求

发布时间: 2023-01-30
来源: 科技服务团
截止日期:2024-01-30

价格 双方协商

地区: 广东省 深圳市 南山区

需求方: 中国***究院

行业领域

电子信息技术

需求背景

Hadoop是一个分布式系统基础架构,用户可以在不了解分布式底层细节的情况下,开发分布式程序,充分利用集群的威力高速运算和存储Aadoop实现了一个分布式文件系统(Hadoop Distributed FileSystem),简称HDFSc3HDFS有着高容错性的特点,并且设计用来部署在低廉的硬件上。

目前,hadoop集群采用手动配置,步骤繁琐,效率低下,而且容易出错。特别是在大规模数据中心环境下,无法进行系统动态扩容和收缩等弹性管理。所以,实现hadoop自动配置自动部署是急需解决的问题。当前可实现hadoop自动部署的典型系统有Mesos Jesos是一个分布式环境的资源管理平台,它使得Hadoop、MP1、Spark作业在统一资源管理环境下执行。Mesos通过Framework(框架)来对hadoop系统进行管理。Framework表示的是一种分布式计算框架。Hadoop使用者通过Job Client提交了作业之后,交由Job Tracker通过心跳信息与Task Tracker进行任务分配,在Job Tracker中会由TaskScheduIer分配task到具体的Task Tracker执行,在选择哪个TaskTracker去执行的过程中,Mesos不参与,完全由Hadoop自己的主节点-从节点的框架来做,只是在申请资源的过程中,会通过其中Mesos提供的分配资源模块进行资源的请求,Mesos资源分配模块,会根据当前分布式系统中资源的使用情况,适时地将作业下放到对应TaskTracker所在节点。与此同时,Mesos系统具有以下缺点;Mesos实现hadoop的相关接口通过SWIG封装成Java对象。

需解决的主要技术难题

此技术需解决:

1.框架过于复杂,要想支持其它计算框架,不仅需要对于Mesos源码十分熟悉,而且还要对另外的计算框架非常精通,这明显增加了很大的人力成本

2.要对hadoop的源代码进行改动,增加了开发运维成本

***对于资源的管理还不够成熟,从节点资源信息只有Mem大小和CPU的个数,管理力度过于粗糙

***没有对程序有效地监控机制,不能实时地获得程序的运行状态

期望实现的主要技术目标

a 该系统的框架结构简单,维护成本低

b 使hadoop集群的自动部署和回收得以实现,并且能动态监测程序的运行

需求解析

解析单位:天津市滨海新区 解析时间:2023-02-06

吴正斌

天津中科先进技术产业有限公司

总经理

综合评价

这个企业已经有一定的基础,建议与相关学会组织搭建平台,请学会以及研究所、大学和相关企业参与,可能会攻克难关,会对我们国家甚至世界所存在问题提出解决的措施并做出贡献,前途可期。
查看更多>
更多

处理进度

  1. 提交需求
    2023-01-30 14:52:52
  2. 确认需求
    2023-02-06 10:11:55
  3. 需求服务
    2023-02-14 21:09:08
  4. 需求签约
  5. 需求完成