设为首页
收藏本站
注册账号
登录
|
搜索
搜索
本版
文章
帖子
用户
门户
Portal
论坛
BBS
网赚问答
科教问答
平面设计
网站制作
软件开发
网络运维
网教网
»
论坛
›
网教网
›
网络运维
›
EMR 重磅发布智能运维诊断系统(EMR Doctor)——开源大 . ...
返回列表
发新帖
查看:
114
|
回复:
1
EMR 重磅发布智能运维诊断系统(EMR Doctor)——开源大 ...
[复制链接]
殞歿恒乩瞳
殞歿恒乩瞳
当前离线
积分
10
1
主题
5
帖子
10
积分
新手上路
新手上路, 积分 10, 距离下一级还需 40 积分
新手上路, 积分 10, 距离下一级还需 40 积分
积分
10
发消息
发表于 2022-9-21 14:57:17
|
显示全部楼层
|
阅读模式
大数据运维的挑战—如何保证集群稳定与运行效率
企业级大数据集群通常拥有海量的数据存储、日常运算成干上万的计算任务,需要满足各类上层业务的计算需求。对于这类集群的运维往往充满着挑战:海量的数据、庞杂的组件以及组件之间复杂的依赖关系、对于时效要求的的运算任务,都会提升运维难度。作为支撑平台,大数据集群的稳定性和运行效率,会直接影响到公司业务的正常运作和发展。
集群管理员往往对整体集群做好了监控运维体系,对于大数据集群,简单的监控运维体系能够帮助管理员在遇到故障的时候定位问题。但对于整体集群的运行效率,集群的状态,通过单纯的监控指标很难给出一个全面的解答。
对于大数据集群,管理员以及 CIO 等更关注以下的内容:
集群内的节点的运行状态和资源使用状况;
运行在集群上的服务组件的状态监控和异常处理,包括 YARN、HDFS、Hive 和 Spark 等;
计算任务运行情况和执行效率;
整体集群的健康程度和如何改进。
面对运维挑战,EMR重磅推出:智能运维诊断系统(EMR Doctor)
为了提升大数据集群运维效率,辅助 EMR 用户完善集群监控体系。E-MapReduce 推出面向开源大数据集群的智能运维诊断系统 E-MapReduce Doctor(简称EMR Doctor)。 EMR Doctor 作为开源大数据集群的管家,会自动每日巡检集群。集群管理员只需要定期查看健康检查报告,并且根据报告中的建议对集群做相应的优化调整,即可全局了解集群的健康状况和动态走势,并保持集群的健康度。
如何使用 EMR Doctor
进入 EMR 控制台健康检查页面。
登录 EMR on ECS 控制台
。
在顶部菜单栏处,根据实际情况选择地域和资源组。
在
集群管理
页面,单击目标集群的
集群ID
。
单击上方的
健康检查
页签。
在健康检查页面,您可以看到当前集群的健康检查报告(T+1)。健康状态列显示了该集群的健康度,您可以点击查看报告进入检查报告页面。
3.健康检查报告中包含集群计算资源的总体分析
4.健康检查报告中包含计算任务从各个维度的排名并给出任务调优建议
5.健康检查报告中包含对集群存储的总体分析,以及大小文件和冷热数据的详细分析
6.健康检查报告主要分析内容,更详细说明请参见查看健康检查状态和报告
原文链接
本文为阿里云原创内容,未经允许不得转载。
回复
使用道具
举报
怪怪怪蜀黍
怪怪怪蜀黍
当前离线
积分
9
0
主题
5
帖子
9
积分
新手上路
新手上路, 积分 9, 距离下一级还需 41 积分
新手上路, 积分 9, 距离下一级还需 41 积分
积分
9
发消息
发表于 2025-2-12 12:06:03
|
显示全部楼层
沙发位出租,有意请联系电话:13838384381
回复
使用道具
举报
返回列表
发新帖
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
本版积分规则
发表回复
回帖后跳转到最后一页
快速回复
返回顶部
返回列表