storm进程正常运行一段时间shut down,运维方式

2019-03-02 23:40|来源: 网路

storm启动一段时间后,无征兆的停止了,然后nimbus,supervisor,ui所有的worker都stop了。

我用的storm是0.8.2版本的

 

nimbus中留下的log如下

2014-02-19 17:05:35 nimbus [INFO] Shutting down master
2014-02-19 17:05:35 ClientCnxn [INFO] EventThread shut down
2014-02-19 17:05:35 ZooKeeper [INFO] Session: 0x14395fa892b0032 closed
2014-02-19 17:05:35 nimbus [INFO] Shut down master

 

看到storm作者的wiki Fault-tolerance 

中间有一句话:the Nimbus and Supervisor daemons must be run under supervision using a tool like daemontools or monit.

所以nimbus,supervisor和ui进程都用daemontools管理起来,这样意外进程终止的时候,可以自动重启进程。

daemontools管理进程的配置可以参见之前的一个博文 daemontools管理fast-fail的zookeeper


转自:http://www.cnblogs.com/yanghuahui/p/3559139

相关问答

更多
  • 电脑 测试 运维[2023-02-04]

    我是做测试的。。我还是建议做软件测试。 网络运行维护方面的话 需要的硬件知识和局域网知识比较多。 相对于女性朋友来说。经常外出维护是件很痛苦的是。 至于测试。。 测试上手很简单。 但是想继续深度的做下去的话 有困难。如果做得久的话可以向 需求分析方面发展。 当然 如果你的软件开发也比较猛的话 可以向白盒测试发展。但是网络运行维护我认为升值的空间不是很大。 测试方向比较适合你。 测试虽然枯燥。但是是软件发版不可缺少的部分。
  • 建议你把你平时的日常运维工作列出来。 比如拷贝文件啊,部署啊,数据库维护啊之类的工作,列个表。 然后把每个工作项都用python实现。 然后放到系统的cron里面。 这样你的python学习第一步就完成了。 第二步,把生活中经常做的事情列举出来。 比如经常上的网站,经常看的电视,经常玩儿的游戏。 可以尝试着用python 登陆常上的网站,爬取网站内容,下载拼接flv片段,做个游戏的辅助工具。 这个时候你就很有经验了,其他人会仰视你了。 第三步,去解决一个业务上的问题,不要管是否跟python搭边。 然后用你 ...
  • 1. 运维人员的要求特别严苛,因为运维人员针对不同的问题,需要不断的补充扩大自己的知识和研究范畴。 2. 在初级阶段,优秀运维人员会体现出格外出众的主动性和责任心,面对陌生的业务会主动学习和拓展自己对业务对认识和相应的知识范畴,以能够足够的胜任业务的独立维护。 3. 在逐步的发展阶段中,注重总结反省的工程师会逐渐成长为高阶运维人员,通常他们会有比较体系化的服务运维理解。也有一部分工程师由于出色的项目管理规划能力,逐渐成为项目经理。 4. 再进一步的发展,高阶的运维人员对于产品的理解将非常的透彻,因而在这种情 ...
  • 有一种同感,
  • –工作强度低不低是看各个公司的,在A公司运维的强度非常高,基本都是晚上回去还要加班做一些事情,主要原因是人比较少;而B公司的运维强度和人均的负荷成正比,这个我虽然为B服务过(以前我在一家B的供应商呆过,去过B做过一段时间),但是现在B怎么样我不太清楚;2.运维工程师工作的技术含量会不会低一些? 所以压力小一些?– 运维的工作性质主要还是维持运行的平稳和高效,工作主要有安装调试软硬件,根据不同开发项目配置服务器软件,监控等事情;相对开发来说更加偏向操作系统或数据库(这是两个方向,一般是分开招人的);而开发的偏 ...
  • linux运维是什么[2022-11-26]

    linux运维即linux运维工程师;Linux是一套免费使用和自由传播的类Unix操作系统,是一个基于POSIX和UNIX的多用户、多任务、支持多线程和多CPU的操作系统。它能运行主要的UNIX工具软件、应用程序和网络协议。它支持32位和64位硬件。Linux继承了Unix以网络为核心的设计思想,是一个性能稳定的多用户网络操作系统。   运维工程师,集合网络、系统、数据库、开发、安全工作于一身的“复合性人才”。   “运维”是指:门户网站应用运维,与其它运维如网络、系统的区别还是很大的;然后我们再对大型网 ...
  • linux运维是什么[2023-01-13]

    linux运维即linux运维工程师;Linux是一套免费使用和自由传播的类Unix操作系统,是一个基于POSIX和UNIX的多用户、多任务、支持多线程和多CPU的操作系统。它能运行主要的UNIX工具软件、应用程序和网络协议。它支持32位和64位硬件。Linux继承了Unix以网络为核心的设计思想,是一个性能稳定的多用户网络操作系统。   运维工程师,集合网络、系统、数据库、开发、安全工作于一身的“复合性人才”。   “运维”是指:门户网站应用运维,与其它运维如网络、系统的区别还是很大的;然后我们再对大型网 ...
  • 因此,如果您想在第一次运行中运行您的应用程序一段时间,则需要保留第一次运行的跟踪。 因此,您可以设置一个首选项变量,以便它可以告诉您它是否是第一次运行。 现在设置一个CountDownTimer并将其设置为运行一小时,当计时器完成时,通过调用finish()来关闭Activity。 SharedPreferences pref = getSharedPreferences("ApplicationTag", Activity.MODE_PRIVATE); if (pref.contains("FIRST_ ...
  • 您的服务不是前台服务,因此可以随时终止。 您可以使用Service.startForeground解决问题。 您还可以通过从onStartCommand返回START_REDELIVER_INTENT来onStartCommand ,然后onStartCommand将以相同的意图再次调用您的服务。 有关服务生命周期的更多信息,请查看本文档的这一部分 。 Your service isn't foreground, so it can be killed at any time. You can solve ...