<div style="font-family: arial; font-size: 12px;"><div data-empty="true">Oddly enough, I never made changes to the original code to get that output. It is just masakari-monitor 4.0.0 as installed by pip.</div><div data-empty="true"><br></div><div data-empty="true">Here are the changes and output to that code snippit you sent:</div><div data-empty="true"><a target="_blank" href="http://paste.openstack.org/show/723924/">http://paste.openstack.org/show/723924/</a></div><div data-empty="true"><br></div><div data-empty="true">I'd like to increase the logging, but I'm not familiar with the codebase and lack more than a rudimentary knowledge of python. I've found where it seems pip installed the files for masakari-hostmonitor, but I don't know which one contains the corosync bit.</div><div data-empty="true"><br></div><hr id="previousmessagehr"><div><span><strong>From</strong>: "Patil, Tushar" <Tushar.Patil@nttdata.com><br><strong>Sent</strong>: 6/20/18 12:51 AM<br><strong>To</strong>: "torin.woltjer@granddial.com" <torin.woltjer@granddial.com><br><strong>Subject</strong>: Re: Masakari on queens</span></div><div>Hi Torin,</div><div data-empty="true"><br></div><div>Option -i is correct.</div><div data-empty="true"><br></div><div>It seems that you have modified code to log error message: "ProcessExecutionError: Unexpected error while running command."</div><div data-empty="true"><br></div><div>Could you please log 'stderr' and 'exit_code' as well in order to know the exact error you are getting?</div><div>I suspect you must be getting 124 exit code.</div><div data-empty="true"><br></div><div>This is a small program which I have created to simulate the error you are getting.</div><div><a href="http://paste.openstack.org/show/723882/" target="_blank"><a target="_blank" href="http://paste.openstack.org/show/723882/">http://paste.openstack.org/show/723882/</a></a></div><div data-empty="true"><br></div><div>Please specify interface and port as per your configuration and run the program.</div><div data-empty="true"><br></div><div>Regards,</div><div>Tushar Patil</div><div data-empty="true"><br></div><div data-empty="true"><br></div><div>________________________________________</div><div>From: Torin Woltjer</div><div>Sent: Tuesday, June 19, 2018 9:58:32 PM</div><div>To: Patil, Tushar</div><div>Subject: Re: Masakari on queens</div><div data-empty="true"><br></div><div>Thank for the reply. Tushar Patil.</div><div data-empty="true"><br></div><div>The command:</div><div>$timeout 5 tcpdump -n -c 1 -p -I vlan60 port 5405</div><div>returns:</div><div>"tcpdump: enp2s0f0: That device doesn't support monitor mode"</div><div data-empty="true"><br></div><div>The command:</div><div>(lowercase i)</div><div>$timeout 5 tcpdump -n -c 1 -p -i vlan60 port 5405</div><div>Runs fine with no errors:</div><div>"tcpdump: listening on vlan60, link-type EN10MB (Ethernet), capture size 262144 bytes"</div><div data-empty="true"><br></div><div>The in use interfaces on all of my nodes are as follows:</div><div data-empty="true"><br></div><div>enp2s0f0=192.168.114.x</div><div>enp3s0f0=bond0=vlan60,vlan101</div><div>enp3s0f1=bond0=vlan60,vlan101</div><div>vlan60=management</div><div>vlan101=provider</div><div data-empty="true"><br></div><div>From this part of handle_host.py I can't tell what is causing the command to raise exception.</div><div data-empty="true"><br></div><div>________________________________</div><div>From: "Patil, Tushar"</div><div>Sent: 6/18/18 9:10 PM</div><div>To: "openstack@lists.openstack.org" , "torin.woltjer@granddial.com"</div><div>Subject: Re: Masakari on queens</div><div>Hi Torin,</div><div data-empty="true"><br></div><div>Looking at the code, it seems it is trying to run below command as root user.</div><div data-empty="true"><br></div><div>timeout tcpdump -n -c 1 -p -I port</div><div data-empty="true"><br></div><div>where,</div><div>tcpdump_timeout -> CONF.host.tcpdump_timeout -> default value is 5 seconds</div><div>multicast_interface -> corosync_multicast_interface -> vlan60</div><div>multicast_ports-> corosync_multicast_ports -> 5405</div><div data-empty="true"><br></div><div>Unfortunately, the error message is suppressed [1] hence it's difficult to know the exact reason.</div><div>Can you please run below command on the host where you are running masakari-hostmonitor service? The error you would get after running this command would give you some hint to troubleshoot this issue further.</div><div data-empty="true"><br></div><div>$timeout 5 tcpdump -n -c 1 -p -I vlan60 port 5405</div><div data-empty="true"><br></div><div data-empty="true"><br></div><div>[1] : <a href="https://github.com/openstack/masakari-monitors/blob/cde057bc685b7bbc35f5c425f9690b01766654b2/masakarimonitors/hostmonitor/host_handler/handle_host.py#L121" target="_blank"><a target="_blank" href="https://github.com/openstack/masakari-monitors/blob/cde057bc685b7bbc35f5c425f9690b01766654b2/masakarimonitors/hostmonitor/host_handler/handle_host.py#L121">https://github.com/openstack/masakari-monitors/blob/cde057bc685b7bbc35f5c425f9690b01766654b2/masakarimonitors/hostmonitor/host_handler/handle_host.py#L121</a></a></div><div data-empty="true"><br></div><div>Regards,</div><div>Tushar Patil</div><div data-empty="true"><br></div><div data-empty="true"><br></div><div>________________________________________</div><div>From: Torin Woltjer</div><div>Sent: Tuesday, June 19, 2018 4:01:29 AM</div><div>To: Patil, Tushar; openstack@lists.openstack.org</div><div>Subject: Masakari on queens</div><div data-empty="true"><br></div><div>Hello Tushar Patil,</div><div data-empty="true"><br></div><div>I have upgraded to Openstack Queens and am trying to run Masakari version 4.0.0 . I'm curious what additional configuration is required to get this set up correctly.</div><div data-empty="true"><br></div><div>/etc/masakarimonitors/masakarimonitors.conf</div><div><a href="http://paste.openstack.org/show/723726/" target="_blank"><a target="_blank" href="http://paste.openstack.org/show/723726/">http://paste.openstack.org/show/723726/</a></a></div><div data-empty="true"><br></div><div>masakari-hostmonitor is giving me errors like:</div><div>2018-06-18 12:44:44.812 18236 ERROR masakarimonitors.hostmonitor.host_handler.handle_host [-] Corosync communication is failed.: ProcessExecutionError: Unexpected error while running command.</div><div>2018-06-18 12:45:14.895 18236 INFO masakarimonitors.hostmonitor.host_handler.handle_host [-] 'UBNTU-OSTACK-COMPUTE2' is 'online'.</div><div>2018-06-18 12:46:20.047 18236 WARNING masakarimonitors.hostmonitor.host_handler.handle_host [-] Corosync communication using 'vlan60' is failed.: ProcessExecutionError: Unexpected error while running command.</div><div data-empty="true"><br></div><div>Do you have any knowledge on this?</div><div>Disclaimer: This email and any attachments are sent in strictest confidence for the sole use of the addressee and may contain legally privileged,confidential, and proprietary data. If you are not the intended recipient,please advise the sender by replying promptly to this email and then delete and destroy this email and any attachments without any further use, copying or forwarding.</div><div>Disclaimer: This email and any attachments are sent in strictest confidence for the sole use of the addressee and may contain legally privileged,confidential, and proprietary data. If you are not the intended recipient,please advise the sender by replying promptly to this email and then delete and destroy this email and any attachments without any further use, copying or forwarding.</div></div>