<div dir="ltr"><div>Hi John, hi all,<br></div><div><br></div><div>if an already running daemon is triggered to reload the spread.conf at runtime, it can crash if the number of daemons has changed. There can be a confusion in the internal VirtualID table. Apparently spread fetches the wrong auto generated virtual id, if some daemon is removed/added in the middle of the table at runtime. <br></div><div><br></div><div>Following steps lead to the problem:</div><div>- spread version 5.0.1<br></div><div>- No VirtualIDs are configured by us. VirtualIDs are auto-generated.<br></div><div>- All daemons are running.</div><div>- One Segment with one daemon is removed in the middle of spread.conf.</div><div>- The spread.conf is distributed to all hosts.</div><div>- spread is triggered to reload spread.conf by spmonitor r<br></div><div>- some spread daemon will abort with bad failure shown below. It is the daemon behind the removed one in the list.<br></div><div><br></div><div></div><div>Here a conflict of virtual IDs is logged:<br></div><div>2018-07-20 16:12:27 GMT Auto-generated virtual ID = '1696126475' for daemon 'host-06a'<br>2018-07-20 16:12:27 GMT The virtual ID '1696126475' of 'host-06a' is already in use by 'host-52'!  You will probably need to explicitly reconfigure the daemons' virtual IDs so that they don't conflict.<br><br>One of the spread daemons complaining after reload:<br>2018-07-25 14:43:04 GMT Hash value for this configuration is: 4055467701<br>2018-07-25 14:43:04 GMT Finished configuration file.<br>2018-07-25 14:43:04 GMT Conf_load_conf_file: My name: 
host-05a, id: 3524380600, addr: 1.2.3.5, port: 9876<br>2018-07-25 14:43:04 GMT Conf_reload_initiate: daemon identity mapped to two different old daemons: name '
host-06a' -> 0x7f57eccd8800, id '2876338096' -> 0x7f57eccd8208! Partitioning to singleton!<br>2018-07-25 14:43:04 GMT Conf_reload_initiate: Return need_singleton = 1<br><br>One other spread daemon crashing after reload because of virtual ID chaos:<br>2018-07-25 14:43:04 GMT Hash value for this configuration is: 4055467701<br>2018-07-25 14:43:04 GMT Finished configuration file.<br>2018-07-25 14:43:04 GMT Conf_load_conf_file: My name: 
host-06a, id: 2876338096, addr: 1.2.3.7, port: 9876<br>2018-07-25 14:43:04 GMT Conf_reload_initiate: My daemon parameters have changed! Exiting!<br>2018-07-25 14:43:04 GMT     Old: name 'host-06a', addr [1.2.3.7]:7654, id '1696126475', num_ifs 1<br>2018-07-25 14:43:04 GMT     New: name 'host-06a', addr [1.2.3.7]:7654, id '2876338096', num_ifs 1<br>Exit caused by Alarm!<br></div><div><br></div><div>Workaround:</div><div>- Configure a unique VirtualID in spread.conf explicitly for each daemon is a solution, because this configuration is always reloaded including configured virtualID.</div><div><br></div><div>Maybe the virtualID table in memory has to be cleared before the parser is loading the spread.conf a second time.</div><div>The auto-generation of virtualID is done only if the found virtualID is zero. This is not true for a reload.</div><div><br></div><div>No, I think this is not a problem of the internal hash algorithm delivering ambiguous hashes.<br></div><div><br></div><div>Currently we have no fix for that bug, because the workaround is good enough for us.</div><div><br></div><div>Best regards,</div><div>Martin</div><div><br></div></div>