<div dir="ltr">On Sat, Oct 4, 2008 at 12:00 PM, Adrian Revill <span dir="ltr">&lt;<a href="mailto:adrian.revill@shazamteam.com">adrian.revill@shazamteam.com</a>&gt;</span> wrote:<br><div class="gmail_quote"><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">
Hi,<br>
<br>
We are running spread 4.00.00 on a single segment with redhat el5, and have been experiencing a problem where one server crashes (OS), and all the spread daemons on all the other servers die.<br>
<br>
We have enabled logging on spread but do not see any reason logged, probably because spread uses a buffered logger and the buffer is not being flushed.<br>
We are also not getting any core dumps.<br>
<br>
Has anyone else seen this problem? or have any idea how to fault find?<br>
<br>
Also is there a newer version of spread?<br>
<br>
Our configuration is.<br>
<br>
Spread_Segment &nbsp;<a href="http://172.20.255.255" target="_blank">172.20.255.255</a><br>
{<br>
 &nbsp; &nbsp; &nbsp; purple9 &nbsp; &nbsp; &nbsp; &nbsp; <a href="http://172.20.0.134" target="_blank">172.20.0.134</a><br>
 &nbsp; &nbsp; &nbsp; purple10 &nbsp; &nbsp; &nbsp; &nbsp;<a href="http://172.20.0.135" target="_blank">172.20.0.135</a><br>
 &nbsp; &nbsp; &nbsp; purple11 &nbsp; &nbsp; &nbsp; &nbsp;<a href="http://172.20.0.136" target="_blank">172.20.0.136</a><br>
 &nbsp; &nbsp; &nbsp; purple12 &nbsp; &nbsp; &nbsp; &nbsp;<a href="http://172.20.0.137" target="_blank">172.20.0.137</a><br>
 &nbsp; &nbsp; &nbsp; purple13 &nbsp; &nbsp; &nbsp; &nbsp;<a href="http://172.20.0.140" target="_blank">172.20.0.140</a><br>
 &nbsp; &nbsp; &nbsp; purple14 &nbsp; &nbsp; &nbsp; &nbsp;<a href="http://172.20.0.144" target="_blank">172.20.0.144</a><br>
 &nbsp; &nbsp; &nbsp; purple15 &nbsp; &nbsp; &nbsp; &nbsp;<a href="http://172.20.0.141" target="_blank">172.20.0.141</a><br>
 &nbsp; &nbsp; &nbsp; purple16 &nbsp; &nbsp; &nbsp; &nbsp;<a href="http://172.20.0.143" target="_blank">172.20.0.143</a><br>
 &nbsp; &nbsp; &nbsp; app11 &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; <a href="http://172.20.0.130" target="_blank">172.20.0.130</a><br>
 &nbsp; &nbsp; &nbsp; app12 &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; <a href="http://172.20.0.131" target="_blank">172.20.0.131</a><br>
 &nbsp; &nbsp; &nbsp; app13 &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; <a href="http://172.20.0.142" target="_blank">172.20.0.142</a><br>
 &nbsp; &nbsp; &nbsp; wombat14 &nbsp; &nbsp; &nbsp; &nbsp;<a href="http://172.20.0.145" target="_blank">172.20.0.145</a><br>
 &nbsp; &nbsp; &nbsp; app15 &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; <a href="http://172.20.0.132" target="_blank">172.20.0.132</a><br>
 &nbsp; &nbsp; &nbsp; app16 &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; <a href="http://172.20.0.133" target="_blank">172.20.0.133</a><br>
 &nbsp; &nbsp; &nbsp; webportal11 &nbsp; &nbsp; <a href="http://172.20.0.138" target="_blank">172.20.0.138</a><br>
 &nbsp; &nbsp; &nbsp; webportal12 &nbsp; &nbsp; <a href="http://172.20.0.139" target="_blank">172.20.0.139</a><br>
 &nbsp; &nbsp; &nbsp; webportal13 &nbsp; &nbsp; <a href="http://172.20.0.157" target="_blank">172.20.0.157</a><br>
 &nbsp; &nbsp; &nbsp; app20 &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; <a href="http://172.20.0.170" target="_blank">172.20.0.170</a><br>
 &nbsp; &nbsp; &nbsp; app21 &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; <a href="http://172.20.0.171" target="_blank">172.20.0.171</a><br>
 &nbsp; &nbsp; &nbsp; purple20 &nbsp; &nbsp; &nbsp; &nbsp;<a href="http://172.20.0.172" target="_blank">172.20.0.172</a><br>
 &nbsp; &nbsp; &nbsp; purple21 &nbsp; &nbsp; &nbsp; &nbsp;<a href="http://172.20.0.173" target="_blank">172.20.0.173</a><br>
 &nbsp; &nbsp; &nbsp; app30 &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; <a href="http://172.20.0.160" target="_blank">172.20.0.160</a><br>
 &nbsp; &nbsp; &nbsp; app31 &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; <a href="http://172.20.0.161" target="_blank">172.20.0.161</a><br>
 &nbsp; &nbsp; &nbsp; purple30 &nbsp; &nbsp; &nbsp; &nbsp;<a href="http://172.20.0.162" target="_blank">172.20.0.162</a><br>
 &nbsp; &nbsp; &nbsp; purple31 &nbsp; &nbsp; &nbsp; &nbsp;<a href="http://172.20.0.163" target="_blank">172.20.0.163</a><br>
 &nbsp; &nbsp; &nbsp; pws30 &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; <a href="http://172.20.0.164" target="_blank">172.20.0.164</a><br>
 &nbsp; &nbsp; &nbsp; pws31 &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; <a href="http://172.20.0.165" target="_blank">172.20.0.165</a><br>
}<br>
<br>
DaemonUser = nobody<br>
DaemonGroup = nobody<br>
RuntimeDir = /usr/spread<br>
<br>
# &nbsp; &nbsp; &nbsp; EXIT PRINT DEBUG DATA_LINK NETWORK PROTOCOL SESSION<br>
# &nbsp; &nbsp; &nbsp; CONFIGURATION MEMBERSHIP FLOW_CONTROL STATUS EVENTS<br>
# &nbsp; &nbsp; &nbsp; GROUPS MEMORY SKIPLIST ALL NONE<br>
<br>
#DebugFlags = { ALL !DATA_LINK !MEMORY !DEBUG !EVENTS }<br>
DebugFlags = { ALL !DATA_LINK !MEMORY !DEBUG !EVENTS }<br>
<br>
</blockquote><div><br>Can you paste the last 10 or so lines in the log before the crash?&nbsp; I&#39;ve seen weird memory behaviors with spread when you have members in too many groups and sending out too many messages all at once where spread will consume all memory on the host and crash with an malloc error. <br>
<br></div><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;"><br>
<br>
<br>
______________________________________________________________________<br>
This email has been scanned by the MessageLabs Email Security System.<br>
For more information please visit <a href="http://www.messagelabs.com/email" target="_blank">http://www.messagelabs.com/email</a> ______________________________________________________________________<br>
<br>
_______________________________________________<br>
Spread-users mailing list<br>
<a href="mailto:Spread-users@lists.spread.org" target="_blank">Spread-users@lists.spread.org</a><br>
<a href="http://lists.spread.org/mailman/listinfo/spread-users" target="_blank">http://lists.spread.org/mailman/listinfo/spread-users</a><br>
</blockquote></div><br><br clear="all"><br>-- <br>[ Rodrick R. Brown ] &nbsp;<br><a href="http://www.rodrickbrown.com">http://www.rodrickbrown.com</a> <a href="http://www.linkedin.com/in/rodrickbrown">http://www.linkedin.com/in/rodrickbrown</a><br>

</div>