Are all systems running the same setup? Ie. same version of glibc and linux kernel? Have you compared these versions to the systems that dont crash? Was spread built from source or was it provided by your distro? <br><br><div class="gmail_quote">
On Fri, May 9, 2008 at 9:01 AM, Matt Garman &lt;<a href="mailto:matthew.garman@gmail.com">matthew.garman@gmail.com</a>&gt; wrote:<br><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">
<br>
Just some more info on the problem below.<br>
<br>
I&#39;m seeing this problem with spread <a href="http://4.0.0." target="_blank">4.0.0.</a> &nbsp;The link below, and<br>
another one I found:<br>
 &nbsp; &nbsp;<a href="http://marc.info/?l=spread-users&amp;m=107427748906439&amp;w=2" target="_blank">http://marc.info/?l=spread-users&amp;m=107427748906439&amp;w=2</a><br>
both talk about this problem with spread version 3.x.<br>
<br>
I also can&#39;t reproduce this with the spflooder -b 100000 method<br>
described in the post above.<br>
<br>
This is on CentOS 4.3, Linux kernel version 2.6.9-34.ELsmp on<br>
x86_64.<br>
<br>
This crash is pretty rare; it&#39;s happened three times on one box,<br>
once on another, and never on any of our other ~20 machines. &nbsp;The<br>
three crashes on the one box have been fairly recent though: 5-Mar,<br>
1-May and 8-May. &nbsp;We&#39;re worried that it&#39;s going to continue to<br>
increase in frequency.<br>
<br>
Thanks again,<br>
<font color="#888888">Matt<br>
</font><div><div></div><div class="Wj3C7c"><br>
On Fri, May 09, 2008 at 07:44:01AM -0500, Matt Garman wrote:<br>
&gt; We&#39;ve experienced some random spread crashes recently.<br>
&gt;<br>
&gt; In the log, we have the following message:<br>
&gt;<br>
&gt; [Thu 01 May 2008 23:01:52] Send_new_packets: created packet 16 already exist 2<br>
&gt; Exit caused by Alarm(EXIT)<br>
&gt;<br>
&gt; I found another post on this in the archives, but it doesn&#39;t help<br>
&gt; much: <a href="http://marc.info/?t=111651309700001&amp;r=1&amp;w=2" target="_blank">http://marc.info/?t=111651309700001&amp;r=1&amp;w=2</a><br>
&gt;<br>
&gt; We have modified some of the #defines for spread, but not<br>
&gt; recently---we&#39;ve been running with the same parameter set for well<br>
&gt; over a year. &nbsp;But only recently are we seeing this issue.<br>
&gt;<br>
&gt; I don&#39;t know if it&#39;s related, but I&#39;m also seeing the following in<br>
&gt; the logs:<br>
&gt;<br>
&gt; [Thu 01 May 2008 23:01:52] Prot_handle_token: BUG WORKAROUND: Too many rounds in EVS state; swallowing token; state:<br>
&gt; [Thu 01 May 2008 23:01:52] &nbsp;Aru: &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;31<br>
&gt; [Thu 01 May 2008 23:01:52] &nbsp;My_aru: &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; 31<br>
&gt; [Thu 01 May 2008 23:01:52] &nbsp;Highest_seq: &nbsp; &nbsp; &nbsp;15<br>
&gt; [Thu 01 May 2008 23:01:52] &nbsp;Highest_fifo_seq: 2<br>
&gt; [Thu 01 May 2008 23:01:52] &nbsp;Last_discarded: &nbsp; 0<br>
&gt; [Thu 01 May 2008 23:01:52] &nbsp;Last_delivered: &nbsp; 31<br>
&gt; [Thu 01 May 2008 23:01:52] &nbsp;Last_seq: &nbsp; &nbsp; &nbsp; &nbsp; 3348<br>
&gt; [Thu 01 May 2008 23:01:52] &nbsp;Token_rounds: &nbsp; &nbsp; 501<br>
&gt; [Thu 01 May 2008 23:01:52] Last Token:<br>
&gt; [Thu 01 May 2008 23:01:52] &nbsp;type: &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; 0x80040080<br>
&gt; [Thu 01 May 2008 23:01:52] &nbsp;transmiter_id: &nbsp; &nbsp;-1062683843<br>
&gt; [Thu 01 May 2008 23:01:52] &nbsp;seq: &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;0<br>
&gt; [Thu 01 May 2008 23:01:52] &nbsp;proc_id: &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;-1062683843<br>
&gt; [Thu 01 May 2008 23:01:52] &nbsp;aru: &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;31<br>
&gt; [Thu 01 May 2008 23:01:52] &nbsp;aru_last_id: &nbsp; &nbsp; &nbsp;-1062683843<br>
&gt; [Thu 01 May 2008 23:01:52] &nbsp;flow_control: &nbsp; &nbsp; 0<br>
&gt; [Thu 01 May 2008 23:01:52] &nbsp;rtr_len: &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;0<br>
&gt; [Thu 01 May 2008 23:01:52] &nbsp;conf_hash: &nbsp; &nbsp; &nbsp; &nbsp;1602235222<br>
&gt;<br>
&gt; And here is a more recent example:<br>
&gt;<br>
&gt; [Thu 08 May 2008 16:22:01] Prot_handle_token: BUG WORKAROUND: Too many rounds in EVS state; swallowing token; state:<br>
&gt; [Thu 08 May 2008 16:22:01] &nbsp;Aru: &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;42<br>
&gt; [Thu 08 May 2008 16:22:01] &nbsp;My_aru: &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; 42<br>
&gt; [Thu 08 May 2008 16:22:01] &nbsp;Highest_seq: &nbsp; &nbsp; &nbsp;33<br>
&gt; [Thu 08 May 2008 16:22:01] &nbsp;Highest_fifo_seq: 0<br>
&gt; [Thu 08 May 2008 16:22:01] &nbsp;Last_discarded: &nbsp; 0<br>
&gt; [Thu 08 May 2008 16:22:01] &nbsp;Last_delivered: &nbsp; 42<br>
&gt; [Thu 08 May 2008 16:22:01] &nbsp;Last_seq: &nbsp; &nbsp; &nbsp; &nbsp; 3366<br>
&gt; [Thu 08 May 2008 16:22:01] &nbsp;Token_rounds: &nbsp; &nbsp; 501<br>
&gt; [Thu 08 May 2008 16:22:01] Last Token:<br>
&gt; [Thu 08 May 2008 16:22:01] &nbsp;type: &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; 0x80040080<br>
&gt; [Thu 08 May 2008 16:22:01] &nbsp;transmiter_id: &nbsp; &nbsp;-1062683843<br>
&gt; [Thu 08 May 2008 16:22:01] &nbsp;seq: &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;0<br>
&gt; [Thu 08 May 2008 16:22:01] &nbsp;proc_id: &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;-1062683843<br>
&gt; [Thu 08 May 2008 16:22:01] &nbsp;aru: &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;42<br>
&gt; [Thu 08 May 2008 16:22:01] &nbsp;aru_last_id: &nbsp; &nbsp; &nbsp;-1062683843<br>
&gt; [Thu 08 May 2008 16:22:01] &nbsp;flow_control: &nbsp; &nbsp; 0<br>
&gt; [Thu 08 May 2008 16:22:01] &nbsp;rtr_len: &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;0<br>
&gt; [Thu 08 May 2008 16:22:01] &nbsp;conf_hash: &nbsp; &nbsp; &nbsp; &nbsp;-1879690443<br>
&gt;<br>
&gt; [ ... ]<br>
&gt;<br>
&gt; [Thu 08 May 2008 16:22:02] Send_new_packets: created packet 34<br>
&gt; already exist 2<br>
&gt; Exit caused by Alarm(EXIT)<br>
&gt;<br>
&gt;<br>
&gt; The &quot;BUG WORKAROUND&quot; messages occur more often, maybe two to five<br>
&gt; times a month, but they are not always correlated with a crash.<br>
&gt;<br>
&gt; Any help would be much appreciated.<br>
&gt;<br>
&gt; Thank you,<br>
&gt; Matt<br>
&gt;<br>
<br>
_______________________________________________<br>
Spread-users mailing list<br>
<a href="mailto:Spread-users@lists.spread.org">Spread-users@lists.spread.org</a><br>
<a href="http://lists.spread.org/mailman/listinfo/spread-users" target="_blank">http://lists.spread.org/mailman/listinfo/spread-users</a><br>
</div></div></blockquote></div><br><br clear="all"><br>-- <br>[ Rodrick R. Brown ] <br><a href="http://www.rodrickbrown.com">http://www.rodrickbrown.com</a> <a href="http://www.linkedin.com/in/rodrickbrown">http://www.linkedin.com/in/rodrickbrown</a>