<br><div>Here is an update on the status of this issue :</div><div>  - We tried adding 1ms delay between transmissions (still fails)</div><div>  - We tried upgrading to spread 4.2.0 (still fails)</div><div><br></div><div>We will try Melissa&#39;s suggestion and do some reading.</div>
<div><br></div><div>Thanks,</div><div>##Shawn</div><div class="gmail_extra"><br><br><div class="gmail_quote">On Mon, Nov 5, 2012 at 3:33 PM, Jonathan Stanton <span dir="ltr">&lt;<a href="mailto:jonathan@spreadconcepts.com" target="_blank">jonathan@spreadconcepts.com</a>&gt;</span> wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Hello Shawn,<br>
<br>
Since you are using Spread 4.1, this may be a fixed problem. The Spread 4.2 release that came out in June has a number of fixes (especially to the Java API) which solved a number of deadlock, disconnection and crash bugs. If you can try the 4.2 release and see if that resolves the problem, or look at the changes to the Java API between 4.1 and 4.2 and merge them into the version of the Java library that you use that could help.<br>

<br>
I&#39;ve included the summary release notes below.<br>
<br>
Cheers,<br>
<br>
Jonathan<br>
<br>
The main new features of this release are:<br>
<br>
1) Added Keepalive support to client-server TCP connections. Requires correct<br>
   operating system values set for keepalives in order to be useful.<br>
2) Switch internal code to use MONOTONIC clocks when available and appropriate<br>
   to remove chance of system clock changes (from the clock being set) from affecting<br>
   message processing<br>
3) Break out events, memory, data_link and alarm code into separate<br>
   libspread-util package. This package also has a number of improvements in<br>
   the functionality of those code files which are listed in the internal<br>
   package release notes.<br>
<br>
It also includes a number of important bug fixes. The most significant include:<br>
<br>
1) Fix bug with structure size on 64 bit platforms causing crash.<br>
2) Fix several deadlock, crashes and race conditions in java Listener code.<br>
3) Fix 100 ms timeout in java socket handling code so it does not corrupt<br>
   messages that take a long time to arrive.<br>
4) Fix java disconnect bug that prevented client from reconnecting until restarted.<br>
5) Remove cause of slow message delivery when a client is receiving a lot of<br>
   messages and gets into a badger state.<br>
6) Improve help output and error messages in utility programs.<br>
7) Fix token hurry bug that caused messages to have a 2 second latency in<br>
   specific circumstances.<br>
8) Fix crash bug when new daemon configuration files are loaded while the<br>
   system is running.<br>
<br>
<br>
-------------------------------------------------------------------------------<br>
Jonathan Stanton                <a href="mailto:jonathan@spreadconcepts.com">jonathan@spreadconcepts.com</a><br>
Spread Group Messaging  <a href="http://www.spread.org" target="_blank">www.spread.org</a><br>
Spread Concepts LLC     <a href="http://www.spreadconcepts.com" target="_blank">www.spreadconcepts.com</a><br>
-------------------------------------------------------------------------------<br>
<div class="im"><br>
<br>
<br>
On Nov 5, 2012, at 3:03 PM, Shawn Bradford wrote:<br>
<br>
</div><div class="im">&gt; Hello,<br>
&gt;<br>
&gt; We are currently using spread and have found this error occurring quite<br>
&gt; frequently. Unfortunately there is little information on write() errors to<br>
&gt; be found on the net (many more read() errors).<br>
&gt;<br>
</div>&gt; *spread.SpreadException: write(): java.net.SocketException: Connection reset<br>
<div class="im">&gt; *<br>
&gt;<br>
&gt; Would someone be able to describe what would be a potential issue causing<br>
&gt; this?  I am looking for some guidance as to the source of the error (maybe<br>
&gt; from a developer) to assist in debugging the error.<br>
&gt;<br>
&gt; We have tried to write several test apps to replicate the bug but have been<br>
&gt; unsuccessful.  Our system is quite large with many moving parts and it is<br>
&gt; unclear as to what sequence of events are causing the errors.<br>
&gt;<br>
&gt; We are using spread 4.1 on 64 bit centos 5.5.<br>
&gt;<br>
&gt; Thanks in advance,<br>
&gt; ##Shawn<br>
&gt;<br>
</div>&gt; *--<br>
&gt; ------------------------------<br>
<div class="im HOEnZb">&gt; *  Director Software | Mojix Inc.<br>
&gt;  phone : <a href="tel:%2B1.562.221.3474" value="+15622213474">+1.562.221.3474</a><br>
&gt;  email : <a href="mailto:shawn.bradford@mojix.com">shawn.bradford@mojix.com</a><br>
&gt;  web : <a href="http://www.mojix.com" target="_blank">www.mojix.com</a><br>
&gt;<br>
&gt; Unless expressly identified to the contrary herein, this email and any<br>
&gt; attachments contain  and constitute confidential and  proprietary<br>
&gt; material  and information for the sole use of the intended recipient. If<br>
&gt; you are not the intended recipient or otherwise received this e-mail in<br>
&gt; error, please (i) immediately delete this email and any attachments, print<br>
&gt; outs and copies of the foregoing and (ii) please notify me immediately by<br>
&gt; responding to this e-mail message.<br>
&gt;<br>
</div><div class="HOEnZb"><div class="h5">&gt; *<br>
&gt; _______________________________________________<br>
&gt; Spread-users mailing list<br>
&gt; <a href="mailto:Spread-users@lists.spread.org">Spread-users@lists.spread.org</a><br>
&gt; <a href="http://lists.spread.org/mailman/listinfo/spread-users" target="_blank">http://lists.spread.org/mailman/listinfo/spread-users</a><br>
<br>
</div></div></blockquote></div><br></div>