It depends on what you want to accomplish with the LM. Under most circumstances you would want to preserve the word boundary information (akin to the sentence boundary tags - <s> and </s>, which stands for the start and  end of a sentence). <div>


<br></div><div>The first format you describe (training.txt) accomplishes this by using <s> and </s> to proxy for your word boundaries. But it loses information which you might otherwise have obtained from knowledge of which words are likely to occupy which sentential slots (e.g. the is almost invariably followed by another word and hence <w> should be more likely after "the" than after, say, an arbitrary noun.) You could introduce <w> and </w> as special tokens in training2.txt, for instance.</div>


<div><div><br></div><div>&<br><br><div class="gmail_quote">On Tue, Jan 8, 2013 at 8:19 PM, Koonnoo <span dir="ltr"><<a href="mailto:dcherubangel@gmail.com" target="_blank">dcherubangel@gmail.com</a>></span> wrote:<br>


<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div dir="auto"><blockquote type="cite"><div class="gmail_extra"><font color="#000000"><span style="background-color:rgba(255,255,255,0)">Dear All</span></font><div>


<font color="#000000"><span style="background-color:rgba(255,255,255,0)">i used this tool via cygwin terminal.</span></font></div><div><font color="#000000"><span style="background-color:rgba(255,255,255,0)"><br></span></font></div>


<div><font color="#000000"><span style="background-color:rgba(255,255,255,0)">Example in training.txt<br></span></font></div><div><font color="#000000"><span style="background-color:rgba(255,255,255,0)"><br></span></font></div>


<div><font color="#000000"><span style="background-color:rgba(255,255,255,0)">s i m p l y</span></font></div><div><font color="#000000"><span style="background-color:rgba(255,255,255,0)">g o o d</span></font></div><div><font color="#000000"><span style="background-color:rgba(255,255,255,0)">t h a n k y o u</span></font></div>


<div><font color="#000000"><span style="background-color:rgba(255,255,255,0)">c l o u n d</span></font></div><div><font color="#000000"><span style="background-color:rgba(255,255,255,0)"><br></span></font></div><div><font color="#000000"><span style="background-color:rgba(255,255,255,0)">or</span></font></div>


<div><font color="#000000"><span style="background-color:rgba(255,255,255,0)">training2.txt</span></font></div><div><font color="#000000"><span style="background-color:rgba(255,255,255,0)">s i m p l y g o o d t h a n k y o u c l o u n d</span></font></div>


<div><font color="#000000"><span style="background-color:rgba(255,255,255,0)"><br></span></font></div><div><font color="#000000"><span style="background-color:rgba(255,255,255,0)"><br></span></font></div><div><font color="#000000"><span style="background-color:rgba(255,255,255,0)">which training text correct for LM built on character level? first,right? If first i can directly enter to add more line or add some symbol for add line?</span></font></div>


<div><font color="#000000"><span style="background-color:rgba(255,255,255,0)"><br></span></font></div><div><font color="#000000"><span style="background-color:rgba(255,255,255,0)">i'm not sure what is <s>and</s> mean.</span></font></div>


<div><font color="#000000"><span style="background-color:rgba(255,255,255,0)"><br></span></font></div><div><font color="#000000"><span style="background-color:rgba(255,255,255,0)">Is this command for train lm model character level (trigram)?</span></font></div>


<div><font color="#000000"><span style="background-color:rgba(255,255,255,0)">$ ngram-count -text /srilm/training.txt -order 3 -lm /srilm/training.lm<br></span></font></div><div><font color="#000000"><span style="background-color:rgba(255,255,255,0)"><br>


</span></font></div><div><font color="#000000"><span style="background-color:rgba(255,255,255,0)">My english is weak maybe i ask you more than 1 time :)</span></font></div><div><font color="#000000"><span style="background-color:rgba(255,255,255,0)">thank you in advance</span></font></div>


<div class="gmail_extra"><font color="#000000"><span style="background-color:rgba(255,255,255,0)"><br></span><br></font></div></div></blockquote></div><br>_______________________________________________<br>
SRILM-User site list<br>
<a href="mailto:SRILM-User@speech.sri.com" target="_blank">SRILM-User@speech.sri.com</a><br>
<a href="http://www.speech.sri.com/mailman/listinfo/srilm-user" target="_blank">http://www.speech.sri.com/mailman/listinfo/srilm-user</a><br></blockquote></div><br></div></div>