<HTML><BODY style="word-wrap: break-word; -khtml-nbsp-mode: space; -khtml-line-break: after-white-space; ">Hello,<DIV><DIV><SPAN class="Apple-style-span" style="border-collapse: separate; border-spacing: 0px 0px; color: rgb(0, 0, 0); font-family: Helvetica; font-size: 12px; font-style: normal; font-variant: normal; font-weight: normal; letter-spacing: normal; line-height: normal; text-align: auto; -khtml-text-decorations-in-effect: none; text-indent: 0px; -apple-text-size-adjust: auto; text-transform: none; orphans: 2; white-space: normal; widows: 2; word-spacing: 0px; "><SPAN class="Apple-style-span" style="border-collapse: separate; border-spacing: 0px 0px; color: rgb(0, 0, 0); font-family: Helvetica; font-size: 12px; font-style: normal; font-variant: normal; font-weight: normal; letter-spacing: normal; line-height: normal; text-align: auto; -khtml-text-decorations-in-effect: none; text-indent: 0px; -apple-text-size-adjust: auto; text-transform: none; orphans: 2; white-space: normal; widows: 2; word-spacing: 0px; "><DIV><FONT class="Apple-style-span" color="#7E7E7E" face="Verdana" size="2"><SPAN class="Apple-style-span" style="font-size: 10px;; color: rgb(126, 126, 126); font-family: Verdana; "><BR class="khtml-block-placeholder"></SPAN></FONT></DIV><DIV>I'm using FLM to test some models.</DIV><DIV><BR class="khtml-block-placeholder"></DIV><DIV>I'm using the same data and the same vocabulary in both tools, ngram-count and fngram-count.</DIV><DIV>I'm not able to generate the same trigram model.</DIV><DIV>The number of bigram and trigram in the LM files generated are different.</DIV><DIV><BR class="khtml-block-placeholder"></DIV><DIV>using ngram-count, I'm getting: </DIV><DIV>\data\</DIV><DIV>ngram 1=315</DIV><DIV>ngram 2=23800</DIV><DIV>ngram 3=120408</DIV><DIV><BR class="khtml-block-placeholder"></DIV><DIV>using fngram-count, I'm getting:</DIV><DIV>\data\</DIV><DIV>ngram 0x0=315</DIV><DIV>ngram 0x1=23523</DIV><DIV>ngram 0x2=0</DIV><DIV>ngram 0x3=86366</DIV><DIV><BR class="khtml-block-placeholder"></DIV><DIV>knowing that ngram-count is used with the default parameters and the factor file for the fngram-count is:</DIV><DIV><BR class="khtml-block-placeholder"></DIV><DIV>##rule trigram</DIV><DIV>1</DIV><DIV>U : 2 U(-1) U(-2) ntextfile.flm.cnt ntextfile.flm.lm 3</DIV><DIV>U1U2<SPAN class="Apple-tab-span" style="white-space:pre">        </SPAN>U2<SPAN class="Apple-tab-span" style="white-space:pre">        </SPAN>wbdiscount<SPAN class="Apple-tab-span" style="white-space:pre">        </SPAN>gtmin 3<SPAN class="Apple-tab-span" style="white-space:pre">        </SPAN>interpolate</DIV><DIV>U1<SPAN class="Apple-tab-span" style="white-space:pre">        </SPAN>U1<SPAN class="Apple-tab-span" style="white-space:pre">        </SPAN>wbdiscount<SPAN class="Apple-tab-span" style="white-space:pre">        </SPAN>gtmin<SPAN class="Apple-tab-span" style="white-space:pre">        </SPAN>1<SPAN class="Apple-tab-span" style="white-space:pre">        </SPAN>interpolate</DIV><DIV>0<SPAN class="Apple-tab-span" style="white-space:pre">        </SPAN>0</DIV><DIV><BR class="khtml-block-placeholder"></DIV></SPAN></SPAN></DIV><DIV>What are the parameters  to use in the factor file in order to get the same LM output?</DIV><DIV><BR class="khtml-block-placeholder"></DIV><DIV><BR class="khtml-block-placeholder"></DIV><DIV>Thanks</DIV><DIV><BR class="khtml-block-placeholder"></DIV><DIV>Antoine</DIV><BR></DIV></BODY></HTML>