<DIV>Hi,</DIV>
<DIV>I'm trying to convert an n-gram model (e.g., a.lm) into AT&amp;T FSM format.</DIV>
<DIV>I have first used make-ngram-pfsg (e.g., make-ngram-pfsg a.lm &gt; a.pfsg), then I used pfsg-to-fsm (e.g., pfsg-fsm a.pfsg &gt; a.fsm). I have some questions regarding the interpretation of the transition probabilities and labels:</DIV>
<DIV>1. words are represented as themselves in the n-gram format, but in the FSM format model, the transitions seem to have an index. Which word is represented with which index? Can it be extracted from the order of the unigrams in the ngram format file? Is 0 representing an epsilon?</DIV>
<DIV>2. Are the transition probabilities -10000.5*logprobs?</DIV>
<DIV>3. What do the state potentials represent?</DIV>
<DIV>&nbsp;</DIV>
<DIV>Also, is there&nbsp;a better way of doing these?</DIV>
<DIV>&nbsp;</DIV>
<DIV>I appreciate any help about these.</DIV>
<DIV>&nbsp;</DIV>
<DIV>Thanks,</DIV>
<DIV>Dilek Hakkani-Tür</DIV>
<DIV>&nbsp;</DIV><p>
                <hr size=1> <a href="http://store.yahoo.com/redcross-donate3/">Click here to donate to the Hurricane Katrina relief effort.</a>