The process is killed anyway... Are there any alternatives?<br><br>best regards,<br>Marta<br><br><div class="gmail_quote">On Thu, Jan 17, 2013 at 11:22 AM, Andreas Stolcke <span dir="ltr"><<a href="mailto:stolcke@icsi.berkeley.edu" target="_blank">stolcke@icsi.berkeley.edu</a>></span> wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
  
    
  
  <div text="#000000" bgcolor="#FFFFFF"><div class="im">
    <div>On 1/16/2013 6:00 PM, Marta Ruiz wrote:<br>
    </div>
    <blockquote type="cite">Hi Andreas,<br>
      <br>
      regarding this issue, I got the error <br>
      <br>
       class definition has too many fields<br>
    </blockquote></div>
    That means you must have a very long line in your class definitions
    file.<br>
    You should have one class membership definition per line.<br>
    If a class has many members you write one per line, for example<br>
    <br>
    NN    cat<br>
    NN    dog<br>
    NN    ball<br>
    <br>
    etc.<span class="HOEnZb"><font color="#888888"><br>
    <br>
    Andreas</font></span><div><div class="h5"><br>
    <blockquote type="cite"><br>
      in fact, I wanted to expand a language model of PoS tags into
      words...<br>
      actually, each PoS has many words related...<br>
      <br>
      <br>
      best regards,<br>
      Marta<br>
      <br>
      <div class="gmail_quote">On Wed, Jan 9, 2013 at 3:34 PM, Andreas
        Stolcke <span dir="ltr"><<a href="mailto:stolcke@icsi.berkeley.edu" target="_blank">stolcke@icsi.berkeley.edu</a>></span>
        wrote:<br>
        <blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
          <div text="#000000" bgcolor="#FFFFFF">
            <div>
              <div>On 1/8/2013 6:07 PM, Marta Ruiz wrote:<br>
              </div>
              <blockquote type="cite">Thanks Andreas, two more questions<br>
                <div class="gmail_quote">
                  <blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"> <br>
                    1. Create a word-based version of each model.  For
                    example, you can construct a POS-based LM and
                    combine it with a class membership mapping (in
                    classes-format, see man page) to get a word-level
                    POS-based model.   Similar with lemma-based LMs (the
                    lemmas are effectively word classes).<br>
                    <br>
                  </blockquote>
                  <div><br>
                    which is the instruction to do this?<br>
                  </div>
                </div>
              </blockquote>
              <br>
            </div>
            1. You create the class-to-word mapping file (in the format
            described <a href="http://www.speech.sri.com/projects/srilm/manpages/classes-format.5.html" target="_blank">here</a>) to reflect either your
            POS-to-word or lemma-to-word mapping.<br>
            2. Process the training data to replace the words with POS
            or lemmas, as appropriate.<br>
            3. Train the ngram portion of the LM by running ngram-count
            on the training data represented as a sequence of POS tags /
            lemmas (from step 2).
            <div><br>
              <br>
              <br>
              <blockquote type="cite">
                <div class="gmail_quote">
                  <div> </div>
                  <blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
                    2. Then interpolate the models using<br>
                    <br>
                        ngram -bayes 0 -lm LM1 -mix-lm LM2 -mix-lm2 LM3
                    .... -lambda ... -mix-lambda2 ... -classes CLASSES<br>
                    <br>
                    where CLASSES is a classes-format(5) file defining
                    the union of all the word classes used in the
                    various component models.<span><font color="#888888"><br>
                        <br>
                      </font></span></blockquote>
                  <div><br>
                    to find the lambdas can I use the compute-best-mix,
                    can't I?<br>
                  </div>
                </div>
              </blockquote>
            </div>
            Exactly.<span><font color="#888888"><br>
                <br>
                Andreas<br>
                <br>
              </font></span></div>
        </blockquote>
      </div>
      <br>
      <br clear="all">
      <br>
      -- <br>
      Marta Ruiz Costa-jussą<br>
      <a href="mailto:martaruizcostajussa@gmail.com" target="_blank">martaruizcostajussa@gmail.com</a><br>
      <a href="http://gps-tsc.upc.es/veu/personal/mruiz/mruiz.php3" target="_blank">http://gps-tsc.upc.es/veu/personal/mruiz/mruiz.php3</a><br>
    </blockquote>
    <br>
  </div></div></div>

</blockquote></div><br><br clear="all"><br>-- <br>Marta Ruiz Costa-jussą<br><a href="mailto:martaruizcostajussa@gmail.com">martaruizcostajussa@gmail.com</a><br><a href="http://gps-tsc.upc.es/veu/personal/mruiz/mruiz.php3">http://gps-tsc.upc.es/veu/personal/mruiz/mruiz.php3</a><br>