<html>
  <head>
    <meta content="text/html; charset=ISO-8859-1"
      http-equiv="Content-Type">
  </head>
  <body bgcolor="#FFFFFF" text="#000000">
    You can build class-based LMs using your own class assignments.<br>
    <br>
    Step 2 works with a classfile with or without probabilities (the
    probs are optional in the format).<br>
    <br>
    For step 3, you need some probability distribution over the words to
    obtain a proper language model.<br>
    For example, use the "uniform-classes" script to insert uniform
    probabilities for those class assignments that don't have any.<br>
    If you have a large training set, you can run <br>
    <br>
        replace-with-words-classes classes=<classfile> addone=1
    normalize=1 outfile=OUTPUT  TEXTFILE<br>
    <br>
    to count the number of times each word occurs and estimate class
    expansion probabilities (written to OUTFILE).<br>
    <br>
    Andreas<br>
    <br>
    On 6/5/2012 1:37 AM, Shammur Absar Chowdhury wrote:
    <blockquote
cite="mid:CAKnxEU-OkMrDoKMW2jHPVn3QbEU1Mw_87XA9DJN2WfL+BxOZrQ@mail.gmail.com"
      type="cite">Hello
      <div><br>
      </div>
      <div>I am new to srilm and at the same time I am recently learning
        about language model. My aim was to build a class based language
        model with a given class definition.<br>
        <br>
        So far I have used, the below 3 commands from <a
          moz-do-not-send="true"
          href="http://www.speech.sri.com/pipermail/srilm-user/2010q1/000843.html">http://www.speech.sri.com/pipermail/srilm-user/2010q1/000843.html</a><br>
        <br>
        <br>
        1. ngram-class -vocab vocab.txt \<br>
                    -text LM.txt \<br>
                    -numclasses 16 \<br>
                    -classes classfile<br>
        2. replace-words-with-classes classes=classfile LM.txt >
        Output_text_with_classes<br>
        3. ngram-count  -text Output_text_with_classes   -lm
        Class_based_model<br>
        <br>
        <br>
        But as far as I think that the first command here induces the
        classes. Now what if I want srilm to use my assigned class tag
        and its followed words list to make the class model, how will I
        do it? I meant I try formating my classes tag in the
        class-format and then run the second step but as in the format I
        am suppose to assign a probability, p - which I cant assign in
        my manual created class file.<br>
        <br>
        Could any one please help me and give a direction or suggest
        some reading for me.<br>
        Thank you .<br>
          <br>
        Shammur Absar Chowdhury<br>
        <br>
      </div>
      <br>
      <fieldset class="mimeAttachmentHeader"></fieldset>
      <br>
      <pre wrap="">_______________________________________________
SRILM-User site list
<a class="moz-txt-link-abbreviated" href="mailto:SRILM-User@speech.sri.com">SRILM-User@speech.sri.com</a>
<a class="moz-txt-link-freetext" href="http://www.speech.sri.com/mailman/listinfo/srilm-user">http://www.speech.sri.com/mailman/listinfo/srilm-user</a></pre>
    </blockquote>
    <br>
  </body>
</html>