<div dir="ltr">Dear SRILM users,<br>I am trying to train a class-based LM.  I was hoping there is an step-by-step guide for doing this, but I couldn't find any.<br>I have to create two different LM. my corpus is POS tagged and one of LMs should be based on POS tags. I should also create an LM based on automatic clustering(I removed the tags and I should perform this automatic clustering on this untagged corpus).<br>
The format of my tagged corpus is one word per line along with its tag, which are tab-separated.<br>I first excluded the tags in a separate text file and performed the following command on it -><br><br>./ngram-class -text tag.txt -full -classes output.cls  -class-counts output.counts<br>
<br>then I tried <br><br>./replace-word-with-classes classes=output.cls corpus.txt > tag.txt<br><br>in the end the tag.txt file was someting like the corpus.txt file (it was a word -space- tag per line format).<br><br>
The thing is I don't know what to do next, and if I have done correctly up to now.<br>I appreciate it if anyone can help me ASAP. I have deadlines on Monday.<br><br><br>Maral<br></div>