I&#39;d like to use srilm to generate bigram counts from the British National Corpus in XML format. I see that the paper<br>&nbsp;&quot;SRILM - An
Extensible Language Modeling Toolkit&quot;, in Proc. Intl. Conf. Spoken
Language Processing, Denver, Colorado, September 2002 <br>mentions that support for SGML-tagged formats is regarded as desirable: has this support been implemented in the toolkit at this time please?<br><br>thanks,<br>--matt<br>