Lo primero que hay que hacer si el texto que quiere analizar está etiquetado es decírselo a WordSmith. Para ello, tiene que elegir en el Controlador inicial Settings | Adjust Settings
y después Tags y Mark-up.
Si usted va a trabajar con el British National Corpus, selecciónelo en Custom settings tal como se muestra en la ilustración anterior. Después seleccione su Entity file si no desea ver eacute; en vez de é y cosas por el estilo, y haga click en el botón Load:
.
Hasta aquí, le hemos dicho al Controlador que debe ignorar todas la etiquetas que empiecen y terminen por paréntesis angulares o cuñas(< >), para traducir unas cuantas referencias de entidades a símbolos como % and ", y para asimismo, separar el encabezamiento de cada texto (hasta </teiHeader>). Esto bastará por ahora.