La première chose à faire, si votre texte source est balisé, consiste probablement signaler ce fait à WordSmith. Pour ce faire, au niveau de l'écran principal du WordSmith Tools Controller, sélectionnez l'option Advanced Settings
puis l'option Tags.
Si vous utilisez le corpus BNC (British National Corpus) dans son édition mondiale, sélectionnez ce corpus sous Custom settings comme indiqué ci-dessus.
À ce stade, nous avons déclaré au WordSmith Tools Controller qu'il ne devait tenir compte d'aucune balise commançant ou se terminant par les chevrons (< >) pour traduire quelques entités en symboles tels que % et ", et pour tronquer l'en-tête de chaque texte (jusqu'à la balise </teiHeader>). C'est suffisant pour commencer.