Para crear una lista de palabras con secuencias de dos, tres o más palabras (n-gramas), como
OF THE
IN THE END
ONCE UPON A TIME,
etc. primero hay que computar un archivo de índice o index file. Este reconoce básicamente la posición de cada palabra separada en el corpus.
Véase también: Hacer una lista de secuencias de varias palabras.