El Índice KWIC

Time Limit:
1 Sec
Memory Limit:
128Mb
Enviados:
1124
Resuelto:
252

Descripción

Ordenar y buscar es parte de la practica y teoria de la informática. Los índices KWIC es un método que permite la búsqueda eficiente de las palabras significativas (palabras clave) dentro de una lista de títulos.

Dado una lista de palabras a ignorar y una lista de títulos, debe escribir un programa que genere un índice KWIC (Key Word In Context) de los títulos.
En este índice se debe incluir la palabra clave (en mayúsculas). Este índice debe estar ordenado alfabéticamente por ésta palabra clave.

Todas las palabras son potencialmente palabra clave, pero se tiene inicialmente un conjunto de palabras que deben ser ignoradas.

Como ejemplo consideremos a las siguientes palabras a ignorar: de la en el su y las se que

La lista de títulos es:

Juan de la Rosa
En el primer centenario de su independencia
La cara india y campesina
En que se halla la riqueza nacional de Bolivia
Las Misiones Franciscanas de Apolobamba


el índice generado es:


          las misiones franciscanas de APOLOBAMBA
en que se halla la riqueza nacional de BOLIVIA
                       la cara india y CAMPESINA
                                    la CARA india y campesina
                          en el primer CENTENARIO de su independencia
                          las misiones FRANCISCANAS de apolobamba
                             en que se HALLA la riqueza nacional de bolivia
         en el primer centenario de su INDEPENDENCIA
                               la cara INDIA y campesina
                                       JUAN de la rosa
                                   las MISIONES franciscanas de apolobamba
            en que se halla la riqueza NACIONAL de bolivia
                                 en el PRIMER centenario de su independencia
                    en que se halla la RIQUEZA nacional de bolivia
                            juan de la ROSA

Entrada

La entrada consiste de una secuencia de lineas, la cadena :: se utiliza para separar al conjunto de las palabras que deben ser ignoradas de la lista de títulos. Cada una de las palabras ignoradas aparece en minúsculas, cada una en una linea. Cada titulo aparece en una línea y consiste de una mezcla de palabras en minúsculas y mayúsculas. Las palabras en el titulo están separada por un espacio.

No habrán mas de 200 títulos y 50 palabras a ignorar. Los únicos caracteres que existen son letras mayúsculas y minúsculas.

Salida

La salida debe ser un índice KWIC de los títulos. Cada título está en una línea con una palabra clave que será parte del índice. Este índice KWIC debe estar ordenado alfabéticamente. Si hay más de una palabra clave que es parte de un título, seguramente este título aparecerá más de una vez en el índice, mostrando en cada una a su respectiva palabra clave.

Las palabras claves deben mostrarse en mayúsculas, el resto se imprime en minúsculas.

Ejemplo Entrada

Copy icon
de
la
en
el
su
y
las
se
que
::
Juan de la Rosa
En el primer centenario de su independencia
La cara india y campesina
En que se halla la riqueza nacional de Bolivia
Las Misiones Franciscanas de Apolobamba

Ejemplo Salida

Copy icon
las misiones franciscanas de APOLOBAMBA
en que se halla la riqueza nacional de BOLIVIA
la cara india y CAMPESINA
la CARA india y campesina
en el primer CENTENARIO de su independencia
las misiones FRANCISCANAS de apolobamba
en que se HALLA la riqueza nacional de bolivia
en el primer centenario de su INDEPENDENCIA
la cara INDIA y campesina
JUAN de la rosa
las MISIONES franciscanas de apolobamba
en que se halla la riqueza NACIONAL de bolivia
en el PRIMER centenario de su independencia
en que se halla la RIQUEZA nacional de bolivia
juan de la ROSA

Ayuda