Hola a todos. Tengo un
textinput, donde el usuario escribe o pega texto y de donde yo extraigo su representación html a través de
htmlText, con el fin de construir posteriormente un xml. Hasta aquí todo bien, el problema es que el htmlText trae mucha basura (<font>, <b>, y otras etiquetas más) que no me sirven para la construcción de mi xml (de hecho sólo me sirve el <p>, pues el xml lo voy a mostrar con una hoja de transformación).
¿Puedo desactivar la representación de algunas de esas etiquetas en el htmlText? Si no, ¿puedo quitarlas de alguna manera?
He pensado hacer una rutina que recorra la cadena, limpiando las etiquetas que no me sirvan, pero quisiera saber si hay otro método más fácil y/o efectivo...
Saludos.