我有一个网站,用户可以使用TinyMCE的自定义实现发布内容(如论坛,评论等).他们中的很多人喜欢从Word复制和粘贴,这意味着他们的输入通常带有大量相关的MS内联格式.
我无法摆脱因为TinyMCE依赖于span标签的某些格式,我不能(并且不想)强迫所述用户使用TinyMCE的"从Word粘贴"功能(这不是'无论如何,似乎工作得很好.
有人知道图书馆/班级/功能会为我照顾这个吗?它必定是一个常见的问题,尽管我找不到任何确定的东西.我最近一直在想,一系列寻找特定于MS的模式的暴力正则表达式可能会成功,但我不想重新编写可能已经可用的东西,除非我必须这样做.
此外,固定卷曲引号,em-dashes等也会很好.我现在有自己的东西,但我真的只想找到一个MS转换过滤器来统治它们.
HTML Purifier将创建符合标准的标记并过滤掉许多可能的攻击(例如XSS).
对于不需要XSS过滤的更快清理,我使用PECL扩展Tidy,它是Tidy HTML实用程序的绑定.
如果那些没有帮助你,我建议你切换到内置此功能的FCKEditor .