当前位置:  开发笔记 > 编程语言 > 正文

使用Java标准库将HTML字符转换回文本

如何解决《使用Java标准库将HTML字符转换回文本》经验,为你挑选了4个好方法。

我想使用Java标准库将一些HTML字符转换回文本.我想知道是否有任何图书馆能实现我的目的?

/**
 * @param args the command line arguments
 */
public static void main(String[] args) {
    // TODO code application logic here

    // "Happy & Sad" in HTML form.
    String s = "Happy & Sad";
    System.out.println(s);

    try {
        // Change to "Happy & Sad". DOESN'T WORK!
        s = java.net.URLDecoder.decode(s, "UTF-8");
        System.out.println(s);
    } catch (UnsupportedEncodingException ex) {

    }
}

Bill.D.. 58

我认为Jakarta Commons Lang库的StringEscapeUtils.escapeHtml()和unescapeHtml()方法正是您所寻找的.请参阅http://commons.apache.org/proper/commons-lang/javadocs/api-3.1/org/apache/commons/lang3/StringEscapeUtils.html.



1> Bill.D..:

我认为Jakarta Commons Lang库的StringEscapeUtils.escapeHtml()和unescapeHtml()方法正是您所寻找的.请参阅http://commons.apache.org/proper/commons-lang/javadocs/api-3.1/org/apache/commons/lang3/StringEscapeUtils.html.



2> 小智..:

在这里,您只需在应用程序中的lib jsoup中添加jar文件,然后使用此代码.

import org.jsoup.Jsoup;

public class Encoder {
    public static void main(String args[]) {
        String s = Jsoup.parse("<Français>").text();
        System.out.print(s);
    }
}

链接下载jsoup:http://jsoup.org/download



3> Zach Scriven..:

java.net.URLDecoder仅处理application/x-www-form-urlencodedMIME格式(例如"%20"表示空格),而不处理HTML字符实体.我不认为Java平台上有任何东西.您可以编写自己的实用程序类来进行转换,就像这样.



4> 小智..:

URL解码器只应用于解码由"application/x-www-form-urlencoded"mime类型的html表单生成的URL中的字符串.这不支持html字符.

一个经过搜索,我发现一个翻译的类内的HTML解析器库.

推荐阅读
小白也坚强_177
这个屌丝很懒,什么也没留下!
DevBox开发工具箱 | 专业的在线开发工具网站    京公网安备 11010802040832号  |  京ICP备19059560号-6
Copyright © 1998 - 2020 DevBox.CN. All Rights Reserved devBox.cn 开发工具箱 版权所有