如果不使用任何外部库,将网站的HTML内容提取到String中的最简单方法是什么?
我目前正在使用这个:
String content = null; URLConnection connection = null; try { connection = new URL("http://www.google.com").openConnection(); Scanner scanner = new Scanner(connection.getInputStream()); scanner.useDelimiter("\\Z"); content = scanner.next(); scanner.close(); }catch ( Exception ex ) { ex.printStackTrace(); } System.out.println(content);
但不确定是否有更好的方法.
这对我很有用:
URL url = new URL(theURL); InputStream is = url.openStream(); int ptr = 0; StringBuffer buffer = new StringBuffer(); while ((ptr = is.read()) != -1) { buffer.append((char)ptr); }
不确定提供的其他解决方案是否更有效.