您可能正在寻找
HtmlUnit – 一个“用于Java程序的GUI-Less浏览器”.
这是打开的示例代码,使用表单搜索“htmlunit”并打印结果数量.
import com.gargoylesoftware.htmlunit.*;
import com.gargoylesoftware.htmlunit.html.*;
public class HtmlUnitFormExample {
public static void main(String[] args) throws Exception {
WebClient webClient = new WebClient();
HtmlPage page = webClient.getPage("");
HtmlInput searchBox = page.getElementByName("q");
searchBox.setValueAttribute("htmlunit");
HtmlSubmitInput googleSearchSubmitButton =
page.getElementByName("btnG"); // sometimes it's "btnK"
page=googleSearchSubmitButton.click();
HtmlDivision resultStatsDiv =
page.getFirstByXPath("//div[@id='resultStats']");
System.out.println(resultStatsDiv.asText()); // About 309,000 results
webClient.closeAllWindows();
}
}
其他选择是:
> Selenium:将打开像Firefox这样的浏览器并进行操作.
> Watij:也将打开一个浏览器,但在自己的窗口中.
> Jsoup:好的解析器.但是没有JavaScript.