Tag: jsoup

Jsoup,在执行表单POST之前获取值

这是我用来提交表单的代码: Connection.Response res = Jsoup.connect(“http://example.com”) .data(“id”, “myID”) .data(“username”, “myUsername”) .data(“code”, “MyAuthcode”) // get the value of Auth code from page element .method(Method.POST).execute(); 要成功提交给定表单,[name =“code”]字段需要设置值。 该值可以在另一个元素的页面上找到 。 在如上所示实际提交表单之前,我如何使用相同的连接获取元素的值? 我需要使用元素中的值,才能成功填写表单。

Jsoup有特殊HTML符号的问题,‘ — 等等

我有一些HTML(字符串),我通过Jsoup,所以我可以添加一些东西到所有href和src属性,这很好。 但是,我注意到对于一些特殊的HTML字符,Jsoup正在将它们转换为“ 对于实际的人物“ 。 我输出前后的值,我看到了这个变化。 之前: THIS — IS A “TEST”. 5 > 4. trademark: ™ 后: THIS — IS A “TEST”. 5 > 4. trademark: ? 到底他妈发生了什么? 我特意将这些特殊字符转换为HTML实体,然后才能避免这种情况。 引号更改为实际引号字符,大于保持不变,商标变为问号。 AAAAAAA。 仅供参考,我的Jsoup代码正在做: Document document = Jsoup.parse(fileHtmlStr); //some stuff String modifiedFileHtmlStr = document.html(); 谢谢你的帮助!

使用jsoup替换HTML标记

这是我的代码 String html = “fsdfsdfsdfdasdasd”; Document doc = Jsoup.parse(html); Elements elements = doc.select(“font”); for(Element element : elements) { element.replaceWith(new Element(Tag.valueOf(“span”),””).html(element.html())); } System.out.println(doc.html()); 我想替换字体标记并放置span标记。 在此,它将替换第一个字体标记,但不替换第二个标记

如何在具有lazyload scrollLoader.js的站点中使用Jsoup

我有一个关于jsoup的问题因为lazyload scrollLoader.js我用java代码到达网站,我只列出了50个图像名称jsoup.But在网站上向下滚动时,很多图像不断加载。 我的问题是,是否可以将图像数量发布到与Jsoup.connect()一起使用的url中以从网站获取所有图像? 这是网站: http : //www.logowik.com 这是网站中脚本的用法: $(document).ready(function(e) { CalculateColumns(); recordCount = 50; groupID = “0”; catID = “0”; query = “”; userEntry = “”; groupInterval = “0”; AddEvent(window, “resize”, CalculateColumns); document[“scrollLoader”] = new scrollLoader({evn : getGrids, seize : 1}); document[“scrollLoader”].DoScroll(); addLogoClickEvent(); }); 我用以下url发布这些参数: http://www.logowik.com/index.php?g=1&groupID=1&catID=0 : http://www.logowik.com/index.php?g=1&groupID=1&catID=0 recordCount = 50这个url我得到50张图片,因为recordCount = 50在script 。 但我无法将此参数发布到url。 […]

Jsoup图像标记提取

我需要使用此html中的jsoup提取图像标记 我需要提取这个img标签的src …我正在使用这个代码我得到空值 Element masthead2 = doc.select(“div.picture”).first(); String linkText = masthead2.outerHtml(); Document doc1 = Jsoup.parse(linkText); Element masthead3 = doc1.select(“img[src]”).first(); String linkText1 = masthead3.html();

在JSoup中逐个元素地获取

我尝试获取div类中包含的所有信息: bg_block_info ,但我得到另一个div类的信息 为什么我弄错了? Document doc = Jsoup.connect(“http://www.maib.md”).get(); Elements myin = doc.getElementsByClass(“bg_block_info”);

JSoup:请求JSON响应

我正在使用JSoup进行身份validation,然后连接到网站。 某些URL具有JSON响应(因为该站点的一部分是在AJAX中)。 JSoup可以处理JSON响应吗? Connection.Response doc = Jsoup.connect(“…”) .data(…) .cookie(…) .header(…) .method(Method.POST) .execute(); String result = doc.body() 在我的情况下,身体是“”。 是因为JSoup不知道如何处理JSON? (当然没有) 或者因为我的请求中有错误? 是否有类似JSON的JSoup库?

使用jsoup获取谷歌搜索结果时出现403错误

我正在尝试使用以下代码获取Google搜索结果: Document doc = con.connect(“http://www.google.com/search?q=lakshman”).timeout(5000).get(); 但是我得到了这个例外: org.jsoup.HttpStatusException: HTTP error fetching URL. Status=403,URL=http://www.google.com/search?q=lakshman 403错误意味着服务器禁止访问,但我可以在Web浏览器中加载此URL。 为什么Jsoup会收到403错误?

如何使用JAVA从html页面获取表格

我正在开发一个项目,我试图从互联网上获取财务报表,并在JAVA应用程序中使用它们来自动创建比率和图表。 我使用的网站使用登录名和密码来访问表。 标签是TBODY,但html中还有另外两个TBODY。 如何使用java将我的表打印到txt文件,然后我可以在我的应用程序中使用? 最好的方法是什么,我应该阅读什么?

如何将Jsoup(Java html解析器)中生成的文档转换为字符串

我有一个在jsoup中制作的文档,看起来像这样 Document doc = Jsoup.connect(“http://en.wikipedia.org/”).get(); 如何将该doc转换为字符串。