Apache HttpClient 4和JavaScript

我使用Apache HttpClient访问网页。 我想点击链接,但链接是javaScript,我如何处理点击JavaScript链接并遵循url重定向?

示例javascript和html代码:

 link function send(content_id, fic, cgRate) { var params = new Hash(); params.set('content_id', content_id); params.set('tool', fic); params.set('cgRate', cgRate); new Ajax.Updater('return', '/mypkg/tools', { method: 'post', parameters: params, evalScripts: true, onInitialize: new Effect.Appear('loader', {duration: 0.0}), onComplete: new Effect.Fade('loader', {duration: 1.2}) }); } 

看起来您尝试访问的页面使用AJAX来获取链接。 仅用vanilla HTTPClient来模拟这种行为是很困难的。 HTTPClient用于“原始”HTTP通信,而不是浏览器仿真。 相反,我建议使用类似于HtmlUnit的东西,它可以模拟浏览器并在页面上执行JavaScript: http : //htmlunit.sourceforge.net/

HtmlUnit具有相当不错的JavaScript支持,但它并不完美。 如果您需要依赖100%完美的浏览器仿真,您需要使用浏览器自动化框架,例如Selenium: http : //seleniumhq.org/