从Google网络历史记录中检索旧搜索
我想要检索旧的Google搜索,这些搜索是我几年/几个月后所做的,并且存在于Google网络历史记录中。 我怎么能以编程方式检索它们呢?
https://www.google.com/history/?output=rss仅提供最近的Google搜索,但不是全部搜索。
还有这个问题: 如何检索我的Google搜索记录? 没有为我的问题提供任何答案!
您可以将月,日和年作为参数传递以获取特定日期的历史记录。
例如2010年12月1日的https://www.google.com/history/lookup?month=12&day=1&yr=2010&output=rss 。
没有办法获得整整一个月或一年的历史,更不用说整个历史了。 但是这些关于参数的信息必须至少使你能够在某个循环中获得整个历史记录,这个历史记录每次都会在某个时间段内进一步发展。 要小心,你不要在太短的时间内吮吸太多。
你真的需要逐页解析HTML然后获取你的数据,因为我不认为有任何替代方案!
我认为这将非常困难。
我知道这并没有完全回答你的问题,但至少可以保留网页。 有些组织和工具允许您从过去的日期重新创建网页 – 例如参见http://www.mementoweb.org/ 。
更新:我刚刚获悉Memento已获得数字保存奖(http://www.dpconline.org/newsroom)
我知道你不想回头看每一页,但你真的不需要解析整个页面,只需要查看总是在一个条目之前的html。 从我开始谷歌网络历史记录和做一些简单的搜索,如果你浏览历史记录页面,你搜索的每个字符串如下: