看了论坛上HTTPClient模拟登陆人人网
的文章,正好今天想注销自己的人人网帐号,又找不到人人网有提供导出日志的功能(超级BS人人网,只提供导入不提供导出),所以想试着用HttpClient做一个,权当练习了。google了一翻,找到了一个python版的导出脚本
,直接改成了java版的,感谢提供脚本的老杨
。
本来只想写个程序自己导出日志用的,所以代码写的不是很OO,还有改进的余地。有兴趣的朋友可以自我发挥。
导出思路:
1、登录帐号。
2、获得日志首页信息。
3、获得最新一篇日志的地址。
4、获得日志的信息,并转换为xml格式。
5、获得下一篇日志的地址,循环读取日志信息直到最后一篇日志。
6、写入xml文件中。
其中获得日志的信息包括日志的标题,日志的发表日期和日志的内容,通过正则表达式完成。
用到的包,请自行导入:
<classpathentry kind="lib" path="apache-mime4j-0.6.jar"/>
<classpathentry kind="lib" path="commons-codec-1.3.jar"/>
<classpathentry kind="lib" path="commons-logging-1.1.1.jar"/>
<classpathentry kind="lib" path="httpclient-4.0.1.jar"/>
<classpathentry kind="lib" path="httpcore-4.0.1.jar"/>
<classpathentry kind="lib" path="httpmime-4.0.1.jar"/>
<classpathentry kind="lib" path="commons-io-1.4.jar"/>
<classpathentry kind="lib" path="commons-lang-2.3.jar"/>
分享到:
相关推荐
关闭HttpClient日志的logback文件
最新版httpclient自动登录人人代码,内含有代码,httpclient4.3包,只需要修改账户和密码,就可以登陆
HttpClient代理访问网络
NULL 博文链接:https://malixxx.iteye.com/blog/452695
NULL 博文链接:https://theoffspring.iteye.com/blog/1610345
这个是一巍峨巍峨的成小儿额weoifweio维尔维尔我额外额外哦
网络爬虫 httpclient jar 包
httpclient官网教程中文版,这是根据官方文档翻译的doc文件,带有目录
为了使我们的程序能使用别人所提供的服务页面,就要求程序首先登录后再访问服务页面,这过程就需要自行处理cookie,想想当你用java.net.HttpURLConnection来完成这些功能时是多么恐怖的事情啊!况且这仅仅是我们所说...
HttpClient httpClient = new HttpClient(); // 设置 Http 连接超时为5秒 httpClient.getHttpConnectionManager().getParams().setConnectionTimeout(5000); /* 2 生成 GetMethod 对象并设置参数 */ GetMethod ...
基于QT的httpclient源代码,适合于新手,QT4可以运行
用HttpClient来模拟浏览器GET_POST,技术简单学!!
httpClient完整封装获取网页信息、数据的代码+httpclient.jar
android HttpClient 获取网络图片 实例
HTTPclient 4.3版本的Apache官网英文版的翻译版本
从网络获取数据和图片,用gson解析并用listview展示
最新httpclient4.5.5 帮助文档,文档比较apache httpclient官网,可以用来学习。