`
yechw
  • 浏览: 58621 次
  • 性别: Icon_minigender_1
  • 来自: 杭州
社区版块
存档分类
最新评论

用HttpClient写的导出人人网日志的程序

阅读更多

看了论坛上HTTPClient模拟登陆人人网 的文章,正好今天想注销自己的人人网帐号,又找不到人人网有提供导出日志的功能(超级BS人人网,只提供导入不提供导出),所以想试着用HttpClient做一个,权当练习了。google了一翻,找到了一个python版的导出脚本 ,直接改成了java版的,感谢提供脚本的老杨

 

本来只想写个程序自己导出日志用的,所以代码写的不是很OO,还有改进的余地。有兴趣的朋友可以自我发挥。

 

导出思路:

1、登录帐号。

2、获得日志首页信息。

3、获得最新一篇日志的地址。

4、获得日志的信息,并转换为xml格式。

5、获得下一篇日志的地址,循环读取日志信息直到最后一篇日志。

6、写入xml文件中。

 

其中获得日志的信息包括日志的标题,日志的发表日期和日志的内容,通过正则表达式完成。

 

用到的包,请自行导入:

<classpathentry kind="lib" path="apache-mime4j-0.6.jar"/>
<classpathentry kind="lib" path="commons-codec-1.3.jar"/>
<classpathentry kind="lib" path="commons-logging-1.1.1.jar"/>
<classpathentry kind="lib" path="httpclient-4.0.1.jar"/>
<classpathentry kind="lib" path="httpcore-4.0.1.jar"/>
<classpathentry kind="lib" path="httpmime-4.0.1.jar"/>
<classpathentry kind="lib" path="commons-io-1.4.jar"/>
<classpathentry kind="lib" path="commons-lang-2.3.jar"/>
分享到:
评论
4 楼 lee_3do 2010-10-25  
yechw 写道
lee_3do 写道
貌似人人大改版,楼主这个好像不行了,看来还是得抽个时间自己再写一个了

是吗?我的帐号注销了,不然改天上去再看一下。

是啊,前几天看了一下,楼主好像是先找到人人上日志的首页,现在人人改版貌似得不到这个日志的首页了,于是也就得不到相关日志的地址了。不过人人还有个地址http://m.renren.com/,可以从这里登录得到日志的首页,别的应该都没问题。不过还是多谢楼主啦~
3 楼 yechw 2010-10-12  
lee_3do 写道
貌似人人大改版,楼主这个好像不行了,看来还是得抽个时间自己再写一个了

是吗?我的帐号注销了,不然改天上去再看一下。
2 楼 lee_3do 2010-10-10  
貌似人人大改版,楼主这个好像不行了,看来还是得抽个时间自己再写一个了
1 楼 lee_3do 2010-10-09  
多谢楼主啦,本来想自己写个呢,呵呵

相关推荐

Global site tag (gtag.js) - Google Analytics