帝国论坛
→
帝国网站管理系统交流区
→
采集使用交流
→
[求助]老大发现一个超级麻烦的网站,怎么采集啊
【本版专题贴子】
主题:[求助]老大发现一个超级麻烦的网站,怎么采集啊
[加入收藏夹]
fenjar
用户头衔:书生
精华贴 :0
发贴数 :62
经验值 :264
注册时间:2007-01-16
信息
搜索
好友
发送悄悄话
【
精益求精-帝国网站管理系统7.5正式版开源发布
】 [第
1
楼]
[求助]老大发现一个超级麻烦的网站,怎么采集啊
老大发现一个超级麻烦的网站,怎么采集啊。地址是:
http://www.emkt.com.cn/brand/
他列表页里面的链接是动态的,点击后他自动跳转为静态页面。
这怎么采集啊
www.959cn.cn营销策划文案大全
2007-06-07 10:54:45
已设置保密
顶部
回复
引用
报告
编辑
删除
msn1981
用户头衔:书生
精华贴 :0
发贴数 :21
经验值 :108
注册时间:2007-05-14
信息
搜索
好友
发送悄悄话
【
免费开源-EBMA系统:更安全的MYSQL管理和备份系统
】 [第
2
楼]
晕~~这也叫超级麻烦
师徒工业设计网http://www.st126.com
2007-06-07 13:03:13
已设置保密
顶部
回复
引用
报告
编辑
删除
fenjar
用户头衔:书生
精华贴 :0
发贴数 :62
经验值 :264
注册时间:2007-01-16
信息
搜索
好友
发送悄悄话
【
精益求精-帝国网站管理系统7.5正式版开源发布
】 [第
3
楼]
不麻烦?那你教下我怎么采集啊
www.959cn.cn营销策划文案大全
2007-06-08 09:10:16
已设置保密
顶部
回复
引用
报告
编辑
删除
msn1981
用户头衔:书生
精华贴 :0
发贴数 :21
经验值 :108
注册时间:2007-05-14
信息
搜索
好友
发送悄悄话
【
免费开源-EBMA系统:更安全的MYSQL管理和备份系统
】 [第
4
楼]
我也在这个网上采过内容,他里面的内容里加了很多防采集的代码,要过虑掉,要不然采集到的都是垃圾了
师徒工业设计网http://www.st126.com
2007-06-08 13:48:52
已设置保密
顶部
回复
引用
报告
编辑
删除
fenjar
用户头衔:书生
精华贴 :0
发贴数 :62
经验值 :264
注册时间:2007-01-16
信息
搜索
好友
发送悄悄话
【
精益求精-帝国网站管理系统7.5正式版开源发布
】 [第
5
楼]
里面没有加放采代码啊。但是他在列表页的链接是动态链接,但是到内容页他就自动跳转为静态链接。现在就问题就是如何把动态链接替换成静态链接。
列表页的链接:
<a href="http://www.emkt.com.cn/cgi-bin/article.cgi?ID=31585" target="_blank">“史泰博事件”考量奥组委商业开发的智慧</a></b></span>
点击后内容页的链接是:
http://www.emkt.com.cn/article/315/31585.html
这应该怎么采啊。老大帮帮忙啊。
www.959cn.cn营销策划文案大全
2007-06-08 16:11:50
已设置保密
顶部
回复
引用
报告
编辑
删除
wm_chief
用户头衔:
管理员
精华贴 :
21
发贴数 :48941
经验值 :114161
注册时间:2002-10-30
信息
搜索
好友
发送悄悄话
【
免费开源-EBMA系统:更安全的MYSQL管理和备份系统
】 [第
6
楼]
可以考虑这么处理。全页替换,将:" target="_blank">替换为.html" target="_blank">
然后采集时采集31585这个数值。加上前缀http://www.emkt.com.cn/article/315/
上面的315应该是栏目id
[该贴被修改
1
次,最后修改时间
2007-06-08 16:20:12
]
[零基础入门教程]
[模板制作教程]
[采集使用教程]
2007-06-08 16:19:55
已设置保密
顶部
回复
引用
报告
编辑
删除
chunle
用户头衔:进士
精华贴 :0
发贴数 :1368
经验值 :4349
注册时间:2007-01-09
信息
搜索
好友
发送悄悄话
【
精益求精-帝国网站管理系统7.5正式版开源发布
】 [第
7
楼]
wm真佩服你的精力。
顺安途科技
2007-06-08 21:58:22
已设置保密
顶部
回复
引用
报告
编辑
删除
fenjar
用户头衔:书生
精华贴 :0
发贴数 :62
经验值 :264
注册时间:2007-01-16
信息
搜索
好友
发送悄悄话
【
免费开源-EBMA系统:更安全的MYSQL管理和备份系统
】 [第
8
楼]
老大经过我研究,采集时采集31585这个数值,315不是栏目id,而是发布日期。同个日期不管是那个栏目前面这3个数字是一样的。
看来是没方法采了,就算能采,采集后整理也很麻烦。
不过还是要感谢老大的帮助。
太感动,老大基本上是有问必答。
我会继续支持帝国的。
www.959cn.cn营销策划文案大全
2007-06-09 11:26:38
已设置保密
顶部
回复
引用
报告
编辑
删除
快速回复
内容
表情
使用EBB代码
使用smile代码
显示签名
自动分析url
自动分析img
【
进入高级模式
】
(按 Ctrl+Enter 直接提交)
顶部
加入收藏夹
关于帝国
|
广告服务
|
联系我们
|
法律声明
|
隐私条款
|
许可协议
Powered by:
EBB
Version 2.2.1