帝国论坛帝国网站管理系统交流区采集使用交流ECMS采集的问题 【本版专题贴子】  
主题:ECMS采集的问题 [加入收藏夹]   

nm05
用户头衔:书生

精华贴   :0
发贴数   :3
经验值   :19
注册时间:2007-05-21
信息 搜索 好友 发送悄悄话 精益求精-帝国网站管理系统7.5正式版开源发布】   [第 1 楼]
ECMS采集的问题
ECMS在采集含有'单引号的链接时无法正确识别.
如"采集页面地址:"
http://www.ezinearticles.com/?cat=Health-and-Fitness:Men's-Issues

将识别为
http://www.ezinearticles.com/?cat=Health-and-Fitness:Men\'s-Issues

--------------------------------------------------------------------------------------------------------


如果是"信息页链接正则:"里边的链接含有'引单号.

http://www.ezinearticles.com/?cat=Health-and-Fitness:Men's-Issues
将会识别为
http://www.ezinearticles.com/?cat=Health-and-Fitness:Men

去除了'单引号后面的

-------------------------------------------------------------------------------------------------------


在正文中含有'单引号时无法正常采集.只采集到内容中第一个单引号的前的部分内容
如:
http://ezinearticles.com/?How-to-Get-Rid-of-Man-Boob-With-a-Little-Trick---Use-It-to-Get-Rid-of-Man-Boob-Faster-and-Safer&id=581672

内容只采集到以下内容

<p>Now, this trick that I

单引号后的没有了

[该贴被修改 1 次,最后修改时间 2009-05-02 09:16:10 ]



2007-06-03 13:35:05 已设置保密 顶部 回复 引用 报告 编辑 删除

wm_chief
用户头衔:管理员

精华贴   :21
发贴数   :48941
经验值   :114161
注册时间:2002-10-30
信息 搜索 好友 发送悄悄话 免费开源-EBMA系统:更安全的MYSQL管理和备份系统】   [第 2 楼]

页面地址不支持有特殊字符,如单引号,双引号



[零基础入门教程] [模板制作教程] [采集使用教程]
2007-06-03 16:38:11 已设置保密 顶部 回复 引用 报告 编辑 删除

风堂.风之痕
用户头衔:秀才

精华贴   :0
发贴数   :83
经验值   :339
注册时间:2007-06-01
信息 搜索 好友 发送悄悄话 精益求精-帝国网站管理系统7.5正式版开源发布】   [第 3 楼]

能不能解决下?

是不是可以用变换字符格式的办法解决?




2007-06-03 18:33:18 已设置保密 顶部 回复 引用 报告 编辑 删除

rocky711
用户头衔:书生

精华贴   :0
发贴数   :31
经验值   :155
注册时间:2006-10-12
信息 搜索 好友 发送悄悄话 免费开源-EBMA系统:更安全的MYSQL管理和备份系统】   [第 4 楼]

对于特殊字符请在前面加上“\\”,自己试试




2007-06-04 00:57:37 已设置保密 顶部 回复 引用 报告 编辑 删除

wm_chief
用户头衔:管理员

精华贴   :21
发贴数   :48941
经验值   :114161
注册时间:2002-10-30
信息 搜索 好友 发送悄悄话 精益求精-帝国网站管理系统7.5正式版开源发布】   [第 5 楼]

他说的是内容页网页链接,如:http://bbs.phome.net/showthread-32-27469.html
这个基本不可能出现单引与双引。楼主的情况太特殊了



[零基础入门教程] [模板制作教程] [采集使用教程]
2007-06-04 09:22:20 已设置保密 顶部 回复 引用 报告 编辑 删除

nm05
用户头衔:书生

精华贴   :0
发贴数   :3
经验值   :19
注册时间:2007-05-21
信息 搜索 好友 发送悄悄话 免费开源-EBMA系统:更安全的MYSQL管理和备份系统】   [第 6 楼]

为什么不支持单引号啊。。。外国的站点。链接里都是有单引号的啊。
希望你们的程序。适用性大一点。




2007-06-10 21:22:23 已设置保密 顶部 回复 引用 报告 编辑 删除

cenkee
用户头衔:进士

精华贴   :1
发贴数   :635
经验值   :2093
注册时间:2007-08-23
信息 搜索 好友 发送悄悄话 精益求精-帝国网站管理系统7.5正式版开源发布】   [第 7 楼]

这个问题需要解决



北漂一族
2009-05-01 19:54:56 已设置保密 顶部 回复 引用 报告 编辑 删除

快速回复
内容

表情
使用EBB代码 使用smile代码 显示签名 自动分析url 自动分析img
     【进入高级模式】   (按 Ctrl+Enter 直接提交)
    顶部  加入收藏夹
关于帝国 | 广告服务 | 联系我们 | 法律声明 | 隐私条款 | 许可协议
Powered by: EBB Version 2.2.1