请选择 进入手机版 | 继续访问电脑版

修复织梦DEDECMS5.5采集功能的一些bug

[复制链接]
查看1681 | 回复1 | 2019-9-16 08:50 | 显示全部楼层 |阅读模式
修复织梦DEDECMS5.5采集功能的一些bug
修复1:将开始标签和结束标签以在网页源码中第一次出现的位置为准
修改文件\include\dedecollection.class.php
在成员函数GetHtmlArea中的
$posend = @strpos($html,$areaRules[1],$posstart);
语句前增加语句:
$posstart=$posstart+strlen($areaRules[0]);
将:
return substr($html,$posstart+strlen($areaRules[0]),$posend-$posstart-strlen($areaRules[0]));
替换为:
return substr($html,$posstart,$posend-$posstart);

修复2:下载图片时对图片的扩展名判断错误
相同文件


eregi("\.gif",$v)
替换为
eregi("\.gif$",$url)

eregi("\.png",$v)
替换为
eregi("\.png$",$url)

修复3:采集软件地址的正则表达式不准确
\include\dedecollection.func.php
将TurnLinkTag函数中
preg_match_all("/<a(?:.*)href=['\"](.+?)['\"]([^>]+?)>(.+?)<\/a>/is",$body,$match);
换为:
preg_match_all("/<a(?:[^\>]+?)href\\s*=\\s*[\'\"]?([^\\s\>\"\']+)([^\>]+?)>(.+?)<\/a>/is",$body,$match);
修复4:采集图片的正则表达式不准确
相同文件

preg_match_all('/src=[\'"](.+?)[\'"]/is',$body,$match);
$ttx = '';
if(is_array($match[1]) && count($match[1])>0)
{
  for($i=0;isset($match[1][$i]);$i++)
  {
   $ttx .= "{dede:img text='' }".$match[1][$i]." {/dede:img}"."\r\n";
  }
}
改为
$patten = "/<\\s*img\\s.*?src\\s*=\\s*([\"\\'])?(?(1)(.*?)\\1|([^\\s\\>\"\\']+))/isx";
    preg_match_all( $patten, $body, $images );
    $returnArray1 = $images[2];
    $returnArray2 = $images[3];
    foreach ( $returnArray1 as $key => $value )
    {
        if ( $value )
        {
            $ttx .= "{dede:img ddimg='$litpicname' text='图 ".($key+1)."'}".$value."{/dede:img}"."\r\n";
        }
        else
        {
            $ttx .= "{dede:img ddimg='$litpicname' text='图 ".($key+1)."'}".$returnArray2[$key]."{/dede:img}"."\r\n";
        }

自丢网更多织梦模板与织梦教程与大家学习分享!
老虎 | 2019-9-16 09:09 | 显示全部楼层
自丢网真心不错,学习教程网。
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

UID
1
贡献
387
丢币
38902
主题
4607
回帖
116
注册时间
2018-9-25
最后登录
2024-3-24